Робастность

Робастность (англ. robustness, от robust — «крепкий», «сильный», «твёрдый», «устойчивый») — свойство статистического метода, характеризующее независимость влияния на результат исследования различного рода выбросов, устойчивости к помехам. Робастный метод — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.

На практике наличие в выборках даже небольшого числа резко выделяющихся наблюдений (выбросов) способно сильно повлиять на результат исследования, например, метод наименьших квадратов и метод максимального правдоподобия на специфических распределениях подвержены такого рода искажениям, и значения, получаемые в результате, могут перестать нести в себе какой-либо смысл. Для исключения влияния таких помех используются различные подходы для снижения влияния «плохих» наблюдений (выбросов), либо полного их исключения. Основная задача робастных методов — отличить «плохое» наблюдение от «хорошего», притом даже самый простой из подходов — субъективный (основанный на внутренних ощущениях исследователя) — может принести значительную пользу, однако для мотивированной отбраковки все же исследователями применяются методы, имеющие в своей основе некие строгие математические обоснования. Этот процесс представляет собой весьма нетривиальную задачу для статистика и определяет собой одно из направлений статистической науки.

Понятие робастности

Под робастностью в статистике понимают нечувствительность к различным отклонениям и неоднородностям в выборке, связанным с теми или иными, в общем случае неизвестными, причинами[1][2]. Это могут быть ошибки детектора, регистрирующего наблюдения, чьи-то добросовестные или намеренные попытки «подогнать» выборку до того, как она попадёт к статистику, ошибки оформления, вкравшиеся опечатки и многое другое. Например, наиболее робастной оценкой параметра сдвига закона распределения является медиана, что на интуитивном уровне вполне очевидно (для строгого доказательства следует воспользоваться тем, что медиана является усечённой М-оценкой, см. ниже)[1]. Помимо непосредственно «бракованных» наблюдений, также может присутствовать некоторое количество наблюдений, подчиняющихся другому распределению. Ввиду условности законов распределений, а это не более, чем модели описания, сама по себе выборка может содержать некоторые расхождения с идеалом.

Тем не менее, параметрический подход настолько вжился, доказав свою простоту и целесообразность, что нелепо от него отказываться. Поэтому и возникла необходимость приспособить старые модели к новым задачам.

Стоит отдельно подчеркнуть и не забывать, что отбракованные наблюдения нуждаются в отдельном, более пристальном внимании. Наблюдения, кажущиеся «плохими» для одной гипотезы, могут вполне соответствовать другой. Наконец, отнюдь не всегда резко выделяющиеся наблюдения являются «браком». Одно такое наблюдение для генной инженерии, к примеру, стоит миллионов других, мало отличающихся друг от друга.

Основные подходы

Для того, чтобы ограничить влияние неоднородностей, либо вовсе его исключить, существует множество различных подходов. Среди них выделяются два основных направления.

  • Группировка данных без удаления отдельных наблюдений (для снижения возможности порчи выборки отдельными выпадами). После чего с достаточной степенью уверенности допустимо использование классических методов статистики.

Группирование данных как метод робастной статистики

Посредством группирования выборки можно резко снизить влияние отдельных наблюдений, не отбрасывая их. Разбиение на интервалы не представляет особых трудностей и даёт весьма ощутимый результат. Существует три наиболее распространённых способа разбиения.

  • Разбиение на интервалы равной длины. Наиболее простой и потому распространённый способ.
  • Разбиение на асимптотически оптимальные интервалы. При таком разбиении минимизируются потери информации в результате группирования, то есть максимизируется фишеровская информация , где  — оцениваемый параметр закона. Для многих законов распределения удалось получить инвариантные относительно параметров границы интервалов, и были составлены соответствующие таблицы. Такое разбиение позволяет максимизировать мощность критерия.

Подход, основанный на функции влияния

Один из подходов к созданию робастных методов — оценка параметров распределения по «загрязнённой» выборке, используя методику, разработанную Хампелем[1]. Для анализа влияния отдельного наблюдения на оценку (или рассматриваемую статистику) определённого параметра распределения, Хампел ввёл так называемую функцию влияния (англ. influence function), которая по сути является производной данной статистики.

Основные понятия

Вводится функционал , как функция от некоторой выборки из распределения c параметром (оно же ). зависит от . Значит является функцией от закона и от параметра . Пусть также удовлетворяет некоторым условиям состоятельности и регулярности:

Производная этого функционала в точке с распределением :

где:

 — некая функция, смысл которой прояснится на следующем шаге;
 — некий закон распределения, отличный от .

При подстановке , приписывающей единичную массу событию , вместо , в результате чего от интеграла в правой части выражения останется только :

Эту функцию и называют функцией влияния.

Смысл функции влияния демонстрируется подстановкой вместо и заменой предела, в результате выражение преобразуется в , что соответствует ситуации, когда в выборку, состоящую из наблюдения, подчиняющихся распределению , добавляют ещё одно новое. Таким образом отслеживает реакцию используемого функционала на внесённое добавление, показывая влияние от вклада отдельного наблюдения на оценку по всей совокупности данных.

Для характеристики влияния отдельных наблюдений также вводят понятие чувствительности к большой ошибке  :

Если функция влияния ограничена, то соответствующую оценку называют B-робастной.

М-оценки

Наиболее эффективными и широко используемыми оценками параметров законов распределений являются оценки максимального правдоподобия (ОМП), которые определяются одним из следующих условий:

где в случае негруппированной выборки , а в случае группированной —

М-оценки являются неким обобщеним ОМП. Они формулируются аналогично одному из следующих уравнений:

Если наложить условие регулярности в подстановке и продифференцировать его по в 0:

то не представляет большого труда получить выражение функции влияния для M-оценок:

Указанное выражение позволяет сделать вывод о том, что M-оценки эквивалентны с точностью до ненулевого множителя-константы.

Пример функций влияния для усечённых ОМП параметров сдвига (синяя линия) и параметра масштаба (красная линия) стандартного нормального закона распределения

Несложно проверить, что для ОМП стандартного нормального закона распределения функции влияния параметра сдвига и параметра масштаба выглядят соответственно:

Эти функции неограничены, а это значит, что ОМП не является робастной в терминах B-робастности.

Для того, чтобы это исправить, M-оценки искусственно ограничивают, а значит, и ограничивают её (см. выражение для M-оценок), устанавливая верхний барьер на влияние резко выделяющихся (далеко отстоящих от предполагаемых значений параметров) наблюдений. Делается это введением так называемых усечённых M-оценок, определяемых выражением:

где , и  — оценки параметров сдвига и масштаба соответственно.

Среди усечённых M-оценок оптимальными с точки зрения B-робастности являются усечённые ОМП[1].

Процедура оценивания параметров

Чтобы решить уравнение

,

необходимо воспользоваться каким-либо численным методом. Для этого понадобится выбрать начальные приближения. Нулевым параметром сдвига обычно служит медиана, параметром масштаба — значение, кратное медиане отклонений от медианы.

Например, если необходимо оценить параметр сдвига, скажем, нормального закона распределения, можно воспользоваться методом Ньютона численного нахождения корней уравнения. В результате вся процедура нахождения параметра сводится к итеративному вычислению выражения:

где  — некоторая оценка параметра масштаба, используемая для уравнивания распределения с разным размахом.

См. также

Примечания

  1. 1 2 3 4 5 Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике. Подход на основе функций влияния = Robust statistics: the approach based on influence functions. — М.: Мир, 1989.
  2. Хьюбер П. Робастность в статистике. — М.: Мир, 1984.
  3. Кендалл М., Стьюарт А. Статистические выводы и связи. — М.: Наука, 1973.

Литература

Ссылки

Read other articles:

Airborne infantry fighting vehicle BMD-2 A Ukrainian BMD-2 on parade at Kyiv in August 2008TypeAirborne infantry fighting vehiclePlace of originSoviet UnionService historyIn service1985–presentUsed bySee OperatorsWarsSee Service historyProduction historyDesigned1981–1985ManufacturerVolgograd Tractor PlantProduced1985–1991? (out of production)VariantsSee VariantsSpecifications (BMD-2)Mass11.5 tonnesLength7.85 mWidth2.94 mHeight2.45 mCrew2 (driver and turre...

 

1941 film by George B. Seitz Andy Hardy's Private SecretaryDirected byGeorge B. SeitzWritten byAurania RouverolKatharine BrushScreenplay byJane MurfinHarry RuskinCarey WilsonStarringMickey RooneyKathryn GraysonCinematographyLester WhiteEdited byElmo VeronMusic byHerbert StothartDistributed byMetro-Goldwyn-MayerRelease date21 February 1941Running time101 min.CountryUnited StatesLanguageEnglishBudget$329,000[1]Box office$2,402,000[1] Andy Hardy's Private Secretary is a 1941 Amer...

 

2008 American filmBeautiful LosersRelease PosterStarring Thomas Campbell Cheryl Dunn Shepard Fairey Jo Jackson Chris Johanson Margaret Kilgallen Harmony Korine Geoff McFetridge Barry McGee Mike Mills Stephen Powers II Claire E. Rojas Aaron Rose Deanna Templeton Ed Templeton CinematographyTobin YellandEdited byLenny MesinaMusic byMoney MarkRelease date March 1, 2008 (2008-03-01) (SXSW) Running time89 minutesCountryUnited StatesLanguageEnglish Beautiful Losers is a 2008 docum...

National emblem of the Republic of North Macedonia National emblem of North MacedoniaVersionsAs used by the Government of North Macedonia ArmigerRepublic of North MacedoniaAdopted27 July 1946; 77 years ago (1946-07-27) (original version)16 November 2009; 14 years ago (2009-11-16) (current version) The national emblem of North Macedonia depicts two curved garlands of sheaves of wheat, tobacco leaves and opium poppy fruits, tied by a ribbon decorated with emb...

 

Опис файлу Опис Церква пророка Іллі у Галичі_реконструкція південного фасаду Ю. Лукомського Джерело Ю.Лукомський Арххітектурна спадщинм давнього Галича. Галич, 1991р. Час створення 1991 Автор зображення Ю.Лукомський Ліцензія див. нижче Ліцензування Цей твір поширюється на ...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Januari 2023. Robyn BlumnerBlumner pada 2013Lahir14 Mei 1961 (umur 62)New York CityAlmamaterUniversitas CornellNew York University School of LawPekerjaanWartawan, pengarang, presiden dan CEO di Center for InquiryDikenal atasCenter For InquiryRichard Dawkins Fou...

American painter, japanner, and printmaker, 1708–1767 Thomas JohnstonBorn1708Boston, MassachusettsDiedMay 8, 1767(1767-05-08) (aged 58–59)Boston, MassachusettsNationalityAmericanOccupationEngraverKnown forEngraving, organ buildingNotable workFirst engraved print of an historical event in Colonial America, an overview of the Battle of Lake George Thomas Johnston (1708–1767)[a] was an American engraver, japanner, and heraldic painter in Colonial Boston. Johnston engraved...

 

New Tales of GisaengPoster promosi untuk New Tales of GisaengGenreRomansa, MelodramaDitulis olehIm Sung-hanSutradaraLee Young-hee Son Moon-kwonPemeranIm Soo-hyangSung HoonHan Hye-rinNegara asalKorea SelatanBahasa asliKoreaJmlh. episode52ProduksiProduserOh Se-kangLokasi produksiKoreaDurasi60 menit pada Sabtu dan Minggu pada pukul 21:45 (WSK)Rumah produksiGolden PineRilisJaringan asliSeoul Broadcasting SystemRilis asli23 Januari (2011-01-23) –17 Juli 2011 (2011-7-17)Pranala lua...

 

Roman Catholic parish church in Manhattan, New York City For the 1896 building, see Church of the Immaculate Conception and Clergy Houses. The Church of the Immaculate ConceptionFormer church building in 1914General informationTown or cityNew York, New YorkCountryUnited States of AmericaCompleted1858Cost$700,000 (for 1945 convent and school)[1]ClientRoman Catholic Archdiocese of New YorkDesign and constructionArchitect(s)Eggers & Higgins (for 1945 convent and school)[1]Web...

Indian politician Jayaprakash ReddyJagga ReddyMember of Telangana Legislative AssemblyIn office2018–2023Preceded byChinta PrabhakarSucceeded byChinta PrabhakarConstituencySangareddy [1]Member of Andhra Pradesh Legislative AssemblyIn office2004–2014ConstituencySangareddyWorking President of Telangana Pradesh Congress CommitteeIncumbentAssumed office 28 June 2021PresidentRevanth Reddy Personal detailsBornAredla Jagadeeshwar Reddy (1966-07-07) 7 July 1966 (age 57)Indrakaran,...

 

Ophellas was part of Alexander's fleet that sailed down the Indus in 326 BC. Coin of Ophellas, as Ptolemaic governor of Cyrene, first reign, circa 322-313 BC. AV Stater (17mm, 8.57 g, 11h). Coin struck by Polianthes, magistrate. Obv Nike, driving fast quadriga right, holding kentron and reins. Rev Zeus Ammon standing left, holding patera and lotus-tipped scepter; thymiaterion to left, [Π]OΛIANΘEYΣ to right. Cyrene coin struck under Ophellas as Ptolemaic governor. Circa 322-313 BC. Æ 19mm...

 

Artikel ini memerlukan pemutakhiran informasi. Alasannya: Ada beberapa unjuk rasa yang terjadi selama tahun 2021 dan di bulan-bulan awal 2022 serta tuntutan baru, pembentukan Partai Buruh, pernyataan UU Cipta Kerja inkonstitusional bersyarat oleh MK. Harap perbarui Artikel dengan menambahkan informasi terbaru yang tersedia.Unjuk rasa Undang-Undang Cipta KerjaDemonstrasi di Jakarta, 8 Oktober 2020Tanggal13 Januari 2020 – sekarang[1][2][3] Fase 1: 6 Oktober – 4 Novem...

Sports season2008–09 Mid-American Conference men's basketball seasonLeagueNCAA Division ISportBasketballNumber of teams12Regular seasonLeague championsBowling Green and BuffaloSeason MVPMichael BramosTournamentChampionsAkron  Runners-upBuffaloFinals MVPNate LinhartMid-American men's basketball seasons← 2007–082009–10 → 2008–09 Mid-American Conference men's basketball standings vte Conf Overall Team W   L   PCT W   L   PCT East Bowling Green ...

 

Daun inai Inai adalah pewarna yang dibuat dari tanaman Lawsonia inermis, juga dikenal sebagai pohon inai dan pacar kuku, [1] satu-satunya spesies dari genus Lawsonia . Inai juga bisa merujuk pada seni tubuh sementara yang dihasilkan dari pewarnaan kulit dari pewarna. Setelah pewarna inai mencapai warna puncaknya, mereka bertahan selama beberapa hari, kemudian secara bertahap hilang melalui pengelupasan kulit, biasanya dalam satu hingga tiga minggu. Inai telah digunakan sejak zaman kun...

 

جدانوفسكي   الإحداثيات 56°12′45″N 44°06′10″E / 56.2125°N 44.102777777778°E / 56.2125; 44.102777777778  تقسيم إداري  البلد روسيا[1]  معلومات أخرى 607684  تعديل مصدري - تعديل   زهدانوفسكيي (بالروسية: Ждановский) هي مدينة في مقاطعة نيجني نوفغورود أوبلاست في روسيا. يبلغ عدد سكان...

Film Titel Brujería Produktionsland Chile, Mexiko, Deutschland Originalsprache Spanisch, Mapudungun, Deutsch Erscheinungsjahr 2023 Länge 101 Minuten Stab Regie Christopher Murray Drehbuch Christopher Murray,Pablo Paredes Produktion Nicolás Celis,Rocío Jadue,Juan de Dios Larraín,Pablo Larraín Musik Leonardo Heiblum Kamera María Secco Schnitt Paloma López Besetzung Sebastian Hülk: Stefan Daniel Antivilo: Mateo Valentina Véliz: Rosa Raín Brujería (span. für ‚Hexerei‘, inter...

 

American politician Buron FittsFitts c. 193529th District Attorney of Los Angeles CountyIn officeDecember 3, 1928 – December 2, 1940Preceded byAsa KeyesSucceeded byJohn F. Dockweiler29th Lieutenant Governor of CaliforniaIn officeJanuary 4, 1927 – November 30, 1928Preceded byC. C. YoungSucceeded byHerschel L. Carnahan Personal detailsBorn(1895-03-22)March 22, 1895Belcherville, Texas, U.S.DiedMarch 29, 1973(1973-03-29) (aged 78)Three Rivers, California, U.S.Cause ...

 

Persian merchant Mirza Mohamed Ali Namazie Mirza Mohamed Ali Namazie (1864 - 26 July 1931), was a Persian merchant, property owner, and founder of the firm M. A. Namazie and Sons in Singapore. Biography Namazie was born in Chennai, which his father had emigrated to, in 1864. In 1909, he moved to Singapore and carried on work as a general merchant, as well as an agent for Namazee, a shipping firm from Hong Kong.[1] He was also employed in a patent flooring agency.[2] Namazie ow...

Tribes originating in the Arabian Peninsula Arab tribes in the Arabian Peninsula in 600 AD The Tribes of Arabia (Arabic: قبائل الجزيرة العربية) or Arab tribes (Arabic: القبائل العربية) denote ethnic Arab tribes originating in the Arabian Peninsula. These tribes trace their ancestry to one of the two Arab forefathers, Adnan or Qahtan.[1] Historically, Arab tribes have inhabited the Arabian Peninsula. However, with the spread of Islam, they started migra...

 

American anthology TV series This article is about the 2019 anthology television series. For the 2006 sitcom television series, see Cake (2006 TV series). For other uses, see Cake (disambiguation). CakeGenrePsychedelicAnthology seriesAdult animationComedyCountry of originUnited StatesOriginal languageEnglishNo. of seasons5No. of episodes47 (+8 specials) (list of episodes)ProductionExecutive producersMichelle Simunovic Monina VeranoProducerJulia GrimmRunning time22 minutesProduction companiesS...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!