Допасованість (статистика)

Допасо́ваність[1] (англ. goodness of fit) статистичної моделі описує, наскільки добре її допасовано до набору спостережень. Міри допасованості зазвичай роблять підсумок незгідності між спостережуваними значеннями та значеннями, очікуваними за моделі, що розглядають. Такі міри можливо використовувати в перевірці статистичних гіпотез, наприклад, для перевірки нормальності залишків, для перевірки того, чи дві вибірки вибрано з ідентичних розподілів (див. критерій Колмогорова — Смирнова), чи для перевірки того, чи слідують виходові частоти певному розподілові (див. критерій хі-квадрат Пірсона). В дисперсійному аналізі однією зі складових, на яку розбивають дисперсію, може бути сума квадратів браку допасованості[en].

Допасованість розподілів

При оцінюванні того, чи підходить даний розподіл до набору даних, можливо використовувати наступні критерії та міри допасованості, що лежать в їх основі:

Регресійний аналіз

В регресійному аналізі до допасованості мають стосунок такі предмети:

Категорійні дані

Далі наведено приклади, що виникають у контексті категорійних даних.

Критерій хі-квадрат Пірсона

Критерій хі-квадрат Пірсона використовує міру допасованості, яка є сумою різниць між спостережуваними та очікуваними виходовими частотами (тобто, кількостями спостережень), кожну з яких піднесено до квадрату, й поділено на очікувану:

де

Oi = спостережувана кількість для засіку (англ. bin) i
Ei = очікувана кількість для засіку i, підтримувана нульовою гіпотезою.

Очікувану частоту обчислюють як

де

F = кумулятивна функція розподілу ймовірності для розподілу ймовірності, що перевіряють.
Yu = верхня (англ. upper) межа класу i,
Yl = нижня (англ. lower) межа класу i,
N = розмір вибірки

Отримуване в результаті значення можливо порівнювати з розподілом хі-квадрат для визначення допасованості. Розподіл хі-квадрат має (kc) ступенів вільності, де k є числом не порожніх комірок, а c є числом оцінюваних параметрів розподілу (включно з параметрами положення, масштабу та форми) плюс один. Наприклад, для 3-параметрового розподілу Вейбула, c = 4.

Приклад: однакові частоти чоловіків та жінок

Наприклад, щоби перевірити гіпотезу, що випадкову вибірку зі 100 людей вибрано із сукупності, в якій чоловіки та жінки є рівними за частотою, спостережуване число чоловіків та жінок порівнюватиметься з теоретичними частотами 50 чоловіків та 50 жінок. Якщо в вибірці було 44 чоловіки та 56 жінок, то

Якщо нульова гіпотеза є істинною (тобто, чоловіків та жінок вибирають з рівною частотою у вибірці), то перевірну статистику вибиратимуть з розподілу хі-квадрат з одним ступенем вільності. І хоча можна було би очікувати двох ступенів вільності (по одному для чоловіків та жінок), ми мусимо враховувати те, що загальне число чоловіків та жінок є обмеженим (100), і відтак є лише один ступінь вільності (2 − 1). Або ж, якщо кількість чоловіків є відомою, то кількість жінок є визначеною, і навпаки.

Результат звернення до розподілу хі-квадрат для 1 ступеню вільності показує, що ймовірність спостереження цієї відмінності (або екстремальнішої за цю), якщо чоловіки та жінки є однаково численними в генеральній сукупності, становить приблизно 0.23. Ця ймовірність є вищою за загальноприйнятий критерій статистичної значущості (.001-.05), тож звичайно ми не відкидатимемо нульову гіпотезу про те, що число чоловіків у сукупності є таким же, як і число жінок (тобто, ми розглядатимемо нашу вибірку як таку, що знаходиться в межах того, що ми би очікували для співвідношення чоловіків/жінок 50/50).

Зверніть увагу на припущення, що механізм, який породив цю вибірку, є випадковим, в сенсі незалежного випадкового вибирання з однаковою ймовірністю, тут 0.5 як для чоловіків, так і для жінок. Якщо ж, наприклад, кожен з обраних 44 чоловіків приведе приятеля-чоловіка, й кожна з обраних 56 жінок приведе приятельку-жінку, то кожне збільшиться в 4 рази, тоді як кожне збільшиться в 2 рази. Значення цієї статистики подвоїться до 2.88. Знаючи цей внутрішній механізм, ми, звісно, повинні були би рахувати пари. В загальному випадку, якщо механізм не є обґрунтовано випадковим, він буде невідомим. Розподіл, до якого повинно бути віднесено перевірну статистику, може, відповідно, дуже відрізнятися від розподілу хі-квадрат.[5]

Біноміальний випадок

Біноміальний експеримент є послідовністю незалежних проб, у якій проби можуть призводити в результаті до двох виходів, успіху чи відмови. Є n проб, кожна з імовірністю успіху, позначуваною через p. Якщо npi ≫ 1 для кожного i (де i = 1, 2, ..., k), то

Це приблизно має розподіл хі-квадрат з k − 1 ступенями вільності. Той факт, що ступенів вільності є k − 1, є наслідком обмеження . Ми знаємо, що є k спостережуваних лічильників клітин, проте щойно стають відомими будь-які k − 1, то один, що лишився, визначається однозначно. В принципі, можна сказати, що є лише k − 1 лічильників клітин, що визначаються вільно, звідси k − 1 ступенів вільності.

G-критерій

G-критерії[en] є перевірками статистичної значущості відношенням правдоподібностей, які все ширше застосовують у ситуаціях, в яких раніше радили критерії хі-квадрат Пірсона.[6]

Загальною формулою G є

де та є тим же, що й для критерію хі-квадрат, позначує натуральний логарифм, а суму беруть над усіма не порожніми комірками. Крім того, загальна спостережена кількість повинна дорівнювати загальній очікуваній кількості:де є загальним числом спостережень.

G-критерії почали радити щонайменше починаючи з випуску популярного статистичного підручника Роберта Р. Сокала[en] та Ф. Джеймса Рольфа[en] 1981 року.[7]

Див. також

Примітки

  1. goodness of fit // Англійсько-українсько-англійський словник наукової мови (фізика та споріднені науки). Частина ІІ українсько-англійська / уклад. О. Кочерга, Є. Мейнарович. — 2010.
  2. Liu, Qiang; Lee, Jason; Jordan, Michael (20 червня 2016). A Kernelized Stein Discrepancy for Goodness-of-fit Tests. Proceedings of the 33rd International Conference on Machine Learning. The 33rd International Conference on Machine Learning. New York, New York, USA: Proceedings of Machine Learning Research. с. 276—284. Архів оригіналу за 1 серпня 2020. Процитовано 18 квітня 2020. (англ.)
  3. Chwialkowski, Kacper; Strathmann, Heiko; Gretton, Arthur (20 червня 2016). A Kernel Test of Goodness of Fit. Proceedings of the 33rd International Conference on Machine Learning. The 33rd International Conference on Machine Learning. New York, New York, USA: Proceedings of Machine Learning Research. с. 2606—2615. Архів оригіналу за 17 лютого 2020. Процитовано 18 квітня 2020. (англ.)
  4. Zhang, Jin (2002). Powerful goodness-of-fit tests based on the likelihood ratio (PDF). J. R. Stat. Soc. B. 64: 281—294. Архів оригіналу (PDF) за 23 листопада 2018. Процитовано 5 листопада 2018. (англ.)
  5. Maindonald, J. H.; Braun, W. J. (2010). Data Analysis and Graphics Using R. An Example-Based Approach (вид. Third). New York: Cambridge University Press. с. 116—118. ISBN 978-0-521-76293-9. (англ.)
  6. McDonald, J.H. (2014). G–test of goodness-of-fit. Handbook of Biological Statistics (вид. Third). Baltimore, Maryland: Sparky House Publishing. с. 53—58. Архів оригіналу за 26 травня 2020. Процитовано 18 квітня 2020. (англ.)
  7. Sokal, R. R.; Rohlf, F. J. (1981). Biometry: The Principles and Practice of Statistics in Biological Research (вид. Second). W. H. Freeman[en]. ISBN 0-7167-2411-1. (англ.)

Література

Read other articles:

ギメ東洋美術館Musée national des Arts asiatiques-Guimet パリ内の位置施設情報専門分野 アジア美術開館 1879年所在地 フランス パリ 6, place d'Iéna 75116 Paris位置 北緯48度51分55秒 東経2度17分38秒 / 北緯48.86528度 東経2.29389度 / 48.86528; 2.29389アクセス イエナ駅外部リンク 公式ウェブサイトプロジェクト:GLAMテンプレートを表示 ギメ東洋美術館(ギメとうようびじゅつか...

 

Coordenadas: 26° 30' N, 80° 3' W Briny Breezes Localidade dos Estados Unidos Briny Breezes Localização de Briny Breezes na Flórida Briny Breezes Localização de Briny Breezes nos Estados Unidos Dados gerais Incorporado em 1963 (60 anos)[1] Prefeito Roger Bennett[1] Localização 26° 30' 32 N 80° 3' 15 O Condado Palm Beach Estado  Flórida Tipo de localidade Vila Fuso horário -5/-4 Características geográficas Área 0,28 km² - terra 0,18 km² - água 0,...

 

Estádio Major Antônio Couto Pereira De harde kern: Império Alviverde Plaats Curitiba, Brazilië Capaciteit 37.182 Geopend 20 november, 1932 Bespelers Coritiba Eerste wedstrijd Coritiba - America-RJ 4-2 Gerenoveerd 1958, 2005 Veldafmetingen 109 x 72 Portaal    Sport Hoofdtribune in het oosten De lange kant tegenover de hoofdtribune en de Mauá Het Estádio Major Antônio Couto Pereira, of simpelweg Couto Pereira is het thuisstadion van Coritiba uit de Braziliaanse stad Curitiba in...

غيرهارد روزباخ معلومات شخصية الميلاد 28 فبراير 1893  الوفاة 30 أغسطس 1967 (74 سنة)   هامبورغ  مواطنة ألمانيا  الحياة العملية المهنة عسكري،  وسياسي  الحزب الحزب النازي  اللغات الألمانية  الخدمة العسكرية الرتبة جندي  المعارك والحروب الحرب العالمية الأولى  تع

 

Deutsche Bank CenterInformasi umumStatusSelesaiLokasi10 Columbus CircleNew York City, ASKoordinat40°46′08″N 73°58′59″W / 40.76889°N 73.98306°W / 40.76889; -73.98306Koordinat: 40°46′08″N 73°58′59″W / 40.76889°N 73.98306°W / 40.76889; -73.98306Penyewa sekarangDeutsche BankMulai dibangun2 November 2000Rampung2003Pembukaan5 Februari 2004Biaya$1.8 miliarTinggiAtap750 ft (230 m)Data teknisJumlah lantai55[1]Des...

 

Dutch painter and engraver This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Salomon Koninck – news · newspapers · books · scholar · JSTOR (February 2016) (Learn how and when to remove this template message) The Hermit by Salomon Koninck The Annunciation by Salomon Koninck. Oil on canvas,1655. Hallwyl Museum. ...

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (يونيو 2022) إسهال الرضع المزمن Chronic diarrhea of infancy معلومات عامة من أنواع إسهال مزمن  [لغات أخرى]‏  تعديل مصدري - تعديل   إسهال الرضع المزمن ويُعرف باسم إسهال الطفل

 

Naphtali ist eine Weiterleitung auf diesen Artikel. Zum deutschen Kaufmann und späteren israelischen Finanzminister siehe Fritz Naphtali. Zwölf Stämme Israels Ruben Simeon Levi Juda Dan Naftali Gad Ascher Issachar Sebulon Josef Manasse Ephraim Benjamin Naftali (hebräisch נַפְתָּלִי naftāli) war der sechste Sohn Jakobs und der zweite mit Bilha, der Leibmagd Rahels (Gen 35,25 EU). Naftali ist einer der zwölf Stammväter Israels. Inhaltsverzeichnis 1 Name 2 Stamm 3 Stammesti...

 

Collection of works by Michel de Montaigne Essays Cover, circa 1588.AuthorMichel de MontaigneOriginal titleEssaisCountryKingdom of FranceLanguageMiddle FrenchGenreEssayPublisherSimon Millanges, Jean RicherPublication dateMarch 1580TextEssays at Wikisource The Essays (French: Essais, pronounced [esɛ]) of Michel de Montaigne are contained in three books and 107 chapters of varying length. They were originally written in Middle French and were originally published in the Kingdom of...

Улица Мукусаласлатыш. Mūkusalas iela Общая информация Страна  Латвия Город Рига Исторический район Торнякалнс, Зиепниеккалнс Протяжённость 4081 м Прежние названия Мукенгольмская,Оскара (Оскаровская), Радиотехникас  Медиафайлы на Викискладе Улица Му́кусалас (латыш. Mūkusalas ...

 

Armenian comedian Garik MartirosyanBorn (1974-02-14) February 14, 1974 (age 49)Yerevan, Armenian SSR, Soviet UnionNationalityArmenianYears active1996–presentGenresStand-up, Sketch comedySpouseZhanna Levina Garik Yurievich Martirosyan (Russian: Гарик Юрьевич Мартиросян, Armenian: Գարիկ Մարտիրոսյան; born February 13, 1974) is a Russia-based Armenian entertainer, comedian, TV host, actor and singer. He is the co-producer and host of the Comedy Club Ru...

 

2019 Nigerian romantic comedy film KasanovaDirected byOluseyi AsurfWritten byTomi AdesinaUgochukwu IsrealOluseyi AsurfProduced byEddy YoungStarringWale OjoIretiola DoyleToyin AbrahamCinematographyKagho IdheborProductioncompanyFojo MediaRelease date 13 September 2019 (2019-09-13) Running time115 minutesCountryNigeriaLanguageEnglish Kasanova is a 2019 Nigerian romantic comedy film directed by Oluseyi Asurf and produced by Eddy Young with Faith Ojo as its Executive Producer. The f...

Type of long-term human memory Explicit memory (or declarative memory) is one of the two main types of long-term human memory, the other of which is implicit memory. Explicit memory is the conscious, intentional recollection of factual information, previous experiences, and concepts.[1] This type of memory is dependent upon three processes: acquisition, consolidation, and retrieval.[2][3] Explicit memory can be divided into two categories: episodic memory, which stores...

 

Her ExcellencyKamala HarrisPotret resmi, 2021Wakil Presiden Amerika Serikat ke-49PetahanaMulai menjabat 20 Januari 2021PresidenJoe BidenPendahuluMike PenceSenator Amerika Serikat dari CaliforniaMasa jabatan3 Januari 2017 – 18 Januari 2021PendahuluBarbara BoxerPenggantiAlex PadillaJaksa Agung California ke-32Masa jabatan3 Januari 2011 – 3 Januari 2017GubernurJerry BrownPendahuluJerry BrownPenggantiXavier BecerraJaksa Distrik San Francisco ke-27Masa jabatan8 Januari 20...

 

TV series or program FartsaGenreCrime dramaPsychological thrillerDirected byEgor BaranovStarringAlexander PetrovYevgeny StychkinAleksei SerebryakovComposerPavel EseninNo. of seasons1No. of episodes8ProductionProducersAlexander TsekaloRuslan SorokinIvan SamokhvalovRunning time50–52 minutesProduction companySredaOriginal releaseNetworkC1R (season 1)Nikolai Bulygin (season 2)Maksim Polinsky (season 2)Igor Tverdokhlebov (season 2)Release30 January 2015 (2015-25-30) Fart (Rus...

Overview about the modern searches for Lorentz violation See also: Tests of special relativity Measurements on light from gamma-ray bursts show that the speed of light does not vary with energy Modern searches for Lorentz violation are scientific studies that look for deviations from Lorentz invariance or symmetry, a set of fundamental frameworks that underpin modern science and fundamental physics in particular. These studies try to determine whether violations or exceptions might exist for ...

 

Albert Séguin Medallista olímpico Datos personalesNacimiento Isère,  Francia8 de marzo de 1891Nacionalidad(es) FrancésFallecimiento Villefranche-sur-Saône, Ródano,  Francia29 de mayo de 1948 (57 años)Carrera deportivaDeporte Gimnasia artística               Medallero París 1924, salto de potro lateral París 1924, escalado de cuerda París 1924, selección nacional [editar datos en Wikidata]...

 

Poem in Latin by Roman poet Ovid Remedia Amoris (Love's Remedy or The Cure for Love) [c. 2 AD] is an 814-line poem in Latin by Roman poet Ovid. In this companion poem to The Art of Love, Ovid offers advice and strategies to avoid being hurt by love feelings, or to fall out of love, with a stoic overtone. Genre Remedia Amoris fell into the Hellenistic category of didactic poetry, often carried out on mock-solemn subjects.[1] Goal and methods Ovid's goal was to provide, for men an...

1941 mass killing of ethnic Romanians by Soviet troops at the Romanian–Soviet border Lunca massacreLunca massacre (Ukraine)LocationLunca, Ukrainian SSR, Soviet Union (now Lunka, Ukraine)Coordinates48°10′50″N 26°19′40″E / 48.18056°N 26.32778°E / 48.18056; 26.32778Date7 February 1941 (CET)Targetethnic Romanians attempting to cross the border from the Soviet Union into RomaniaVictimsHundreds[1] (at least 600)PerpetratorsSoviet Border Troops The Lunca...

 

French TV journalist and documentary filmmaker Marie-Monique RobinMarie-Monique Robin in 2009Born15 June 1960Gourgé, Poitou-Charentes, FranceOccupation(s)TV journalist and documentary filmmaker Marie-Monique Robin (born 15 June 1960, Poitou-Charentes) is a French TV journalist and documentary filmmaker. She generally issues books and documentary films together on the topics she investigates, in order to make more people aware of the issues she studies. Her work has been recognized by numerou...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!