Індуктивна статистика (англ.statistical inference) — це процес застосування аналізу даних для встановлення властивостей розподілу ймовірностей, який лежить в їх основі.[1] Індуктивна статистика робить висновки про властивості генеральної сукупності, наприклад, шляхом перевірки гіпотез та отримування оцінок. Він виходить з припущення, що спостережувані дані є вибіркою з більшої сукупності.
Індуктивну статистику[2] (англ.inferential statistics) можливо протиставляти описовій статистиці. Описова статистика цікавиться виключно властивостями спостережуваних даних, і не спирається на припущення, що ці дані походять із більшої сукупності.
Передмова
Індуктивна статистика створює інформацію про генеральну сукупність, використовуючи дані, вибрані з цієї сукупності за допомогою якогось виду відбору. Для заданої гіпотези про генеральну сукупність, про яку ми хочемо робити висновки, статистичне висновування складається з (по-перше) обираннястатистичної моделі процесу, що породжує ці дані, та з (по-друге) виведення висловлень з цієї моделі.[джерело?]
Конісі та Кітагава стверджують, що «більшість задач індуктивної статистики можливо розглядати як задачі, пов'язані зі статистичним моделюванням».[3] Стосовно цього Девід Кокс[en] сказав, що «як саме здійснюється [цей] переклад із предметної задачі до статистичної моделі, є часто найкритичнішою частиною аналізу.»[4]
Висновком статистичного висновування є статистичне висловлення.[5] Деякими з поширених видів статистичних висловлень є наступні:
точкова оцінка, тобто певне значення, що найкраще наближує деякий досліджуваний параметр;
інтервальна оцінка[en], наприклад, довірчий інтервал (або множинна оцінка), тобто інтервал, побудований з використанням набору даних, вибраного з генеральної сукупності, так, що при повторюваному відборі таких наборів даних такі інтервали міститимуть істинне значення параметру з імовірністю на заданому довірчому рівні;
імовірний інтервал, тобто множина значень, що містить, наприклад, 95% апостеріорного переконання;
Статистичне висновування вимагає деяких припущень. Статисти́чна моде́ль є набором гіпотез стосовно породження спостережуваних даних, та схожих на них. Описи статистичних моделей зазвичай підкреслюють роль досліджуваних величин генеральних сукупностей, стосовно яких ми хочемо робити висновки.[6] Як підготовчий крок перед отриманням формальніших висновків, як правило, використовують описову статистику.[7]
Рівні моделей гіпотез
Статистики розрізняють три рівні моделювальних припущень:
Повністю параметричний[en]: Розподіли ймовірностей, що описують процес породження даних, вважають повністю описаними сімейством розподілів імовірності, що включають лише обмежену кількість невідомих параметрів.[8] Наприклад, можна припустити, що розподіл значень генеральної сукупності є істинно нормальним, з невідомими середнім значенням та дисперсією, і що набори даних породжуються «простим» випадковим вибиранням[en]. Широко застосовуваним та гнучким класом параметричних моделей є узагальнені лінійні моделі[en].
Непараметричний[en]: Припущення стосовно процесу, що породжує дані, є значно меншими, ніж у параметричній статистиці, й можуть бути мінімальними.[9] Наприклад, кожен безперервний розподіл імовірності має медіану, яку може бути оцінено з використанням медіани вибірки, або оцінки Ходжеса — Лемана — Сена[en], що має гарні властивості, коли дані походять з простого випадкового відбору.
Напівпараметричний[en]: Під цим терміном зазвичай мають на увазі припущення «посередині» між повністю параметричним та непараметричним підходами. Наприклад, можна припустити, що розподіл генеральної сукупності має скінченне середнє значення. Крім того, можна припустити, що рівень чутливості середнього значення в генеральній вибірці залежить істинно лінійним чином від деякої коваріати (параметричне припущення), але не робити жодного параметричного припущення, що описувало би дисперсію навколо цього середнього значення (тобто, про наявність або можливий вигляд будь-якої гетероскедастичності). Загальніше, напівпараметричні моделі часто можливо розділити на «структурну» складову, та складову «випадкової дисперсії». Одну складову обробляють параметрично, а іншу — непараметрично. Добре відома модель Кокса[en] є набором напівпараметричних припущень.
Якого б рівня припущення не робилися, правильно відкаліброване висновування в цілому вимагає, щоби ці припущення були правильними, тобто, щоби механізми породжування даних дійсно було вказано правильно.
Неправильні припущення про «просте» випадкове вибирання[en] можуть зробити статистичне висновування нечинним. Наприклад, неправильне припущення про модель Кокса може в деяких випадках призвести до хибних висновків.[10] Неправильні припущення про нормальність в генеральній сукупності також позбавляють чинності деякі види висновування на основі регресії.[11] Використання будь-якої параметричної моделі розглядається скептично більшістю експертів у відборі вибірок з людських сукупностей: «більшість статистиків, що роблять вибірки, коли мають справу з довірчими проміжками взагалі, то обмежують себе твердженнями [про оцінки] на основі дуже великих вибірок, коли центральна гранична теорема гарантує, що [оцінки] матимуть розподіли, що є майже нормальними».[12] Зокрема, нормальний розподіл «був би абсолютно нереалістичним та катастрофічно нерозумним припущенням, якщо ми маємо справу з будь-яким типом економічної генеральної сукупності».[12] Тут центральна гранична теорема стверджує, що розподіл середнього значення вибірки «для дуже великих вибірок» є розподіленим приблизно нормально, якщо цей розподіл має не повільно спадний хвіст[en].
Для нескінченно великих вибірок граничний розподіл вибіркової статистики, якщо такий існує, описують граничні результати[en], такі як центральна гранична теорема. Граничні результати не є твердженнями про скінченні вибірки, і дійсно є недоречними для них.[17][18][19] Тим не менш, асимптотичну теорію граничних розподілів часто залучають для роботи зі скінченними вибірками. Наприклад, граничні результати часто залучають для обґрунтування узагальненого методу моментів[en] та для використання узагальнених оцінювальних рівнянь[en], що є популярними в економетрії та біологічній статистиці. Величину різниці між граничним та істинним розподілами (формально, «похибку» апроксимації) може бути оцінено із застосуванням симуляції.[20] Евристичне застосування граничних результатів до скінченних вибірок є поширеною практикою в багатьох застосуваннях, особливо з моделями невисокої розмірності з логарифмічно угнутимиправдоподібностями (такими як однопараметричні експоненційні сімейства[en]).
Об'єктивна рандомізація дозволяє правильні індуктивні процедури.[27][28][29][30][31] Багато статистиків віддають перевагу аналізу на основі рандомізації для даних, що було породжено чітко визначеними рандомізаційними процедурами.[32] (Тим не менше, правдою є й те, що в галузях науки із розвиненими теоретичними знаннями та керуванням експериментами рандомізовані експерименти можуть збільшувати витрати на експериментування без поліпшення якості висновків.[33][34]) Так само, результати рандомізованих експериментів рекомендуються провідними статистичними органами як такі, що можуть уможливлювати висновування з більшою надійністю, ніж спостережні дослідження тих самих явищ.[35] Тим не менше, добре спостережне дослідження може бути кращим за поганий рандомізований експеримент.
Статистичний аналіз рандомізованого експерименту може ґрунтуватися на схемі рандомізації, визначеній у протоколі експерименту, і не потребує суб'єктивної моделі.[36][22]
Проте, як би там не було, деякі гіпотези неможливо перевіряти із застосуванням об'єктивних статистичних моделей, що точно описують рандомізовані експерименти або випадкові вибірки. В деяких випадках такі рандомізовані дослідження є неекономічними або неетичними.
Аналіз рандомізованих експериментів на основі моделей
Стандартною практикою при аналізі даних з рандомізованих експериментів є посилатися на статистичну модель, наприклад, лінійну або логістичну.[37] Проте схема рандомізації направляє обирання статистичної моделі. Неможливо вибрати підхожу модель, не знаючи схеми рандомізації.[22] Ігноруючи протокол експерименту при аналізі даних з рандомізованих експериментів, можна отримати небезпечно оманливі результати; поширені помилки включають забування блокування, що використовується в експерименті, та сплутування повторюваних вимірювань на одній і тій же експериментальній одиниці з незалежними повторами обробки, застосовуваної до різних експериментальних одиниць.[38]
Безмодельне рандомізоване висновування
Безмодельні методики забезпечують доповнення до методів на основі моделей, які застосовують редукціоністські стратегії спрощування дійсності. Перші ж поєднують, розвивають, комбінують та тренують алгоритми динамічно, пристосовуючись до контекстних спорідненостей процесу, та навчаючись характеристик, притаманних спостереженням.[37][39]
Наприклад, безмодельна проста лінійна регресія ґрунтується або на
випадковім плануванні, в якому пари спостережень є незалежними та однаково розподіленими (н. о. р.), або на
детермінованім плануванні, в якому пари спостережень є детермінованими, але відповідні змінні відгуку є випадковими та незалежними зі спільним умовним розподілом, тобто, , що є незалежним від індексу .
В кожному з випадків безмодельне рандомізоване висновування для ознак спільного умовного розподілу покладається на певні умови регулярності, наприклад, функційної гладкості. Наприклад, безмодельне рандомізоване висновування для ознаки сукупності умовне середнє, , може бути послідовно оцінено через локальне усереднювання або локальне поліноміальне допасовування, за припущення, що є гладкою. Також, покладаючись на асимптотичну нормальність або перевибірку[en], ми можемо будувати довірчі проміжки для ознаки сукупності, в цьому випадку, умовного середнього.[40]
Парадигми висновування
Було засновано різні школи статистичного висновування. Ці школи, або «парадигми», не є взаємовиключними, і методи, що добре працюють за однієї парадигми, часто мають привабливі інтерпретації за інших парадигм.
Бандіопадхай та Форстер[41] описують чотири парадигми: «(I) класичні статистики або статистики похибок, (II) баєсові статистики, (III) статистики на основі правдоподібностей, та (IV) статистики на основі інформаційного критерію Акаіке». Огляд класичної (або частотницької) парадигми, баєсової парадигми, правдоподібницької парадигми, та парадигми на основі інформаційного критерію Акаіке наведено нижче.
Ця парадигма калібрує слушність висловлень шляхом розгляду (релевантного) повторюваного відбору з розподілу сукупності для вироблення наборів даних, подібних до наявного. Шляхом розгляду характеристик цього набору даних на повторюваних вибірках може бути отримано кількісну оцінку частотницьких властивостей статистичного висловлення, хоча на практиці таке кількісне оцінювання може бути складним завданням.
Частотницьке висновування, об'єктивність та теорія рішень
Однією з інтерпретацій частотницького висновування (або класичного висновування) є те, що воно є застосовним лише в термінах частотницької ймовірності, тобто в термінах повторюваних вибірок із генеральної сукупності. Проте підхід Неймана[42] розвиває ці процедури в термінах преекспериментальних імовірностей. Тобто, перш ніж приступати до експерименту, ухвалюють рішення про правило, як приходити до висновку, так що ймовірність бути правильними контролюється зручним чином: такій імовірності не потрібно мати частотницьку інтерпретацію, або інтерпретацію повторного відбору. На противагу, баєсове висновування працює в термінах умовних імовірностей (тобто ймовірностей, обумовлених спостережуваними даними), порівнюваних із відособленими (але обумовленими невідомими параметрами) ймовірностями, що застосовуються в частотницькому підході.
Хоча статистики, що використовують частотницьке висновування, і повинні обирати для себе параметри, що їх цікавлять, та оцінки/критерії, які застосовувати, відсутність очевидно явних функцій корисності та апріорних розподілів посприяла тому, що частотницькі процедури стали широко розглядатися як «об'єктивні».[44]
Баєсове числення описує міри переконання із застосуванням «мови» ймовірності; переконання є додатними, інтегруються в одиницю, та підкоряються аксіомам імовірності. Баєсове висновування використовує доступні апостеріорні переконання як основу для створення статистичних висловлень. Існує декілька різних обґрунтувань застосування баєсового підходу.
Баєсове висновування, суб'єктивність та теорія рішень
Багато неформальних баєсових висновувань ґрунтуються на «інтуїтивно розумних» зведенняхапостеріорного. Наприклад, як такі може бути обґрунтовано апостеріорне середнє, медіану та моду, проміжки найвищої густини апостеріорного та коефіцієнти Баєса. І хоча в цьому типі висновування й не потрібно вказувати користувацьку функцію корисності, ці зведення всі залежать (певною мірою) від вказаних апріорних переконань, і загалом розглядаються як суб'єктивні висновки. (Було запропоновано методи побудови апріорного, що не вимагають зовнішнього введення, але їх ще не було повністю розроблено.)
Формально баєсове висновування калібрується із посиланням на явно вказану функцію корисності, або втрат; «правило Баєса» є таким, що максимізує очікувану корисність, усереднену над невизначеністю апостеріорного. Формальне баєсове висновування відтак автоматично пропонує оптимальні рішення в розумінні теорії рішень. При заданих припущеннях, даних та корисності баєсове висновування може бути зроблено практично для будь-якої задачі, хоча не кожному статистичному висновуванню потрібно мати баєсову інтерпретацію. Аналізи, що не є формально баєсовими, можуть бути (логічно) незв'язними[en]; особливість баєсових процедур, що використовують коректні апріорні (тобто такі, що інтегруються до одиниці), полягає в тому, що вони гарантовано будуть зв'язними[en]. Деякі прихильники баєсового висновування стверджують, що висновування мусить мати місце в цій теоретичній моделі рішень, і що баєсове висновування не повинне завершуватися оцінкою та узагальненням апостеріорних переконань.
Правдоподібництво підходить до статистики з використанням функції правдоподібності. Деякі правдоподібники відкидають висновування, розглядаючи статистику лише як обчислювання підтримки свідченнями. Інші, проте, пропонують висновування на основі функції правдоподібності, найвідомішим з яких є оцінювання максимальною правдоподібністю.
Висновування на основі інформаційного критерію Акаіке
Інформаційний критерій Акаіке (ІКА, англ.Akaike information criterion, AIC) — це оцінювач відносної якості статистичних моделей для заданого набору даних. Для заданого набору моделей для цих даних ІКА оцінює якість кожної з них, по відношенню до кожної іншої з цих моделей. Таким чином, ІКА забезпечує засоби обирання моделі.
ІКА ґрунтується на теорії інформації: він пропонує оцінку відносних втрат інформації при застосуванні заданої моделі для представлення процесу, що породив дані. (Роблячи це, він працює на компромісом між допасованістю моделі та її простотою.)
Принцип мінімальної довжини опису (МДО, англ.minimum description length, MDL) було розроблено з ідей із теорії інформації[45] та теорії колмогоровської складності.[46] Принцип МДО обирає статистичні моделі, що максимально стискають дані; висновування відбувається без розгляду «механізмів породження даних» або моделей ймовірності, що суперечать даним або є неспростовними, як це може робитися в частотницькому або баєсовому підходах.
Розвиваючи ідеї Фішера та Пітмана з 1938 по 1939 рік,[54]Джордж Барнард[en] розробив «структурне висновування» (англ.structural inference) або «центральне висновування» (англ.pivotal inference),[55] підхід, що використовує інваріантні ймовірності на групових сімействах[en] (англ.group family). Барнард переформулював аргументацію, що стояла за фідуційним висновуванням, на обмеженому класі моделей, на якому «фідуційні» процедури були би добре визначеними та корисними.
Питання висновування
Наведені нижче питання зазвичай включаються до царини статистичного висновування.
↑van der Vaart, A.W. (1998) Asymptotic Statistics Cambridge University Press. ISBN 0-521-78450-6 (page 341) (англ.)
↑Freedman, D.A.[en] (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Reprinted as Chapter 11 (pages 169–192) of Freedman (2010)). (англ.)
↑Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5(англ.)
↑ абBrewer, Ken (2002). Combined Survey Sampling Inference: Weighing of Basu's Elephants. Hodder Arnold. с. 6. ISBN978-0340692295. (англ.)
↑ абJörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399 (англ.)
↑Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press. (англ.)
↑Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer. ISBN978-0-387-73193-3. (англ.)
↑Kolmogorov, 1963, С. 369: «Частотницький підхід, що ґрунтується на понятті граничної частоти при кількості проб, що прямує до нескінченності, не дозволяє обґрунтувати застосовність результатів теорії ймовірностей до практичних задач, в яких ми маємо справу зі скінченним числом проб».
↑Le Cam, 1986, С. xiv: «Дійсно, граничні теореми „при n, що прямує до нескінченності“, є логічно позбавленими змісту про те, що відбувається за будь-якого конкретного n. Все, що вони можуть,— це запропонувати певні підходи, чия продуктивність повинна підлягати перевірці для випадків, що є під рукою.».
↑Pfanzagl, 1994, «Вирішальний недолік асимптотичної теорії: Що ми очікуємо від асимптотичної теорії, це результати, які мають силу приблизно… Що асимптотична теорія може запропонувати, це граничні теореми.» (С. ix) «Що має значення для застосувань, це наближення, а не границі.» С. 188.
↑Pfanzagl, 1994, «Беручи граничну теорему як приблизно істинну для великих розмірів вибірок, ми привносимо похибку, розмір якої є невідомим. […] Реалістичну інформацію про залишкові похибки можна отримувати з симуляцій.» С. ix.
↑ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website)
David A. Freedman et alia's Statistics.
Moore et al. (2015).
(англ.)
↑Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska[en] and Terence P. Speed. (англ.)
↑Bandyopadhyay та Forster, 2011, Цитату взято зі вступу до книги (С.3). Див. також «Section III: Four Paradigms of Statistics»..
↑Neyman, J. (1937). Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability. Philosophical Transactions of the Royal Society of London A. 236 (767): 333—380. doi:10.1098/rsta.1937.0005. JSTOR91337. (англ.)
↑Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR1403482(англ.)
↑Broemeling, Lyle D. (1 листопада 2011). An Account of Early Statistical Inference in Arab Cryptology. The American Statistician. 65 (4): 255—257. doi:10.1198/tas.2011.10191. (англ.)
Джерела
Bandyopadhyay, P. S.; Forster, M. R., ред. (2011), Philosophy of Statistics, Elsevier(англ.)
Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical statistics: Basic and selected topics. Т. 1 (вид. Second (updated printing 2007)). Prentice Hall. ISBN978-0-13-850363-5. MR0443141. (англ.)
Freedman, D. A.[en] (2010). Statistical Models and Causal Inferences: A Dialogue with the Social Sciences (Edited by David Collier, Jasjeet S. Sekhon, and Philip B. Stark), Cambridge University Press. (англ.)
Hampel, Frank (Feb 2003). The proper fiducial argument(PDF) (Research Report No. 114). Архів оригіналу(PDF) за 10 травня 2017. Процитовано 29 березня 2016. (англ.)
(1878 March), "The Doctrine of Chances", Popular Science Monthly, v. 12, March issue, pp. 604 [Архівовано 20 серпня 2020 у Wayback Machine.]–615. Internet ArchiveEprint. (англ.)
(1878 April), "The Probability of Induction", Popular Science Monthly, v. 12, pp. 705 [Архівовано 5 грудня 2015 у Wayback Machine.]–718. Internet ArchiveEprint. (англ.)
(1878 June), "The Order of Nature", Popular Science Monthly, v. 13, pp. 203 [Архівовано 19 серпня 2020 у Wayback Machine.]–217.Internet ArchiveEprint. (англ.)
(1878 August), "Deduction, Induction, and Hypothesis", Popular Science Monthly, v. 13, pp. 470 [Архівовано 19 серпня 2020 у Wayback Machine.]–482. Internet ArchiveEprint. (англ.)
Reid, N.; Cox, D. R. (2014). On Some Principles of Statistical Inference. International Statistical Review. 83 (2): 293—308. doi:10.1111/insr.12067. (англ.)
Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8(англ.)
В іншому мовному розділі є повніша стаття Statistical inference(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою перекладу з англійської. (липень 2022)
Перекладач повинен розуміти, що відповідальність за кінцевий вміст статті у Вікіпедії несе саме автор редагувань. Онлайн-переклад надається лише як корисний інструмент перегляду вмісту зрозумілою мовою. Не використовуйте невичитаний і невідкоригований машинний переклад у статтях української Вікіпедії!
Машинний переклад Google є корисною відправною точкою для перекладу, але перекладачам необхідно виправляти помилки та підтверджувати точність перекладу, а не просто скопіювати машинний переклад до української Вікіпедії.
Не перекладайте текст, який видається недостовірним або неякісним. Якщо можливо, перевірте текст за посиланнями, поданими в іншомовній статті.