Ба́єсова ймові́рність (англ.Bayesian probability) — це одна з інтерпретацій поняття ймовірності. На протилежність до інтерпретування ймовірності як «частоти» або «схильності»[en] певного явища, баєсова ймовірність є величиною, що ми визначаємо з метою представлення стану знання[1] або переконання.[2] З баєсової точки зору ймовірність призначається гіпотезі, тоді як згідно з частотницькою точкою зору гіпотеза зазвичай перевіряється, не маючи призначеної ймовірності.
Баєсова ймовірність належить до категорії доказових імовірностей; для обчислення ймовірності гіпотези фахівець із баєсової статистики встановлює певну апріорну ймовірність, що потім уточнюється у світлі нових, доречних даних (свідчень).[3] Баєсова інтерпретація забезпечує стандартний набір процедур та формул для виконання цього обчислення.
Термін «баєсова» походить від математика та теолога XVIII сторіччя Томаса Баєса, що запропонував перший математичний підхід до нетривіальної задачі баєсового висновування.[4] Математик П'єр-Симон Лаплас започаткував та популяризував те, що тепер називається баєсовою ймовірністю.[5]
Загалом кажучи, існує два погляди на баєсову ймовірність, що інтерпретують поняття ймовірність різним чином. Згідно з об'єктивістським підходом, правила баєсової статистики може бути підтверджено вимогами раціональності та відповідності[en], та інтерпретовано як розширення логіки.[1][6] Згідно з суб'єктивістським підходом, ймовірність визначає «особисте переконання».[2]
Баєсова методологія
Баєсові методи характеризуються такими поняттями та процедурами:
Використанням випадкових змінних, або, загальніше, невідомих величин[7] для моделювання всіх джерел невизначеності у статистичних моделях. Це також включає невизначеність, що випливає з браку інформації (див. також випадкову та пізнавальну невизначеність[en]).
Потребою визначення апріорного розподілу ймовірності, що враховує наявну (апріорну) інформацію.
Послідовним застосуванням формули Баєса: щойно надходять додаткові дані, обчислити апостеріорний розподіл за допомогою формули Баєса; згодом цей апостеріорний розподіл стає наступним апріорним.
Для частотника гіпотеза є судженням (що мусить бути або істинним, або хибним), таким чином, частотницька ймовірність гіпотези є або нулем, або одиницею. В баєсовій статистиці, якщо значення істинності є невизначеним, гіпотезі може бути призначено ймовірність, що відрізняється від 0 та 1.
Об'єктивні та суб'єктивні баєсові ймовірності
Загалом кажучи, існує два погляди на баєсову ймовірність, що інтерпретують поняття «ймовірність» різним чином. Для об'єктивістівймовірність об'єктивно вимірює правдоподібність тверджень, тобто, ймовірність твердження відповідає розсудливому переконанню, яке будь-хто (навіть «робот»), хто поділяють однакові знання, повинні поділяти у відповідності з правилами баєсової статистики, що може бути підтверджено вимогами раціональності та відповідності[en].[1][6] Для суб'єктивістів ймовірність відповідає «особистому переконанню».[2] Для суб'єктивістів раціональність та зв'язність обмежують властивості, що міг би мати предмет, дозволяючи істотне коливання в межах цих обмежень. Об'єктивні та суб'єктивні варіанти баєсової ймовірності відрізняються переважно в їхній інтерпретації та в побудові апріорної ймовірності.
У XX столітті ідеї Лапласа отримали подальший розвиток у двох різних напрямках, давши початок об'єктивній та суб'єктивній течіям у баєсовій практиці. «Теорія ймовірності» Гарольда Джеффріса (вперше опублікована 1939 року) відіграла важливу роль у відродженні баєсового погляду на ймовірність, з наступними працями Абрахама Валда (1950) та Леонарда Севіджа[en] (1954). Сам прикметник баєсів сходить до 1950-х років; похідні баєсовизм та нео-баєсовизм викарбувано у 1960-х.[11]
В об'єктивістській течії статистичний аналіз залежить лише від прийнятої моделі та аналізованих даних.[12] Потреба в залученні суб'єктивних рішень відсутня. На відміну від цього, «суб'єктивістські» статистики заперечують можливість повністю об'єктивного аналізу в загальному випадку.
У 1980-х роках було різке зростання наукових досліджень та застосувань баєсових методів, що здебільшого стосувалися відкриття методів Монте-Карло марковських ланцюгів, які усунули чимало обчислювальних проблем та посилили зацікавленість у нестандартних, складних застосуваннях.[13] Попри ріст баєсових наукових досліджень, більшість початкового викладання й досі ґрунтується на частотницькій статистиці.[14][джерело?] Тим не менш, баєсові методи є широко визнаними та застосовуваними, наприклад, у галузі машинного навчання.[15]
Річард Кокс[en] показав,[6] що баєсове уточнення слідує кільком аксіомам, включно з двома функційними рівняннями та спірною гіпотезою диференційовності. Відомо, що розробка Кокса 1961 року (переважно скопійована Джейнсом[en]) не є суворою, і насправді Галперном[en] було знайдено контрприклад.[16] Припущення про диференційовність чи навіть безперервність є сумнівним, оскільки булева алгебра виразів може бути лише скінченною.[7] Щоби зробити цю теорію суворішою, різними авторами було запропоновано інші аксіоматизації.[7]
Підхід голландської системи ставок
Доведення голландської системи ставок, що запропонував де Фінетті, базується на парі. Система ставок є голландською[en] тоді, коли вправний гравець укладає такий набір парі, що гарантує вигоду, не залежно від результатів парі. Якщо букмекер у побудові своїх шансів слідує правилам баєсового числення, то голландську систему ставок зробити неможливо.
Проте Ян Хакінг[en] зауважив, що традиційні аргументи голландської системи ставок не визначали використання саме баєсового уточнення: вони залишили відкритою можливість, що не-баєсові правила уточнення можуть обходити голландську систему ставок. Наприклад, Хакінг пише[17], що
Й ані аргумент голландської системи ставок, ані жоден інший в арсеналі доказів ймовірнісних аксіом персоналістів не тягне за собою динамічного припущення. Жоден не тягне за собою баєсовизму. Тому персоналістові потрібно, щоби динамічне припущення було баєсовим. Це є правда, що в послідовності персоналіст може відмовитися від байєсової моделі навчання на досвіді. Сіль може втратити свій смак.
Оригінальний текст (англ.)
And neither the Dutch book argument, nor any other in the personalist arsenal of proofs of the probability axioms, entails the dynamic assumption. Not one entails Bayesianism. So the personalist requires the dynamic assumption to be Bayesian. It is true that in consistency a personalist could abandon the Bayesian model of learning from experience. Salt could lose its savour.
Насправді, існують не-баєсові правила уточнення, що також обходять голландську систему ставок (як обговорюється в літературі про «кінематику ймовірностей» після публікації правила Річарда Джефрі[en], що й саме розглядається як баєсове[18]). Додаткові гіпотези, достатні для (однозначного) вказання баєсового уточнення, є значними, складними та незадовільними.[19]
Підхід теорії рішень
Обґрунтування статистичної теорії рішень використання баєсового висновування (і відтак баєсових імовірностей) було запропоновано Абрахамом Валдом, який довів, що кожна прийнятна[en] статистична процедура є або баєсовою процедурою, або границею баєсових процедур.[20] І навпаки, кожна баєсова процедура є прийнятною[en].[21]
Особисті ймовірності та об'єктивні методи побудови апріорних
Після праці Ремзі та фон Неймана про теоріюочікуваної корисності фахівці з теорії рішень пояснили раціональну поведінку із використанням розподілу ймовірності для агента. Йоган Пфанцагль завершив «Теорію ігор та економічної поведінки[en]», запропонувавши аксіоматизацію суб'єктивної ймовірності та корисності — завдання, залишене незавершеним фон Нейманом та Оскаром Морґенштерном: їхня первісна теорія для зручності передбачала, що всі агенти мають однаковий розподіл ймовірностей.[22] Аксіоматизацію Пфанцагля було схвалено Оскаром Морґенштерном: «Фон Нейман та я передбачили» питання, чи ймовірності «могли би, можливо типовіше, бути суб'єктивними, та конкретно заявили, що в останньому випадку може бути знайдено аксіоми, з яких могло би бути виведено бажану числову корисність разом зі значеннями ймовірностей (пор. с. 19 Теорії ігор та економічної поведінки[en]). Ми не довершували це; це було продемонстровано Пфанцаглем… з усією необхідною суворістю».[23]
Ремзі та Севідж[en] зауважили, що розподіли ймовірностей окремих агентів може бути об'єктивно вивчено в експериментах. Роль обґрунтування й незгоди в науці визнавалася починаючи з Аристотеля, і ще ясніше за Френсіса Бекона. Об'єктивність науки полягає не в психології окремих науковців, але в самому процесі науки, та особливо у статистичних методах, як зауважив Ч. Пірс.[24] Нагадуємо, що, об'єктивні методи спростування припущень про особисті ймовірності використовувалися протягом півстоліття, як було зауважено вище. Процедури перевірки гіпотез про ймовірності (з використанням скінченних проб) завдячують Ремзі (1931) та де Фінетті[en] (1931, 1937, 1964, 1970). Як Бруно де Фінетті[en], так і Френк Ремзі визнають[джерело?] свій борг перед прагматичною філософією[en], зокрема (для Ремзі) перед Чарлзом Пірсом.
«Перевірка Ремзі» для оцінювання розподілів ймовірності є теоретично реалізовною, і вона займала експериментальних психологів протягом півстоліття.[25] Ця праця показує, що баєсово-ймовірнісні припущення можливо спростовувати, і отже вони відповідають емпіричному критерієві Чарлза Пірса, чия праця надихнула Ремзі. (Цей критерій спростовності було популяризовано Карлом Поппером.[26][27])
Сучасні праці над експериментальною оцінкою особистих ймовірностей використовують рандомізацію, сліпий метод та процедури булевих рішень експерименту Пірса-Ястрова[en].[28] Оскільки особи діють відповідно до різних оцінок ймовірності, ці ймовірності агентів є «особистими» (проте придатними до об'єктивного вивчення).
Особисті ймовірності є проблематичними для науки та деяких застосувань, у яких ухвалювачам рішень бракує знань або часу для визначення обґрунтованого розподілу ймовірності (на підставі якого вони готуються діяти). Щоби відповідати потребам науки та людським обмеженням, баєсові статистики розробили «об'єктивні» методи визначення апріорних ймовірностей.
Справді, деякі баєсівці стверджують, що апріорний стан знання визначає єдиний (унікальний) апріорний розподіл ймовірності для «звичайних» статистичних задач; пор. з коректно поставленими задачами. Знаходження правильного методу побудови таких «об'єктивних» апріорних (для відповідних класів звичайних задач) було предметом пошуку теоретиків статистики від Лапласа до Джона Кейнса, Гарольда Джеффріса та Едвіна Джейнса[en]: теоретики та їхні послідовники запропонували декілька методів для побудови «об'єктивних» апріорних:
Кожен із цих методів вносить корисні апріорні для «звичайних» однопараметрових задач, і кожне апріорне може впоруватися з декількома складними статистичними моделями (з «нерегулярністю», або з декількома параметрами). Кожен із цих методів був корисним у баєсовій практиці. Справді, методи побудови «об'єктивних» (або ж «стандартних», або «необізнаних») апріорних було розроблено видатними суб'єктивістськими (або «персоналістськими») баєсівцями, такими як Джеймс Бергер[en] (Дюкський університет) та Хосе-Мігель Бернардо[en] (Університет Валенсії), просто тому, що такі апріорні потрібні для баєсового застосування, зокрема в науці.[29] Пошук «універсального методу побудови апріорних» продовжує приваблювати статистичних теоретиків.[29]
Отже, баєсів статистик потребує або використання обґрунтованих апріорних (із застосуванням відповідного досвіду або попередніх даних), або вибору серед конкуруючих методів побудови «об'єктивних» апріорних.
Баєсове середнє
Ба́єсове сере́днє є методом оцінювання середнього значення вибірки згідно з баєсовою інтерпретацією, де замість оцінювання середнього суворо з будь-яких або всіх доступних даних набору до обчислення може також бути включено іншу наявну інформацію, пов'язану із цим набором даних, з метою мінімізації впливу великих відхилень, або для заявлення стандартного значення, якщо набір даних є малим.
Обчислення баєсового середнього включає апріорне середнє m та сталу C. Сталій C встановлюється значення, пропорційне типовому розмірові набору даних. Це значення є більшим, коли очікувані відхилення між наборами даних (у межах більшої вибірки) є малими. Воно є меншим, коли очікується, що набори даних значно різнитимуться один від одного.
↑ абвCox, Richard T. Algebra of Probable Inference, The Johns Hopkins University Press, 2001 (англ.)
↑ абвDupré, Maurice J., Tipler, Frank T. New Axioms For Bayesian Probability[недоступне посилання з лютого 2019], Bayesian Analysis (2009), Number 3, pp. 599—606 (англ.)
↑«The works of Wald, Statistical Decision Functions (1950) and Savage[en], The Foundation of Statistics (1954) are commonly regarded starting points for current Bayesian approaches»;
«Recent developments of the so-called Bayesian approach to statistics»
Marshall Dees Harris, Legal-economic research, University of Iowa. Agricultural Law Center (1959), p. 125 (fn. 52); p. 126.
«This revolution, which may or may not succeed, is neo-Bayesianism. Jeffreys tried to introduce this approach, but did not succeed at the time in giving it general appeal.» Annals of the Computation Laboratory of Harvard University 31 (1962), p. 180.
«It is curious that even in its activities unrelated to ethics, humanity searches for a religion. At the present time, the religion being 'pushed' the hardest is Bayesianism.»
Oscar Kempthorne, 'The Classical Problem of Inference—Goodness of Fit', Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability (1967), p. 235 [Архівовано 15 липня 2015 у Wayback Machine.].
↑ абBernardo, J. M. (2005). Reference Analysis [Архівовано 23 листопада 2015 у Wayback Machine.]. Handbook of Statistics 25 (D. K. Dey and C. R. Rao eds). Amsterdam: Elsevier, 17-90 (англ.)
↑Yang, Xiao; Zhang, Zhaoxin (2013). Combining Prestige and Relevance Ranking for Personalized Recommendation. Proceedings of the 22nd ACM international conference on information & knowledge management (CIKM): 1877—1880. doi:10.1145/2505515.2507885. (англ.)
Література
Berger, James O.[en] (1985). Statistical Decision Theory and Bayesian Analysis. Springer Series in Statistics (вид. II). Springer-Verlag. ISBN0-387-96098-8. (англ.)
de Finetti, Bruno[en]. "Probabilism: A Critical Essay on the Theory of Probability and on the Value of Science, " (переклад статті 1931 року) в Erkenntnis, volume 31, вересень 1989. (англ.)
de Finetti, Bruno (1937) "La Prévision: ses lois logiques, ses sources subjectives, " Annales de l'Institut Henri Poincaré, (фр.)
de Finetti, Bruno. "Foresight: its Logical Laws, Its Subjective Sources, " (переклад франкомовної статті 1937 року [Архівовано 21 липня 2015 у Wayback Machine.]) в H. E. Kyburg та H. E. Smokler (eds), Studies in Subjective Probability, New York: Wiley, 1964. (англ.)
de Finetti, Bruno (1974–5). Theory of Probability. A Critical Introductory Treatment, (переклад A.Machi та AFM Smith[en] книги 1970 року) 2 томи. Wiley ISBN 0-471-20141-3, ISBN 0-471-20142-1(англ.)
Hajek, A. and Hartmann, S. (2010): «Bayesian Epistemology», in: Dancy, J., Sosa, E., Steup, M. (Eds.) (2001) A Companion to Epistemology, Wiley. ISBN 1-4051-3900-5Preprint(англ.)
Hald, Anders (1998). A History of Mathematical Statistics from 1750 to 1930. New York: Wiley. ISBN0-471-17912-4. (англ.)
Hartmann, S. and Sprenger, J. (2011) «Bayesian Epistemology», in: Bernecker, S. and Pritchard, D. (Eds.) (2011) Routledge Companion to Epistemology. Routledge. ISBN 978-0-415-96219-3 (Preprint) (англ.)
McGrayne, SB. (2011). The Theory That Would Not Die: How Bayes' Rule Cracked The Enigma Code, Hunted Down Russian Submarines, & Emerged Triumphant from Two Centuries of Controversy. New Haven: Yale University Press. ISBN 9780300169690/ISBN 0300169698; OCLC 670481486 [Архівовано 22 лютого 2019 у Wayback Machine.] (англ.)
Morgenstern, Oskar (1978). Some Reflections on Utility. У Andrew Schotter (ред.). Selected Economic Writings of Oskar Morgenstern. New York University Press. с. 65—70. ISBN978-0-8147-7771-8. (англ.)
Pfanzagl, J. in cooperation with V. Baumann and H. Huber (1968). Events, Utility and Subjective Probability. Theory of Measurement. Wiley. с. 195–220. (англ.)
Ramsey, Frank Plumpton (1931) «Truth and Probability» (PDF), Chapter VII in The Foundations of Mathematics and other Logical Essays, передруковано 2001 року, Routledge. ISBN 0-415-22546-9, (англ.)
Stigler, SM. (1990). The History of Statistics: The Measurement of Uncertainty before 1900. Belknap Press/Harvard University Press. ISBN0-674-40341-X. (англ.)
Stigler, SM. (1999) Statistics on the Table: The History of Statistical Concepts and Methods. Harvard University Press. ISBN 0-674-83601-4(англ.)