統計学 は、歴史的には、現代の観点では、18世紀 に、主権国家 が工業化し新たなニーズに応える上で進歩し始めた。統計学の進歩の特に大きな要因として、ヴェストファーレン条約 (1648年 )後のヨーロッパ諸国の発展と、統計学を強固な理論とした確率論 の発展が挙げられる。
初期の頃は、統計学が対象とするデータ は、人口 統計などの、国家についての情報に限られていた。後に、対象となるデータはあらゆる情報に広がり、データの分析や解釈が発展していった。現代の言葉では、「統計 」とは、国民経済計算 や過去の気温変化 といった集積されたデータと、統計学的推測 による分析作業の両方を指す。統計学の手段として、確率論 における確率空間 が用いられることが多い。特に求められるのはコンピュータ のアプリケーションソフトウェア によるデータ処理である。統計学の概念の多くは科学の世界に幅広く重要な影響を与えている。実験計画法 や、ベイズ推定 といった統計学的推測へのアプローチはこれらに含まれる。これらはそれぞれ現代統計学の基礎となるアイディアの系譜と見なされている。
概要
18世紀 までは、「統計 」という語は、国家による人口 や経済 のデータ の公的集計を指していた。少なくとも二千年の間、こういったデータは、主に課税や徴兵のための人的、物的資源の集計であった。19世紀 初頭、集計が強化され、「統計」の意味は広がり、データの集計、要約、分析に関連する分野を含むようになった。今日、データが集計され、統計量 が計算され、広く、政府、企業、大半の科学やスポーツ、さらには多くの娯楽で使用されている。電子計算機はより精巧な統計計算をもたらし、データが大きかったり多くても処理を十分に可能にした。1人のデータ分析者が、大きさが数十~数百のデータセット で、数百万の測定値を分析したい場合がある。これらは年月とともにコンピュータのはたらき(例えば証券取引所 )や電算化されたセンサ 、POSレジなどから登場するようになる。コンピュータは、統計量を正確で短時間に出力し、巨大な正方行列の逆行列を求めたり、数百の段階を反復して実行するなど、手作業ではけっしてできない、面倒な分析を可能にする。より高速のコンピューティング により、統計家 はコンピュータを集約して母集団内の全てを検索する方法を開発したり、大きさが1万個もの母集団の推測が理論だけでは難しいのを、ランダム化 により推測可能にした。
数理統計学とは、数学において統計学で実際に使用される確率論 と推計統計学 を指す。しかし、統計学と確率論の連携は少し遅れて発展した。19世紀になると、統計学では確率論がますます使われるようになり、その初期の結果は、17世紀と18世紀の特に運が左右するゲーム(賭博 )の分析で見出された。1800年まで、天文学 では確率モデルと統計学理論、特に最小二乗法 が使われていた。初等的な確率論と統計学は19世紀に体系化され、統計的推論、確率モデルが、実験心理学 、社会学 といった新しい科学を志向する社会科学 者、熱力学 、統計力学 の物理学 者に使われた。推計統計学の発展には帰納 法、科学的方法 の発展と密接な関係があった。このことは、統計家の対象が狭義の数理統計学から遠ざかってしまうことが懸念される。コンピュータが台頭するまでは、統計学の理論的業績の多くが有用であった。1970年代 までに、サミュエル・コッツ (英語版 ) とノーマン・ロイド・ジョンソン (英語版 ) は4巻からなる統計分布の大著を著したが(第1巻は1969年–1972年)、これは依然として貴重な資料となっている。
応用統計学は数学 の一分野でなく、計算機科学 やオペレーションズ・リサーチ といった数理科学 の独立した一分野と見なすことができる。数学とは異なり、統計学は行政 に端を発している。初期の頃から人口統計学 、経済学 に応用されている。今日のミクロ経済学 、マクロ経済学 の主な対象領域は、時系列 の分析を中心とした「統計学」である。データから学び、最善の予測をすることに重きを置いた統計学は、心理検査 、医学 、疫学 の学術研究によっても形作られてきた。仮説検定 の考え方は意志決定科学 とかなり重なり合っている。データの調査や効果的な提示に関わっている統計学は、情報学 や計算機科学と重なる部分がある。
語源
英語のstatisticsという語は、最終的には、ラテン語 のstatisticum collegium (「国会」)とイタリア語 のstatista(「政治家 」)に由来している。1749年 にゴットフリート・アッヘンヴァル によって初めて紹介されたドイツ語のStatistikは、元々は国家についてのデータの分析のことを指しており、「国家の科学」(当時は英語でpolitical arithmeticと呼ばれていた)を意味していた。19世紀 初頭には、それは一般的にはデータの集計と分類を意味するようになった。この単語は1791年 、ジョン・シンクレア (英語版 ) が21巻からなる "Statistical Accounts of Scotland"(『スコットランド統計研究 (英語版 ) 』)の第1巻を出版したときに英語で紹介された[ 1] 。
したがって、Statistikの本来の主な目的は、データが政府の(中枢)行政機関に使用されることであった。国や地方についてのデータの集計は主に国家や国際的な公共事業を通じて定期的に行われる。特に、人口 統計についての情報は国勢調査 を通じて頻繁に更新される。
"Statistics" を題名に最初に冠した本は、Francis G. P. Neison(Medical Invalid and General Life Officeの保険数理士[要出典 ] )による "Contributions to Vital Statistics"(1845年)である。
日本における用語の取り扱い
日本で初めて紹介された統計書は、1854年 (江戸時代 末期)の、オランダのP. A. de Jongによる "Statistische tafel van alle landen der aarde"(『地球上の全ての国の統計表』)と言われている[ 2] 。当時はstatisticsという語に対する日本語が存在せず、一時期は片仮名で「スタチスチク」と使われていた[ 3] 。この本は1860年 (万延 元年)、福澤諭吉 とその弟子古川正雄 (岡本博卿)の訳により、『万国政表』(萬國政表)として刊行された。そこでは "statistische tafel" を「政表」と訳している。
現在で一般的に使われている「統計」と初めて訳したのは、洋学者の柳川春三 と推定されている[ 4] 。1870年 (明治3年 )8月4日に、外務省が諸省に廻達した文書(外国貿易品輸出入の物品高表を編集、貿易年表を出版する旨を通知した文書)の中で、「統計年鑑」という用語がある。日本の公文書に「統計」という語が初めて登場したのはこの時とみられる。1871年 (明治4年 )7月27日、大蔵省 に「統計司」という機関が設置され、日本の官署で初めて「統計」という名称が附された(翌8月10日に「統計寮」と改められた)[ 2] 。これは、米国視察から帰国した伊藤博文 の建議による[ 4] 。「統計学」という訳語が日本の社会に普及し始めるのは、(明治 7年)6月に文部省出版の『統計学』(モロー・ド・ジョンネ著 "Elementde Staisique" 箕作麟祥 訳)によるとされる[ 4] 。
現在の中国 、韓国 でも、statistics の訳語として「統計」が用いられている。その起源は日本であり、中国語の造語である「統紀」に触発されて日本で造語された「統計」が中国に導入された[ 2] 。
起源
文明の開始以来、統計には基本的な方式が用いられてきた。初期の帝国では、しばしば人口国勢調査 を照合したり、様々な商品の取引を記録したりしていた。漢 王朝とローマ帝国 は、帝国の人口、国土面積、富の規模についてのデータを広範囲に集計した、最初の国家たちである。
統計的手法が使用されるようになるのは、少なくとも紀元前5世紀 にまでさかのぼる。歴史家のトゥキュディデス は『戦史 』[ 5] で、アテネ 人がプラタイア (都市国家 )の壁の高さを測定する方法を説明している。周囲の、壁で漆喰 の塗られていない区間のレンガの数を十分な回数数えた。そのカウントは何人かの兵士によって数回繰り返された。そこでの最頻値 はレンガの数の最もありうる値と見なされた。この値に、壁に使われているレンガの高さを掛けることで、アテネ人は壁に架けるのに必要なはしごの高さを決めることができた[要出典 ] 。
貨幣検査函審査 (英語版 ) (トライアル・オブ・ザ・ピクス)は、12世紀 から定期的に実施されている、王立造幣局 (イギリス)の硬貨の純度の検査である。その検査方法は、統計学の標本調査 による方法に基づいている。一連の硬貨を(元々は10ポンド の銀から)鋳造した後、1枚の硬貨をウェストミンスター寺院 にあるピクス (英語版 ) に入れる。一定期間後(現在は1年に1度)硬貨を取り出して計量する。次に、箱から取り出された標本硬貨の純度を検査する。
14世紀 のフィレンツェ の歴史を記した『新年代記 (英語版 ) 』(ジョヴァンニ・ヴィッラーニ 、フィレンツェの銀行家であり公務員)には、人口、法令、通商貿易、教育、宗教施設についての多くの統計情報が記載され、歴史上統計データを明確に著した最初のものである[ 6] 。だが、そこにはまだ、特定の分野としての統計学の用語も概念もまだ存在していなかった。
算術平均 はギリシャ人には知られていた概念であるが、16世紀まで3個以上の値に対して一般化されていなかった。1585年 にシモン・ステヴィン が十進法 を発明したことで、これらの計算が容易になったと思われる。この方法はティコ・ブラーエ により天文学 で採用された。様々な天体の位置を推定したときの誤差を減らそうとしていた。
中央値 の発想は、1599年 のエドワード・ライト (英語版 ) の航法 についての著書 ("Certaine Errors in Navigation ") を起源とし、コンパスによる位置の特定についての節に書かれている。ライトは、一連の観測値の中でこの値が最も正しそうな値だと感じた。
ウィリアム・ペティ は17世紀の経済学者で、人口統計データを分析するために早くから統計学的手法を駆使した。
統計学の誕生は、1662年 にまでさかのぼる。ジョン・グラント (英語版 ) がウィリアム・ペティ と共に、国勢調査のための統計的方法を開発し、人口統計学 の現代的な枠組みを構築した。彼は生命表 を初めて作成し、年齢ごとの生存率を与えた。彼の著書 "Natural and Political Observations Made upon the Bills of Mortality " では死亡率 の分析を行い、初等統計学的に基づいてロンドン の人口を推定した。彼は、ロンドンでは年間で約13,000の葬儀があり、11家族中3名の割合で亡くなっていることを知っていた。彼は小教区 の記録から、世帯平均人数は8名と推定し、そこからロンドンの人口はおよそ384,000名と割り出した。これは比推定量 (英語版 ) が初めて使用された例として知られる。1802年 にラプラス は、同様の方法でフランス の人口を推定した。
統計学の適用範囲は元々は統治に有用なデータに限られていたが、その守備範囲は19世紀 の間に、科学や商学の多くの分野に広がって行った。この分野の数学的基礎は、16世紀 になって新たに拓かれた確率論 によって促された。その初期の確率論を拓いたのは、ジェロラモ・カルダーノ 、ピエール・ド・フェルマー 、ブレーズ・パスカル である。クリスティアーン・ホイヘンス (1657年)は、この分野を科学的にとらえた最も初期の科学者として知られる。ヤコブ・ベルヌーイ は『推測術 (英語版 ) 』(死後の1713年に出版)で、アブラーム・ド・モアブル は『偶然の理論 (英語版 ) 』(1718年)で、この分野を数学の一分野として扱った。ベルヌーイは著書で、確実に起こることを1で表し、確率を0から1の間の数で表すという考えを紹介した。
統計学的検定の登場
統計学の適用で18世紀 に早く行われた重要なものは、出生時の人間の性比 であった[ 7] 。ジョン・アーバスノット (英語版 ) は1710年 にこの疑問を研究した[ 8] [ 9] [ 10] [ 11] 。アーバスノットは、1629年から1710年までの82年間のロンドンでの出生記録を調べた。どの年でも、ロンドンでの男子の出生数が女子のそれより多かった。男子と女子の出生が同様に確からしいと仮定すると、その結果 から観察される、男女の出生が異なる確率は0.582 、つまり約4.836 × 1024 分の1であることを導いた。これは現在の言葉ではP値 である。これはほとんどないに等しく、アーバスノットは、これは偶然ではなく神が与えた摂理と説いた:「それが示すのは、偶然でなく作為が決定している」これと他を含むアーバスノットの業績は「有意 性検定の最初の使用」[ 12] として評価されている。その最初の例は、有意性と道徳的な誠実さについての推定であり[ 13] 、「おそらく、ノンパラメトリック検定の最初の発表された報告」(具体的には符号検定 (英語版 ) )[ 9] であった。
確率分布の登場
誤差の理論の定式的な研究は、1722年 のロジャー・コーツ の "Opera Miscellanea "(死後に出版)にまでさかのぼる。しかし、1755年 (出版されたのは1756年 )にトーマス・シンプソン により作られた回想録では、観測による誤差についての議論に理論が初めて適用されている。この回想録の再版 (1757) では、正と負の誤差が同じ割合で含まれ、通例想定される全ての誤差の集合の極限が、確かにあるという公理 を示した。連続した誤差たちについて論じ、確率曲線を与えた。シンプソンは誤差のありうる分布をいくつか示した。彼は初めに離散一様分布 について考察し、次に連続対称三角分布 から離散対称三角分布を考察した。トビアス・マイヤー は月 の秤動 についての研究で("Kosmographische Nachrichten " ニュルンベルク 、1750年 )、未知の量を推定する定式化した方法を初めて考案した。同じ状況での観測結果の平均を、類似の方程式のグループの平均に一般化している。
1755年 、ルジェル・ヨシプ・ボスコヴィッチ は、地球 の形についての研究を、著書 "De Litteraria expeditione per pontificiam ditionem ad dimetiendos duos meridiani gradus a PP " で著した。Maire et Boscovicli は、一連の観測値の中で真の値は絶対偏差の総和を最小にするだろうと述べた。現代の用語・観点では、この値は中央値 である。後に正規分布 曲線と呼ばれる分布曲線を最初に研究したのはアブラーム・ド・モアブル で、彼はこの曲線を1733年 11月12日 に見出した[ 14] 。ド・モアブルは公正なコイン を投げたときに表が出る回数について研究していた。
トーマス・ベイズ は1761年 にベイズの定理 を証明し、ジョゼフ・プリーストリー は1765年 に最初にタイムライン チャートを発明した。
ヨハン・ハインリヒ・ランベルト は1765年 の著書 "Anlage zur Architectonic " で誤差の分布曲線が半円 になることを発表した:
f
(
x
)
=
1
2
1
− − -->
x
2
(
− − -->
1
<
x
<
1
)
{\displaystyle f(x)={\frac {1}{2}}{\sqrt {1-x^{2}}}\quad (-1<x<1)}
正規分布の登場
ラプラス分布 の確率密度関数のグラフ
ピエール=シモン・ラプラス (1774) は、観測値の集まりを、確率論 の原理から導出する試みを初めて行った。彼は誤差の確率の法則を曲線で表し、3個の観測値の平均の公式を導出した。
ラプラスは1774年 に、誤差の頻度は、いったん符号を無視すると、それの大きさの指数関数 で表せると述べた[ 15] [ 16] 。この分布は現在ラプラス分布 として知られている。ジョゼフ=ルイ・ラグランジュ は1776年 に、誤差の放物線状フラクタル分布 (英語版 ) を発表した。
ラプラスは1778年 に、誤差についての2番目の法則を著した。彼は、誤差の頻度はそれの大きさの2乗のべきに比例するということを述べた。このことはその後ガウス によっても(おそらく1795年 に)発見され、統計学で中心的な役割を果たす正規分布 として最もよく知られている[ 17] 。この分布は、1873年 にチャールズ・サンダース・パース によって、最初に「正規」分布と呼ばれた。彼は物体を木製の台座に落としたときの測定の誤差について研究していた[ 18] 。彼が用語に「正規」を採用したのは、自然な発生回数で頻繁に起こるからである。
また、ジョゼフ=ルイ・ラグランジュ は1781年 に、誤差についての2つの分布、余弦分布 (英語版 ) と対数分布 (英語版 ) を発表している。
1781年 に、ラプラスは「誤差の容易さの法則 」についての式(ラグランジュによる用語〈1774年 〉)を与えた[ 19] [ 20] 。だがそれは扱いにくい方程式を導いた。ダニエル・ベルヌーイ は1778年 に、同時誤差の系の確率の最大積の原理を導入した。
統計図表の登場
1786年 に、ウィリアム・プレイフェア (1759年 - 1823年)は統計グラフ を導入した。彼は折れ線グラフ 、棒グラフ 、ヒストグラム を考案し、彼の経済学 ("Commercial and Political Atlas ") の業務に組み込んだ。このことは、1795年 に彼が円グラフ を考案することにつながった。彼は英国の輸出入の進展を円グラフで表した。後者のチャートは、1801年 に彼が著した "Statistical Breviary " の例で広く注目を集めた。
ラプラスは1787年 の土星 と木星 の運動の研究において、1つの方程式のグループの異なる線型結合 を使うことによってマイヤーの方法を一般化した。
1791年 にジョン・シンクレアは、自身の『スコットランド統計研究』で、英語の 'statistics' という語を導入した。
1802年 に、ラプラスはフランスの人口を2832万8612人と推定した[ 21] 。彼はこの数値を、前年の出生数と3つの値域の国勢調査のデータから計算した。これらの地域の国勢調査のデータからは、居住者が2,037,615人であり、出生数が71,866人であることが分かった。ラプラスは、これらの標本がフランスを代表していると仮定して、全人口を見積った。
最小二乗法の登場
カール・フリードリヒ・ガウス は1809年 に最小二乗法 を考案した。
データの測定値の誤差を最小にするために使われる最小二乗法 は、アドリアン=マリ・ルジャンドル (1805年)、ロバート・アドレイン (英語版 ) (1808年)、カール・フリードリヒ・ガウス (1809年)によって独立に発表された。ガウスは、1801年 の彼の名高い、準惑星 ケレス の位置の予測で、この方法を用いた。ガウスの計算の基となる観測は、イタリアの僧侶ピアッツィによって行われた。
最小二乗法より先に中央値回帰直線の傾きが用いられた。これは中央絶対偏差の総和を最小にする。この傾きを推定する方法は、1760年 にルジェル・ヨシプ・ボスコヴィッチ によって考案された。彼は天文学に応用した。
「確率誤差」(der wahrscheinliche Fehler 、平均からの中央値のずれ)という用語は、1815年 にドイツの天文学者であるフリードリヒ・ヴィルヘルム・ベッセル によって導入された。1843年 にアントワーヌ・オーギュスタン・クールノー は、確率分布 における、面積を2等分する値に valeur mediane (「中央値 」)という語を初めて用いた。
誤差の理論についての他の貢献者には、Ellis (1844), オーガスタス・ド・モルガン (1864)、ジェームズ・ウィットブレッド・リー・グレイシャー (1872)、ジョヴァンニ・スキアパレッリ (1875) がいる[要出典 ] 。ピーター(1856年)の
r
{\displaystyle r}
(単一の観測値の「確率誤差」)についての式は広く用いられ、初期の頑健統計学 (英語版 ) に影響を与えた(外れ値 に左右されにくい。パース基準 (英語版 ) を参照)。
19世紀 の理論統計学者には、ラプラス、シルヴェストル・フランソワ・ラクロワ (英語版 ) (1816)、Littrow (1833)、リヒャルト・デーデキント (1860、Helmert (1872)、ポール・マチュー・エルマン・ローラン (英語版 ) (1873)、Liagre、Didion、オーガスタス・ド・モルガン 、ジョージ・ブール がいる。
グスタフ・フェヒナー は社会学的および心理学的現象で中央値 (Centralwerth ) を用いた[ 22] 。それ以前では天文学とその関連分野でしか使われていなかった。フランシス・ゴルトン は1881年 に、初めて英語での用語として median を用いた。それより以前では、1869年に middle-most value が、1880年には medium が使用されていた[ 23] 。
もう1人の重要な統計学の創始者であるアドルフ・ケトレー (1796年 - 1874年)は、犯罪率、結婚率、自殺率といった複雑な社会現象を理解するために、「平均人」(l'homme moyen ) という概念を導入した[ 24] 。
正規分布の最初の検査は、1870年代 にドイツの統計家であるヴィルヘルム・レキシス によって考案された。彼が示すことのできたデータセットは、正規分布である出生率のみであった。
現代統計学の開発
統計理論の起源は18世紀 の確率の進歩にあるが、現代統計学が19世紀 後半から20世紀 前半にかけて、3つの段階により形作られる。最初の波は、世紀の変わり目に起こり、フランシス・ゴルトン 、カール・ピアソン の業績により導かれた。彼らは統計学を科学だけでなく、産業や政治に対しても同様に分析することのできる厳密な数学の体系に打ち立てた。2番目の波は1910年代から20年代にかけて起こり、ウィリアム・ゴセット に始まり、ロナルド・フィッシャー の洞察により最高潮に達した。この流れで、実験計画法 のモデルのさらなる発展や、小さな標本から仮説検定 する技術が起こった。最後の波は、1930年代 にエゴン・ピアソン とイェジ・ネイマン の共同研究により誕生し[ 25] 、主に初期の開発で洗練と拡大を見た。今日、統計学の手法は、意思決定 を含むすべての分野で適用されている。データを照合することで正確な推論を行い、不確実性に直面した場面での意思決定を、統計学の手法に基づいて行う。
潮流への兆し
1834年 に創設されたイギリス 王立統計学会 のロゴ
最初の統計機関は19世紀初頭に設立された。王立統計学会 が1834年 に創始され、フローレンス・ナイチンゲール はそれの最初の女性所員であった。彼女は疫学 を理解し公衆衛生を実践するために、健康問題の統計的分析を促進することを切り拓いた。ただし、当時行われていた方法は、今日の近代的な統計学とは見なされてはいない。
オックスフォード大学 の学者であるフランシス・イシドロ・エッジワース は著書 "Metretike: or The Method of Measuring Probability and Utility " (1887) で、帰納的推論の基礎として確率を扱っており、彼の後の作品では「偶然の哲学」に焦点が当てられていた[ 26] 。彼の統計学に関する最初の論文 (1883) は誤差の法則(正規分布 )を調べたものであった。そして彼の "Methods of Statistics " (1885) では、t分布 の初期のバージョン、エッジワース展開 、エッジワース級数 (英語版 ) 、変数変換する方法、最尤推定 の漸近理論が導入された。
1895年 に、ノルウェーの統計家であるアンネシュ・ニコライ・ヒエルは層化抽出法 の概念を導入した[ 27] 。1906年 に、アーサー・リオン・ボウリー (英語版 ) は、社会統計学 に従事しているときに、標本調査の新しい方法を導入した。社会情勢の統計調査は、チャールス・ブース の "Life and Labour of the People in London" (1889-1903)、シーボーム・ラウントリー の "Poverty, A Study of Town Life" (1901) に端を発したが、中でも革新的なのは、ボウリーの無作為抽出 による手法である。彼の功績は "New Survey of London Life and Labour " で最高潮に達した[ 28] 。
第一の波
フランシス・ゴルトン は統計理論の創始の第一人者の一人として評価されている。彼のこの分野の功績に、標準偏差 、相関 、回帰 の概念の導入と、これらの手法を、人間の特徴(中でも、身長、体重、まつげの長さ)の多様性についての研究へ適用したことがある。彼は、これらの多くが正規分布曲線に従うことを発見した[ 29] 。
1907年 にゴルトンは、中央値の有用性についての論文をネイチャー に投稿した[ 30] 。彼は、農産物品評会での雄牛1頭の重さの推測値が 787ポンドとなっていることについての確度を検証した。実際の重さは 1208ポンドであり、中央値による推測は 1198 であった。その推測は正規分布から著しくかけ離れていた。
カール・ピアソン は数理統計学を創設した。
ゴルトンが1889年 に出版した "Natural Inheritance " は、卓越した数学者であるカール・ピアソン の興味を引きつけた[ 31] 。当時ピアソンはユニヴァーシティ・カレッジ・ロンドン に勤めており、数理統計学の萌芽を見出していた[ 32] 。ピアソンは科学の法則に基づいた統計学の土台の必要性を強調し、それの研究を促進した。新しい分析方法を行う彼の研究室は、ウィドニ・ユール (英語版 ) といった、世界中の学生を引き付けることとなった。彼の業績は生物学 、疫学 、人体測定学、医学 、社会史 といった分野を取り巻くまでに成長した。1901年 にゴルトンは、生物測定学 を創始したウォルター・ウェルドン と共に、世界初の数理統計学と生物測定学の学術雑誌であるBiometrika を創刊した。
ピアソンとゴルトンの業績は、今日よく使われている「古典的な」統計学の手法の多くを支えている。それには積率として定義される(ピアソンの)相関係数 が含まれている[ 33] 。分布を標本に適合させるためにモーメント法がある。ピアソンの連続曲線系 は、現在でいう、従来の連続確率分布 の基礎を形作るものである。カイ距離はマハラノビス距離 の前身かつ特別な場合である[ 34] 。P値 は、仮定した値を中心、chi distance を半径とする球体 の補集合の確率測度として定義される[ 34] 。彼は 'standard deviation'(標準偏差)という語も導入した。
彼はまた仮説検定 の理論[ 34] 、ピアソンのカイ二乗検定 、主成分分析 を確立した[ 35] [ 36] 。1911年 に彼は、ユニヴァーシティ・カレッジ・ロンドンに世界初の統計学科を創設した。
第二の波
数理統計学の第2の波は、ロナルド・フィッシャー によって切り拓かれた。彼は2冊の教本を著した。1つは1925年 の『研究者のための統計的方法 (英語版 ) 』、もう1つは1935年 の『実験計画法 (英語版 ) 』である。それは世界中の大学の学問を定義した。彼はまた、それまでの成果を体系化し、それらをきちんとした数学的基礎の上に置いた。1918年 、彼の影響力の大きな論文『メンデル遺伝の仮定における親族間の相関関係 (英語版 ) 』で、統計学用語としての "variance"(分散 )を初めて用いた。1919年 に、彼はロザムステッド農業試験場 (英語版 ) で、彼は長年広範囲にわたって記録されたデータ集の主要な研究を開始した。これにより、包括した題である ("Studies in Crop Variation. ") 一連のレポートが作成された。1930年 に彼は『自然淘汰の遺伝学説 (英語版 ) 』を著し、そこで進化生物学 に統計学を適用した。
次の7年間で、彼は実験計画法 (#実験計画法 を参照)の原理を開発し、分散分析 の研究を入念に進めた。彼は小さい標本から推測する統計学を進めた。さらに重要と考えられることは、彼は新しい統計手法を開発し始め、実際のデータ分析に体系的なアプローチを施したことである。彼は釣り合い型の標本から分析するための計算アルゴリズムを開発した。1925年 、この業績により、彼の最初の著書である『研究者のための統計的方法』[ 37] が出版されることとなった。この本は後年多くの版と翻訳を重ね、多くの分野の科学者にとっての標準的な参考書となった。この本は1935年 の『実験計画法』に続くこととなり、広く用いられることとなった。
フィッシャーは分散分析に加えて、最尤推定 法を名づけ促進した。フィッシャーは十分統計量 、補助統計量 (英語版 ) 、線形判別分析 (英語版 ) (LDA)、フィッシャー情報量 の概念も生み出した。フィッシャーの論文 "On a distribution yielding the error functions of several well known statistics "(よく知られた統計集団の誤差関数を与える分布について、1924年)には、ピアソンのカイ二乗検定 、正規分布 と同じ構成での、ウィリアム・ゴセット のt分布 、分散分析における、フィッシャーのz分布 (英語版 ) (数十年後に、より一般化したF分布 の形で用いられるようになる)の変数が示されている[ 38] 。5%有意 水準は、1925年 にフィッシャーによって導入されたようである[ 39] 。フィッシャーは、標準偏差の2倍を超える偏差は有意と見なせると述べた。以前は、標準誤差の3倍を超える確率偏差が有意であると考えられていた。対称分布の場合、確率誤差は四分位偏差に等しい。正規分布の場合、確率誤差は標準偏差の約2 / 3 である。フィッシャーの5%水準は以前の慣習に根ざしているようである。
この時点での他の重要な貢献には、ピアソンの積率相関係数を有用に拡張した、スピアマンの順位相関係数 がある。イギリスの統計家ウィリアム・ゴセット は、本名よりもペンネーム "Student "(スチューデント)としての方が知られている。彼は、標本が小さく、母標準偏差が未知の場合に有用な連続確率分布である、t分布 を導入した。
第三の波
エゴン・ピアソン とイェジ・ネイマン は、第二種過誤 、検出力 (検定力)、信頼区間 の概念を導入した。1934年 にネイマンは、無作為層化抽出法 は一般に、有意抽出法よりも良い推定方法であることを示した[ 40] 。
実験計画法
ジェームズ・リンド は壊血病 の治療法を見つけるために、1747年 に初めて治験 を実施した。
1747年 に、HM Bark Salisbury (船)で外科医として勤務していたジェームズ・リンド は、壊血病 の治療法を開発するために、よく管理された実験を行った[ 41] 。この研究では、彼の被験者の症例は「自分の症状と同じ位のを持っていた」つまり、彼は無関係な変動を減らすために入場要件を厳格にした。男性は組になり、系統誤差を減らすようにした(「ブロッキング」)。現代の観点から大きく欠けているのは、治療する被験者をランダムに割り当てることである。
リンドは今日「一時一事」("one-factor-at-a-time" (OFAT)) を実行した実験者としてしばしば説明される[ 42] 。one-factor-at-a-time (OFAT) の実験が同様に実施された例として、1840年代 にロザムステッド農業試験場 でのジョン・ローズ (英語版 ) による、小麦に最適な無機肥料の決定がある[ 42] 。
統計的推測の理論は、チャールズ・サンダース・パース の『科学の論理の図解』(Illustrations of the Logic of Science、1877-1878)と『確率的推論の理論』(A Theory of Probable Inference、1883)によって開発された。2つの著書では、無作為性に基づいた統計的推測重要性を強調している。別の研究では、パースは盲検 ・反復測定デザイン (英語版 ) を適用して、ボランティアを無作為に割り当て、体重を識別する能力を評価した[ 43] [ 44] [ 45] [ 46] 。
パースの実験は心理学 と教育学 の他の研究者に大きく影響を与え、1800年代に、研究室や専門書で行われる無作為に行う実験での調査法を発展させた[ 43] [ 44] [ 45] [ 46] 。パースはまた、1876年 に回帰 モデル の最適計画 (英語版 ) についての最初の英語の本を出版した[ 47] 。多項式回帰 の最適計画で先駆的なものは、1815年 にジョゼフ・ディエズ・ジョルゴンヌ (英語版 ) が提示したものである[要出典 ] 。1918年 にキアスティーネ・スミス (英語版 ) は、6次(以下の)多項式についての最適計画を発表した[ 48] 。
計画における実験の繰り返しは、前の実験結果に依存しうり、実験を中止する可能性がある。このことは、エイブラハム・ウォールド の論文 "sequential tests of statistical hypotheses"[ 49] の文脈で見出された[ 50] 。逐次計画 (英語版 ) [ 51] や適応的デザイン (英語版 ) [ 52] は最適化が可能である。逐次計画の具体的な型は「二腕バンディット問題」である(これは多腕バンディット問題 に一般化される)。これの初期の功績は、1952年 のハーバート・ロビンズ (英語版 ) によるものである[ 53] 。
"Design of experiments"(DOE、実験計画法 )という語は、ロナルド・フィッシャー の初期の統計学の研究に由来する。アネシュ・ハル (英語版 ) はフィッシャーを「現代の統計科学の基礎をほぼ独力で創った天才」と評した[ 54] 。フィッシャーは実験計画法の原理を開始し、「分散分析 」の研究に腐心した。さらに重要と考えられることは、フィッシャーは新しい統計手法を開発し始め、実際のデータ分析に体系的なアプローチを施したことである。彼は手作業で行われる必要な計算に伴う労力に特別の注意を払い、数学的厳密性 に基づき実用的である手法を開発した。1925年 に、この業績は、彼の最初の著書『研究者のための統計的方法』で最高潮に達した[ 55] 。この本は後年多くの版と翻訳を重ね、多くの分野の科学者にとっての標準的な参考書となった[ 56] 。
実験を設計するための方法論は、フィッシャーの著書『実験計画法』(1935) で提示され、これも標準的なものとなった[ 57] [ 58] [ 59] [ 60] 。例として、彼は次の仮説 を確かめる方法を述べた:[ある女性が最初にカップに入れたのがミルクであるか紅茶であるかを、味だけで判断することができるか] これは取るに足らない適用のように聞こえるが、これは実験計画法の最も重要な考え方をよく説明することができる例となっている。詳細は紅茶の違いのわかる婦人 を参照。
農学 の進歩は、大都市の人口増加と農場の少なさの両立を可能にした。しかし、成育するための地理や気候、ニーズが大きく異なることを作物学者が十分に考慮するためには、地域の生育条件を識別することが重要であった。地域の作物実験を全国規模に外挿 するために、作物の標本調査を経済的に母集団全体に拡張する必要があった。統計的手法が進歩(主に、「一時一事」の実験に代わる、実験計画法の有効性)するに連れて、要因計画で代表的なものは、標本による結果から母集団全体の有意義な推測をすることを可能とした[要出典 ] 。しかし作物の標本をどのように抽出したかを知るのは困難である[要出典 ] 。要因計画法は、無作為な標本の変動とデータを収集する手順の中から推定し修正する方法を示した。
ベイズ統計学
ピエール=シモン・ラプラス は、ベイズ統計学 を初期に開発した主要人物である。
ベイズ統計学 の「ベイズ」とは、トーマス・ベイズ (1702-1761) を指し示す。ベイズは、事象列が確率収束 しうることを示した。しかし、現在ベイズの定理 と呼ばれているものを("principle VI" として)導入し、それを天体力学 、医療統計学、信頼性 、法学 に適用したのはピエール=シモン・ラプラス (1749-1827) である[ 61] 。彼の "principle of insufficient reason"(等確率の原理 )によると、事前分布の知識について不十分であるときは、ラプラスは一様 な事前分布を用いた[ 61] [ 62] 。ラプラスは哲学的な理由でなく単純な数学として事前分布に一様性を仮定した[ 61] 。ラプラスはまた、原始的な共役事前分布 (英語版 ) とベルンシュテイン -フォン・ミーゼス の定理を導入した[要出典 ] 。これによると、観測回数が増加するにつれて、事後分布は最初は事前分布と最初は異なっていても、最終的には一致する[ 63] 。このラプラスの等確率の原理による、事前分布を採用した初期のベイズ推定 は「逆確率 (英語版 ) 」と呼ばれた(なぜなら、これは観測から確率変数値へ、結果から原因へと、逆向きに推測するからである[ 64] )。
1920年代以降、逆確率は、ロナルド・フィッシャー 、イェジ・ネイマン 、エゴン・ピアソン によって開発された一連の手法に大きく取って代わられた[要出典 ] 。彼らの手法は頻度主義統計学 と呼ばれるようになった[ 64] 。フィッシャーはベイズの見解を否定し、「逆確率の理論は誤りに基づいており、完全に否定されるべきである」と記している[ 65] 。しかしながら、フィッシャーの事実に基づく確率へのアプローチがベイズの随筆に記されており、彼は晩年いたく敬意を表していた。フィッシャーは依然、ラプラスの確率に対する見解は "fallacious rubbish"(誤ったごみ)であると主張した[ 65] 。ネイマンは「準ベイズ統計学」の研究を始め、その後信頼区間 (頻度主義統計学での重要な手法)を開発した彼は次を述べている:「ベイズ主義、事前分布を考慮に入れずに理論全体を構築した方が、より明解になる」[ 66] Bayesian という語は1950年頃に登場し、1960年代 までに、頻度主義統計学に限界と不満を感じている者に好まれるようになった[ 64] [ 67] 。
20世紀にラプラスの発想はさらに2つの方向に発展し、ベイズ統計学の実践に「客観性」と「主観性」の流れをもたらした。客観主義の流れでは、統計分析は想定されたモデルと分析されたデータのみを依りどころとする[ 68] 。そこでは主観的な判断をする必要はない。対照的に、「主観主義者」の統計家は、一般の場合における分析は完全に客観的であることの可能性を否定している。
ラプラスの発想のさらなる発展の中で、主観的な発想は客観主義者の立場より前からある。「確率」は「命題における主観的な信念の度合い」として解釈されるべきである、という発想は、例えば、1920年代 初期にジョン・メイナード・ケインズ によって提唱されている[要出典 ] 。この発想はさらに、ブルーノ・デ・フィネッティ (イタリア、Fondamenti Logici del Ragionamento Probabilistico , 1930)、フランク・ラムゼイ (ケンブリッジ 、The Foundations of Mathematics , 1931)に取り入れられた[ 69] 。このアプローチは、統計的確率についての問題点を解決するために考案された。これはラプラスの客観的なアプローチより前のことであった[ 68] 。主観的なベイズ統計学の手法は、1950年代 に Leonard Jimmie Savage によってさらに発展し普及した[要出典 ] 。
客観的なベイズ推定はさらにハロルド・ジェフリーズ (ケンブリッジ大学 )によって発展した。彼の独創的な著書『確率論』(Theory of probability)が1939年 に最初に登場し、ベイズ確率 の再興に重要な役割を果たした[ 70] [ 71] 。1957年 に、エドウィン・トンプソン・ジェインズ (英語版 ) は、事前分布を構成するために、最大エントロピー の概念を創始した。これは、主に離散的な問題を客観的な手法で定式化するための重要な原理である。1965年 の、デニス・リンドリー (英語版 ) の全2巻の作品 "Introduction to Probability and Statistics from a Bayesian Viewpoint" はベイズ統計学の手法を大衆に広くもたらした。1979年 にホセ=ミゲル・ベルナルド (英語版 ) は、客観的分析が一般の場合に適用することのできる[ 72] 、参照事前分布分析 (reference analysis)を導入した[ 68] 。他によく知られているベイズ確率の理論の支持者として、I・J・グッド (英語版 ) 、バーナード・クープマン (英語版 ) 、ハワード・ライファ (英語版 ) 、ロバード・シュライファー (英語版 ) 、アラン・チューリング がいる。
1980年代 になって、ベイズ統計学の手法の研究と応用は劇的な成長を遂げた。これは主として、計算問題 (英語版 ) の多くを解決するマルコフ連鎖モンテカルロ法 の発見と、複雑で規格外に対する応用への関心の高まりが挙げられる[ 73] 。ベイズ統計学の伸長にもかかわらず、ほとんどの学部教育では依然頻度主義統計学に準拠している[ 74] 。それにもかかわらず、ベイズ統計学の手法は広く受け入れられ、用いられている。その例として、機械学習 の分野がある[ 75] 。
日本で実施された統計調査
日本においては、3世紀 から4世紀 (崇神天皇 の時代)にかけて人口調査が行われたことが、『日本書紀 』に記されている[ 3] 。大化の改新 (645年 )の頃になり班田収授法 が発令、6年に一度全国的な戸籍調査が行われるようになった。この人口調査は体系的であり、約360年間続いた[ 76] 。その後は、豊臣秀吉 が1592年 (天正 20年)に人掃令 を発令し、全国的な戸籍調査を行った。これは、朝鮮出兵 のための兵力把握のために、村ごとの家族構成などをまとめて提出させるための法令であった。さらにその後、江戸幕府 第8代将軍徳川吉宗 の時代では、キリシタン を取り締まるために全国人口調査が行われた。しかしこの調査では、武士など対象外の身分の人が多数存在したり、調査方法が統一されていなかったりと、正確なものではなかった。
明治 時代になり、「国勢調査ニ関スル法律」が制定された。第1回目の国勢調査 が行われたのは、日露戦争 や第一次世界大戦 の影響もありかなり遅れ、1920年 (大正 9年)に実施された。この後日本では、原則として5年に1度国勢調査が行われ、現在に至る。
重要な統計学者
脚注および参照
^ Ball, Philip (2004). Critical Mass . Farrar, Straus and Giroux. p. 53. ISBN 978-0-374-53041-9
^ a b c 酒井弘憲「数式なしの統計のお話 第2回 統計のルーツを探る」『ファルマシア』第50巻第4号、2014年、334–335頁、doi :10.14894/faruawpsj.50.4_334 。
^ a b “意外に面白い!統計学を歴史から眺めてみよう! ”. 数学・統計教室の和から株式会社 (2021年9月8日). 2022年11月29日 閲覧。
^ a b c 奥積雅彦. “公文書で初めて統計の用語が登場したのはいつか? ” (PDF). 国立国会図書館 支部総務省統計図書館. 2022年11月29日 閲覧。
^ Thucydides (1985). History of the Peloponnesian War . New York: Penguin Books, Ltd.. p. 204
^ Giovanni Villani . Encyclopædia Britannica. Encyclopædia Britannica 2006 Ultimate Referece Suite DVD . Retrieved on 2008-03-04.
^ Brian, Éric; Jaisson, Marie (2007). “Physico-Theology and Mathematics (1710-1794)”. The Descent of Human Sex Ratio at Birth . Springer Science & Business Media. pp. 1-25. ISBN 978-1-4020-6036-6
^ John Arbuthnot (1710). “An argument for Divine Providence, taken from the constant regularity observed in the births of both sexes” . Philosophical Transactions of the Royal Society of London 27 (325-336): 186-190. doi :10.1098/rstl.1710.0011 . http://www.york.ac.uk/depts/maths/histstat/arbuthnot.pdf .
^ a b Conover, W.J. (1999), “Chapter 3.4: The Sign Test”, Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157-176, ISBN 978-0-471-16068-7
^ Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 978-0-412-44980-2
^ Stephen Mack Stigler (1986). The History of Statistics: The Measurement of Uncertainty Before 1900 . Harvard University Press . pp. 225-226 . ISBN 978-0-67440341-3
^ Bellhouse, P. (2001), “John Arbuthnot”, in Statisticians of the Centuries by C.C. Heyde and E. Seneta , Springer, pp. 39-42, ISBN 978-0-387-95329-8
^ Hald, Anders (1998), “Chapter 4. Chance or Design: Tests of Significance”, A History of Mathematical Statistics from 1750 to 1930 , Wiley, p. 65
^ Abraham de Moivre (1738) The doctrine of chances. Woodfall
^ P=S Laplace (1774). “Mémoire sur la probabilité des causes par les évènements”. Mémoires de l'Académie Royale des Sciences Présentés par Divers Savants 6 : 621-656.
^ Wilson, Edwin Bidwell (1923) "First and second laws of error", Journal of the American Statistical Association , 18 (143), 841-851 JSTOR 2965467
^ Havil J (2003) Gamma: Exploring Euler's Constant . Princeton, NJ: Princeton University Press, p.157
^ Charles Sanders Peirce (1873) Theory of errors of observations. Report of the Superintendent US Coast Survey, Washington, Government Printing Office. Appendix no. 21: 200-224
^ P. S. Laplace (1781). “MEMOIRE SUR LES PROBABILITÉS”. Oeuvres completes 9 : 227-332. 英語訳PDF
^ フランス語版ウィキソース に本記事に関連した原文があります:Page:Laplace_-_Œuvres_complètes,_Gauthier-Villars,_1878,_tome_9.djvu/395
^ William Gemmell Cochran (1978) "Laplace's ratio estimators". pp.3-10. In David H.A., (ed). Contributions to Survey Sampling and Applied Statistics: papers in honor of H. O. Hartley . Academic Press, New York ISBN 978-1483237930
^ John Maynard Keynes (1921) A treatise on probability. Pt II Ch XVII §5 (p 201)
^ Francis Galton (1881) Report of the Anthropometric Committee pp.245-260. Report of the 51st Meeting of the British Association for the Advancement of Science
^ Stigler (1986, Chapter 5: Quetelet's Two Attempts)
^ Helen Mary Walker (1975). Studies in the history of statistical method . Arno Press. ISBN 9780405066283 . https://books.google.com/books?id=jYFRAAAAMAAJ
^ (Stigler 1986, Chapter 9: The Next Generation: Edgeworth)
^ Bellhouse DR (1988) A brief history of random sampling methods. Handbook of statistics. Vol 6 pp.1-14 Elsevier
^ Bowley, AL (1906). “Address to the Economic Science and Statistics Section of the British Association for the Advancement of Science” . J R Stat Soc 69 : 548-557. doi :10.2307/2339344 . JSTOR 2339344 . https://zenodo.org/record/2152740 .
^ Francis Galton (1877). “Typical laws of heredity”. Nature 15 (388): 492-553. doi :10.1038/015492a0 .
^ Francis Galton (1907). “One Vote, One Value” . Nature 75 (1948): 414. doi :10.1038/075414a0 . https://zenodo.org/record/2125755 .
^ Stigler (1986, Chapter 10: Pearson and Yule)
^ Varberg, Dale E. (1963). “The development of modern statistics”. The Mathematics Teacher 56 (4): 252-257. JSTOR 27956805 .
^ Stephen Mack Stigler (1989). “Francis Galton's Account of the Invention of Correlation”. Statistical Science 4 (2): 73-79. doi :10.1214/ss/1177012580 .
^ a b c Karl Pearson (1900). “On the Criterion that a given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it can be reasonably supposed to have arisen from Random Sampling” . Philosophical Magazine . Series 5 50 (302): 157-175. doi :10.1080/14786440009463897 . https://zenodo.org/record/1430618 .
^ Karl Pearson (1901). “On Lines and Planes of Closest Fit to Systems of Points is Space” . Philosophical Magazine . Series 6 2 (11): 559-572. doi :10.1080/14786440109462720 . https://zenodo.org/record/1430636 .
^ I.T. Jolliffe (2002) Principal Component Analysis, 2nd ed . New York: Springer-Verlag.
^ Box, R.A. Fisher , pp.93-166
^ Agresti, Alan; David B. Hichcock (2005). “Bayesian Inference for Categorical Data Analysis” . Statistical Methods & Applications 14 (3): 298. doi :10.1007/s10260-005-0121-y . http://www.stat.ufl.edu/~aa/articles/agresti_hitchcock_2005.pdf .
^ R.A. Fisher (1925) Statistical methods for research workers, Edinburgh: Oliver & Boyd
^ Jerzy Neyman (1934) On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection. Journal of the Royal Statistical Society 97 (4) 557-625 JSTOR 2342192
^ Dunn, Peter (1997-01). “James Lind (1716-94) of Edinburgh and the treatment of scurvy” . Archives of Disease in Childhood: Fetal and Neonatal Edition 76 (1): 64-65. doi :10.1136/fn.76.1.F64 . PMC 1720613 . PMID 9059193 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1720613/ .
^ a b Klaus Hinkelmann (2012). Design and Analysis of Experiments, Special Designs and Applications . John Wiley & Sons. p. xvii. ISBN 9780470530689 . https://books.google.com/books?id=8Y71m9yoK6UC
^ a b Charles Sanders Peirce , Joseph Jastrow (1885). “On Small Differences in Sensation” . Memoirs of the National Academy of Sciences 3 : 73-83. http://psychclassics.yorku.ca/Peirce/small-diffs.htm .
^ a b Ian Hacking (1988-09). “Telepathy: Origins of Randomization in Experimental Design”. Isis 79 (A Special Issue on Artifact and Experiment, number 3): 427-451. doi :10.1086/354775 . JSTOR 234674 . MR 1013489 .
^ a b Stephen Mack Stigler (1992-11). “A Historical View of Statistical Concepts in Psychology and Educational Research”. American Journal of Education 101 (1): 60-70. doi :10.1086/444032 .
^ a b Trudy Dehue (1997-12). “Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design” . Isis 88 (4): 653-673. doi :10.1086/383850 . PMID 9519574 . https://www.rug.nl/research/portal/files/71855616/237831.pdf .
^ C.S. Peirce (1876). “Note on the Theory of the Economy of Research”. Coast Survey Report : 197-201. , actually published 1879, NOAA PDF Eprint . Reprinted in Collected Papers 7 , paragraphs 139-157, also in Writings 4 , pp.72-78, and in Charles Sanders Peirce (1967年7-8月). “Note on the Theory of the Economy of Research” . Operations Research 15 (4): 643-648. doi :10.1287/opre.15.4.643 . JSTOR 168276 . http://or.journal.informs.org/cgi/content/abstract/15/4/643 .
^ Smith, Kirstine (1918). “On the Standard Deviations of Adjusted and Interpolated Values of an Observed Polynomial Function and its Constants and the Guidance they give Towards a Proper Choice of the Distribution of Observations” . Biometrika 12 (1/2): 1-85. doi :10.2307/2331929 . JSTOR 2331929 . https://zenodo.org/record/1431591 .
^ Abraham Wald (1945) "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16 (2), 117-186.
^ Johnson, N.L. (1961). "Sequential analysis: a survey." Journal of the Royal Statistical Society , Series A. Vol. 124 (3), 372-411. (pages 375-376)
^ Herman Chernoff (1972) Sequential Analysis and Optimal Design , SIAM Monograph. ISBN 978-0898710069
^ Zacks, S. (1996) "Adaptive Designs for Parametric Models". In: Ghosh, S. and Rao, C. R., (Eds) (1996). "Design and Analysis of Experiments," Handbook of Statistics , Volume 13. North-Holland. ISBN 0-444-82061-2 . (pp.151-180)
^ Robbins, H. (1952). “Some Aspects of the Sequential Design of Experiments”. Bulletin of the American Mathematical Society 58 (5): 527-535. doi :10.1090/S0002-9904-1952-09620-8 .
^ Hald, Anders (1998) A History of Mathematical Statistics . New York: Wiley. [要ページ番号 ]
^ Box, Joan Fisher (1978) R. A. Fisher: The Life of a Scientist , Wiley. ISBN 0-471-09300-9 (pp.93-166)
^ Edwards, A.W.F. (2005). “R. A. Fisher, Statistical Methods for Research Workers, 1925”. In Grattan-Guinness, Ivor. Landmark writings in Western mathematics 1640-1940 . Amsterdam Boston: Elsevier. ISBN 9780444508713
^ Stanley, J. C. (1966). “The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later”. American Educational Research Journal 3 (3): 223-229. doi :10.3102/00028312003003223 .
^ Box, JF (1980-02). “R. A. Fisher and the Design of Experiments, 1922-1926”. The American Statistician 34 (1): 1-7. doi :10.2307/2682986 . JSTOR 2682986 .
^ Frank Yates (1964-06). “Sir Ronald Fisher and the Design of Experiments”. Biometrics 20 (2): 307-321. doi :10.2307/2528399 . JSTOR 2528399 .
^ Stanley, Julian C. (1966). “The Influence of Fisher's "The Design of Experiments" on Educational Research Thirty Years Later”. American Educational Research Journal 3 (3): 223-229. doi :10.3102/00028312003003223 . JSTOR 1161806 .
^ a b c Stigler (1986, Chapter 3: Inverse Probability)
^ Hald (1998)[要ページ番号 ]
^ Lucien Le Cam (1986) Asymptotic Methods in Statistical Decision Theory : pp.336, 618-621(von Mises と Bernstein ).
^ a b c Stephen. E. Fienberg, (2006) When did Bayesian Inference become "Bayesian"? Archived 2014-09-10 at the Wayback Machine . Bayesian Analysis , 1 (1), 1-40. See page 5.
^ a b Aldrich, A (2008). “R. A. Fisher on Bayes and Bayes' Theorem” . Bayesian Analysis 3 (1): 161-170. doi :10.1214/08-ba306 . http://ba.stat.cmu.edu/journal/2008/vol03/issue01/aldrich.pdf .
^ Jerzy Neyman (1977). “Frequentist probability and frequentist statistics”. Synthese 36 (1): 97-131. doi :10.1007/BF00485695 .
^ Jeff Miller, "Earliest Known Uses of Some of the Words of Mathematics (B)" "The term Bayesian entered circulation around 1950. R. A. Fisher used it in the notes he wrote to accompany the papers in his Contributions to Mathematical Statistics (1950). Fisher thought Bayes's argument was all but extinct for the only recent work to take it seriously was Harold Jeffreys 's Theory of Probability (1939). In 1951 L. J. Savage, reviewing Wald's Statistical Decisions Functions, referred to "modern, or unBayesian, statistical theory" ("The Theory of Statistical Decision," Journal of the American Statistical Association , 46, p.58.). Soon after, however, Savage changed from being an unBayesian to being a Bayesian."
^ a b c José-Miguel Bernardo (2005). “Reference analysis”. Bayesian Thinking - Modeling and Computation . Handbook of Statistics. 25 . pp. 17-90. doi :10.1016/S0169-7161(05)25002-2 . ISBN 9780444515391
^ Donald A. Gillies (2000), Philosophical Theories of Probability . Routledge. ISBN 0-415-18276-X pp.50-1
^ E.T. Jaynes Probability Theory: The Logic of Science Cambridge University Press, (2003). ISBN 0-521-59271-2
^ O'Connor, John J.; Robertson, Edmund F. , “統計学の歴史” , MacTutor History of Mathematics archive , University of St Andrews , https://mathshistory.st-andrews.ac.uk/Biographies/Jeffreys/ .
^ J.M. Bernardo, A.F.M. Smith (1994). "Bayesian Theory". Chichester: Wiley.
^ Wolpert, RL (2004). “A conversation with James O. Berger” . Statistical Science 9 : 205-218. doi :10.1214/088342304000000053 . MR 2082155 . http://projecteuclid.org/euclid.ss/1089808283 .
^ Bernardo, J.M. (2006). "A Bayesian Mathematical Statistics Primer" (PDF) . Proceedings of the Seventh International Conference on Teaching Statistics [CDROM] . Salvador (Bahia), Brazil: International Association for Statistical Education.
^ C.M. Bishop (2007) Pattern Recognition and Machine Learning . Springer ISBN 978-0387310732
^ 統計学の歴史〜古代ローマから現代まで〜 | AVILEN AI Trend 2020年4月14日、2022年6月26日閲覧。
参考文献
Freedman, D. (1999). “From association to causation: Some remarks on the history of statistics”. Statistical Science 14 (3): 243-258. doi :10.1214/ss/1009212409 . (Revised version, 2002 )
Anders Hald (2003). A History of Probability and Statistics and Their Applications before 1750 . Hoboken, NJ: Wiley. ISBN 978-0-471-47129-5
Anders Hald (1998). A History of Mathematical Statistics from 1750 to 1930 . New York: Wiley. ISBN 978-0-471-17912-2
Kotz, S., Johnson, N.L. (1992,1992,1997). Breakthroughs in Statistics , Vols I, II, III. Springer ISBN 0-387-94037-5 , 0-387-94039-1 , 0-387-94989-5
エゴン・ピアソン (1978). The History of Statistics in the 17th and 18th Centuries against the changing background of intellectual, scientific and religious thought(カール・ピアソン による、ユニヴァーシティ・カレッジ・ロンドン の 1921-1933 の academic session での講義) . New York: MacMillan Publishing Co., Inc.. p. 744. ISBN 978-0-02-850120-8
David Salsburg (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century . ISBN 0-7167-4106-7
スティーブン・スティグラー (1986). The History of Statistics: The Measurement of Uncertainty before 1900 . Belknap Press/Harvard University Press . ISBN 978-0-674-40341-3
スティーブン・スティグラー (1999) Statistics on the Table: The History of Statistical Concepts and Methods . ハーバード大学出版局 。ISBN 0-674-83601-4
David, H.A. (1995). “First (?) Occurrence of Common Terms in Mathematical Statistics”. The American Statistician 49 (2): 121-133. doi :10.2307/2684625 . JSTOR 2684625 .
外部リンク
ウィキメディア・コモンズには、
統計学の歴史 に関連するカテゴリがあります。