Теорема Муавра — Лапласа — одна из предельных теорем теории вероятностей, установлена Лапласом в 1812 году. Если при каждом из n {\displaystyle n} независимых испытаний вероятность появления некоторого случайного события E {\displaystyle E} равна p ∈ ( 0 , 1 ) {\displaystyle p\in (0,1)} , и m {\displaystyle m} — число испытаний, в которых E {\displaystyle E} фактически наступает, то вероятность справедливости неравенства близка (при больших n {\displaystyle n} ) к значению интеграла Лапласа.
При рассмотрении количества m {\displaystyle m} появлений события A {\displaystyle A} в n {\displaystyle n} испытаниях Бернулли чаще всего нужно найти вероятность того, что m {\displaystyle m} заключено между некоторыми значениями a {\displaystyle a} и b {\displaystyle b} . Так как при достаточно больших n {\displaystyle n} промежуток [ a , b ] {\displaystyle [a,b]} содержит большое число единиц, то непосредственное использование биномиального распределения
p n ( m ) = n ! m ! ( n − m ) ! p m q n − m {\displaystyle p_{n}(m)={\frac {n!}{m!(n-m)!}}p^{m}q^{n-m}}
требует громоздких вычислений, так как нужно суммировать большое число определённых по этой формуле вероятностей.
Поэтому используют асимптотическое выражение для биномиального распределения при условии, что p {\displaystyle p} фиксировано, а n → + ∞ {\displaystyle n\rightarrow +\infty } . Теорема Муавра — Лапласа утверждает, что таким асимптотическим выражением для биномиального распределения является нормальная функция.
Если в схеме Бернулли n {\displaystyle n} стремится к бесконечности, величина p ∈ ( 0 , 1 ) {\displaystyle p\in (0,1)} постоянна, а величина x m = m − n p n p q {\displaystyle x_{m}={\frac {m-np}{\sqrt {npq}}}} ограничена равномерно по m {\displaystyle m} и n {\displaystyle n} (то есть ∃ a , b : − ∞ < a ⩽ x m ⩽ b < + ∞ {\displaystyle \exists a,b:-\infty <a\leqslant x_{m}\leqslant b<+\infty } ), то
P n ( m ) = 1 2 π n p q exp ( − x m 2 2 ) ( 1 + α n ( m ) ) {\displaystyle P_{n}(m)={\frac {1}{\sqrt {2\pi npq}}}\exp \left(-{\frac {x_{m}^{2}}{2}}\right)(1+\alpha _{n}(m))}
где | α n ( m ) | < c n , c = const > 0 {\displaystyle \left|\alpha _{n}(m)\right|<{\frac {c}{\sqrt {n}}},c={\text{const}}>0} .
Приближённую формулу
P n ( m ) ≈ 1 2 π n p q exp ( − x m 2 2 ) {\displaystyle P_{n}(m)\approx {\frac {1}{\sqrt {2\pi npq}}}\exp \left(-{\frac {x_{m}^{2}}{2}}\right)}
рекомендуется применять при n > 100 {\displaystyle n>100} и при m > 20 {\displaystyle m>20} .
Для доказательства теоремы будем использовать формулу Стирлинга из математического анализа:
где 0 < θ s < 1 / 12 s {\displaystyle 0<\theta _{s}<1/{12s}} .
При больших s {\displaystyle s} величина θ {\displaystyle \theta } очень мала, и приближённая формула Стирлинга, записанная в простом виде
даёт малую относительную ошибку, быстро стремящуюся к нулю при s → + ∞ {\displaystyle s\rightarrow +\infty } .
Нас будут интересовать значения m {\displaystyle m} , не очень отличающиеся от наивероятнейшего. Тогда при фиксированном p {\displaystyle p} условие n → + ∞ {\displaystyle n\rightarrow +\infty } будет также означать, что
Поэтому использование приближённой формулы Стирлинга для замены факториалов в биномиальном распределении допустимо, и мы получаем
Также понадобится использование отклонения относительной частоты от наивероятнейшего значения:
Тогда выражение (4) приобретает вид:
Предположим, что
Взяв логарифм второго и третьего множителей равенства (6), применим разложение в ряд Тейлора:
Располагаем члены этого разложения по степеням x m {\displaystyle x_{m}} :
Предположим, что при n → + ∞ , {\displaystyle n\rightarrow +\infty ,}
Это условие, как уже было указано выше, означает, что рассматриваются значения m {\displaystyle m} не очень далёкие от наивероятнейшего. Очевидно, что (10) обеспечивает выполнение (7) и (3).
Теперь, пренебрегая вторым и последующими членами в разложении (6), получаем, что логарифм произведения второго и третьего членов произведения в правой части (8) равен
Отбрасывая малые слагаемые в скобках первого множителя (6), получаем
Обозначив
переписываем (12) в виде
Где φ ( x m ) {\displaystyle \varphi (x_{m})} — нормальная функция.
Поскольку в интервале [ m , m + 1 ) {\displaystyle [m,m+1)} имеется только одно целое число m {\displaystyle m} , то можно сказать, что p n ( m ) {\displaystyle p_{n}(m)} есть вероятность попадания m {\displaystyle m} в интервал [ m , m + 1 ) {\displaystyle [m,m+1)} . Из (5) следует, что изменению m {\displaystyle m} на 1 соответствует изменение x m {\displaystyle x_{m}} на
Поэтому вероятность попадания m {\displaystyle m} в интервал [ m , m + 1 ) {\displaystyle [m,m+1)} равна вероятности попадания x m {\displaystyle x_{m}} в промежуток [ x m 0 , x m 0 + Δ x ) , {\displaystyle [x_{m0},x_{m0}+\Delta x),}
Если n → + ∞ {\displaystyle n\rightarrow +\infty } , то Δ x → + 0 {\displaystyle \Delta x\rightarrow +0} и равенство (16) показывает, что нормальная функция φ ( x ) {\displaystyle \varphi (x)} является плотностью случайной переменной x m {\displaystyle x_{m}} .
Таким образом, если n → + ∞ , n x 3 → 0 {\displaystyle n\rightarrow +\infty ,nx^{3}\rightarrow 0} то для отклонения относительной частоты от наивероятнейшего значения справедлива асимптотическая формула (16), в которой φ ( x ) {\displaystyle \varphi (x)} — нормальная функция с x m = 0 {\displaystyle x_{m}=0} и σ 2 = p q n {\displaystyle \sigma ^{2}={\frac {pq}{n}}} .
Таким образом, теорема доказана.