Функція маси ймовірності відрізняється від функції густини імовірності (ФГІ) тим, що остання пов'язана з неперервними випадковими величинами, а не з дискретними. Щоби вона давала ймовірність, ФГІ потрібно інтегрувати на проміжку.[4]
Значення випадкової величини, яке має найбільшу масу ймовірності, називають модою.
Формальне визначення
Функція маси ймовірності — це розподіл імовірності дискретної випадкової величини, вона подає можливі значення та їхні відповідні ймовірності. Це функція , визначена як
Імовірності, пов'язані з усіма (гіпотетичними) значеннями, повинні бути невід'ємними, та давати в сумі 1:
і
Міркування про ймовірність як про масу допомагає уникати помилок, оскільки фізична маса зберігається, як і повна ймовірність для всіх гіпотетичних результатів .
Формулювання в термінах теорії міри
Функцію маси ймовірності дискретної випадкової величини можливо розглядати як окремий випадок двох загальніших конструкцій теорії міри: розподілу та функції густини ймовірності щодо лічильної міри. Нижче наведено докладніше пояснення.
Припустімо, що — імовірнісний простір, а — вимірний простір, σ-алгебра в основі якого дискретна, зокрема містить одноелементні множини з . У цьому випадку випадкова величина дискретна, за умови що її образ зліченний.
Образ міри(інші мови), в цьому контексті званий розподілом , є ймовірнісною мірою на , обмеження якої на одноелементні множини породжує функцію маси ймовірності (як зазначено в попередньому розділі) , оскільки для кожного .
Тепер припустімо, що — простір з мірою з лічильною мірою . Функція густини ймовірності для щодо лічильної міри, якщо вона існує, є похідною Радона — Нікодима образу міри (щодо лічильної міри), тож , а є функцією з до невід'ємних дійсних чисел. Як наслідок, для будь-якого маємо
що показує, що є фактично функцією маси ймовірності.
Якщо існує природний порядок серед можливих значень , то може бути зручно призначити їм числові значення (або n-вимірні кортежі у випадку дискретної багатовимірної випадкової величини), і розглянути також значення, що не належать образові. Тобто, може бути визначено для всіх дійсних чисел, і для всіх , як показано на графіку.
Образ має зліченну підмножину, на якій функція маси ймовірності є одиницею. Як наслідок, функція маси ймовірності дорівнює нулеві для всіх, крім зліченної кількості значень .
Розривність функцій маси ймовірності пов'язана з тим, що інтегральна функція розподілу дискретної випадкової величини також розривна. Якщо — дискретна випадкова величина, то означає, що випадкова подія достовірна (відбувається у 100 % випадків); навпаки, означає, що випадкова подія неможлива. Це твердження не істинне для неперервної випадкової величини, для якої для будь-якого можливого . Процес перетворення неперервної випадкової величини на дискретну — це дискретування(інші мови).
Розподіл Бернуллі, ber(p), використовують для моделювання експерименту, що має лише два можливі результати. Ці два результати часто кодують як 1 та 0. Приклад розподілу Бернуллі — підкидання монети. Нехай — це вибірко́вий простір всіх результатів одиничного підкидання симетричної монети(інші мови), а — випадкова величина, визначена на , яка призначує 0 категорії «реверс» і 1 категорії «аверс». Оскільки монета симетрична, функція маси ймовірності така:
Біноміальний розподіл моделює кількість успіхів у разі спроб із вертанням. Кожна спроба або експеримент незалежна й має два можливі результати. Пов'язана з ним функція маси ймовірності виглядає як . Приклад біноміального розподілу — ймовірність отримати рівно одну 6 при підкиданні симетричної гральної кісточки тричі.
Геометричний розподіл описує кількість спроб, необхідних для досягнення одного успіху. Його функція маси ймовірності виглядає як .Приклад — підкидання монети, поки не випаде перший аверс. позначує ймовірність результату «аверс», а — кількість необхідних підкидань монети. Інші розподіли, які можливо моделювати за допомогою функції маси ймовірності, — категорійний розподіл (відомий також як узагальнений розподіл Бернуллі) та поліноміальний розподіл.
Якщо дискретний розподіл має дві або більше категорій, з яких може відбутися одна, незалежно від того, чи мають ці категорії природний порядок, і коли є лише одна спроба (витягування), то це категоріальний розподіл.
Приклад багатовимірного дискретного розподілу та його функції маси ймовірності — поліноміальний розподіл. У ньому декілька випадкових величин відповідають кількостям успіхів у кожній з категорій після заданої кількості спроб, і кожна ненульова функція маси ймовірності дає ймовірність певної комбінації кількостей успіхів у різних категоріях.
Нескінченні
Наведений нижче експоненційно спадний розподіл — приклад розподілу з нескінченним числом можливих результатів, усіма додатними цілими числами: Незважаючи на нескінченну кількість можливих результатів, сумарна маса ймовірності становить 1/2 + 1/4 + 1/8 + ⋯ = 1, що відповідає вимозі одиничної повної ймовірності для її розподілу.
Дві або більше дискретні випадкові величини мають спільну функцію маси ймовірності, яка задає ймовірність кожної можливої комбінації результатів для цих випадкових величин.