Eine Wahrscheinlichkeitsfunktion, auch Zähldichte genannt,[1] ist eine spezielle reellwertige Funktion in der Stochastik. Wahrscheinlichkeitsfunktionen werden zur Konstruktion und Untersuchung von Wahrscheinlichkeitsverteilungen, genauer diskreten Wahrscheinlichkeitsverteilungen verwendet. Dabei kann jeder diskreten Wahrscheinlichkeitsverteilung eine eindeutige Wahrscheinlichkeitsfunktion zugeordnet werden. Umgekehrt definiert jede Wahrscheinlichkeitsfunktion eine eindeutig bestimmte diskrete Wahrscheinlichkeitsverteilung.
In den meisten Fällen werden Wahrscheinlichkeitsfunktionen auf den natürlichen Zahlen definiert. Sie ordnen dann jeder Zahl die Wahrscheinlichkeit zu, dass diese Zahl auftritt. So würde bei der Modellierung eines fairen Würfels die Wahrscheinlichkeitsfunktion den Zahlen von eins bis sechs jeweils den Wert 1 6 {\displaystyle {\tfrac {1}{6}}} zuordnen und allen anderen die Null.
Aus der Sicht der Maßtheorie handelt es sich bei Wahrscheinlichkeitsfunktionen um spezielle Dichtefunktionen (im Sinne der Maßtheorie) bezüglich des Zählmaßes. Diese werden im allgemeineren Kontext auch Gewichtsfunktionen genannt.[2]
Definition Wahrscheinlichkeitsfunktion: Für eine diskrete Zufallsvariable X {\displaystyle X} ist die Wahrscheinlichkeitsfunktion f ( x ) {\displaystyle f(x)} für x ∈ R {\displaystyle x\in \mathbb {R} } definiert durch
Gegeben sei ein Wahrscheinlichkeitsraum ( Ω , A , P ) {\displaystyle (\Omega ,{\mathcal {A}},{\mathbb {P} })} sowie eine Funktion f : N 0 → R {\displaystyle f\colon \mathbb {N} _{0}\to \mathbb {R} } mit folgenden Eigenschaften:
Die Funktion f {\displaystyle f} ordnet also jeder natürlichen Zahl eine reelle Zahl zwischen null und eins zu und ist normiert in dem Sinne, dass sich die Funktionswerte zu eins aufsummieren.
Dann heißt f {\displaystyle f} eine Wahrscheinlichkeitsfunktion und definiert durch
eine eindeutig bestimmte Wahrscheinlichkeitsverteilung P {\displaystyle {P}} auf den natürlichen Zahlen N 0 {\displaystyle \mathbb {N} _{0}} , versehen mit der Potenzmenge P ( N 0 ) {\displaystyle {\mathcal {P}}(\mathbb {N} _{0})} als der Sigma-Algebra A {\displaystyle {\mathcal {A}}} (Ereignissystem).
Insbesondere gilt aufgrund der Sigma-Additivität des Wahrscheinlichkeitsmaßes P {\displaystyle \mathbb {P} } :
Aus f ( i ) = P ( X = i ) {\displaystyle f(i)=P(X=i)} folgt des Weiteren:
Es ist hierbei zu beachten, dass P {\displaystyle {P}} als Wahrscheinlichkeitsverteilung lediglich Mengen aus Ω {\displaystyle \Omega } als Argumente zulässt, während die Argumente der Wahrscheinlichkeitsfunktion stets durch einzelne natürliche Zahlen als Elemente von Ω {\displaystyle \Omega } dargestellt werden. Das Wahrscheinlichkeitsmaß P {\displaystyle \mathbb {P} } hingegen ist definiert als die Abbildung:
Gegeben sei eine Wahrscheinlichkeitsverteilung P {\displaystyle P} auf den natürlichen Zahlen N 0 {\displaystyle \mathbb {N} _{0}} , versehen mit P ( N 0 ) {\displaystyle {\mathcal {P}}(\mathbb {N} _{0})} , und sei X {\displaystyle X} eine Zufallsvariable mit Werten in N 0 {\displaystyle \mathbb {N} _{0}} . Dann heißt
definiert durch
die Wahrscheinlichkeitsfunktion von P {\displaystyle \mathbb {P} } . Analog heißt
die Wahrscheinlichkeitsfunktion von X {\displaystyle X}
Eine typische Wahrscheinlichkeitsfunktion ist
für eine natürliche Zahl n {\displaystyle n} und eine reelle Zahl p ∈ ( 0 , 1 ) {\displaystyle p\in (0,1)} . Die Normiertheit folgt hier direkt aus dem binomischen Lehrsatz, denn es ist
Die so erzeugte Wahrscheinlichkeitsverteilung ist die Binomialverteilung.
Eine weitere klassische Wahrscheinlichkeitsfunktion ist
und ein p ∈ ( 0 , 1 ) {\displaystyle p\in (0,1)} . Hier folgt die Normiertheit aus der geometrischen Reihe, denn es ist
Die so erzeugte Wahrscheinlichkeitsverteilung ist die Geometrische Verteilung.
Die Definition lässt sich von den natürlichen Zahlen auf beliebige höchstens abzählbare Mengen ausweiten. Ist Ω {\displaystyle \Omega } solch eine Menge und ist
mit
so definiert f {\displaystyle f} durch
eine eindeutig bestimmte Wahrscheinlichkeitsverteilung auf ( Ω , P ( Ω ) ) {\displaystyle (\Omega ,{\mathcal {P}}(\Omega ))} .[3] Ist umgekehrt P {\displaystyle P} eine Wahrscheinlichkeitsverteilung auf ( Ω , P ( Ω ) ) {\displaystyle (\Omega ,{\mathcal {P}}(\Omega ))} und X {\displaystyle X} eine Zufallsvariable mit Werten in Ω {\displaystyle \Omega } , so heißen
und
die Wahrscheinlichkeitsfunktion von P {\displaystyle P} beziehungsweise X {\displaystyle X} .[4]
Manche Autoren definieren zuerst reelle Folgen ( p i ) i ∈ Ω {\displaystyle (p_{i})_{i\in \Omega }} mit p i ∈ [ 0 , 1 ] {\displaystyle p_{i}\in [0,1]} für alle i ∈ Ω {\displaystyle i\in \Omega } und
und nennen diese Folgen Wahrscheinlichkeitsvektoren[5] oder stochastische Folgen[6][7].
Eine Wahrscheinlichkeitsfunktion wird dann definiert als
gegeben durch
Umgekehrt definiert dann jede Wahrscheinlichkeitsverteilung oder Zufallsvariable auf Ω {\displaystyle \Omega } auch eine stochastische Folge/Wahrscheinlichkeitsvektor über ( P ( { i } ) ) i ∈ Ω {\displaystyle (P(\{i\}))_{i\in \Omega }} beziehungsweise ( P ( X = i ) ) i ∈ Ω {\displaystyle (P(X=i))_{i\in \Omega }}
Andere Autoren nennen bereits die Folge ( p i ) i ∈ Ω {\displaystyle (p_{i})_{i\in \Omega }} eine Zähldichte.[8]
Typisches Beispiel für Wahrscheinlichkeitsfunktionen auf beliebigen Mengen ist die diskrete Gleichverteilung auf einer endlichen Menge Ω {\displaystyle \Omega } . Sie besitzt dann per Definition die Wahrscheinlichkeitsfunktion
Der Zugang über die stochastischen Folgen erlaubt die folgende Konstruktion von Wahrscheinlichkeitsfunktionen: Ist eine beliebige (höchstens abzählbare) Folge von positiven reellen Zahlen ( a i ) i ∈ Ω {\displaystyle (a_{i})_{i\in \Omega }} mit Indexmenge Ω {\displaystyle \Omega } gegeben, für die
gilt, so definiert man
Dann ist ( a i c ) i ∈ Ω {\displaystyle ({\tfrac {a_{i}}{c}})_{i\in \Omega }} eine stochastische Folge und definiert damit auch eine Wahrscheinlichkeitsfunktion. Betrachtet man zum Beispiel die Folge
so ist
Somit ist die Normierungskonstante c = e λ {\displaystyle c=e^{\lambda }} und als Wahrscheinlichkeitsfunktion ergibt sich
Dies ist die Wahrscheinlichkeitsfunktion der Poisson-Verteilung.
Viele der wichtigen Kennzahlen von Zufallsvariablen und Wahrscheinlichkeitsverteilungen lassen sich bei Existenz der Wahrscheinlichkeitsfunktion direkt aus dieser herleiten.
Ist X {\displaystyle X} eine Zufallsvariable mit Werten in N {\displaystyle \mathbb {N} } und Wahrscheinlichkeitsfunktion f X {\displaystyle f_{X}} , so ist der Erwartungswert gegeben durch
Er existiert immer, kann aber auch unendlich sein. Ist allgemeiner Ω ⊂ R {\displaystyle \Omega \subset \mathbb {R} } eine höchstens abzählbare Teilmenge der reellen Zahlen und X {\displaystyle X} eine Zufallsvariable mit Werten in Ω {\displaystyle \Omega } und Wahrscheinlichkeitsfunktion f X {\displaystyle f_{X}} so ist der Erwartungswert gegeben durch
falls die Summe existiert.
Analog zum Erwartungswert lässt sich auch die Varianz direkt aus der Wahrscheinlichkeitsfunktion herleiten. Sei dazu
der Erwartungswert. Ist dann X {\displaystyle X} eine Zufallsvariable mit Werten in N {\displaystyle \mathbb {N} } und Wahrscheinlichkeitsfunktion f X {\displaystyle f_{X}} , so ist die Varianz gegeben durch
oder aufgrund des Verschiebungssatzes äquivalent dazu
Entsprechend gilt im allgemeineren Fall einer Zufallsvariable mit Werten in Ω {\displaystyle \Omega } (vgl. oben), dass
Auch hier gelten alle Aussagen nur, wenn die entsprechenden Summen existieren.
Für diskrete Wahrscheinlichkeitsverteilungen wird der Modus direkt über die Wahrscheinlichkeitsfunktion definiert: Ist X {\displaystyle X} eine Zufallsvariable mit Werten in N {\displaystyle \mathbb {N} } und Wahrscheinlichkeitsfunktion f {\displaystyle f} oder ist P {\displaystyle P} eine Wahrscheinlichkeitsverteilung auf N {\displaystyle \mathbb {N} } mit Wahrscheinlichkeitsfunktion f {\displaystyle f} , so heißt k mod {\displaystyle k_{\text{mod}}} ein Modus oder Modalwert von X {\displaystyle X} oder P {\displaystyle P} , wenn
ist. Ist etwas allgemeiner eine höchstens abzählbare Menge Ω {\displaystyle \Omega } gegeben, deren Elemente x k {\displaystyle x_{k}} in aufsteigender Ordnung sortiert sind, das heißt ⋯ < x k − 1 < x k < x k + 1 < … {\displaystyle \dots <x_{k-1}<x_{k}<x_{k+1}<\dots } , so heißt ein x k {\displaystyle x_{k}} ein Modus oder Modalwert, wenn
gilt.[9]
Ist f {\displaystyle f} eine Wahrscheinlichkeitsfunktion auf N {\displaystyle \mathbb {N} } , so ist die Verteilungsfunktion des entsprechenden Wahrscheinlichkeitsmaßes gegeben als
Dabei bezeichnet ⌊ ⋅ ⌋ {\displaystyle \lfloor \cdot \rfloor } die Abrundungsfunktion, das heißt ⌊ x ⌋ {\displaystyle \lfloor x\rfloor } ist größte ganze Zahl, die kleiner oder gleich x {\displaystyle x} ist.
Ist f {\displaystyle f} auf einer höchstens abzählbaren Teilmenge der reellen Zahlen definiert, also auf A ⊂ R {\displaystyle A\subset \mathbb {R} } , so ist die Verteilungsfunktion des Wahrscheinlichkeitsmaßes definiert durch
Beispiel hierfür ist A = Z {\displaystyle A=\mathbb {Z} } .
Für Wahrscheinlichkeitsverteilungen mit Wahrscheinlichkeitsfunktionen kann die Faltung (von Wahrscheinlichkeitsverteilungen) auf die Faltung (von Funktionen) der entsprechenden Wahrscheinlichkeitsfunktionen zurückgeführt werden. Sind P , Q {\displaystyle P,Q} Wahrscheinlichkeitsverteilungen mit Wahrscheinlichkeitsfunktionen f P {\displaystyle f_{P}} und f Q {\displaystyle f_{Q}} , so ist
Hierbei bezeichnet P ∗ Q {\displaystyle P*Q} die Faltung von P {\displaystyle P} und Q {\displaystyle Q} und f ∗ g {\displaystyle f*g} die Faltung der Funktionen f {\displaystyle f} und g {\displaystyle g} . Die Wahrscheinlichkeitsfunktion der Faltung zweier Wahrscheinlichkeitsverteilungen ist somit genau die Faltung der Wahrscheinlichkeitsfunktionen der Wahrscheinlichkeitsverteilungen.
Diese Eigenschaft überträgt sich direkt auf die Summe von stochastisch unabhängigen Zufallsvariablen. Sind zwei stochastisch unabhängige Zufallsvariablen X , Y {\displaystyle X,Y} mit Wahrscheinlichkeitsfunktionen f X {\displaystyle f_{X}} und f Y {\displaystyle f_{Y}} gegeben, so ist
Die Wahrscheinlichkeitsfunktion der Summe ist somit die Faltung der Wahrscheinlichkeitsfunktionen der einzelnen Zufallsvariablen.
Auf N {\displaystyle \mathbb {N} } lässt sich jeder Wahrscheinlichkeitsverteilung eine wahrscheinlichkeitserzeugende Funktion zuordnen. Dies ist ein Polynom oder eine Potenzreihe mit der Wahrscheinlichkeitsfunktion als Koeffizienten. Sie ist somit definiert als
für die Wahrscheinlichkeitsfunktion f P {\displaystyle f_{P}} einer Wahrscheinlichkeitsverteilung P {\displaystyle P} . Die wahrscheinlichkeitserzeugende Funktion einer Zufallsvariable wird analog definiert.
Wahrscheinlichkeitserzeugende Funktionen erleichtern die Untersuchung von und das Rechnen mit Wahrscheinlichkeitsverteilungen. So ist beispielsweise die wahrscheinlichkeitserzeugende Funktion der Faltung zweier Wahrscheinlichkeitsverteilungen genau das Produkt der wahrscheinlichkeitserzeugenden Funktionen der einzelnen Wahrscheinlichkeitsverteilungen. Ebenso finden sich wichtige Kennzahlen wie der Erwartungswert und die Varianz in den Ableitungen der wahrscheinlichkeitserzeugenden Funktionen wieder.