התפלגות דיריכלה
התפלגות דיריכלה
פונקציית צפיפות ההסתברות
מאפיינים
פרמטרים
K
≥ ≥ -->
2
{\displaystyle K\geq 2}
מספר הקטגוריות (מספר שלם )
α α -->
=
(
α α -->
1
,
… … -->
,
α α -->
K
)
{\displaystyle {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
הם פרמטרים של ריכוז, כאשר
α α -->
i
>
0
{\displaystyle \alpha _{i}>0}
תומך
x
1
,
… … -->
,
x
K
{\displaystyle x_{1},\ldots ,x_{K}}
כאשר
x
i
∈ ∈ -->
[
0
,
1
]
{\displaystyle x_{i}\in [0,1]}
ו-
∑ ∑ -->
i
=
1
K
x
i
=
1
{\displaystyle \sum _{i=1}^{K}x_{i}=1}
פונקציית צפיפות הסתברות (pdf)
1
B
(
α α -->
)
∏ ∏ -->
i
=
1
K
x
i
α α -->
i
− − -->
1
{\displaystyle {\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
כאשר
B
(
α α -->
)
=
∏ ∏ -->
i
=
1
K
Γ Γ -->
(
α α -->
i
)
Γ Γ -->
(
α α -->
0
)
{\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma {\bigl (}\alpha _{0}{\bigr )}}}}
ו-
α α -->
0
=
∑ ∑ -->
i
=
1
K
α α -->
i
{\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}}
תוחלת
E
-->
[
X
i
]
=
α α -->
i
α α -->
0
{\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\alpha _{0}}}}
E
-->
[
ln
-->
X
i
]
=
ψ ψ -->
(
α α -->
i
)
− − -->
ψ ψ -->
(
α α -->
0
)
{\displaystyle \operatorname {E} [\ln X_{i}]=\psi (\alpha _{i})-\psi (\alpha _{0})}
(כאשר
ψ ψ -->
{\displaystyle \psi }
היא פונקציית דיגמא )
ערך שכיח
x
i
=
α α -->
i
− − -->
1
α α -->
0
− − -->
K
,
α α -->
i
>
1.
{\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\quad \alpha _{i}>1.}
שונות
Var
-->
[
X
i
]
=
α α -->
~ ~ -->
i
(
1
− − -->
α α -->
~ ~ -->
i
)
α α -->
0
+
1
,
{\displaystyle \operatorname {Var} [X_{i}]={\frac {{\tilde {\alpha }}_{i}(1-{\tilde {\alpha }}_{i})}{\alpha _{0}+1}},}
Cov
-->
[
X
i
,
X
j
]
=
δ δ -->
i
j
α α -->
~ ~ -->
i
− − -->
α α -->
~ ~ -->
i
α α -->
~ ~ -->
j
α α -->
0
+
1
{\displaystyle \operatorname {Cov} [X_{i},X_{j}]={\frac {\delta _{ij}\,{\tilde {\alpha }}_{i}-{\tilde {\alpha }}_{i}{\tilde {\alpha }}_{j}}{\alpha _{0}+1}}}
כאשר
α α -->
~ ~ -->
i
=
α α -->
i
α α -->
0
{\displaystyle {\tilde {\alpha }}_{i}={\frac {\alpha _{i}}{\alpha _{0}}}}
, ו-
δ δ -->
i
j
{\displaystyle \delta _{ij}}
היא הדלתא של קרונקר
אנטרופיה
H
(
X
)
=
log
-->
B
(
α α -->
)
{\displaystyle H(X)=\log \mathrm {B} ({\boldsymbol {\alpha }})}
+
(
α α -->
0
− − -->
K
)
ψ ψ -->
(
α α -->
0
)
− − -->
{\displaystyle +(\alpha _{0}-K)\psi (\alpha _{0})-}
∑ ∑ -->
j
=
1
K
(
α α -->
j
− − -->
1
)
ψ ψ -->
(
α α -->
j
)
{\displaystyle \sum _{j=1}^{K}(\alpha _{j}-1)\psi (\alpha _{j})}
כאשר
α α -->
0
{\displaystyle \alpha _{0}}
מוגדר כמו בשונות, למעלה; ו-
ψ ψ -->
{\displaystyle \psi }
היא פונקציית דיגמא
פונקציה יוצרת מומנטים (mgf)
α α -->
i
=
E
[
X
i
]
(
E
[
X
j
]
(
1
− − -->
E
[
X
j
]
)
V
[
X
j
]
− − -->
1
)
{\displaystyle \alpha _{i}=E[X_{i}]\left({\frac {E[X_{j}](1-E[X_{j}])}{V[X_{j}]}}-1\right)}
כאשר
j
{\displaystyle j}
יכול להיות כל אינדקס כולל,
i
{\displaystyle i}
עצמו
בתורת ההסתברות ובסטטיסטיקה , התפלגות דיריכלה (על שם Peter Gustav Lejeune Dirichlet ), מסומנת לעיתים קרובות
Dir
-->
(
α α -->
)
{\displaystyle \operatorname {Dir} ({\boldsymbol {\alpha }})}
, היא משפחה של התפלגויות רב-משתניות רציפות המוגדרות על ידי וקטור
α α -->
{\displaystyle {\boldsymbol {\alpha }}}
של ממשיים חיוביים. זוהי הכללה רב-משתנית של התפלגות ביתא ,[ 1] ומכאן שמה החלופי - התפלגות בטא רב-משתנית (MBD) . [ 2] התפלגות דיריכלה משמשת בדרך כלל כהתפלגות פריורית בסטטיסטיקה בייסיאנית , ולמעשה, התפלגות דיריכלה היא ההתפלגות הצמודה של ההתפלגות הקטגוריאלית וההתפלגות המולטינומית .
ההכללה האינסוף-ממדית של התפלגות דיריכלה היא תהליך דיריכלה .
הגדרות
פונקציית צפיפות הסתברות
הדגמה כיצד הלוג של פונקציית הצפיפות משתנה כאשר K = 3 ואנו משנים את הווקטור α מ- α = (0.3, 0.3, 0.3) עד (2.0, 2.0, 2.0), תוך שמירה על כך שכל הרכיבים של
α α -->
{\displaystyle \alpha }
נשארים שווים זה לזה.
בערך זה נעשה שימוש בסימנים מוסכמים מתחום המתמטיקה. להבהרת הסימנים ראו סימון מתמטי .
להתפלגות דיריכלה מסדר
K
≥ ≥ -->
2
{\displaystyle K\geq 2}
עם פרמטרים
0
<
α α -->
1
,
.
.
.
α α -->
K
{\displaystyle 0<\alpha _{1},...\alpha _{K}}
, יש פונקציית צפיפות , לפי למידת לבג במרחב האוקלידי
R
K
− − -->
1
{\displaystyle \mathbb {R} ^{K-1}}
, המתוארת באמצעות:
f
(
x
1
,
… … -->
,
x
K
;
α α -->
1
,
… … -->
,
α α -->
K
)
=
1
B
(
α α -->
)
∏ ∏ -->
i
=
1
K
x
i
α α -->
i
− − -->
1
{\displaystyle f\left(x_{1},\ldots ,x_{K};\alpha _{1},\ldots ,\alpha _{K}\right)={\frac {1}{\mathrm {B} ({\boldsymbol {\alpha }})}}\prod _{i=1}^{K}x_{i}^{\alpha _{i}-1}}
כאשר
{
x
k
}
k
=
1
k
=
K
{\displaystyle \{x_{k}\}_{k=1}^{k=K}}
שייכים לסימפלקס
K
− − -->
1
{\displaystyle K-1}
תקני, או באופן שקול, לכל
i
∈ ∈ -->
{
1
,
… … -->
,
K
}
{\textstyle i\in \{1,\dots ,K\}}
,
∑ ∑ -->
i
=
1
K
x
i
=
1
,
x
i
∈ ∈ -->
[
0
,
1
]
{\textstyle \sum _{i=1}^{K}x_{i}=1{\mbox{, }}x_{i}\in \left[0,1\right]}
.
הקבוע המנרמל הוא פונקציית בטא רב-משתנית, שניתן לבטאו במונחים של פונקציית גמא :
B
(
α α -->
)
=
∏ ∏ -->
i
=
1
K
Γ Γ -->
(
α α -->
i
)
Γ Γ -->
(
∑ ∑ -->
i
=
1
K
α α -->
i
)
,
α α -->
=
(
α α -->
1
,
… … -->
,
α α -->
K
)
{\displaystyle \mathrm {B} ({\boldsymbol {\alpha }})={\frac {\prod \limits _{i=1}^{K}\Gamma (\alpha _{i})}{\Gamma \left(\sum \limits _{i=1}^{K}\alpha _{i}\right)}},\qquad {\boldsymbol {\alpha }}=(\alpha _{1},\ldots ,\alpha _{K})}
תומך
התומך של התפלגות דיריכלה היא קבוצת וקטורים
K
{\displaystyle K}
ממדיים
x
{\displaystyle {\boldsymbol {x}}}
שהערכים שלהם הם מספרים ממשיים בקטע [0,1] כך ש
‖ ‖ -->
x
‖ ‖ -->
1
=
Σ Σ -->
i
x
i
=
1
{\displaystyle \|{\boldsymbol {x}}\|_{1}=\Sigma _{i}x_{i}=1}
, כלומר סכום הקואורדינטות שווה ל-1. למשל עבור
K
=
3
{\displaystyle K=3}
התומך הוא משולש שווה-צלעות המשוכן במרחב התלת-ממדי, שקודקודיו בנקודות (1,0,0), (0,1,0) ו (0,0,1), כלומר נמצאים על צירי הקואורדינטות במרחק 1 מהראשית.
תכונות
מומנטים מסדר שני
יהי
X
=
(
X
1
,
… … -->
,
X
K
)
∼ ∼ -->
Dir
-->
(
α α -->
)
{\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} ({\boldsymbol {\alpha }})}
. ויהי
α α -->
0
=
∑ ∑ -->
i
=
1
K
α α -->
i
{\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}}
.
אזי על פי[ 3]
E
-->
[
X
i
]
=
α α -->
i
α α -->
0
,
{\displaystyle \operatorname {E} [X_{i}]={\frac {\alpha _{i}}{\alpha _{0}}},}
Var
-->
[
X
i
]
=
α α -->
i
(
α α -->
0
− − -->
α α -->
i
)
α α -->
0
2
(
α α -->
0
+
1
)
.
{\displaystyle \operatorname {Var} [X_{i}]={\frac {\alpha _{i}(\alpha _{0}-\alpha _{i})}{\alpha _{0}^{2}(\alpha _{0}+1)}}.}
פרט לכך, אם
i
≠ ≠ -->
j
{\displaystyle i\neq j}
אז
Cov
-->
[
X
i
,
X
j
]
=
− − -->
α α -->
i
α α -->
j
α α -->
0
2
(
α α -->
0
+
1
)
{\displaystyle \operatorname {Cov} [X_{i},X_{j}]={\frac {-\alpha _{i}\alpha _{j}}{\alpha _{0}^{2}(\alpha _{0}+1)}}}
.
מטריצת הקוויראנס היא אם כך סימטרית והפיכה.
שכיח
השכיח של ההתפלגות הוא[ 4] הווקטור
(
x
1
,
… … -->
,
x
k
)
{\displaystyle (x_{1},\ldots ,x_{k})}
כאשר
x
i
=
α α -->
i
− − -->
1
α α -->
0
− − -->
K
,
α α -->
i
>
1
{\displaystyle x_{i}={\frac {\alpha _{i}-1}{\alpha _{0}-K}},\qquad \alpha _{i}>1}
.
התפלגות שולית
ההתפלגות השוליות הן התפלגויות בטא [ 5]
X
i
∼ ∼ -->
Beta
-->
(
α α -->
i
,
α α -->
0
− − -->
α α -->
i
)
{\displaystyle X_{i}\sim \operatorname {Beta} (\alpha _{i},\alpha _{0}-\alpha _{i})}
.
אנטרופיה
קישורים חיצוניים
הערות שוליים