Na probabilidade e estatística, a Distribuição de Dirichlet (nome em homenagem à Johann Peter Gustav Lejeune Dirichlet), frequentemente representada por Dir(α), é uma distribuição discreta multivaridada com um parâmetro (vetorial) α não-negativo e real.
Em análises Bayesianas, a distribuição de Dirichlet é usada como a distribuição conjugada da distribuição multinomial, ou seja, se a distribuição a priori é uma distribuição de Dirichlet e a variável observada é uma multinominal, então a distribuição a posteriori será uma distribuição de Dirichlet (com outro parâmetro).
A função de densidade das probabilidades da distribuição de Dirichlet de ordem K são as seguintes:
Onde x i ≥ 0 {\displaystyle x_{i}\geq 0\,} , ∑ i = 1 K x i = 1 {\displaystyle \sum _{i=1}^{K}x_{i}=1\,} , e α i > 0 {\displaystyle \alpha _{i}>0\,} .
A normalização constante é a multinomial função beta, que podem ser expressos nos termos da função gama:
se X = ( X 1 , … , X K ) ∼ Dir ( α ) {\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha )} e α 0 = ∑ i = 1 K α i {\displaystyle \alpha _{0}=\sum _{i=1}^{K}\alpha _{i}} . então:
De fato, essa é uma das propriedades da distribuição beta:
Além disso:
A maneira de distribuição resulta em um vetor (x1, ..., xK) com:
A distribuição de Dirichlet é conjugada como uma distribuição multinomial com a seguinte lógica: se
Onde βi São ocorrências dos números i na amostra de n Pontos na discreta distribuição de {1, ..., K} definida por X, então:
A relação usada nas estatísticas Bayesiana para descobrir o valor das incógnitas, X, de uma distribuição oculta de probabilidades, dada por n amostras. Intuitivamente, a distribuição prior representada como Dir(α), sendo Dir(α + β) resulta em uma distribuição posterior observadas com o historiograma β.
(ver artigo principal: Vetor Neutro).
se X = ( X 1 , … , X K ) ∼ Dir ( α ) {\displaystyle X=(X_{1},\ldots ,X_{K})\sim \operatorname {Dir} (\alpha )} , então o vetor ~ X {\displaystyle X} será neutro[1] se o sentido de X 1 {\displaystyle X_{1}} for independente de X 2 / ( 1 − X 1 ) , X 3 / ( 1 − X 1 ) , … , X K / ( 1 − X 1 ) {\displaystyle X_{2}/(1-X_{1}),X_{3}/(1-X_{1}),\ldots ,X_{K}/(1-X_{1})} e similar à X 2 , … , X K − 1 {\displaystyle X_{2},\ldots ,X_{K-1}} .