일반화된 디리클레 분포

Generalized Dirichlet distribution

통계학에서 일반화된 디리클레 분포(GD)는 더 일반적인 공분산 구조와 모수의 거의 두 배의 숫자를 가진 디리클레 분포의 일반화입니다.GD 분포를 갖는 랜덤 벡터는 완전히 [1]중립입니다.

1 - 밀도 함수는

여기서 p - i = k - ({}=_{i합니다. B () B)는 베타 함수를 나타냅니다.이는 - leqslanti\( 임의)에 대해 - + }= 표준 디리클레 분포로 감소합니다.

예를 들어, k=4라면, 함수는

1 + + < + + < 1 - - 2- 3 } =

코너와 모시만은 다음과 같은 이유로 PDF를 정의합니다.무작위 변수 z 1, …, z k - 1 z_{1},\ldots,z_{k-1}을 정의합니다. z 1 = p 2 / (1 - (p 1 + p 2 ), z 3 = p 3 / (1 - (p 1 + p 2 ), z = p / (1 - (p 1 + p + p 1 ), z = p 1 (p 1 + p - 1 ), z _ left _ 2 _ = {p 1 (p - p - (p 1 ) \ p - (p - p - p - p - p - p - p - p - p - p - p - 1, 다음 매개 변수 }, …, - i = 을 갖는 독립적인 베타인 경우 위의 매개 변수화된 대로 일반화된 디리클레 분포를 가집니다.

웡이 준 대체 양식

Wong은[2] x + + ({{1} +\ 1 약간 더 간결한 형태를 제공합니다.

여기서 γ j = β j - α j + 1 - β j + 1 \lamma _{j}=\lamma _{j}-\alpha _{j+1}-\lamma _{j+1}은 1 ≤ j ≤ k - 1 \leq j \leq k-1 및 γ k gamma k = \lamma _{k} k ∑ k에 대한 분포를 정의합니다온노르와 모시만은 1- ∑ - \{ }= _k - 1 k-1 사용합니다.

일반 모멘트 함수

(…, ~ k ( …, =\

여기서 2 k - 1 j+ + + + + k \ _ {j} =1} + +2+\cdots +k}는 2, - 1 j = 1, 2, \, k-1, k = 0 \_{k} 입니다.

표준 디리클레 분포로 감소

위에서 설명한 바와 , 2 {\leq k에 대해 - + b_{ + 이면 분포는 표준 디리클레로 감소합니다.이 조건은 일반화된 분포의 추가 모수를 0으로 설정하면 원래 분포가 발생하는 일반적인 경우와 다릅니다.그러나 GDD의 경우 매우 복잡한 밀도 함수를 생성합니다.

베이지안 분석

X = (X1, …, Xk ) ~ GD k (α1, …, αk; β1, …, βk) X=\left(X_{1},\ldots, X_{k}\right)\sim GD_{k}\sim GD_{k}\sim GD_{k}\left(\alpha_{1};\ldots,\ldots,\right),\ldots,\ldots,\ldots,\lots,\lots,\, \ \ \ \ k - i \ _ { k + = - \ _ { = }^ {} X 후부에 Y j = j{ j Y_{ j} = { 일반화된 디리클렛 분포입니다.

+ j ({alpha }=\ _{} + }) β j + i + + i{= \ _ + { + + { kquant k}.

샘플링 실험

Wong은 디리클레 분포와 일반화된 디리클레 분포가 어떻게 다른지에 대한 예로 다음 시스템을 제공합니다.그는 큰 항아리에 k+ k + 다른 색의 공이 있다고 가정합니다.각 색상의 비율은 알 수 없습니다.항아리에 있는 볼의 비율을 X ( ,… , k ) X=(라고 .

실험 1.분석가 X ~ 1 k, k + D __{_{, X는 i \_{를 갖는 디리클렛입니다.그런 다음 분석가는k + + 유리 상자를 i \ _개의 대리석을 (i \ _ 정수1 \ 1이라고 가정합니다).그런 다음 분석가 1이 항아리에서 공을 꺼내 색상(예: 을 관찰한 jj에 넣습니다. 상자가 투명하고 안에 있는 구슬의 색상이 보이기 때문에 올바른 상자를 식별할 수 있습니다. n개의 공이 그려질 까지 계속됩니다.그런 다음 사후 분포는 각 상자의 구슬 수가 모수인 디리클레입니다.

실험 2.분석가 2는 X가 일반화된 디리클레 분포를 따른다고 : ~ (1…, ; 1…, k ) GD _ {_ {_ {k 모든 매개 변수는 다시 양의 정수로 가정됩니다.분석가는 k+ k + 나무 상자를 .그 상자들은 두 개의 영역을 가지고 있습니다: 하나는 공을 위한 것이고 다른 하나는 구슬을 위한 것입니다.공은 색을 띠지만 구슬은 색을 띠지 않습니다.그런 다음 j k j = , 그는 j \ _ 색 j j β \ _개의 j j에 넣습니다. 그는 상자+ + k + k +1그런 다음 분석가가 항아리에서 공을 꺼냅니다.상자가 나무이기 때문에 분석가는 어떤 상자에 공을 넣어야 할지 알 수 없습니다(위의 실험 1에서와 같이). 또한 기억력이 좋지 않고 어떤 상자에 어떤 색의 공이 들어 있는지 기억할 수 없습니다.그는 공을 넣을 수 있는 정확한 상자를 찾아야 합니다.그는 1번 박스를 열고 그 안에 있는 공들을 드로잉된 공과 비교함으로써 이것을 합니다.색상이 다르면 상자가 잘못된 것입니다.분석가는 상자 1에 대리석(sic)을 넣고 상자 2로 진행합니다.그는 상자 안의 공이 그려진 공과 일치할 때까지 이 과정을 반복하고, 그 시점에서 상자 안의 공(sic)을 일치하는 다른 색의 공과 함께 넣습니다.그런 다음 분석가는 항아리에서 다른 공을 뽑고 공이 그려질 까지 반복합니다.그런 다음 사후는 각 상자에서 매개 \alpha가 공의 β \ 구슬의 수인 일반화된 디리클레입니다.

실험 2에서는 실험 1과 달리 상자의 순서를 변경하면 사소한 효과가 발생합니다.

참고 항목

레퍼런스

  1. ^ R. J. 코너와 J. E. 모시만 1969.디리클레 분포를 일반화한 비율에 대한 독립성 개념.미국 통계학회지, 제64권, 194~206페이지
  2. ^ T.T. Wong 1998.베이지안 분석에서 일반화된 디리클레 분포.응용수학과 계산, 권97, 165-181