확률분포
통계 에서 행렬 정규 분포 또는 행렬 가우스 분포 는 다변량 정규 분포 를 행렬 값 랜덤 변수에 일반화하는 확률 분포 다.null
정의 행렬 정규 분포 M N , p (M , U , V ){\displaystyle {\mathcal{MN}_{n,p}(\mathbf {M},\mathbf {U} ,\mathbf {V} )을 따르는 랜덤 행렬 X (n × p)의 확률 밀도 함수 는 다음과 같은 형식을 갖는다.
p ( X ∣ M , U , V ) = 생략하다 ( − 1 2 t r [ V − 1 ( X − M ) T U − 1 ( X − M ) ] ) ( 2 π ) n p / 2 V n / 2 U p / 2 {\displaystyle p(\mathbf {X} \mid \mathbf {M} ,\mathbf {U} ,\mathbf {V} )={\frac {\exp \left(-{\frac {1}{2}}\,\mathrm {tr} \left[\mathbf {V} ^{-1}(\mathbf {X} -\mathbf {M} )^{T}\mathbf {U} ^{-1}(\mathbf {X} -\mathbf {M} )\right]\right)}{(2\pi )^{np/2} \mathbf {V} ^{n/2} \mathbf {U} ^{p/2}}}} 여기 서 t r {\ displaystyle \mathrm {tr}은( 는) 추적 을 나타내고 M 은 n × p , U 는 n × n , V 는 p × p 이다.
행렬 정규 분포는 다음과 같은 방법으로 다변량 정규 분포 와 관련이 있다.
X ∼ M N n × p ( M , U , V ) , {\displaystyle \mathbf {X} \sim {\mathcal {MN}_{n\times p}(\mathbf {M},\mathbf {U},\mathbf {V}),} 만약의 경우에 한해서만
v e c ( X ) ∼ N n p ( v e c ( M ) , V ⊗ U ) {\displaystyle \mathbrm {vc}(\mathbf {X} )\심 {\mathcal{N}_{np}(\mathbf {M}),\mathbf {V}\otimes \mathbf {U}}}}}}}} 여기서 ▼ {\displaystyle \otimes } 은(는) Kronecker 제품 을 나타내고 v e c ( ) {\displaystyle \mathbf {M}은( 는) M {\ displaystyle \mathbf {M}} 의 벡터화를 나타낸다.
증명 위의 행렬 정상 밀도와 다변량 정상 밀도 함수 사이의 동등성은 다음과 같이 추적 및 Kronecker 제품 의 여러 특성을 사용하여 나타낼 수 있다. 먼저 일반 PDF 매트릭스 지수의 인수로 시작하십시오.
− 1 2 tr [ V − 1 ( X − M ) T U − 1 ( X − M ) ] = − 1 2 송아지 고기 ( X − M ) T 송아지 고기 ( U − 1 ( X − M ) V − 1 ) = − 1 2 송아지 고기 ( X − M ) T ( V − 1 ⊗ U − 1 ) 송아지 고기 ( X − M ) = − 1 2 [ 송아지 고기 ( X ) − 송아지 고기 ( M ) ] T ( V ⊗ U ) − 1 [ 송아지 고기 ( X ) − 송아지 고기 ( M ) ] {\displaystyle {\begin{aligned}&\;\;\;\;-{\frac {1}{2}}{\text{tr}}\left[\mathbf {V} ^{-1}(\mathbf {X} -\mathbf {M} )^{T}\mathbf {U} ^{-1}(\mathbf {X} -\mathbf {M} )\right]\ \&=-{\frac{1}:{2}}: {\text{vec}}\왼쪽(\mathbf {X} -\mathbf {M} \오른쪽)^ {T}{\text{vec}}\left(\mathbf {U} ^{-1}(\mathbf {X} -\mathbf {M} )\mathbf {V} ^{-1}\right)\\&=-{\frac {1}{2}}{\text{vec}}\left(\mathbf {X} -\mathbf {M} \right)^ {T}\left(\mathbf {V} ^{-1}\otimes \mathbf {U} ^{-1}\right){\text{vec}}\left(\mathbf {X} -\mathbf {M} \right)\\&=-{\frac {1}{2}}\left[{\text{vec}}(\mathbf {X} )-{\text{vec}}(\mathbf {M} )\right]^ {T}\왼쪽(\mathbf {V} \mathbf {U} \right)^{-1}\{\text{vec}(\mathbf {X})-{\text{vec}(\mathbf {M} )\end{ligned}}}}}}}} 다변량 정규 PDF의 지수의 인수인 것이다. 검증은 결정 요인 속성 V ⊗ U = V n U . {\displaystyle \mathbf {V} \otimes \mathbf {U} = \mathbf {V} ^{n} \mathbf {U} ^{p} 을 사용하여 완료된다. }
특성. X ~ M N n × p ( M , U , V ) {\displaystyle \mathbf {X} \sim {\mathcal{MN}_{n\\timep p}(\mathbf {M},\mathbf {U},\mathbf {V })}, 다음과 같은 속성이 있다.[1] [2]
기대값 평균 또는 기대값 은 다음과 같다.
E [ X ] = M {\displaystyle E[\mathbf {X} ]=\mathbf {M}} 그리고 우리는 다음과 같은 2차 주문을 기대하고 있다.
E [ ( X − M ) ( X − M ) T ] = U tr ( V ) {\displaystyle E[(\mathbf {X} -\mathbf {M} )(\mathbf {X} -\mathbf {M})^{T}=\mathbf {U}\operatorname {tr}(\mathbf {V} )} E [ ( X − M ) T ( X − M ) ] = V tr ( U ) {\displaystyle E[(\mathbf {X} -\mathbf {M} )^{T}(\mathbf {X} -\mathbf {M} )=\mathbf {V}\operatorname {tr}(\mathbf {U} )} 여기서 tr {\displaystyle \propertname {tr}은( 는) 추적 을 의미한다 . null
보다 일반적으로 적절한 치수의 행렬 A,B ,C :
E [ X A X T ] = U tr ( A T V ) + M A M T E [ X T B X ] = V tr ( U B T ) + M T B M E [ X C X ] = V C T U + M C M {\displaystyle {\reasoned} E[\mathbf{X}\mathbf{A}\mathbf{X}^{T}]&, =\mathbf{U}\operatorname{tr}, =\mathbf{V}\operatorname{tr}{M}^{T}\mathbf{BM}\\E[\mathbf{X}\mathbf{C}\mathbf{X}]&(\mathbf{U}\mathbf{B}^{T})+\mathbf, =\mathbf{V}\mathbf{C}^{T}\mat{MAM}^ᆰ\\E[\mathbf{X}^{T}\mathbf{B}\mathbf{X}]&(\mathbf{A}^{T}\mathbf{V})+\mathbf.hbf{U}+\ma thbf {MCM} \end{aigned}}} 변환 변환 전치:
X T ∼ M N p × n ( M T , V , U ) {\displaystyle \mathbf {X} ^{T}\sim {\mathcal {MN}_{p\times n}(\mathbf {M}^{T},\mathbf {V},\mathbf {U})}} 선형 변환: D (r-by-n ), 전체 순위 r ≤ n 및 C (p-by-s ), 전체 순위 s ≤ p 가 되도록 한 다음:
D X C ∼ M N r × s ( D M C , D U D T , C T V C ) {\displaystyle \mathbf {DXC} \sim {\mathcal {MN}_{r\times s}(\mathbf {DMC},\mathbf {DUD} ^{T},\mathbf {VC})}}
예 다변량 정규 분포 에 따라 동일하게 분포된 n개 의 독립적 p-차원 랜덤 변수 표본을 상상해 보자.
Y i ∼ N p ( μ , Σ ) with i ∈ { 1 , … , n } {\displaystyle \mathbf {Y} _{i}\sim {\mathcal {N}}_{p}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}){\text{ with }}i\in \{1,\ldots ,n\}} . ith 행이 Y i {\ displaystyle \mathbf {X} 인 n × p 행렬 X {\ displaystyle \mathbf {Y} _{i}} 을( 를) 정의할 때 다음을 얻는다.
X ∼ M N n × p ( M , U , V ) {\displaystyle \mathbf {X} \sim {\mathcal {MN}_{n\times p}(\mathbf {M},\mathbf {U},\mathbf {V}),} 여기서 M {\ displaystyle \mathbf {M} 의 각 행은 μ {\ displaystyle {\boldsymbol {\mu}}, 즉 M = 1n × μ T {\ displaystyle \mathbf {1} _{n}\time {n}\bmu}^{}{}}}}}}}{{{}}}}}}}}}}}}}}}}}}}}}}{{{{{{{{{{{}}}}}}} T }, U {\ displaystyle \mathbf {U}} 은 (는) n × n ID 매트릭스로 행이 독립적이며, V = = {\ displaystyle \mathbf {V} ={\boldsymbol{\Sigma }}}}}}}}}.
최대우도 모수 추정 Given k matrices, each of size n × p , denoted X 1 , X 2 , … , X k {\displaystyle \mathbf {X} _{1},\mathbf {X} _{2},\ldots ,\mathbf {X} _{k}} , which we assume have been sampled i.i.d. from a matrix normal distribution, the maximum likelihood estimate of the parameters can be obtained by maximizing:
∏ i = 1 k M N n × p ( X i ∣ M , U , V ) . {\displaystyle \prod _{i=1}^{k}{\mathcal {MN}_{n\times p}(\mathbf {X} _{i}\mid \mathbf {M},\mathbf {U},\mathbf {V}). } 평균에 대한 해결책은 닫힌 형태, 즉
M = 1 k ∑ i = 1 k X i {\displaystyle \mathbf{M} ={\frac {1}{k}\sum _{i=1}^{k}\mathbf {X} _{i}}}} 공분산 매개변수는 그렇지 않다. 그러나 이러한 매개변수는 다음과 같이 그라데이션 영(0)을 지정하여 반복적으로 최대화할 수 있다.
U = 1 k p ∑ i = 1 k ( X i − M ) V − 1 ( X i − M ) T {\displaystyle \mathbf {U} ={\frac {1}{kp}\sum_{i=1}^{k}(\mathbf {X} _{i}-\mathbf {M} )\mathbf {V}^{1}(\mathbf {X}-mathbf {M})^{{{{}^{{{}^}^}}^}^}^}^}^}}}}^}^}^}}}}}}}}^{{{{{{{{}}} T} 그리고
V = 1 k n ∑ i = 1 k ( X i − M ) T U − 1 ( X i − M ) , {\displaystyle \mathbf {V} ={\frac {1}{kn}}\sum _{i=1}^{k}(\mathbf {X} _{i}-\mathbf {M} )^{T}\mathbf {U} ^{-1}(\mathbf {X} _{i}-\mathbf {M} ),} 예 및 참조를 참조하십시오. 공분산 매개변수는 모든 척도 인자의 경우 s >0에 대해 다음과 같은 것을 가지고 있다는 점에서 식별할 수 없다.
M N n × p ( X ∣ M , U , V ) = M N n × p ( X ∣ M , s U , 1 s V ) . {\displaystyle {\mathcal {MN}}_{n\times p}(\mathbf {X} \mid \mathbf {M} ,\mathbf {U} ,\mathbf {V} )={\mathcal {MN}}_{n\times p}(\mathbf {X} \mid \mathbf {M} ,s\mathbf {U} ,{\tfrac {1}{s}}\mathbf {V} ). }
분포에서 값 그리기 다변량 정규 분포의 표본 추출은 다변량 정규 분포 에 대한 표본 추출 절차의 특별한 경우다. X {\displaystyle \mathbf {X} }을(를) 표준 정규 분포에서 np 독립 표본의 p by p 행렬이 되도록 한다.
X ∼ M N n × p ( 0 , I , I ) . {\displaystyle \mathbf {X} \sim {\mathcal {MN}_{n\times p}(\mathbf {0},\mathbf {I},\mathbf {I}) \mathbf {I} } 그럼 그렇게 합시다.
Y = M + A X B , {\displaystyle \mathbf {Y} =\mathbf {M} +\mathbf {A} \mathbf {X} \mathbf {B},} 하도록
Y ∼ M N n × p ( M , A A T , B T B ) , {\displaystyle \mathbf {Y} \sim {\mathcal {MN}_{n\time p}(\mathbf {M},\mathbf {AA} ^{T},\mathbf {B}),} 여기서 A 와 B 는 Cholesky 분해 또는 유사한 매트릭스 제곱근 연산에 의해 선택될 수 있다. null
기타 분포와의 관계 Dawid(1981)는 위시아트 분포 , 역위시아트 분포 및 행렬 t-분포 를 포함한 다른 분포에 대한 행렬 값 정규 분포의 관계에 대한 논의를 제공하지만 여기서 사용하는 것과 다른 표기법을 사용한다. null
참고 항목 참조 ^ A K Gupta; D K Nagar (22 October 1999). "Chapter 2: MATRIX VARIATE NORMAL DISTRIBUTION". Matrix Variate Distributions . CRC Press. ISBN 978-1-58488-046-2 . Retrieved 23 May 2014 . ^ Ding, Shanshan; R. Dennis Cook (2014). "DIMENSION FOLDING PCA AND PFC FOR MATRIX- VALUED PREDICTORS". Statistica Sinica . 24 (1): 463–492. ^ Glanz, Hunter; Carvalho, Luis. "An Expectation-Maximization Algorithm for the Matrix Normal Distribution". arXiv :1309.6609 .
이산형 일변도의
연속 일변도의
의 지지를 받고 있는. 경계 간격 의 지지를 받고 있는. 반무한 간격을 두고 지지의 대체로 실선 지지하여 누구의 타입이 다른가.
혼합 일변도의
다변량 (공동) 방향 퇴보하다 그리고 단수 가족들