확률 이론 및 통계량의 행렬 유형
확률 이론 과 통계 에서 교차 공분산 행렬 은 i 의 원소를 가진 행렬 이며, j 위치는 랜덤 벡터 의 i번째 원소와 다른 랜덤 벡터의 j번째 원소 사이의 공분산 이다. 랜덤 벡터는 다차원을 갖는 랜덤 변수 다. 벡터의 각 요소는 스칼라 랜덤 변수다. 각 원소에는 관측 된 경험적 값의 유한한 수 또는 유한하거나 무한 의 잠재적 값이 있다. 전위 값은 이론적 접합 확률 분포 로 지정된다. 직관적으로, 교차 공분산 행렬은 공분산 개념을 다차원으로 일반화한다.
The cross-covariance matrix of two random vectors X {\displaystyle \mathbf {X} } and Y {\displaystyle \mathbf {Y} } is typically denoted by K X Y {\displaystyle \operatorname {K} _{\mathbf {X} \mathbf {Y} }} or Σ X Y {\displaystyle \Sigma _{\mathbf {X} \mathbf {Y} }} .
정의 기대값 과 분산 이 존재하는 랜덤 요소 를 포함하는 랜덤 벡터 X {\ displaystyle \mathbf {X} 및 Y {\displaystyle \mathbf {Y}} 의 경우 X {\ displaysty \mathbf {X} 및 Y {\ displaysty \mathbf {Y} 의 교차 공분산 행렬 이 정의된다[1] : p.336 .
K X Y = 코브를 틀다 ( X , Y ) = d e f E [ ( X − μ X ) ( Y − μ Y ) T ] {\displaystyle \operatorname {K} _{\mathbf {X} \mathbf {Y} }=\operatorname {cov} (\mathbf {X} ,\mathbf {Y} ){\stackrel {\mathrm {def} }{=}}\ \operatorname {E} [(\mathbf {X} -\mathbf {\mu _{X}} )(\mathbf {Y} -\mathbf {\mu _{Y}} )^{\rm {T}}]} (Eq.1 )
where μ X = E [ X ] {\displaystyle \mathbf {\mu _{X}} =\operatorname {E} [\mathbf {X} ]} and μ Y = E [ Y ] {\displaystyle \mathbf {\mu _{Y}} =\operatorname {E} [\mathbf {Y} ]} are vectors containing the expected values of X {\displaystyle \mathbf {X} } and Y {\displaystyle \mathbf {Y} } . The v Ector X {\ displaystyle \mathbf {X} 및 Y {\ displaystyle \mathbf {Y} } 은(는) 동일한 차원을 가질 필요가 없으며 둘 중 하나가 스칼라 값일 수 있다.
교차 공분산 행렬은 (i , j ) {\displaystyle (i,j)} 항목이 공분산 인 행렬이다.
K X i Y j = 코브를 틀다 [ X i , Y j ] = E [ ( X i − E [ X i ] ) ( Y j − E [ Y j ] ) ] {\displaystyle \operatorname {K} _{X_{i} Y_{j}}=\operatorname {cov} [X_{i}} Y_{j}]=\operatorname {E} [(X_{i}-\operatorname {E}[X_{i}])(Y_{j}-\operatorname {E} [Y_{j}])]} X {\ displaystyle \mathbf {X} 의 i번째 요소와 Y {\ displaystyle \mathbf {Y}} 의 j번째 요소 사이에 다음과 같은 구성 요소별 교차 공분산 행렬의 정의를 제공한다.
K X Y = [ E [ ( X 1 − E [ X 1 ] ) ( Y 1 − E [ Y 1 ] ) ] E [ ( X 1 − E [ X 1 ] ) ( Y 2 − E [ Y 2 ] ) ] ⋯ E [ ( X 1 − E [ X 1 ] ) ( Y n − E [ Y n ] ) ] E [ ( X 2 − E [ X 2 ] ) ( Y 1 − E [ Y 1 ] ) ] E [ ( X 2 − E [ X 2 ] ) ( Y 2 − E [ Y 2 ] ) ] ⋯ E [ ( X 2 − E [ X 2 ] ) ( Y n − E [ Y n ] ) ] ⋮ ⋮ ⋱ ⋮ E [ ( X m − E [ X m ] ) ( Y 1 − E [ Y 1 ] ) ] E [ ( X m − E [ X m ] ) ( Y 2 − E [ Y 2 ] ) ] ⋯ E [ ( X m − E [ X m ] ) ( Y n − E [ Y n ] ) ] ] {\displaystyle \operatorname {K} _{\mathbf {X} \mathbf {Y} }={\begin{bmatrix}\mathrm {E} [(X_{1}-\operatorname {E} [X_{1}])(Y_{1}-\operatorname {E} [Y_{1}])]&\mathrm {E} [(X_{1}-\operatorname {E} [X_{1}])(Y_{2}-\operatorname {E} [Y_{2}])]&\cdots &\mathrm {E} [(X_{1}-\operatorname {E} [X_{1}])(Y_{n}-\operatorname {E} [Y_{n}])]\ \\\\mathrm {E} [(X_{2}-\operatorname {E} [X_{2}])(Y_{1}-\operatorname {E} [Y_{1}])]&\mathrm {E} [(X_{2}-\operatorname {E} [X_{2}])(Y_{2}-\operatorname {E} [Y_{2}])]&\cdots &\mathrm {E} [(X_{2}-\operatorname {E} [X_{2}])(Y_{n}-\operatorname {E} [Y_{n}])]\ \\\\vdots &\vdots &\ddots &\vdots \\\\\mathrm {E} [(X_{m}-\operatorname {E} [X_{m}])(Y_{1}-\operatorname {E} [Y_{1}])]&\mathrm {E} [(X_{m}-\operatorname {E} [X_{m}])(Y_{2}-\operatorname {E} [Y_{2}])]&\cdots &\mathrm {E} [(X_{m}-\operatorname {E} [X_{m}])(Y_{n}-\operatorname {E} [Y_{n}])]\end{bmatrix}}} 예 For example, if X = ( X 1 , X 2 , X 3 ) T {\displaystyle \mathbf {X} =\left(X_{1},X_{2},X_{3}\right)^{\rm {T}}} and Y = ( Y 1 , Y 2 ) T {\displaystyle \mathbf {Y} =\left(Y_{1},Y_{2}\right)^{\rm {T}}} are random vectors, then cov ( X , Y ) {\displaystyle \operatorname {cov} (\ma thbf {X} ,\mathbf {Y}} 은(는) 3 x 2 {\displaystyle 3\times 2} 행렬이며, (i , j ) {\displaystyle (i,j)} -th 항목은 cov ( X i , Y j ) {\displaystyle \opername {cov}(X_{i}, {cov}, {ci}, {ci}, {ci}, },Y_{j}} .
특성. 교차 공분산 행렬의 경우 다음과 같은 기본 특성이 적용된다.[2]
코브를 틀다 ( X , Y ) = E [ X Y T ] − μ X μ Y T {\displaystyle \operatorname {cov} (\mathbf {X} ,\mathbf {Y} )=\operatorname {E} [\mathbf {X} \mathbf {Y} ^{\rm {T}}]-\mathbf {\mu _{X}} \mathbf {\mu _{Y}} ^{\rm {T}}} 코브를 틀다 ( X , Y ) = 코브를 틀다 ( Y , X ) T {\displaystyle \operatorname {cov}(\mathbf {X},\mathbf {Y} )=\mathbname {cov}(\mathbf {Y},\mathbf {X})^{\rm {T}} 코브를 틀다 ( X 1 + X 2 , Y ) = 코브를 틀다 ( X 1 , Y ) + 코브를 틀다 ( X 2 , Y ) {\displaystyle \operatorname {cov} (\mathbf {X_{1}} +\mathbf {X_{2}} ,\mathbf {Y} )=\operatorname {cov} (\mathbf {X_{1}} ,\mathbf {Y} )+\operatorname {cov} (\mathbf {X_{2}} ,\mathbf {Y} )} 코브를 틀다 ( A X + a , B T Y + b ) = A 코브를 틀다 ( X , Y ) B {\displaystyle \operatorname {cov}(A\mathbf {X} +\mathbf {a}, B^{\rm {T})\mathbf {Y} +\mathbf {b}=A\,\mathbf {X},mathbf {Y},B}) If X {\displaystyle \mathbf {X} } and Y {\displaystyle \mathbf {Y} } are independent (or somewhat less restrictedly, if every random variable in X {\displaystyle \mathbf {X} } is uncorrelated with every random variable in Y {\displaystyle \mathbf {Y} } ), then cov ( X , Y ) = 0 p × q {\displays tyle \operatorname {cov}(\mathbf {X},\mathbf {Y} )=0_{p\times q}} where X {\displaystyle \mathbf {X} } , X 1 {\displaystyle \mathbf {X_{1}} } and X 2 {\displaystyle \mathbf {X_{2}} } are random p × 1 {\displaystyle p\times 1} vectors, Y {\displaystyle \mathbf {Y} } is a random q × 1 {\displaystyle q\times 1} vector, a {\displaystyle \mathbf {a } } is a q × 1 {\displaystyle q\times 1} vector, b {\displaystyle \mathbf {b} } is a p × 1 {\displaystyle p\times 1} vector, A {\displaystyle A} and B {\displaystyle B} are q × p {\displaystyle q\times p} matrices of constants, and 0 p × q {\displaystyle 0_{p\times q}} is a p × q 0 행렬을 표시한다
복잡한 랜덤 벡터에 대한 정의 Z {\ displaystyle \mathbf {Z} 과 (와) W {\displaystyle \mathbf {W}이( 가) 복합 랜덤 벡터인 경우 교차 공분산 행렬의 정의가 약간 변경된다. 전위치는 은둔자 전위 로 대체된다.
K Z W = 코브를 틀다 ( Z , W ) = d e f E [ ( Z − μ Z ) ( W − μ W ) H ] {\displaystyle \operatorname {K} _{\mathbf {Z} \mathbf {W} }=\operatorname {cov} (\mathbf {Z} ,\mathbf {W} ){\stackrel {\mathrm {def} }{=}}\ \operatorname {E} [(\mathbf {Z} -\mathbf {\mu _{Z}} )(\mathbf {W} -\mathbf {\mu _{W}} )^{\rm {H}}]} 복잡한 랜덤 벡터의 경우 의사 교차 공분산 행렬 이라는 또 다른 행렬은 다음과 같이 정의된다.
J Z W = 코브를 틀다 ( Z , W ¯ ) = d e f E [ ( Z − μ Z ) ( W − μ W ) T ] {\displaystyle \operatorname {J} _{\mathbf {Z} \mathbf {W} }=\operatorname {cov} (\mathbf {Z} ,{\overline {\mathbf {W} }}){\stackrel {\mathrm {def} }{=}}\ \operatorname {E} [(\mathbf {Z} -\mathbf {\mu _{Z}} )(\mathbf {W} -\mathbf {\mu _{W}} )^{\rm {T}}]}
상관성 없음 두 개의 랜덤 벡터 X {\ displaystyle [1] : p.337 \ mathbf {X} 과 (와) Y {\displaystyle \mathbf {Y } 은(는) 교차 공분산 행렬 K X Y {\displaystyle \operatorname {K} _{\mathbf {X} \mathbf {Y}}}}}}} 행렬이 0 행렬인 경우 상관 관계 가 없는 것으로 불린다.
Complex random vectors Z {\displaystyle \mathbf {Z} } and W {\displaystyle \mathbf {W} } are called uncorrelated if their covariance matrix and pseudo-covariance matrix is zero, i.e. if K Z W = J Z W = 0 {\displaystyle \operatorname {K} _{\mathbf {Z} \mathbf {W} }=\operatorname {J} _{\mathbf {Z} \mathbf {W} }=0} .
참조