공분산 행렬

Covariance matrix
(0, 0)에 중심을 둔 이변량 가우스 확률 밀도 함수. 공분산 행렬은 [ 0..1지정된다.
대략 왼쪽-오른쪽 하단 방향에서 표준 편차가 3이고 직교 방향에서 1인 이변량 가우스 분포의 표본 점.x와 y의 구성요소는 서로 다르기 때문에 분포를 완전히 나타내지 않습니다.×(\ 22) 공분산 행렬이 필요합니다. 화살표의 방향은 이 공분산 행렬의 고유 벡터에 해당하며, 그 길이는 고유값의 제곱근에 해당합니다.

확률론통계학에서 공분산 행렬(자동 공분산 행렬, 분산 행렬, 분산 행렬 또는 분산-공분산 행렬이라고도 함)은 주어진 랜덤 벡터의 각 요소 쌍 사이의 공분산을 제공하는 정사각형 행렬입니다.공분산 행렬은 대칭 및 양의 반확정 행렬이며 주 대각선에는 분산(즉, 각 원소와 각 원소의 공분산)이 포함됩니다.

직관적으로 공분산 행렬은 분산의 개념을 다차원으로 일반화합니다.예를 들어, 2차원 공간에서의 랜덤 포인트 집합의 변동은 하나의 숫자로 완전히 특징지을 수 x x y(\y) 방향의 변동에 필요한 정보가 모두 포함되어 있지 않습니다 2 ×(\ 2 2)행렬이 합니다.2차원 변형을 완벽하게 특징짓기 위해.

랜덤 Xdisplaystyle 공분산 행렬은 으로 X 또는(\로 표시됩니다.

정의.

이 문서에서는 랜덤 벡터를 나타내기 위해 굵은 글씨로 표시된 X(\Y 사용되고, 스칼라 변수를 나타내기 위해 굵은 글자로 표시된 (\})가 사용됩니다.

벡터의 엔트리가

각각 유한분산과 기대치를 갖는 랜덤 변수이며, 공분산 ( ) \ 엔트리가 공분산[1]: p. 177 행렬이다

서 연산자E \{E 인수의 예상값(평균)을 나타냅니다.

상호 모순되는 명명법 및 표기법

명명법이 다릅니다.일부 통계 학자들은 probabilist 윌리엄 펠러 그의 두권짜리 책에 이어도입 확률 이론에 왜냐하면 그렇게 만들면 자연입니다 Applications,[2]KX}_{\mathbf{X}\mathbf{X}{\displaystyle \operatorname{K}}}, 매트릭스를 확률 벡터 X{\displaystyle \mathbf{X}의 변화 부른다. ge1차원 분산의 더 높은 차원으로 네랄라이제이션합니다. 사람들은 이것을 공분산 행렬이라고 부르는데 그것은 벡터 X의 스칼라 성분들 사이의 이기 때문이다

두 형태 모두 매우 표준적이며, 두 형태 사이에는 모호함이 없습니다. X \ 대각항이 실제로는 분산이기 때문에 분산-공분산 행렬이라고도 합니다.

그에 비해, 두 벡터 사이의 교차 공분산 행렬의 표기법은 다음과 같다.

특성.

자기 상관 행렬과의 관계

{\ \(는) R { _{\{X}}}에 의해 관련됩니다

여기서 자기상관행렬은 R [ X { _ { \ } = \{ E } [ \ { X } \ { X } { RM }= \ rmathbf { T } 로 됩니다.

상관 행렬과의 관계

공분산 행렬과 밀접하게 관련된 실체는 랜덤 X의 각 랜덤 변수 사이의 피어슨 곱-순간 상관 계수의 행렬이며, 다음과 같이 쓸 수 있다.

서 diag X\mathbf )는 대각 요소 i

마찬가지로 상관행렬은 i , {\ idisplaystyle, 표준화된 랜덤 변수 i / ( X ) / \( X{ )의 공분산 행렬로 볼 수 있다.

상관 행렬의 주요 대각선의 각 요소는 랜덤 변수와 그 자체의 상관 관계이며, 항상 1과 같습니다.각 엇대각 요소는 -1과 +1 사이에 있습니다.

공분산 행렬의 역행렬

의 역행렬인 X - \ { \}^{-은 존재하는 경우 농도 행렬 또는 정밀 [3]행렬이라고도 하는 역공분산 행렬이다.

기본 속성

( ) [ ( - [ X ] [ X ) { _mathbf {=\ X []{ displaystyle { X}= \operatorname { [ { \ { X }} 서 X ( 1, n ) \ \}

  1. \ ,} )는 양의 반무한입니다. {\ 입니다
  2. \ 대칭입니다. , { {K}_{\} }
  3. 임의의 상수즉, 비표준) × {\ n A \ {A}) 및 상수 m×1(\ m1) a에 대해 var A)가 .
  4. Y X와 같은 차원을 가진 다른 랜덤 벡터일 var(+ Y ) var(,Y ) + ( ) + cov 、 varY ) 、 var( \ 이름 operatorname{

블록 행렬

X Y { 접합공분산행렬(\{ 블록 형태로 쓸 수 있다.

서 K () \ {\= \ (\{X ) , Y) _ \ { _ _ {K}= }}=\ ,\).

및 K { X \{X 및 Ydisplaystyle 대한 한계 분포의 분산 행렬로 식별할 수 .

XY(\ 함께 정규 분포를 따르는 ,

그러면 X Y \ 대한 조건부 분포는 다음과 같습니다.

[5]

조건부 평균에 의해 정의되다

및 조건부 분산

X K - 1 \} \ }} )은 K X \style에서 회귀 계수의 행렬로 알려져 있다. e \

회귀 계수의 행렬은 전치 형식인 X- 1 X {\1}\operatorname {K}{XY_{\ {}}}_{\mathbf {로 주어질 수 있다. X를 곱한 값입니다. 이 형식에서는 정규 최소 제곱(OLS) 방정식의 행렬을 반전시킨 계수에 해당합니다.

부분 공분산 행렬

0이 아닌 모든 원소가 포함된 공분산 행렬은 모든 개별 랜덤 변수가 상호 연관되어 있음을 나타냅니다.즉, 변수는 직접 상관될 뿐만 아니라 다른 변수를 통해 간접적으로 상관됩니다.대부분의 경우 이러한 간접적인 공통 모드 상관관계는 사소하고 흥미롭지 않습니다.부분 공분산 행렬, 즉 상관 관계의 흥미로운 부분만 표시하는 공분산 행렬을 계산하여 이러한 행렬을 억제할 수 있습니다.

랜덤 XY(\ 두 벡터가 다른 I(\를 통해 상관되어 있는 경우, 후자의 상관관계가 행렬로[6] 억제됩니다.

부분 공분산 K I {\ 사실상 단순 공분산 K Y_ 같습니다

분포의 모수로서의 공분산 행렬

n개의\ n의X(\ 공통 정규 분포이거나 보다 일반적인 타원 분포일 경우, 그 확률 밀도 fθ ( \{X covar로 표현될 수 있다.iance 매트릭스(\ 다음과[6] 같습니다

서 μ [ } [ ] σdisplaydisplaydisplay σ display display display \ \}{ 행렬식입니다

선형 연산자로서의 공분산 행렬

하나의 벡터에 적용된 공분산 행렬은 랜덤 변수 X의 선형 조합 c를 δ ( TX ,) { style \ =\ (f})와 함께 공분산 벡터에 매핑합니다.두 선형 조합 사이의 공분산을 산출한다. c ( d , ) { \ =\ {c 조합의 분산은 c {\이며, 이 값은 그 자신과의 공분산이다.

마찬가지로 (의사-) 역공분산행렬은 [citation needed]c의 "비슷한" 측정값인 마할라노비스 거리를 유도하는 내부곱 c - c μ δ { c - \mu \Sigma c - 를 제공한다.

공분산 행렬은 무엇입니까?

위의 아이덴티티에서 b\mathbf {a ×1) {p\times 1 실값 벡터라고 .

이는 실수값 랜덤 변수의 분산이므로 항상 음이 아니어야 하므로 공분산 행렬은 항상 양의-반한 행렬입니다.

위의 인수는 다음과 같이 전개할 수 있습니다.

여기서 마지막 부등식은 w ( - E [ { - 스칼라라는 관측에서 온다.

반대로 모든 대칭 양의 반확정 행렬은 공분산 행렬입니다.를 확인하기 위해 M M× p {\p\times p 대칭 양의 반무한 행렬이라고 합니다.스펙트럼 정리의 유한 차원 사례에서 M M M으로 나타낼1/2 수 있는 음이 아닌 대칭 제곱근을 가진다. p× 1p\1) 열 벡터 값 랜덤 변수로 , 공분산 행렬은 × \ pp} ID 행렬입니다.그리고나서

복소 랜덤 벡터

복잡한 스칼라 변수의 분산은 일반적으로 복잡한 활용을 사용하여 정의된다

여기서 복소수 켤레는 z {로 표시되므로복소수 랜덤 변수의 분산은 실수입니다.

( , , )T \Z} =(},\n}^{\{ 복소수 랜덤 변수의 열 벡터라면 켤레 H 다음 식에서, 켤레 전치 벡터의 곱은 [7]: p. 293 기대대로 공분산 행렬이라고 불리는 정사각형 행렬이 됩니다.

[ , ] [ (Z - Z) ( - Z ) \K} _=\ {v} } {Mathb} {

이렇게 얻어진 행렬은 에르미트 [8]반유한이며, 실수는 대각선에 있고 복소수는 대각선에 있다.

특성.
  • 공분산 행렬은 에르미트 행렬입니다. , Z {\ \{Z}^{\ =\ \ {K\mathbf
  • 공분산 행렬의 대각 원소는 [1]: p. 179 실재합니다.

의사공분산행렬

복소수 랜덤 벡터의 경우, 또 다른 종류의 두 번째 중심 모멘트인 의사 공분산 행렬(관계 행렬이라고도 함)은 다음과 같이 정의됩니다.

위에서 정의한 공분산 행렬과 달리 에르미트 전치는 정의에서 전치로 대체됩니다.대각선 요소는 복잡한 값을 매길 수 있습니다. 복잡한 대칭 행렬입니다.

견적

X Y(\ _ 각각 n개의 관측치를 갖는 차원 ×pn 중심 데이터 행렬인 .행 평균을 감산한 경우, 행 평균을 데이터에서 추정하면 샘플 공분산 Q XQ{XX Q 정의하도록 할 수 있다.

또는 행의 평균이 선험적으로 알려진 경우,

이러한 경험적 표본 공분산 행렬은 공분산 행렬에 가장 간단하고 자주 사용되는 추정치이지만, 더 나은 속성을 가질 수 있는 정규화 또는 수축 추정치를 비롯한 다른 추정치들도 있습니다.

적용들

공분산 행렬은 여러 영역에서 유용한 도구입니다.로부터 변환 매트릭스, 미백 변태라 불리는 하나의 완전히 또는, 다른 입장에서 그 data[표창 필요한]decorrelate에 다량 way[표창 필요한]의 데이터를 나타내는에 대한 최적의 근거를 찾기 위해(공식적인 증거와 covaria의 추가 속성에 대한 레일리 몫 볼 수 있도록 파생될 수 있다.nce 매트릭스).이를 주성분 분석(PCA) 및 카르후넨-로브 변환(KL-변환)이라고 합니다.

공분산 매트릭스는 특히 포트폴리오 이론과 뮤추얼 펀드 분리 정리 및 자본 자산 가격 결정 모델에서 금융 경제학에서 중요한 역할을 합니다.다양한 자산의 수익률 간 공분산 매트릭스는 특정 가정 하에서 (규범적 분석에서) 투자자가 다양화의 맥락에서 보유해야 하거나 (긍정적 분석에서) 보유할 것으로 예상되는 다른 자산의 상대적 금액을 결정하기 위해 사용된다.

최적화에 사용

무작위 검색 휴리스틱스의 특정 제품군인 진화 전략은 근본적으로 메커니즘의 공분산 행렬에 의존합니다.특성 돌연변이 연산자는 진화하는 공분산 행렬을 사용하여 다변량 정규 분포에서 업데이트 단계를 끌어냅니다.진화 전략의 공분산 행렬이 검색 환경의 헤시안 행렬의 역행렬에 스칼라 인자와 작은 랜덤 변동까지 적응한다는 공식 증거가 있다(인구 크기가 증가함에 따라 2차 [9]근사에 의존하여 한 부모 전략과 정적 모델에 대해 입증됨).직관적으로, 이 결과는 최적의 공분산 분포가 균등 확률 등고선이 경관의 수준 집합과 일치하는 돌연변이 단계를 제공할 수 있다는 근거에 의해 뒷받침되며, 따라서 진행률을 극대화할 수 있다.

공분산 매핑

공분산 매핑에서 θ( {{{ 또는 θ( I {Y)의 값.X(\Y(\ 이산 랜덤 함수일 경우 맵은 랜덤 함수의 서로 다른 영역 간의 통계 관계를 표시합니다.함수의 통계적으로 독립적인 영역은 지도에 0레벨 평지로 표시되고 양의 상관관계 또는 음의 상관관계는 각각 언덕 또는 계곡으로 표시됩니다.

실제로 열 X \\n개의 행으로 실험적으로 수집됩니다.

서 Xj ( 는 랜덤 함수 ( t X(의 샘플 j의 i번째 이산값입니다.공분산 공식에 필요한 기대값은 표본 평균을 사용하여 추정됩니다.

그리고 공분산 행렬은 표본 공분산 행렬에 의해 추정됩니다.

여기서 각 괄호는 편향을 방지하기 위해 베셀 보정수행해야 한다는 점을 제외하고 이전과 같은 표본 평균을 나타냅니다.이 추정을 사용하여 부분 공분산 행렬을 다음과 같이 계산할 수 있습니다.

여기서 백슬래시는 행렬 반전 요건을 우회하고 Matlab[10]같은 일부 계산 패키지에서 사용할 수 있는 왼쪽 행렬 나눗셈 연산자를 나타냅니다.

그림 1: 자유 전자 [11]레이저에 의해 유도되는 쿨롱 폭발을 겪는 N개 분자의 부분2 공분산 지도 구축.패널 a와 b는 패널 c에 표시된 공분산 행렬의 두 항을 매핑합니다. 패널 d는 레이저의 강도 변동을 통해 공통 모드 상관 관계를 매핑합니다.패널 e는 강도 변동에 대해 보정된 부분 공분산 행렬을 매핑합니다.패널 f는 10% 과보정이 지도를 개선하고 이온이온 상관관계를 명확하게 볼 수 있음을 보여줍니다.운동량 보존으로 인해 이러한 상관관계는 자기상관 라인에 거의 수직인 선(및 검출기 링잉에 의해 발생하는 주기적 변조)으로 나타난다.

그림 1은 [11]함부르크의 FLASH 자유 전자 레이저에서 수행된 실험의 예에서 부분 공분산 맵을 구성하는 방법을 보여줍니다.무작위 X ( ){X( 레이저 펄스에 의해 이온화된 질소 분자의 쿨롱 폭발에서 발생하는 이온의 비행 시간 스펙트럼이다.각 레이저 펄스에서 수백 개의 분자만 이온화되기 때문에 싱글샷 스펙트럼은 크게 변동한다.단, 으로 m 4{\ m=개의 {를 수집하여 j{\j 대해 평균을 구하면 매끄러운 스펙트럼X ( ) ⟩ \ \ ( t } ( t } ( t ) } ( 평균 스펙트럼 Xδ {\ \ 운동 에너지에 의해 넓어진 피크 형태로 여러 질소 이온을 나타내지만 이온화 단계와 이온 모멘타의 상관관계를 찾으려면 공분산 맵을 계산해야 한다.

그림 1의 j ( ) { )} Y (t) { \ _)}는 비행 t {t 범위가 다르다는 점을 제외하고 동일하다.패널 a에는 T \ 패널 b에는 「X {가 표시됩니다.{색척도 변경에 주의).안타깝게도 이 지도는 샷 간에 변동하는 레이저 강도에 의해 유도되는 재미없는 공통 모드 상관에 의해 압도된다.이러한 상관 관계를 억제하기 위해 레이저 jj {\I(\ ( , I)(\} (\.그러나 레이저 강도 이외에 공통 모드 변동의 다른 소스가 있고 원칙적으로 이러한 모든 선원은 I{I} 로 모니터링되어야 하기 때문에 관심 없는 상관의 억제는 불완전하다. 그러나 실제로는 부분 공분산 상관을 과도하게 보상하는 것으로 종종 충분하다.패널 f와 같이 이온 모멘타의 흥미로운 상관관계가 원자 질소의 이온화 단계를 중심으로 하는 직선으로 명확히 나타난다.

2차원 적외선 분광법

2차원 적외선 분광법은 상관 분석을 사용하여 응축된 위상의 2D 스펙트럼을 얻는다.이 분석에는 동기비동기 두 가지 버전이 있습니다.수학적으로 전자는 표본 공분산 행렬로 표현되며 이 기법은 공분산 [12]매핑과 동일합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications. Springer. ISBN 978-3-319-68074-3.
  2. ^ William Feller (1971). An introduction to probability theory and its applications. Wiley. ISBN 978-0-471-25709-7. Retrieved 10 August 2012.
  3. ^ Wasserman, Larry (2004). All of Statistics: A Concise Course in Statistical Inference. ISBN 0-387-40272-1.
  4. ^ Taboga, Marco (2010). "Lectures on probability theory and mathematical statistics".
  5. ^ Eaton, Morris L. (1983). Multivariate Statistics: a Vector Space Approach. John Wiley and Sons. pp. 116–117. ISBN 0-471-02776-6.
  6. ^ a b W J Krzanowski "다변량 분석의 원리"(옥스포드 대학 출판부, 뉴욕, 1988), 14.4장; K V 마르디아, J T 켄트 및 J M 비비 "다변량 분석"(아카데믹 프레스, 런던, 1997), 6.5장; 앤더슨.
  7. ^ Lapidoth, Amos (2009). A Foundation in Digital Communication. Cambridge University Press. ISBN 978-0-521-19395-5.
  8. ^ Brookes, Mike. "The Matrix Reference Manual". {{cite journal}}:Cite 저널 요구 사항 journal=(도움말)
  9. ^ Shir, O.M.; A. Yehudayoff (2020). "On the covariance-Hessian relation in evolution strategies". Theoretical Computer Science. Elsevier. 801: 157–174. doi:10.1016/j.tcs.2019.09.002.
  10. ^ L J Frasinski "공변성 매핑 기술" J. Phys. At. Mol. Opt. Phys.49 152004 (2016), 오픈 액세스
  11. ^ a b O Kornilov, M Eckstein, M Rosenblatt, C P Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, D. Holland, Schland At. Mol. Opt. Phys.46 164028 (2013), 오픈 액세스
  12. ^ I Noda "적외선, 라만, 기타 분광학에 적용할 수 있는 일반 2차원 상관법" Appl. 스펙트럼 47 1329–36 (1993)

추가 정보