(0, 0)에 중심을 둔 이변량 가우스 확률 밀도 함수. 공분산 행렬은 [ 0..1로지정된다.
대략 왼쪽-오른쪽 하단 방향에서 표준 편차가 3이고 직교 방향에서 1인 이변량 가우스 분포의 표본 점.x와 y의 구성요소는 서로 다르기 때문에와의 가 분포를 완전히 나타내지 않습니다.×(\ 22) 공분산 행렬이 필요합니다. 화살표의 방향은 이 공분산 행렬의 고유 벡터에 해당하며, 그 길이는 고유값의 제곱근에 해당합니다.
확률론과 통계학에서 공분산 행렬(자동 공분산 행렬, 분산 행렬, 분산행렬 또는 분산-공분산 행렬이라고도 함)은 주어진 랜덤 벡터의 각 요소 쌍 사이의 공분산을 제공하는 정사각형 행렬입니다.공분산 행렬은 대칭 및 양의 반확정행렬이며 주 대각선에는 분산(즉, 각 원소와 각 원소의 공분산)이 포함됩니다.
직관적으로 공분산 행렬은 분산의 개념을 다차원으로 일반화합니다.예를 들어, 2차원 공간에서의 랜덤 포인트 집합의 변동은 하나의 숫자로 완전히 특징지을 수 x x y(\y) 방향의 변동에 필요한 정보가 모두 포함되어 있지 않습니다 2 ×(\ 2 2)행렬이합니다.2차원 변형을 완벽하게 특징짓기 위해.
명명법이 다릅니다.일부 통계 학자들은 probabilist 윌리엄 펠러 그의 두권짜리 책에 이어도입 확률 이론에 왜냐하면 그렇게 만들면 자연입니다 Applications,[2]KX}_{\mathbf{X}\mathbf{X}{\displaystyle \operatorname{K}}}, 매트릭스를 확률 벡터 X{\displaystyle \mathbf{X}의 변화 부른다. ge1차원 분산의 더 높은 차원으로 네랄라이제이션합니다. 사람들은 이것을 공분산 행렬이라고 부르는데 그것은 벡터 X의 스칼라 성분들 사이의 이기 때문이다
두 형태 모두 매우 표준적이며, 두 형태 사이에는 모호함이 없습니다. X \는 대각항이 실제로는 분산이기 때문에 분산-공분산 행렬이라고도 합니다.
X K - 1 \} \ }} )은 K X \style에서 회귀 계수의 행렬로 알려져 있다.e \
회귀 계수의 행렬은 전치 형식인 X- 1 X {\1}\operatorname {K}{XY_{\ {}}}_{\mathbf {로 주어질 수 있다.열 X를 곱한 값입니다. 이 형식에서는 정규최소제곱(OLS) 방정식의 행렬을 반전시킨 계수에 해당합니다.
부분 공분산 행렬
0이 아닌 모든 원소가 포함된 공분산 행렬은 모든 개별 랜덤 변수가 상호 연관되어 있음을 나타냅니다.즉, 변수는 직접 상관될 뿐만 아니라 다른 변수를 통해 간접적으로 상관됩니다.대부분의 경우 이러한 간접적인 공통 모드 상관관계는 사소하고 흥미롭지 않습니다.부분 공분산 행렬, 즉 상관 관계의 흥미로운 부분만 표시하는 공분산 행렬을 계산하여 이러한 행렬을 억제할 수 있습니다.
랜덤 X와Y(\의 두 벡터가 다른 I(\를 통해 상관되어 있는 경우, 후자의 상관관계가 행렬로[6] 억제됩니다.
부분 공분산 K I {\는 사실상 단순 공분산 K Y_와 같습니다
분포의 모수로서의 공분산 행렬
n개의\ n의열 X(\가공통 정규 분포이거나 보다 일반적인 타원 분포일 경우, 그 확률 밀도 fθ ( \{X는 covar로 표현될 수 있다.iance 매트릭스(\는 다음과[6] 같습니다
서 μ [ } [ ] σdisplaydisplaydisplay σ display display display \ \}{ 의 행렬식입니다
하나의 벡터에 적용된 공분산 행렬은 랜덤 변수 X의 선형 조합 c를 δ ( TX ,) { style \ =\ (f})와 함께 공분산 벡터에 매핑합니다.두 선형 조합 사이의 공분산을 산출한다. c ( d , ) { \ =\ {c 조합의 분산은 c {\이며, 이 값은 그 자신과의 공분산이다.
마찬가지로 (의사-) 역공분산행렬은 [citation needed]c의 "비슷한" 측정값인 마할라노비스 거리를 유도하는 내부곱 c - c μ δ { c - \mu \Sigma c -를 제공한다.
공분산 행렬은 무엇입니까?
위의 아이덴티티에서 b\mathbf {를a ×1) {p\times 1 실값 벡터라고 .
이는 실수값 랜덤 변수의 분산이므로 항상 음이 아니어야 하므로 공분산 행렬은 항상 양의-반한 행렬입니다.
위의 인수는 다음과 같이 전개할 수 있습니다.
여기서 마지막 부등식은 w ( - E [ { -가 스칼라라는 관측에서 온다.
반대로 모든 대칭 양의 반확정 행렬은 공분산 행렬입니다.를 확인하기 위해 M M을× p {\p\times p 대칭 양의 반무한 행렬이라고 합니다.스펙트럼 정리의 유한 차원 사례에서 M M은 M으로 나타낼1/2 수 있는 음이 아닌 대칭 제곱근을 가진다.를 p× 1p\1) 열 벡터 값 랜덤 변수로 , 공분산 행렬은 × \ pp} ID 행렬입니다.그리고나서
X Y(\ _가 각각 n개의 관측치를 갖는 차원 ×pn의 중심 데이터 행렬인 .행 평균을 감산한 경우, 행 평균을 데이터에서 추정하면 샘플 공분산 Q XQ{XX와 Q 를 정의하도록 할 수 있다.
또는 행의 평균이 선험적으로 알려진 경우,
이러한 경험적 표본 공분산 행렬은 공분산 행렬에 가장 간단하고 자주 사용되는 추정치이지만, 더 나은 속성을 가질 수 있는 정규화 또는 수축 추정치를 비롯한 다른 추정치들도 있습니다.
적용들
공분산 행렬은 여러 영역에서 유용한 도구입니다.로부터 변환 매트릭스, 미백 변태라 불리는 하나의 완전히 또는, 다른 입장에서 그 data[표창 필요한]decorrelate에 다량 way[표창 필요한]의 데이터를 나타내는에 대한 최적의 근거를 찾기 위해(공식적인 증거와 covaria의 추가 속성에 대한 레일리 몫 볼 수 있도록 파생될 수 있다.nce 매트릭스).이를 주성분 분석(PCA) 및 카르후넨-로브 변환(KL-변환)이라고 합니다.
공분산 매트릭스는 특히포트폴리오 이론과 뮤추얼 펀드 분리 정리 및 자본 자산 가격 결정 모델에서 금융 경제학에서 중요한 역할을 합니다.다양한 자산의 수익률 간 공분산 매트릭스는 특정 가정 하에서 (규범적 분석에서) 투자자가 다양화의 맥락에서 보유해야 하거나 (긍정적 분석에서) 보유할 것으로 예상되는 다른 자산의 상대적 금액을 결정하기 위해 사용된다.
최적화에 사용
무작위 검색 휴리스틱스의 특정 제품군인 진화 전략은 근본적으로 메커니즘의 공분산 행렬에 의존합니다.특성 돌연변이 연산자는 진화하는 공분산 행렬을 사용하여 다변량 정규 분포에서 업데이트 단계를 끌어냅니다.진화 전략의 공분산 행렬이 검색 환경의 헤시안 행렬의 역행렬에 스칼라 인자와 작은 랜덤 변동까지 적응한다는 공식 증거가 있다(인구 크기가 증가함에 따라 2차 [9]근사에 의존하여 한 부모 전략과 정적 모델에 대해 입증됨).직관적으로, 이 결과는 최적의 공분산 분포가 균등 확률 등고선이 경관의 수준 집합과 일치하는 돌연변이 단계를 제공할 수 있다는 근거에 의해 뒷받침되며, 따라서 진행률을 극대화할 수 있다.
공분산 매핑
공분산 매핑에서 θ( {{{ 또는θ(I {Y)의 값.X(\와Y(\가이산 랜덤 함수일 경우 맵은 랜덤 함수의 서로 다른 영역 간의 통계 관계를 표시합니다.함수의 통계적으로 독립적인 영역은 지도에 0레벨 평지로 표시되고 양의 상관관계 또는 음의 상관관계는 각각 언덕 또는 계곡으로 표시됩니다.
실제로 열 X \및 \는n개의 행으로 실험적으로 수집됩니다.
서 Xj ( 는 랜덤 함수 ( t X(의 샘플 j의 i번째 이산값입니다.공분산 공식에 필요한 기대값은 표본 평균을 사용하여 추정됩니다.
여기서 각 괄호는 편향을 방지하기 위해 베셀 보정을 수행해야 한다는 점을 제외하고 이전과 같은 표본 평균을 나타냅니다.이 추정을 사용하여 부분 공분산 행렬을 다음과 같이 계산할 수 있습니다.
여기서 백슬래시는 행렬 반전 요건을 우회하고 Matlab과 [10]같은 일부 계산 패키지에서 사용할 수 있는 왼쪽 행렬 나눗셈 연산자를 나타냅니다.
그림 1: 자유 전자 [11]레이저에 의해 유도되는 쿨롱 폭발을 겪는 N개 분자의 부분2 공분산 지도 구축.패널 a와 b는 패널 c에 표시된 공분산 행렬의 두 항을 매핑합니다. 패널 d는 레이저의 강도 변동을 통해 공통 모드 상관 관계를 매핑합니다.패널 e는 강도 변동에 대해 보정된 부분 공분산 행렬을 매핑합니다.패널 f는 10% 과보정이 지도를 개선하고 이온이온 상관관계를 명확하게 볼 수 있음을 보여줍니다.운동량 보존으로 인해 이러한 상관관계는 자기상관 라인에 거의 수직인 선(및 검출기 링잉에 의해 발생하는 주기적 변조)으로 나타난다.
그림 1은 [11]함부르크의 FLASH 자유 전자레이저에서 수행된 실험의 예에서 부분 공분산 맵을 구성하는 방법을 보여줍니다.무작위 X ( ){X(는 레이저 펄스에 의해 이온화된 질소 분자의 쿨롱 폭발에서 발생하는 이온의 비행 시간 스펙트럼이다.각 레이저 펄스에서 수백 개의 분자만 이온화되기 때문에 싱글샷 스펙트럼은 크게 변동한다.단, 으로 m 4{\ m=개의{를 수집하여 j{\j에 대해 평균을 구하면 매끄러운 스펙트럼X ( ) ⟩ \ \ ( t } ( t } ( t ) } ( 。평균 스펙트럼 Xδ {\ \은 운동 에너지에 의해 넓어진 피크 형태로 여러 질소 이온을 나타내지만 이온화 단계와 이온 모멘타의 상관관계를 찾으려면 공분산 맵을 계산해야 한다.
그림 1의 j ( ) { )} Y (t) { \ _)}는 비행 t {t의 범위가 다르다는 점을 제외하고 동일하다.패널 a에는「 T \ 패널 b에는 「X 「 {가 표시됩니다.{색척도 변경에 주의).안타깝게도 이 지도는 샷 간에 변동하는 레이저 강도에 의해 유도되는 재미없는 공통 모드 상관에 의해 압도된다.이러한 상관 관계를 억제하기 위해 레이저 jj {\를I(\ 및 ( , I)(\} (\에 .그러나 레이저 강도 이외에 공통 모드 변동의 다른 소스가 있고 원칙적으로 이러한 모든 선원은 I{I} 로 모니터링되어야 하기 때문에 관심 없는 상관의 억제는 불완전하다. 그러나 실제로는 부분 공분산 상관을 과도하게 보상하는 것으로 종종 충분하다.패널 f와 같이 이온 모멘타의 흥미로운 상관관계가 원자 질소의 이온화 단계를 중심으로 하는 직선으로 명확히 나타난다.
2차원 적외선 분광법
2차원 적외선 분광법은 상관 분석을 사용하여 응축된 위상의 2D 스펙트럼을 얻는다.이 분석에는 동기 및 비동기 두 가지 버전이 있습니다.수학적으로 전자는 표본 공분산 행렬로 표현되며 이 기법은 공분산 [12]매핑과 동일합니다.
^L J Frasinski "공변성 매핑 기술" J. Phys. At. Mol. Opt. Phys.49 152004 (2016), 오픈 액세스
^ abO Kornilov, M Eckstein, M Rosenblatt, C P Schulz, K Motomura, A Rouzée, J Klei, L Foucar, M Siano, A Lübcke, F. Schapper, P Johnsson, D. Holland, Schland At. Mol. Opt. Phys.46 164028 (2013), 오픈 액세스
^I Noda "적외선, 라만, 기타 분광학에 적용할 수 있는 일반 2차원 상관법" Appl. 스펙트럼 47 1329–36 (1993)