공분산 및 상관 관계
Covariance and correlation통계에 관한 시리즈의 일부 |
상관 및 공분산 |
---|
![]() |
확률 이론과 통계에서 공분산과 상관관계의 수학적 개념은 매우 유사하다.[1][2] 두 변수 모두 두 개의 랜덤 변수 또는 랜덤 변수 집합이 유사한 방법으로 기대값에서 벗어나는 경향이 있는 정도를 설명한다.
X와 Y가 평균(기대 값) μ와X μY, 표준 편차 μ와X μ를Y 각각 갖는 두 개의 랜덤 변수라면 이들의 공분산 및 상관관계는 다음과 같다.
하도록
여기서 E는 기대값 연산자다. 특히 공분산은 두 변수의 단위를 곱하여 얻은 단위인 반면 상관관계는 치수가 없다.
Y가 항상 X와 같은 값을 갖는다면, 우리는 변수와 그 자체(, X X{\의 공분산을 가지고 있는데, 를 이라고 하며 표준편차의 제곱 2,{\ 더 일반적으로 표준편차의 제곱으로 나타낸다. 변수와 그 자체와의 상관관계는 항상 1이다(X가 항상 동일한 단일 값을 취하기 때문에 두 분산이 0인 퇴화된 경우는 제외한다). 이 경우 계산은 0으로 나누기 때문에 상관관계가 존재하지 않는다. 보다 일반적으로 두 변수 중 하나가 각각 양(또는 음) 기울기를 갖는 다른 변수의 선형 함수에 의해 정확히 주어진 값을 항상 갖는다면 두 변수 사이의 상관관계는 1(또는 –1)이다.
이론적 공분산 및 상관관계의 값은 위의 방법으로 연계되어 있지만, 이러한 수량의 표본 추정치의 확률 분포는 어떠한 단순한 방법으로도 연계되어 있지 않으며 일반적으로는 별도로 취급할 필요가 있다.
다중 랜덤 변수
임의의 수의 랜덤 변수가 1을 초과하면 변수를 랜덤 벡터로 쌓을 수 있으며, i 요소는 th i 랜덤 변수다 th. 그런 다음 분산과 공분산 행렬에 배치할 수 있으며, 여기서 (i,j) 요소는 i th 랜덤 변수와 j 변수 th 사이의 공분산이다. 마찬가지로 상관 행렬도 상관 행렬에 배치할 수 있다.
시계열 분석
넓은 의미에서 정지해 있는 시계열의 경우 평균과 분산이 모두 시간에 따라 일정하다(E(Xn+m) = E(Xn) = μX, var(Xn+m) = var(X) = var(Xn) 및 마찬가지로 변수 Y도 마찬가지다. 이 경우 교차 공분산 및 교차 상관 관계는 시간 차이의 함수다.
Y가 X와 동일한 변수인 경우 위의 식을 자기 상관 및 자기 상관이라고 한다.
참조
이 글은 검증을 위해 인용구가 추가로 필요하다. 및 – · · 책 · · (2011년 8월) (이 과 시기 |