분산 안정화 변환

Variance-stabilizing transformation

적용된 통계에서 분산 안정화 변환은 그래픽 탐색 데이터 분석에서 고려사항을 단순화하거나 단순한 회귀 기반 또는 분산 분석 기법의 적용을 허용하기 위해 특별히 선택한 데이터 변환이다.[1]

개요

분산 안정화 변환 선택 이면의 목적은 데이터 집합의 값 x에 적용할 간단한 함수 ƒ을 찾아 새로운 y = ƒ(x)을 생성함으로써 값 y의 변동성이 평균값과 관련되지 않도록 하는 것이다.예를 들어, x 값이 서로 다른 포아송 분포로부터의 현실화라고 가정합시다. 즉, 분포 각각은 서로 다른 평균 μ를 가지고 있다.그런 다음, 포아송 분포의 경우 분산이 평균과 동일하기 때문에 분산이 평균에 따라 달라진다.단, 단순 분산 안정화 변환의 경우

관측치와 관련된 표본 분산은 거의 일정하게 적용된다. 자세한 내용은 Anscombe 변환 및 일부 대체 변환을 참조하십시오.

분산 안정화 변환은 포아송 분포와 이항 분포와 같은 특정 모수 분포에서 잘 알려져 있지만, 일부 유형의 데이터 분석은 보다 경험적으로 진행된다. 예를 들어 적절한 고정 변환을 찾기 위해 전력 변환 사이를 검색하는 것이다.또는 데이터 분석이 분산과 평균의 관계에 대한 함수 형식을 제안하는 경우, 분산 안정화 변환을 추론하는 데 사용할 수 있다.[2]따라서 평균 μ에 대해

분산 안정화 변환의 적절한 근거는 다음과 같다.

편리를 위해 임의의 통합 상수와 임의의 스케일링 계수를 선택할 수 있는 경우.

예제: 상대 분산

X가 양의 랜덤 변수이고 분산이 h(μ) = 22 주어진 경우 표준 편차는 평균에 비례하며 이를 고정 상대 오차라고 한다.이 경우 분산 안정화 변환은

즉, 분산 안정화 변환은 로그 변환이다.

예제: 절대 분산 + 상대 분산

분산이 h(μ) = μ2 + 22 주어지면 분산이 고정 분산 μ2 의해 지배되고, μ가 충분히 작을 때 상대 분산 μ22 의해 지배된다.이 경우 분산 안정화 변환은

즉, 분산 안정화 변환은 λ = σ / s에 대한 축척값 x / λ의 역 쌍곡 사인이다.

델타 방법에 대한 관계

여기서는 델타 방법을 대략적으로 제시하지만, 분산 안정화 변환과의 관계를 확인하기에 충분하다.더 공식적인 접근법을 보려면 델타 방법을 참조하십시오.

Let be a random variable, with and . Define , where is a regular function.= ( ) 에 대한 첫 번째 주문 테일러 근사치는 다음과 같다.

위의 방정식에서 우리는 다음을 얻는다.

[ = g ) [ Y ]= () 2

이 근사법을 델타법이라고 한다.

Consider now a random variable such that and . Notice the relation between the variance and the mean, which implies, for example, heteroscedasticity in a linear model. Y= ( X) 이(가) 예상과 독립적으로(적어도 대략적으로) 분산을 갖는 함수 을(를) 찾는 것이 목표다.

[ Y ) = 이 동등성은 미분 방정식을 암시한다.

이 일반적인 미분방정식은 변수의 분리에 의해 다음과 같은 해법이 있다.

이 마지막 표현은 M. S. 바틀렛지에 처음으로 등장했다.[3]

참조

  1. ^ Everitt, B. S. (2002). The Cambridge Dictionary of Statistics (2nd ed.). CUP. ISBN 0-521-81099-X.
  2. ^ Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms. OUP. ISBN 0-19-920613-9.
  3. ^ Bartlett, M. S. (1947). "The Use of Transformations". Biometrics. 3: 39–52. doi:10.2307/3001536.