분산 안정화 변환

적용된 통계에서 분산 안정화 변환은 그래픽 탐색 데이터 분석에서 고려사항을 단순화하거나 단순한 회귀 기반 또는 분산 분석 기법의 적용을 허용하기 위해 특별히 선택한 데이터 변환이다.^[1]

개요

분산 안정화 변환 선택 이면의 목적은 데이터 집합의 값 x에 적용할 간단한 함수 ƒ을 찾아 새로운 $값$ y = $ƒ (x)$ 을 생성함으로써 값 y의 변동성이 평균값과 관련되지 않도록 하는 것이다.예를 들어, x 값이 서로 다른 포아송 분포로부터의 현실화라고 가정합시다. 즉, 분포 각각은 서로 다른 평균 값 μ를 가지고 있다.그런 다음, 포아송 분포의 경우 분산이 평균과 동일하기 때문에 분산이 평균에 따라 달라진다.단, 단순 분산 안정화 변환의 경우

y={\sqrt {x}\,

관측치와 관련된 표본 분산은 거의 일정하게 적용된다. 자세한 내용은 Anscombe 변환 및 일부 대체 변환을 참조하십시오.

분산 안정화 변환은 포아송 분포와 이항 분포와 같은 특정 모수 분포에서 잘 알려져 있지만, 일부 유형의 데이터 분석은 보다 경험적으로 진행된다. 예를 들어 적절한 고정 변환을 찾기 위해 전력 변환 사이를 검색하는 것이다.또는 데이터 분석이 분산과 평균의 관계에 대한 함수 형식을 제안하는 경우, 분산 안정화 변환을 추론하는 데 사용할 수 있다.^[2]따라서 평균 μ에 대해

\operatorname {var}(X)=h(\mu )\,

분산 안정화 변환의 적절한 근거는 다음과 같다.

y\propto \int ^{x}{\frac {1}{\sqrt {h(\mu )}}\,d\mu ,

편리를 위해 임의의 통합 상수와 임의의 스케일링 계수를 선택할 수 있는 경우.

예제: 상대 분산

$X$ 가 양의 랜덤 변수이고 분산이 $h (μ)$ = $sμ$ 로²² 주어진 경우 표준 편차는 평균에 비례하며 이를 고정 상대 오차라고 한다.이 경우 분산 안정화 변환은

y=\int ^{x}{\frac {d\mu }{\sqrt {s^{2}\mu ^{2}}={\frac {1}{s}}\ln(x)\propto \log(x)\,

즉, 분산 안정화 변환은 로그 변환이다.

예제: 절대 분산 + 상대 분산

분산이 $h (μ)$ = $μ 2$ + $sμ$ 로²² 주어지면 분산이 고정 분산 $μ$ 에² 의해 지배되고, $μ$ 가 충분히 작을 때 상대 분산 $μ$ 에²² 의해 지배된다.이 경우 분산 안정화 변환은

y=\int ^{x}{\frac {d\mu }{\sqrt {\sqrt {\sma ^{2}+s^{2}}}\mu ^{2}}:}={\frac {1}{s}}\frac 이름 {asinh}{\frac {x}{\framma /s}}}\propto \propto {asinh} {\frac {x}{\fracda}}}}}}, }}}}, }}, }, }, },.

즉, 분산 안정화 변환은 $λ$ = $σ$ / $s$ 에 대한 축척값 $x$ / $λ$ 의 역 쌍곡 사인이다.

델타 방법에 대한 관계

여기서는 델타 방법을 대략적으로 제시하지만, 분산 안정화 변환과의 관계를 확인하기에 충분하다.더 공식적인 접근법을 보려면 델타 방법을 참조하십시오.

Let $X$ be a random variable, with $E[X]=\mu$ and $\operatorname {Var} (X)=\sigma ^{2}$ . Define $Y=g(X)$ , where $g$ is a regular function. $Y=g(x)$ = $Y=g(x)$ ( $Y=g(x)$ ) $Y=g(x)$ 에 대한 첫 번째 주문 테일러 근사치는 다음과 같다.

$[\displaystyle Y=g(X)\cHB g(\mu )+g'(\mu )}$

위의 방정식에서 우리는 다음을 얻는다.

E[Y]=g(\mu )

[

E[Y]=g(\mu )

E[Y]=g(\mu )

= g

E[Y]=g(\mu )

)

E[Y]=g(\mu )

및

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

[ Y ]

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

=

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

(

\operatorname {Var} [Y]=\sigma ^{2}g'(\mu )^{2}

) 2

{\

이 근사법을 델타법이라고 한다.

Consider now a random variable $X$ such that $E[X]=\mu$ and $\operatorname {Var} [X]=h(\mu )$ . Notice the relation between the variance and the mean, which implies, for example, heteroscedasticity in a linear model. $Y=g(X)$ Y $Y=g(X)$ = $Y=g(X)$ ( X $Y=g(X)$ ) $Y=g(X)$ 이(가) 예상과 독립적으로(적어도 대략적으로) 분산을 갖는 $Y=g(X)$ 함수 $g$ $g$ $g$ 을(를) 찾는 것이 목표다.

$\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ [ Y $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ ) $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ = $\operatorname {Var} [Y]\approx h(\mu )g'(\mu )^{2}={\text{constant}}$ ${\$ 이 동등성은 미분 방정식을 암시한다.

{\dplaystyle {\frac {dg}{d\mu }}={\frac {C}{\sqrt {h(\mu )}}}}}}}}}}

이 일반적인 미분방정식은 변수의 분리에 의해 다음과 같은 해법이 있다.

g(\mu )=\int {\frac {C\,d\mu }{\sqrt {h(\mu )}}}}}}}

이 마지막 표현은 M. S. 바틀렛지에 처음으로 등장했다.^[3]

참조

^ Everitt, B. S. (2002). The Cambridge Dictionary of Statistics (2nd ed.). CUP. ISBN 0-521-81099-X.
^ Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms. OUP. ISBN 0-19-920613-9.
^ Bartlett, M. S. (1947). "The Use of Transformations". Biometrics. 3: 39–52. doi:10.2307/3001536.

[1] Everitt, B. S. (2002). The Cambridge Dictionary of Statistics (2nd ed.). CUP. ISBN 0-521-81099-X.

[2] Dodge, Y. (2003). The Oxford Dictionary of Statistical Terms. OUP. ISBN 0-19-920613-9.

[3] Bartlett, M. S. (1947). "The Use of Transformations". Biometrics. 3: 39–52. doi:10.2307/3001536.

[1]

[2]

[3]

Search

분산 안정화 변환

네임스페이스

더

목차

개요

예제: 상대 분산

예제: 절대 분산 + 상대 분산

델타 방법에 대한 관계

참조