접힌 정규 분포

	확률밀도함수; μ=1, σ=1
	누적분포함수; μ=1, σ=1
매개변수	㎕∈ R(위치); σ2 > 0 (척도)
지원	x ∈ [0,197]
PDF
CDF
평균
분산

접힌 정규 분포는 정규 분포와 관련된 확률 분포다.평균 μ와 분산 with의² 정규 분포 랜덤 변수 X에 대해 랜덤 변수 Y = X는 접힌 정규 분포를 가진다.그러한 경우는 일부 변수의 크기만 기록되고 그 기호는 기록되지 않는 경우에 직면할 수 있다.x = 0의 왼쪽에 있는 확률 질량은 절대값을 취하여 접기 때문에 분포는 "접기"라고 불린다.열전도 물리학에서 접힌 정상 분포는 절반의 공간에 있는 열 방정식의 근본적인 해결책이다. 이는 원점을 통해 하이퍼플레인 위에 완벽한 절연체를 갖는 것에 해당한다.null

정의들

밀도

확률밀도함수(PDF)는 다음과 같이 제공된다.

f_{Y}(x;\mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}+{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,e^{-{\frac {(x+\mu )^{2}}{2\sigma ^{2}}}}

x x x x x 0, 그리고 다른 모든 곳에 0.대안 공식은 다음과 같다.

f\left(x\right)={\sqrt {\frac {2}{\pi \sigma ^{2}}}}e^{-{\frac {\left(x^{2}+\mu ^{2}\right)}{2\sigma ^{2}}}}\cosh {\left({\frac {\mu x}{\sigma ^{2}}}\right)}

,

여기서 cosh는 코사인 쌍곡선 함수다.누적분포함수(CDF)는 다음과 같이 주어진다.

F_{Y}(x;\mu ,\sigma ^{2})={\frac {1}{2}}\left[{\mbox{erf}}\left({\frac {x+\mu }{\sqrt {2\sigma ^{2}}}}\right)+{\mbox{erf}}\left({\frac {x-\mu }{\sqrt {2\sigma ^{2}}}}\right)\right]

x ≥ 0에 대해, 여기서 erf()는 오류 함수다.이 식은 μ = 0일 때 반정규 분포의 CDF로 감소한다.

접힌 분포의 평균은 다음과 같다.

\mu _{Y}=\sigma {\sqrt {\frac {2}{\pi }}}\,\,\exp \left({\frac {-\mu ^{2}}{2\sigma ^{2}}}\right)+\mu \,{\mbox{erf}}\left({\frac {\mu }{\sqrt {2\sigma ^{2}}}}\right)

또는

\mu_{Y}={\sqrt{2}{\pi }}\sigma e^{{2}}:{2\sigma ^{2}}+\mu 왼쪽[1-2\phi \}{\frac {}{\ma}}오른쪽)\

여기서 $\Phi$ $\Phi$ 은 $\Phi$ (는) 정규 누적 분포 함수:

\Phi(x)\;=\{\frac {1}{1}:{2}}: 왼쪽[1+\operfname {erf} \lef({\frac {x}{\sqrt {2}}\오른쪽)\오른쪽]

그런 다음 분산을 평균으로 쉽게 표현한다.

\sigma _{Y}^{2}=\mu ^{2}+\sigma ^{2}-\mu _{Y}^{2}.

원래 정규 분포에서 X의 평균(μ)과 분산(μ²) 모두 접힌 분포에서 Y의 위치와 척도 모수로 해석할 수 있다.null

특성.

모드

분포 모드는 밀도가 최대화되는 $x$ $x$ $x$ 의 값이다.이 값을 찾기 위해 $x$ $x$ 에 대한 밀도의 첫 번째 파생 모델을 취하여 0으로 $x$ 설정한다.불행히도 폐쇄적인 형태는 없다.그러나 우리는 더 나은 방법으로 파생상품을 쓸 수 있고 결국 비선형 방정식으로 끝날 수 있다.

${\frac {df(x)}{dx}=0\Rightarrow -{\frac {\frac(x-\mu \오른쪽)}}{\frac ^{2}}:e^{-{-{\frac {1}{2}}:{\frac {\frac(x-\mu \right)^{2}}:{\frac ^{2}}-{\frac(x+\mu \right)}}{\frama ^{2}}:e^{-{\frac {1}{2}}:{\frac {\좌(x+\mu \우)^{2}}:{\framma ^{2}}=0$

$x\left[e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}+e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}\right]-\mu \left[e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}-e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}\right]=0$

$x\e^{-{\frac {2\mu x}{2}}\오른쪽)-\mu \left(1-e^{-{\frac{2\mu x}{2}}}\right)=0$

$\left(\mu +x\right)e^{-{-{\frac {2\mu x}{\mu ^{2}}=\mu -x$

$x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ = - $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ - $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ x $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ + $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ x μ + $x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ ${\$ x $=-{\frac {\prac ^{2}}:{2\mu ^}\log{\frac {\mu -x}{\mu +x$

Tsagris(알.(2014년)수치 조사를 통했을 때μ<>σ{\displaystyle \mu<>\sigma}, 최댈 때)=0{\displaystyle x=0} 만난다 μ{\displaystyle \mu}3σ{3\sigma\displaystyle}보다 더 커지고 있습니다, 최대 접근법μ{\displaystyle \mu}. 이것은 당연히 약간의 것을 보았다.것이 경우 접힌 정규 분포가 정규 분포로 수렴되기 때문에 예상할 수 있다.음의 분산을 방지하기 위해 모수의 지수를 제안한다.또는 최적기가 음의 분산을 수행하는 경우 로그 우도 값이 NA이거나 매우 작은 값과 같은 제약 조건을 추가할 수 있다.null

특성함수 및 기타 관련함수

특성 함수는 다음과 같다.

${\displaystyle \varphi _{x}\left(t\right)=e^{{\frac {-\sigma ^{2}t^{2}}{2}}+i\mu t}\$ $Phi \frac({\frac {\mu }}{\sigma }}}}}+i\sigma t\rigma t\right)+e^{-{{{2}}-i\mu t}\\\$ $Phi \left(-{\frac {\mu }{\sigma }}}}}+i\sigma$ t $\오른쪽$

모멘트 생성 기능은

${\displaystyle M_{x}\left(t\right)=\varphi _{x}\left(-it\right)=e^{{\frac {\sigma ^{2}t^{2}}{2}}+\mu t}\$ $Phi \frac({\frac {\mu }{\sigma }}}}}+\sigma t\오른쪽)+e^{{\frac {\sigma ^{2}-{2}}-\mu t}\\\}\$ $Phi \left(-{\frac {\mu }{\sigma }}}}}+\sigma$ t $\오른쪽$

누적 생성 함수는 다음과 같다.

${\displaystyle K_{x}\left(t\right)=\log {M_{x}\left(t\right)}=\left({\frac {\sigma ^{2}t^{2}}{2}}+\mu t\right)+\log {\left\lbrace 1-\Phi \le$ $ft(-{\frac {\mu }{\sigma }}-\sigma t\right)+e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}-\sigma t\right)\right]\right\rbrace }}$ .

Laplace 변환은 다음에 의해 주어진다.

$E\left(e^{-tx}\right)=e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\left[1-\Phi \left(-{\frac {\mu }{\sigma }}+\sigma t\right)\right]+e^{{\frac {\sigma ^{2}t^{2}}{2$ $}}+\mu$ t $}\왼쪽[1-\Phi \left({\frac {\mu }}{\sigma }}}+\sigma t\오른쪽$ .

푸리에 변환은 다음에 의해 주어진다.

${\hat {f}}\left(t\right)=\phi _{x}\left(-2\pi t\right)=e^{{\frac {-4\pi ^{2}\sigma ^{2$ $t^{2}}{2}}-i2\pi \mu t}\left[1-\Phi \left(-{\frac {\mu }{\sigma }}-i2\pi \sigma t\right)\right]+e^{-{\frac {4\pi ^{2}\sigma ^{2}t^{2}}{2}}+i2\pi \mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}-i2\pi \sigma t\right)\right]}$ .

통계적 추론

모수 추정

접힌 정규 분포의 모수를 추정하는 몇 가지 방법이 있다.모두 본질적으로 최대우도추정절차지만 경우에 따라서는 수치최대화가 수행되는 반면, 다른 경우에는 방정식의 근원을 탐색하고 있다. $n$ 가 n $n$ 인 $n$ 샘플 $x_{i}$ $x_{i}$ i ${\$ 일 때 접힌 정규 분포의 로그 우도는 다음과 같은 방법으로 기록할 수 있다.

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}+\sum _{i=1}^{n}\log {\left[e^{-{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}}+e^{-{\frac {\left(x_{i}+\mu \right)^{2}}{2\sigma ^{2}}}}\right]}$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}+\sum _{i=1}^{n}\log {\left[e^{-{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}}\left(1+e^{-{\frac {\left(x_{i}+\mu \right)^{2}}{2\sigma ^{2}}}}e^{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}\right)\right]}$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}-\sum _{i=1}^{n}{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}+\sum _{i=1}^{n}\log {\left(1+e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}\right)}$

R(프로그래밍 언어)에서 Rfast 패키지를 사용하면 MLE를 매우 빠르게 얻을 수 있다(명령어).foldnorm.mle). 또는 명령 최적화 또는 nlm이 이 분포에 적합할 것이다.두 개의 파라미터( $[\displaystyle \mu }$ 및 $\mu$ $\sigma ^{2}$ 2 $[\$ 가 관련되어 있으므로 최대화는 쉽다.유의할 점은 $\mu$ $\mu$ 에 대한 양수 값과 음수 값 모두 허용된다는 $\mu$ 것이다. μ $\mu$ {\ $displaystyle \mu }$ 은 실제 숫자에 $\mu$ 속하므로, 분포가 그것에 대해 대칭적이기 때문에 부호는 중요하지 않다.다음 코드는 R로 되어 있다.

접은 <- 기능을 하다(y) {    ## y는 양의 데이터를 가진 벡터   n <- 길이(y)  ## 표본 크기   sys2 <- 합계를 내다(y^2)      샘. <- 기능을 하다(파를 치다, n, sys2) {       나 <- 파를 치다[1]   ;   se <- 생략하다( 파를 치다[2] )       f <-  - n/2 * 통나무를 하다(2/파이/se) + n * 나^2 / 2 / se +             sys2 / 2 / se - 합계를 내다( 통나무를 하다( 코쉬( 나 * y/se ) ) )       f     }    모드의 <- 최적의( c( 심술궂다(y), sd(y) ), n = n, sys2 = sys2, 샘., 통제를 하다 = 리스트를 작성하다(최대로 하다 = 2000) )   모드의 <- 최적의( 모드의$액면 그대로, 샘., n = n, sys2 = sys2, 통제를 하다 = 리스트를 작성하다(최대로 하다 = 20000) )   결과 <- c( -모드의$가치를 매기다, 모드의$액면 그대로[1], 생략하다(모드의$액면 그대로[2]) )   이름들(결과) <- c("로그 저장", "무", "sigma 제곱")   결과  }

로그 우도의 부분파생상품은 다음과 같이 기록된다.

${\frac {\frac {\properties \mu }}}={\frac {\sum _{i=1}^{n}\왼쪽(x_{i}-\mu \right)}{\sigma ^{2}}}-{\frac {2}{\sigma ^{2}}}\sum _{i=1}^{n}{\frac {x_{i}e^{\frac {-2\mu x_{i}}{\sigma ^{2}}}}{1+e^{\frac {-2\mu x_{i}}{\sigma ^{2}}}}}$

${\frac {\frac {\properties \mu }}}={\frac {\sum _{i=1}^{n}\왼쪽(x_{i}-\mu \right)}}{\ma ^{2}}-{\frac {2}{\frac ^{2}}}\sum _{i=1}{i=1}{n}{\frac {x_{i}}{1+e^{1\frac {2\mu x_{i}}}}}}{\cext}}}}}}}}}$

${\frac {\partial l}{\partial \sigma ^{2}}}=-{\frac {n}{2\sigma ^{2}}}+{\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{2\sigma ^{4}}}+{\frac {2\mu }{\sigma ^{4}}}\sum _{i=1}^{n}{\frac {x_{i}e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}}{1+e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}}}$

${\displaystyle {\frac {\partial l}{\partial \sigma ^{2}}}=-{\frac {n}{2\sigma ^{2}}}+{\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{2\sigma ^{4}}}+{\$ $frac {2\mu }{\ma ^{4}}\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{2\mu x_{i}}}{\ma$ ^{ $2$

로그 우도의 첫 번째 부분파생물을 0과 동일시함으로써 우리는 좋은 관계를 얻는다.

$\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{2}}$ .

위의 방정식은 세 가지 해법이 있는데, 하나는 0에 있고, 다른 하나는 반대 기호로 2가 더 있다.위의 방정식을 대체하여 로그 $\sigma ^{2}$ 우도 w.r.t $\sigma ^{2}$ $\sigma ^{2}$ ${\$ 0과 동일시함으로써 분산에 대한 다음 식을 얻는다.

${\displaystyle \sigma ^{2}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{n}}+{\frac {2\mu \sum _{i=1}^{n}\left(x_{i}-\mu \ri$ $ght)}{n}={n}={\frac {\sum _{i=1}^{n}\왼쪽(x_{i}^{2}-\mu ^{2}\오른쪽)$ $}{n}={$ n}={\ $frac {\sum _{i=1}^{n}x_{i}^{2}}:{n}-\mu ^{2$

정규 분포와 동일한 공식으로 표시됨.여기서 주요한 차이는 $\mu$ 과 $\sigma ^{2}$ $\sigma ^{2}$ ${\$ 은 통계적으로 독립적이지 않다는 것이다 $\sigma ^{2}$ .위의 관계는 효율적인 재귀적 방법으로 최대우도 추정치를 얻기 위해 사용될 수 있다. $\sigma ^{2}$ $\sigma ^{2}$ ${\$ 의 초기 값부터 시작하여 $\sigma ^{2}$ 마지막 방정식의 양근( $\mu$ $\mu$ $\mu$ 을 찾는다.그런 다음 $\sigma ^{2}$ 2 $\sigma ^{2}$ {\ $displaystyle \sigma ^{2$ }}의 업데이트된 값을 받는다 $\sigma ^{2}$ 로그 우도 값의 변경이 무시할 수 있을 때까지 절차를 반복하고 있다.또 다른 쉽고 효율적인 방법은 검색 알고리즘을 수행하는 것이다.마지막 방정식을 좀 더 우아하게 쓰자.

$2\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}-\sum _{i=1}^{n}{\frac {x_{i}\left(1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}\right)}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}+n\mu =0$

$\sum _{i=1}^{n}{\frac {x_{i}\left(1-e^{\frac {2\mu x_{i}}{\sigma ^{2}}}\right)}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}+n\mu =0$ .

두 매개변수에 대한 로그 우도의 최적화가 함수의 루트 검색으로 변했다는 것이 명백해진다.이것은 물론 이전의 루트 검색과 동일하다.Tsagris 외 연구진(2014)은 $[\displaystyle \mu },$ 즉 이 방정식을 만족하는 $\mu$ $[\displaystyle \mu }$ 의 가능한 세 가지 값이 있다는 것을 발견했다.최대우도 추정치인 - $-\mu$ {\ $displaystyle$ $-$ $+\mu$ $}$ 및 + μ {\displaystyle $+\mu$ $+\mu$ 최소 로그 우도에 해당하는 0.null

참고 항목

참조

^ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods: 1–23. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.

Tsagris, M.; Beneki, C.; Hassani, H. (2014). "On the folded normal distribution". Mathematics. 2 (1): 12–28. arXiv:1402.3559.
Leone FC, Nottingham RB, Nelson LS (1961). "The Folded Normal Distribution". Technometrics. 3 (4): 543–550. doi:10.2307/1266560. hdl:2027/mdp.39015095248541. JSTOR 1266560.
Johnson NL (1962). "The folded normal distribution: accuracy of the estimation by maximum likelihood". Technometrics. 4 (2): 249–256. doi:10.2307/1266622. JSTOR 1266622.
Nelson LS (1980). "The Folded Normal Distribution". J Qual Technol. 12 (4): 236–238.
Elandt RC (1961). "The folded normal distribution: two methods of estimating parameters from moments". Technometrics. 3 (4): 551–562. doi:10.2307/1266561. JSTOR 1266561.
Lin PC (2005). "Application of the generalized folded-normal distribution to the process capability measures". Int J Adv Manuf Technol. 26 (7–8): 825–830. doi:10.1007/s00170-003-2043-x.
Psarakis, S.; Panaretos, J. (1990). "The folded t distribution". Communications in Statistics - Theory and Methods. 19 (7): 2717–2734.
Psarakis, S.; Panaretos, J. (2001). "On some bivariate extensions of the folded normal and the folded-t distributions". Journal of Applied Statistical Science. 10 (2): 119–136.
Chakraborty, A. K.; Chatterjee, M. (2013). "On multivariate folded normal distribution". Sankhyā: The Indian Journal of Statistics, Series B. 75 (1): 1–15. JSTOR 42003783.

외부 링크

랜덤(이전의 Virtual Laboratory):접힌 정규 분포

[Sun,_Kong_and_Pal-1] Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods: 1–23. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.

[1]

확률밀도함수 $μ =1, σ =1$
누적분포함수 $μ =1, σ =1$
매개변수	$㎕\in$ $R$ (위치) $σ 2$ > 0 (척도)
지원	$x \in [0,197]$
PDF	${\frac {1}{\sigma {\sqrt {2\pi }}}}\,e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}+{\frac {1}{\sigma {\sqrt {2\pi }}}}\,e^{-{\frac {(x+\mu )^{2}}{2\sigma ^{2}}}}$
CDF	${\frac{1}{2}}\왼쪽[{\mbox{erf}}\frac {x+\frac}{xqrt{2}}\오른쪽)}{\\mboxa{\mbox}}\frac {x-\}{\sqrt{2}}\오른쪽]}}}}}$
평균	$\mu _{Y}=\sigma {2}{\pi }}\, e^{(-\mu ^{2}/2\sigma ^{2}})+\mu \left(1-2\,\pi({\tfrac }}}{sigma)\오른쪽)$
분산	$\sigma _{Y}^{2}=\mu ^{2}+\sigma ^{2}-\mu _{Y}^{2}$

Search