접힌 정규 분포는 정규 분포와 관련된 확률 분포다.평균μ와 분산with의2 정규 분포 랜덤 변수 X에 대해 랜덤변수 Y = X는 접힌 정규 분포를 가진다.그러한 경우는 일부 변수의 크기만 기록되고 그 기호는 기록되지 않는 경우에 직면할 수 있다.x = 0의 왼쪽에 있는 확률 질량은 절대값을 취하여 접기 때문에 분포는 "접기"라고 불린다.열전도 물리학에서 접힌 정상 분포는 절반의 공간에 있는 열 방정식의 근본적인 해결책이다. 이는 원점을 통해 하이퍼플레인 위에 완벽한 절연체를 갖는 것에 해당한다.null
원래 정규 분포에서 X의 평균(μ)과 분산(μ2) 모두 접힌 분포에서 Y의 위치와 척도 모수로 해석할 수 있다.null
특성.
모드
분포 모드는 밀도가 최대화되는의 값이다.이 값을 찾기 위해 에 대한 밀도의 첫 번째 파생 모델을 취하여 0으로 설정한다.불행히도 폐쇄적인 형태는 없다.그러나 우리는 더 나은 방법으로 파생상품을 쓸 수 있고 결국 비선형 방정식으로 끝날 수 있다.
= - -x +x μ + x
Tsagris(알.(2014년)수치 조사를 통했을 때μ<>σ{\displaystyle \mu<>\sigma}, 최댈 때)=0{\displaystyle x=0} 만난다 μ{\displaystyle \mu}3σ{3\sigma\displaystyle}보다 더 커지고 있습니다, 최대 접근법μ{\displaystyle \mu}. 이것은 당연히 약간의 것을 보았다.것이 경우 접힌 정규 분포가 정규 분포로 수렴되기 때문에 예상할 수 있다.음의 분산을 방지하기 위해 모수의 지수를 제안한다.또는 최적기가 음의 분산을 수행하는 경우 로그 우도 값이 NA이거나 매우 작은 값과 같은 제약 조건을 추가할 수 있다.null
접힌 정규 분포의 모수를 추정하는 몇 가지 방법이 있다.모두 본질적으로 최대우도추정절차지만 경우에 따라서는 수치최대화가 수행되는 반면, 다른 경우에는 방정식의 근원을 탐색하고 있다.가 n 인 샘플 i 일 때 접힌 정규 분포의 로그 우도는 다음과 같은 방법으로 기록할 수 있다.
R(프로그래밍 언어)에서 Rfast 패키지를 사용하면 MLE를 매우 빠르게 얻을 수 있다(명령어).foldnorm.mle). 또는 명령 최적화 또는 nlm이 이 분포에 적합할 것이다.두 개의 파라미터( 및 2가 관련되어 있으므로 최대화는 쉽다.유의할 점은 에 대한 양수 값과 음수 값 모두 허용된다는 것이다. μ{\은 실제 숫자에 속하므로, 분포가 그것에 대해 대칭적이기 때문에 부호는 중요하지 않다.다음 코드는 R로 되어 있다.
접은<-기능을 하다(y){## y는 양의 데이터를 가진 벡터n<-길이(y)## 표본 크기sys2<-합계를 내다(y^2)샘.<-기능을 하다(파를 치다,n,sys2){나<-파를 치다[1];se<-생략하다(파를 치다[2])f<--n/2*통나무를 하다(2/파이/se)+n*나^2/2/se+sys2/2/se-합계를 내다(통나무를 하다(코쉬(나*y/se)))f}모드의<-최적의(c(심술궂다(y),sd(y)),n=n,sys2=sys2,샘.,통제를 하다=리스트를 작성하다(최대로 하다=2000))모드의<-최적의(모드의$액면 그대로,샘.,n=n,sys2=sys2,통제를 하다=리스트를 작성하다(최대로 하다=20000))결과<-c(-모드의$가치를 매기다,모드의$액면 그대로[1],생략하다(모드의$액면 그대로[2]))이름들(결과)<-c("로그 저장","무","sigma 제곱")결과}
로그 우도의 부분파생상품은 다음과 같이 기록된다.
^{
로그 우도의 첫 번째 부분파생물을 0과 동일시함으로써 우리는 좋은 관계를 얻는다.
.
위의 방정식은 세 가지 해법이 있는데, 하나는 0에 있고, 다른 하나는 반대 기호로 2가 더 있다.위의 방정식을 대체하여 로그 우도 w.r.t 0과 동일시함으로써 분산에 대한 다음 식을 얻는다.
n}={\
정규 분포와 동일한 공식으로 표시됨.여기서 주요한 차이는 과 은 통계적으로 독립적이지 않다는 것이다.위의 관계는 효율적인 재귀적 방법으로 최대우도 추정치를 얻기 위해 사용될 수 있다.의 초기 값부터 시작하여 마지막 방정식의 양근(을 찾는다.그런 다음 2{\}}의 업데이트된 값을 받는다로그 우도 값의 변경이 무시할 수 있을 때까지 절차를 반복하고 있다.또 다른 쉽고 효율적인 방법은 검색 알고리즘을 수행하는 것이다.마지막 방정식을 좀 더 우아하게 쓰자.
.
두 매개변수에 대한 로그 우도의 최적화가 함수의 루트 검색으로 변했다는 것이 명백해진다.이것은 물론 이전의 루트 검색과 동일하다.Tsagris 외 연구진(2014)은 즉 이 방정식을 만족하는의 가능한 세 가지 값이 있다는 것을 발견했다.최대우도 추정치인 - {\ 및 + μ {\displaystyle 최소 로그 우도에 해당하는 0.null
Johnson NL (1962). "The folded normal distribution: accuracy of the estimation by maximum likelihood". Technometrics. 4 (2): 249–256. doi:10.2307/1266622. JSTOR1266622.
Nelson LS (1980). "The Folded Normal Distribution". J Qual Technol. 12 (4): 236–238.
Elandt RC (1961). "The folded normal distribution: two methods of estimating parameters from moments". Technometrics. 3 (4): 551–562. doi:10.2307/1266561. JSTOR1266561.
Lin PC (2005). "Application of the generalized folded-normal distribution to the process capability measures". Int J Adv Manuf Technol. 26 (7–8): 825–830. doi:10.1007/s00170-003-2043-x.
Psarakis, S.; Panaretos, J. (1990). "The folded t distribution". Communications in Statistics - Theory and Methods. 19 (7): 2717–2734.
Psarakis, S.; Panaretos, J. (2001). "On some bivariate extensions of the folded normal and the folded-t distributions". Journal of Applied Statistical Science. 10 (2): 119–136.
Chakraborty, A. K.; Chatterjee, M. (2013). "On multivariate folded normal distribution". Sankhyā: The Indian Journal of Statistics, Series B. 75 (1): 1–15. JSTOR42003783.