접힌 정규 분포

Folded normal distribution
확률밀도함수
Probability density function for the folded-normal distribution
μ=1, σ=1
누적분포함수
Cumulative distribution function for the normal distribution
μ=1, σ=1
매개변수 ㎕∈ R(위치)
σ2 > 0 (척도)
지원 x ∈ [0,197]
PDF
CDF
평균
분산

접힌 정규 분포정규 분포와 관련된 확률 분포다.평균 μ분산 with2 정규 분포 랜덤 변수 X에 대해 랜덤 변수 Y = X는 접힌 정규 분포를 가진다.그러한 경우는 일부 변수의 크기만 기록되고 그 기호는 기록되지 않는 경우에 직면할 수 있다.x = 0의 왼쪽에 있는 확률 질량은 절대값을 취하여 접기 때문에 분포는 "접기"라고 불린다.열전도 물리학에서 접힌 정상 분포는 절반의 공간에 있는 열 방정식의 근본적인 해결책이다. 이는 원점을 통해 하이퍼플레인 위에 완벽한 절연체를 갖는 것에 해당한다.null

정의들

밀도

확률밀도함수(PDF)는 다음과 같이 제공된다.

x x x x x 0, 그리고 다른 모든 곳에 0.대안 공식은 다음과 같다.

,

여기서 cosh는 코사인 쌍곡선 함수다.누적분포함수(CDF)는 다음과 같이 주어진다.

x ≥ 0에 대해, 여기서 erf()는 오류 함수다.이 식은 μ = 0일 때 반정규 분포의 CDF로 감소한다.

접힌 분포의 평균은 다음과 같다.

또는

여기서 (는) 정규 누적 분포 함수:

그런 다음 분산을 평균으로 쉽게 표현한다.

원래 정규 분포에서 X의 평균(μ)과 분산(μ2) 모두 접힌 분포에서 Y의 위치와 척도 모수로 해석할 수 있다.null

특성.

모드

분포 모드는 밀도가 최대화되는 의 값이다.이 값을 찾기 위해 에 대한 밀도의 첫 번째 파생 모델을 취하여 0으로 설정한다.불행히도 폐쇄적인 형태는 없다.그러나 우리는 더 나은 방법으로 파생상품을 쓸 수 있고 결국 비선형 방정식으로 끝날 수 있다.

= - -x +x μ + x

Tsagris(알.(2014년)수치 조사를 통했을 때μ<>σ{\displaystyle \mu<>\sigma}, 최댈 때)=0{\displaystyle x=0} 만난다 μ{\displaystyle \mu}3σ{3\sigma\displaystyle}보다 더 커지고 있습니다, 최대 접근법μ{\displaystyle \mu}. 이것은 당연히 약간의 것을 보았다.것이 경우 접힌 정규 분포가 정규 분포로 수렴되기 때문에 예상할 수 있다.음의 분산을 방지하기 위해 모수의 지수를 제안한다.또는 최적기가 음의 분산을 수행하는 경우 로그 우도 값이 NA이거나 매우 작은 값과 같은 제약 조건을 추가할 수 있다.null

특성함수 및 기타 관련함수

  • 특성 함수는 다음과 같다.

t

  • 모멘트 생성 기능은

t

  • 누적 생성 함수는 다음과 같다.

.

  • Laplace 변환은 다음에 의해 주어진다.

t .

  • 푸리에 변환은 다음에 의해 주어진다.

.

관련 분포

  • μ = 0일 Y 분포는 반 정규 분포다.
  • 랜덤 변수(2Y/1978)는 자유도가 1도이고 중심성이 (μ/192)비중심 카이-제곱 분포를 가진다.2
  • 접힌 정규 분포는 자유도가 무한대로 가면서 접힌 비표준화 t 분포의 한계로도 볼 수 있다.
  • Psarakis와 Panaretos(2001)가 개발한 이바리테 버전과 Chakraborty와 Chatterjee(2013)가 개발한 다변량 버전이 있다.
  • 쌀 분포는 접힌 정규 분포의 다변량 일반화다.
  • 수정된 반 정규 분포.[1]

통계적 추론

모수 추정

접힌 정규 분포의 모수를 추정하는 몇 가지 방법이 있다.모두 본질적으로 최대우도추정절차지만 경우에 따라서는 수치최대화가 수행되는 반면, 다른 경우에는 방정식의 근원을 탐색하고 있다.가 n 샘플 i 일 때 접힌 정규 분포의 로그 우도는 다음과 같은 방법으로 기록할 수 있다.

R(프로그래밍 언어)에서 Rfast 패키지를 사용하면 MLE를 매우 빠르게 얻을 수 있다(명령어).foldnorm.mle). 또는 명령 최적화 또는 nlm이 이 분포에 적합할 것이다.두 개의 파라미터( 2가 관련되어 있으므로 최대화는 쉽다.유의할 점은 에 대한 양수 값과 음수 값 모두 허용된다는 것이다. μ{\은 실제 숫자에 속하므로, 분포가 그것에 대해 대칭적이기 때문에 부호는 중요하지 않다.다음 코드는 R로 되어 있다.

접은 <- 기능을 하다(y) {    ## y는 양의 데이터를 가진 벡터   n <- 길이(y)  ## 표본 크기   sys2 <- 합계를 내다(y^2)      샘. <- 기능을 하다(파를 치다, n, sys2) {        <- 파를 치다[1]   ;   se <- 생략하다( 파를 치다[2] )       f <-  - n/2 * 통나무를 하다(2/파이/se) + n * ^2 / 2 / se +             sys2 / 2 / se - 합계를 내다( 통나무를 하다( 코쉬(  * y/se ) ) )       f     }    모드의 <- 최적의( c( 심술궂다(y), sd(y) ), n = n, sys2 = sys2, 샘., 통제를 하다 = 리스트를 작성하다(최대로 하다 = 2000) )   모드의 <- 최적의( 모드의$액면 그대로, 샘., n = n, sys2 = sys2, 통제를 하다 = 리스트를 작성하다(최대로 하다 = 20000) )   결과 <- c( -모드의$가치를 매기다, 모드의$액면 그대로[1], 생략하다(모드의$액면 그대로[2]) )   이름들(결과) <- c("로그 저장", "무", "sigma 제곱")   결과  } 

로그 우도의 부분파생상품은 다음과 같이 기록된다.

^{

로그 우도의 첫 번째 부분파생물을 0과 동일시함으로써 우리는 좋은 관계를 얻는다.

.

위의 방정식은 세 가지 해법이 있는데, 하나는 0에 있고, 다른 하나는 반대 기호로 2가 더 있다.위의 방정식을 대체하여 로그 우도 w.r.t 0과 동일시함으로써 분산에 대한 다음 식을 얻는다.

n}={\

정규 분포와 동일한 공식으로 표시됨.여기서 주요한 차이는 은 통계적으로 독립적이지 않다는 것이다.위의 관계는 효율적인 재귀적 방법으로 최대우도 추정치를 얻기 위해 사용될 수 있다. 의 초기 값부터 시작하여 마지막 방정식의 양근( 을 찾는다.그런 다음 2{\}}의 업데이트된 값을 받는다로그 우도 값의 변경이 무시할 수 있을 때까지 절차를 반복하고 있다.또 다른 쉽고 효율적인 방법은 검색 알고리즘을 수행하는 것이다.마지막 방정식을 좀 더 우아하게 쓰자.

.

두 매개변수에 대한 로그 우도의 최적화가 함수의 루트 검색으로 변했다는 것이 명백해진다.이것은 물론 이전의 루트 검색과 동일하다.Tsagris 외 연구진(2014)은 즉 이 방정식을 만족하는 의 가능한 세 가지 값이 있다는 것을 발견했다.최대우도 추정치인 - {\ 및 + μ {\displaystyle 최소 로그 우도에 해당하는 0.null

참고 항목

참조

  1. ^ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 June 2021). "The Modified-Half-Normal distribution: Properties and an efficient sampling scheme". Communications in Statistics - Theory and Methods: 1–23. doi:10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
  • Tsagris, M.; Beneki, C.; Hassani, H. (2014). "On the folded normal distribution". Mathematics. 2 (1): 12–28. arXiv:1402.3559.
  • Leone FC, Nottingham RB, Nelson LS (1961). "The Folded Normal Distribution". Technometrics. 3 (4): 543–550. doi:10.2307/1266560. hdl:2027/mdp.39015095248541. JSTOR 1266560.
  • Johnson NL (1962). "The folded normal distribution: accuracy of the estimation by maximum likelihood". Technometrics. 4 (2): 249–256. doi:10.2307/1266622. JSTOR 1266622.
  • Nelson LS (1980). "The Folded Normal Distribution". J Qual Technol. 12 (4): 236–238.
  • Elandt RC (1961). "The folded normal distribution: two methods of estimating parameters from moments". Technometrics. 3 (4): 551–562. doi:10.2307/1266561. JSTOR 1266561.
  • Lin PC (2005). "Application of the generalized folded-normal distribution to the process capability measures". Int J Adv Manuf Technol. 26 (7–8): 825–830. doi:10.1007/s00170-003-2043-x.
  • Psarakis, S.; Panaretos, J. (1990). "The folded t distribution". Communications in Statistics - Theory and Methods. 19 (7): 2717–2734.
  • Psarakis, S.; Panaretos, J. (2001). "On some bivariate extensions of the folded normal and the folded-t distributions". Journal of Applied Statistical Science. 10 (2): 119–136.
  • Chakraborty, A. K.; Chatterjee, M. (2013). "On multivariate folded normal distribution". Sankhyā: The Indian Journal of Statistics, Series B. 75 (1): 1–15. JSTOR 42003783.

외부 링크