기하급수적으로 수정된 가우스 분포
Exponentially modified Gaussian distribution 확률밀도함수 ![]() | |||
누적분포함수 ![]() | |||
매개변수 | μ μ R — 가우스 성분의 평균 σ2 > 0 — 가우스 성분의 분산 λ > 0 — 지수 성분 비율 | ||
---|---|---|---|
지원 | x ∈ R | ||
CDF | (, , )- -(+ v )/( u + ) / ( + (, v ,)}/(서 | ||
평균 | |||
모드 |
| ||
분산 | |||
왜도 | |||
엑스트라 쿠르토시스 | |||
MGF | |||
CF |
확률론에서 기하급수적으로 수정된 가우스 분포(EMG, exGaussian 분포라고도 함)는 독립 정규 및 지수 랜덤 변수의 합계를 설명한다.exGaussian 랜덤 변수 Z는 Z = X + Y로 표현될 수 있으며, 여기서 X와 Y는 평균 μ와 분산 variance을 가진2 가우스 변수, Y는 비율 λ의 지수형이다.지수 성분으로부터 특징적인 양의 기울기를 가지고 있다.
또한 가중치가 정규 분포의 함수인 상태에서 이동 지수 함수의 가중 함수로 간주할 수 있다.
정의
기하급수적으로 수정된 정규 분포의 확률밀도함수(pdf)는[1]
여기서 erfc는 다음과 같이 정의되는 보완적 오류 함수다.
이 밀도 함수는 정규 확률밀도함수와 지수 확률밀도함수의 콘볼루션을 통해 도출된다.
계산을 위한 대체 양식
크로마토그래피에서 피크 모양을 설명하기 위해 EMG 분포의 대안이지만 동등한 형태를 사용한다.[2]이것은 다음과 같다.
-
(1)
어디에
- 는 가우스 진폭이다.
- = 은 지수 이완 시간이고, 2{\}}은 지수 확률 밀도함수의 분산이다.
산술 오버플로로 인해 파라미터 값(예: = 0 에 대해서는 이 함수를 계산할 수 없다.대안적이지만 동등한 형태의 기능 작성은 델리가 제안하였다.[3]
-
(2)
여기서 = t t\cdot t}은 크기가 조정된 보완 오류 함수임
이 공식의 경우 산술적 오버플로도 가능하다면, 오버플로 영역은 매우 작은 τ을 제외하고는 첫 번째 공식과 다르다.
작은 τ의 경우 두 번째 공식의 점근법을 사용하는 것이 합리적이다.
-
(3)
사용에 대한 결정은 z= 2 ( - - ) z{1 }-{\murigma }\rigma }}\에 기초한다.
- z < 0 계산은 첫 번째 공식에 따라 이루어져야[2] 한다.
- 두 번째 공식에 따라 0 ≤ z ≤ 6.71·107 (이중치 부동소수점 형식의 경우)에 대하여,
- 그리고 세 번째 공식에 따른 z > 6.71·10의7 경우.
모드(정점 위치, 가장 개연성이 높은 값)는 공식 2의 파생상품을 사용하여 계산한다[2]. 계산에는 스케일 보완 오차함수 erfcxinv()의 역이 사용된다.대략적인 값도 Kalembet에 의해 제안된다.[2]모드는 원래 가우스파보다 높은 값에 있지만, 꼭지점은 항상 원래의 (수정되지 않은) 가우스파에 위치한다.
모수 추정
정규 분포의 평균(μ), 정규 분포의 표준 편차(μ), 지수 붕괴 모수( = = 1 / λ)의 세 가지 모수가 있다.K = τ / σ 형상은 분포의 특성을 나타내기 위해 사용되기도 한다.모수의 값에 따라 분포는 거의 정규 분포에서 거의 기하급수적으로 형태가 달라질 수 있다.
분포의 모수는 다음과 같은 모멘트 방법을 사용하여 표본 데이터에서 추정할 수 있다.[4][5]
여기서 m은 표본 평균, s는 표본 표준 편차, γ은1 왜도.
매개변수에 대해 이러한 문제를 해결하면 다음과 같은 이점을 얻을 수 있다.
추천 사항
Ratcliff는 모수 추정치를 신뢰할 수 있는 것으로 간주하기 전에 표본에 적어도 100개의 데이터 점이 있어야 한다고 제안했다.[6]빈센트 평균은 작은 표본과 함께 사용될 수 있다. 이 절차는 분포의 모양을 약간 왜곡시킬 뿐이다.[7]이러한 점 추정치는 최대우도를 포함하여 더 강력한 방법으로 조정할 수 있는 초기 값으로 사용될 수 있다.
신뢰구간
현재 이 분포로 유의성 시험에 사용할 수 있는 게시된 표가 없다.분포는 정규 분포에서 추출한 변수와 지수 분포에서 추출한 변수의 합계를 구성하여 시뮬레이션할 수 있다.
스큐
비모수 스큐 값
이 분포의 값은 0과 0.31 사이에 있다.[8][9]하한은 정상 성분이 지배할 때, 상위는 지수 성분이 지배할 때 접근한다.
발생
분포는 크로마토그래픽 피크의 형상에 대한 이론적 모델로 사용된다.[1][2][10]그것은 세포 분열에 있어서 혼합 시간의 통계적 모델로 제안되어 왔다.[11][12]클러스터 이온 빔 모델링에도 사용된다.[13]그것은 일반적으로 심리학과 반응 시간의 연구에서 뇌과학에 사용된다.[14][15]Normal 성분의 평균이 0으로 설정된 약간의 변종에서는 비효율성을 모델링하는 합성 오차항의 분포 규격 중 하나로 Stochastic Frontinuary Analysis에도 사용된다.[16]
관련 분포
이 분포군은 정상-외부 감마 분포의 특별한 경우 또는 제한적인 경우다.이것은 또한 꼬치를 추가하기 위한 정규 분포의 3-모수 일반화라고 볼 수 있다; 그와 같은 또 다른 분포는 꼬리가 더 얇은 꼬치 정규 분포다.분포는 정규 분포의 평균이 이동 지수 분포로 랜덤하게 변화하는 복합 확률 분포다.
옵션 가격을 모델링하기 위해 가우스 마이너스 지수 분포가 제안되었다.[17]If such a random variable Y has parameters μ, σ, λ, then its negative -Y has an exponentially modified Gaussian distribution with parameters -μ, σ, λ, and thus Y has mean and variance .
참조
- ^ a b Grushka, Eli (1972). "Characterization of Exponentially Modified Gaussian Peaks in Chromatography". Analytical Chemistry. 44 (11): 1733–1738. doi:10.1021/ac60319a011. PMID 22324584.
- ^ a b c d e Kalambet, Y.; Kozmin, Y.; Mikhailova, K.; Nagaev, I.; Tikhonov, P. (2011). "Reconstruction of chromatographic peaks using the exponentially modified Gaussian function". Journal of Chemometrics. 25 (7): 352. doi:10.1002/cem.1343. S2CID 121781856.
- ^ Delley, R (1985). "Series for the Exponentially Modified Gaussian Peak Shape". Anal. Chem. 57: 388. doi:10.1021/ac00279a094.
- ^ Dyson, N. A. (1998). Chromatographic Integration Methods. Royal Society of Chemistry, Information Services. p. 27. ISBN 9780854045105. Retrieved 2015-05-15.
- ^ Olivier J.와 Norberg M. M. (2010) 긍정적으로 치우친 데이터: Box-Cox 전력 변환 재방문.인트 J. 사이코제3(1)항 68-75호.
- ^ Ratcliff, R (1979). "Group reaction time distributions and an analysis of distribution statistics". Psychol. Bull. 86 (3): 446–461. CiteSeerX 10.1.1.409.9863. doi:10.1037/0033-2909.86.3.446. PMID 451109.
- ^ Vincent, S. B. (1912). "The functions of the vibrissae in the behaviour of the white rat". Animal Behaviour Monographs. 1 (5): 7–81.
- ^ Heathcote, A (1996). "RTSYS: A DOS application for the analysis of reaction time data". Behavior Research Methods, Instruments, & Computers. 28 (3): 427–445. doi:10.3758/bf03200523.
- ^ Ulrich, R.; Miller, J. (1994). "Effects of outlier exclusion on reaction time analysis". J. Exp. Psych.: General. 123: 34–80. doi:10.1037/0096-3445.123.1.34.
- ^ Gladney, HM; Dowden, BF; Swalen, JD (1969). "Computer-Assisted Gas-Liquid Chromatography". Anal. Chem. 41 (7): 883–888. doi:10.1021/ac60276a013.
- ^ Golubev, A. (2010). "Exponentially modified Gaussian (EMG) relevance to distributions related to cell proliferation and differentiation". Journal of Theoretical Biology. 262 (2): 257–266. doi:10.1016/j.jtbi.2009.10.005. PMID 19825376.
- ^ Tyson, D. R.; Garbett, S. P.; Frick, P. L.; Quaranta, V. (2012). "Fractional proliferation: A method to deconvolve cell population dynamics from single-cell data". Nature Methods. 9 (9): 923–928. doi:10.1038/nmeth.2138. PMC 3459330. PMID 22886092.
- ^ Nicolaescu, D.; Takaoka, G. H.; Ishikawa, J. (2006). "Multiparameter characterization of cluster ion beams". Journal of Vacuum Science & Technology B: Microelectronics and Nanometer Structures. 24 (5): 2236. Bibcode:2006JVSTB..24.2236N. doi:10.1116/1.2335433.
- ^ Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). "What are the shapes of response time distributions in visual search?". J Exp Psychol. 37 (1): 58–71. doi:10.1037/a0020747. PMC 3062635. PMID 21090905.
- ^ Rohrer, D; Wixted, JT (1994). "An analysis of latency and interresponse time in free recall". Memory & Cognition. 22 (5): 511–524. doi:10.3758/BF03198390. PMID 7968547.
- ^ Lovell, Knox CA; S.C. Kumbhakar (2000). Stochastic Frontier Analysis. Cambridge University Press. pp. 80–82.
- ^ 피터 카와 딜립 B.Madan, 옵션 가격을 위한 Saddlepoint 방법, Journal of Computing Finance (49–61) 제13권/번호 1, 2009년 가을