검벨 분포
Gumbel distribution 확률밀도함수 | |||
누적분포함수 | |||
표기법 | |||
---|---|---|---|
매개변수 | 위치(실제) > 0 > 축척 (리얼) | ||
지지하다 | |||
여기서 = - z = {\beta }} | |||
CDF | |||
의미하다 | 여기서 γ 는 오일러-마스케로니 상수입니다. | ||
중앙값 | |||
모드 | |||
분산 | |||
왜도 | |||
절두술 | |||
엔트로피 | |||
MGF | |||
CF |
확률 이론 및 통계학에서 Gumbel 분포(타입-I 일반화 극단값 분포라고도 함)는 다양한 분포의 여러 표본의 최대(또는 최소) 분포를 모형화하는 데 사용됩니다.
이 분포는 지난 10년간의 최대치 목록이 있는 경우 특정 연도의 강의 최대치 분포를 나타내는 데 사용될 수 있습니다.이것은 극심한 지진, 홍수 또는 다른 자연 재해가 발생할 가능성을 예측하는 데 유용합니다.최대치의 분포를 나타내는 Gumbel 분포의 잠재적 적용 가능성은 극한값 이론과 관련이 있으며, 이 이론은 기본 표본 데이터의 분포가 정규 또는 지수형인 경우 유용할 가능성이 높다는 것을 나타냅니다.이 글에서는 Gumbel 분포를 사용하여 최대값의 분포를 모형화합니다.최소값을 모형화하려면 원래 값의 음수를 사용합니다.
Gumbel 분포는 일반화된 극단값 분포(Fisher-Tippet 분포라고도 함)의 특정한 경우입니다.로그-바이불 분포 및 이중 지수 분포(Laplace 분포를 나타내기 위해 때때로 사용되는 용어)라고도 합니다.곰퍼츠 분포와 관련이 있습니다. 밀도가 원점에 대해 처음으로 반영된 후 양의 반선으로 제한되면 곰퍼츠 함수가 얻어집니다.
다항로짓 모형의 잠재 변수 공식(불연속 선택 이론에서 일반적)에서 잠재 변수의 오차는 Gumbel 분포를 따릅니다.두 Gumbel 분포 랜덤 변수의 차이가 로지스틱 분포를 가지므로 유용합니다.
검벨 분포는 에밀 줄리어스 검벨 (1891–1966)[1][2]의 이름을 따서 지어졌습니다.
정의들
Gumbel 분포의 누적 분포 함수는
표준검벨분포
표준검벨분포는 누적분포함수를 갖는 = 0 = = {\ \beta = 인 경우입니다.
확률밀도함수
이 경우 모드는 0, 중위수는 - ( ( )≈ -\ 0 은 γ ≈ {\오일러-마스케로니 상수), 표준 편차는 π/ ≈ /
n > 1에 대한 누적수는 다음과 같습니다.
특성.
모드는 μ이고 중위수는 - 2 -이며 평균은 다음과 같습니다.
- + )=\eta
여기서 γ 는 오일러-마스케로니 상수입니다.
표준 편차 σ \sigma }은(는) π/ \beta \/이므로 = σ 6 /π ≈ σ입니다 \beta =\sigma {\\approx sigma입니다
= μ x=\인 모드에서 μ, beta의 값은 값에 관계없이 - ≈ approx 이 됩니다.\beta
가 매개 변수( 인 iid Gumbel 랜덤 변수라면, { 도 매개 변수( k){\(\ k인 Gumbel 랜덤 변수입니다
...인 경우모든 자연수 에 대해 k {\ \max{1}, {k k이() G1 {\ G_{과(와) 동일한 분포를 갖도록 iid 랜덤 변수임 는 반드시 Gumbel에 스케일 매개 변수 실제로 공임인 k>1의 두 개의 서로 다른 값만 고려하면 충분함)와 함께 분포됩니다.
관련분포
- 에 Gumbel 분포가 있는 경우 Y가 양수이거나 X가 음수인 경우 이와 동등하게 Gompertz 분포가 있는 Y = -X의 조건부 분포입니다.Y의 cdf G는 식 ( )= ( )= ( ≥- ∣ 0 )=( ( )- F( -))/ ( 0) ) = P y) =P0) = ( - y / F) } 에 의해 결정됩니다. 결과적으로 는 g( ) = (- ) / (0) {\y) = (- / F ( : 곰퍼츠와 관계가 있습니다.밀도는 반사된 Gumbel 밀도에 비례하며 양의 반선으로 제한됩니다.[4]
- X가 평균이 1인 지수 분포 변수이면 -log(X)는 표준 Gumbel 분포를 가집니다.
- ~ ( 와 ~ ,) 가 독립적이면 - ~ 는 ( - α ) (로지스틱 분포 참조).
- ~ (, Ybeta 이 독립적이면 X+ ≁ 는 ,) beta ( + Y)= + γ ≠ 2 = E( i i ) E) = +2beta = 보다 일반적으로, 독립적인 Gumbel 랜덤 변수들의 선형 조합의 분포는 GNIG와 GIG 분포로 근사될 수 있습니다.[5]
일반화된 다변량 로그 감마 분포와 관련된 이론은 Gumbel 분포의 다변량 버전을 제공합니다.
발생 및 적용
Gumbel에 따르면 지수 분포를 따르는 랜덤 변수 표본의 최대값(또는 마지막 순서 통계량)[8]에서 표본 크기의 자연 로그를 뺀 값이 표본 크기가 증가함에 따라 Gumbel 분포에 근접합니다.
구체적으로, ρ(= - x) = 를 의 확률 분포라 하고, (x) = - x ) = 1 - 의 누적 분포라고 합니다.그러면 x 의 의{\N}개의 실현 에서X {\ X}개보다 작은 최대값이 X 개보다 작습니다 따라서 최대값 ~ 개의 누적 분포가 다음을 만족합니다.
큰 의 경우 오른쪽이 -(- )로 수렴합니다 e -
그러므로 수문학에서 굼벨 분포는 일일 강우량과 하천 방류량의 월별 및 연간 최대치와 같은 변수를 분석하고 가뭄을 설명하는 데 사용됩니다.[3][9]
검벨은 또한 추정치가 사건의 확률에 대한 r ⁄(n+1)(여기서 r은 데이터 시리즈의 관측치 값의 순위 번호이고 n은 총 관측치 수)는 분포 모드 주변의 누적 확률에 대한 편향되지 않은 추정치입니다.따라서 이 추정기는 종종 플롯 위치로 사용됩니다.
수론에서 굼벨 분포는 정수의[10] 임의 분할에 있는 항의 수와 최대 소수 간격 및 소수 별자리 사이의 최대 간격의 추세 조정된 크기의 근사치입니다.[11]
검벨 재매개변수화 기술
기계 학습에서 Gumbel 분포는 때로 범주형 분포로부터 표본을 생성하는 데 사용됩니다.이 기술은 "검벨-맥스 트릭"이라고 불리며 "재파라미터화 트릭"의 특별한 예입니다.[12]
구체적으로, (π …,π 를 모두 0이 아닌 음이 아니라고 하고, 을 Gumbel(0, 1)의 독립적인 표본이라고 한 다음, 루틴 적분으로,
이와 동등하게, 의 x x ∈ }, 에서 우리는 다음과 같이 볼츠만 분포로부터 표본을 추출할 수 있습니다.
- ~ λ 인 경우,(- x -γ )~ (-γ+ λ,
- i ( + πi)~ ( π ) j \arg _ _ _ _
- ( )~ 로그 ( 1) \ _ _)},즉, Gumbel 분포는 최대 안정 분포 계열입니다.
변량생성
Gumbel 분포의 분위함수(역누적분포함수)인 Q 는 다음과 같이 주어집니다.
랜덤 변수 를 구간( (1) {\displaystyle 0, 1의 균일한 분포에서 그릴 때 및 매개 변수가 있는 Gumbel 분포가 있습니다
확률지
소프트웨어 이전 시대에는 확률 종이를 사용하여 Gumbel 분포를 그려냈습니다(그림 참조).이 논문은 누적 분포 함수 의 선형화를 기반으로 합니다.
이 논문에서 수평축은 이중 로그 스케일로 구성됩니다.수직 축은 선형입니다.종이의 가로축에 를 그리고 세로축에 - 변수를 플롯함으로써 분포는 기울기 1/ {\/\인 직선으로 표현됩니다 CumFreq와 같은 분포 맞춤 소프트웨어를 사용할 수 있게 되자 분포를 플롯하는 작업이 쉬워졌습니다.
참고 항목
참고문헌
- ^ Gumbel, E.J. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Henri Poincaré, 5 (2): 115–158
- ^ 검벨 E.J. (1941)"홍수 흐름의 귀환기"수학통계연보, 12, 163-190.
- ^ a b Oosterbaan, R.J. (1994). "Chapter 6 Frequency and Regression Analysis" (PDF). In Ritzema, H.P. (ed.). Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175–224. ISBN 90-70754-33-9.
- ^ Willemse, W.J.; Kaas, R. (2007). "Rational reconstruction of frailty-based mortality models by a generalisation of Gompertz' law of mortality" (PDF). Insurance: Mathematics and Economics. 40 (3): 468. doi:10.1016/j.insmatheco.2006.07.003.
- ^ Marques, F.; Coelho, C.; de Carvalho, M. (2015). "On the distribution of linear combinations of independent Gumbel random variables" (PDF). Statistics and Computing. 25 (3): 683‒701. doi:10.1007/s11222-014-9453-5. S2CID 255067312.
- ^ CumFreq, 확률 분포 적합 소프트웨어
- ^ user49229, Gumbel 분포 및 지수 분포
- ^ Gumbel, E.J. (1954). Statistical theory of extreme values and some practical applications. Applied Mathematics Series. Vol. 33 (1st ed.). U.S. Department of Commerce, National Bureau of Standards. ASIN B0007DSHG4.
- ^ Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). "An extreme value analysis of UK drought and projections of change in the future". Journal of Hydrology. 388 (1–2): 131–143. Bibcode:2010JHyd..388..131B. doi:10.1016/j.jhydrol.2010.04.035.
- ^ Erdös, Paul; Lehner, Joseph (1941). "The distribution of the number of summands in the partitions of a positive integer". Duke Mathematical Journal. 8 (2): 335. doi:10.1215/S0012-7094-41-00826-8.
- ^ Kourbatov, A. (2013). "Maximal gaps between prime k-tuples: a statistical approach". Journal of Integer Sequences. 16. arXiv:1301.2242. Bibcode:2013arXiv1301.2242K. 13.5.2조.
- ^ Jang, Eric; Gu, Shixiang; Poole, Ben (April 2017). Categorical Reparametrization with Gumble-Softmax. International Conference on Learning Representations (ICLR) 2017.
- ^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian (2017-07-17). "Lost Relatives of the Gumbel Trick". International Conference on Machine Learning. PMLR: 371–379. arXiv:1706.04161.