꼬리 굵기 배포
Heavy-tailed distribution![]() | 이 기사는 대부분의 독자들이 이해하기에는 너무 전문적일 수 있다.(2020년 5월 (이 및 타이밍 ) |
확률론에서 꼬리 굵기 분포는 꼬리가 [1]지수적으로 한정되지 않은 확률 분포입니다. 즉, 꼬리 굵기는 지수 분포보다 무겁습니다.많은 응용 프로그램에서 관심 있는 것은 분포의 오른쪽 꼬리이지만 분포에 무거운 왼쪽 꼬리가 있거나 두 꼬리가 모두 무거울 수 있습니다.
두꺼운 꼬리 분포에는 세 가지 중요한 하위 분류가 있습니다. 즉, 두꺼운 꼬리 분포, 긴 꼬리 분포 및 하위 지수 분포입니다.실제로 일반적으로 사용되는 모든 굵은 꼬리 분포는 하위 지수 클래스에 속합니다.
헤비테일(Heavy-tailed)이라는 용어의 사용에는 여전히 약간의 불일치가 있다.사용 중인 다른 두 가지 정의가 있습니다.일부 저자는 이 용어를 모든 멱모멘트가 유한하지 않은 분포를 가리키기 위해 사용하고, 다른 저자는 유한한 분산을 가지지 않은 분포를 가리킵니다.이 기사에 제시된 정의는 가장 일반적으로 사용되고 있으며, 대체 정의에 포함되는 모든 분포뿐만 아니라 로그 정규 분포와 같은 모든 전력 모멘트를 소유하지만 일반적으로 두꺼운 꼬리로 간주되는 분포도 포함합니다. (가끔 굵은 꼬리가 ha의 모든 분포에 사용됩니다.)정규 분포보다 무거운 꼬리)
정의들
꼬리 굵기 분포의 정의
분포함수 F를 갖는 랜덤 변수 X의 분포는 X, M(t)의X 모멘트 발생함수가 모든 t > [2]0일 때 무거운(오른쪽) 꼬리를 갖는다고 한다.
즉,
이것은 또한 꼬리 분배 함수의 관점에서 쓰여져 있다.
~하듯이
긴꼬리 분포의 정의
분포함수 F를 갖는 랜덤 변수 X의 분포는 모든 t > 0일 경우 긴 오른쪽 꼬리를[1] 갖는다고 합니다.
또는 동등하게
이는 긴 꼬리 수가 높은 수준을 초과하면 다른 높은 수준을 초과할 확률이 1에 가깝다는 오른쪽 꼬리 긴 꼬리 분포 수량에 대한 직관적인 해석입니다.
모든 긴 꼬리 분포는 두꺼운 꼬리 분포이지만 그 반대는 거짓이며 긴 꼬리가 아닌 두꺼운 꼬리 분포를 구성할 수 있습니다.
지수 이하의 분포
하위 지수성은 확률 분포의 합성곱의 관점에서 정의된다.F({ F를 갖는 2개의 독립적이고 동일한 분포 ({},2에 대해({F})의 제곱은 Legubes를 사용하여 정의한다e-Stieltjes 통합:
Fn(\ F은 다음 규칙에 따라 유도적으로 정의됩니다.
테일 분배 F {\는 F ( ) - (x) \1 - F ( )로 정의됩니다.
양의 하프라인 상의 F F는 다음과 같은 경우 지수 미달입니다[1][4][5].
이는[6] 임의의 1 n1)에 대해
이에 대한[6] 확률론적 해석은 의 \의 독립 랜덤 변수 X1, 의 합계가 공통 분포F {\ F인 경우,
이것은 종종 하나의 큰 도약[7] 또는 재앙의 [8]원리로 알려져 있다.
I([ , ) \ ( [ 0 , \ ) ) is [9]the the the 、 exp line line the the the the 、 the line linea the the the the the the the the the the the 、 F { 0 , \ infty) 。서 I([ , ) { I ( [ , \ ) }는 양의 하프 라인의 인디케이터 함수입니다.또는 X+ ( , ) { X} = \ ( 0 , X ) { X ( 0 , } 가 서브 지수인 에만 실제 라인에서 지원되는 랜덤 X { X } 가 서브 지수입니다.
모든 하위 지수 분포는 꼬리가 길지만, 하위 지수 분포가 아닌 긴 꼬리 분포로 예를 구성할 수 있습니다.
일반적인 굵은 꼬리 분포
일반적으로 사용되는 모든 굵은 꼬리 분포는 [6]지수 미만입니다.
한쪽 꼬리는 다음과 같습니다.
- 파레토 분포
- 로그 정규 분포
- 레비 분포
- 형상 모수가 0보다 크고 1보다 작은 Weibull 분포
- 버 분포
- 로그 출력 분포
- 로그 출력 분포
- 프레셰 분포
- 로그-코치 분포는 파레토 [10][11]분포보다 무거운 꼬리를 생성하는 로그 붕괴를 보이기 때문에 "초중량 꼬리"를 갖는 것으로 설명되기도 한다.
양꼬리는 다음과 같습니다.
- 코시 분포는 안정적인 분포와 t-분포의 특수한 경우입니다.
- 안정적인 [12]분포의 제품군. 단, 해당 제품군 내 정규 분포의 특수한 경우는 제외합니다.일부 안정적인 분포는 단측 분포(또는 반직선으로 지원됨)입니다. 예를 들어,Levy 유통긴 꼬리 분포와 변동성 군집을 사용하는 재무 모델도 참조하십시오.
- t-분포
- 스큐 로그 정규 캐스케이드 분포.[13]
팻테일 분포와의 관계
분포는 가 클 경우 확률밀도함수가 이 되는 로 지수분포의 확률밀도함수에 의해 항상 아래쪽에 제한되므로 분포는 항상 high-tail 분포가 된다그러나 일부 분포는 지수 함수(꼬리 굵기)보다는 느리지만 검정력(꼬리 굵기)보다는 빠릅니다(꼬리 굵기 아님).예를 들어 로그 정규 분포가[contradictory] 있습니다.그러나 로그 로지스틱 및 파레토 분포와 같은 다른 두꺼운 꼬리 분포도 역시 두꺼운 꼬리 분포입니다.
테일 인덱스 추정
꼬리 지수 [when defined as?]추정 문제에는 모수적 접근법(엠브레흐트 [6]등 참조)과 비모수적 접근법(예: 노박[14] 참조)이 있다.
모수적 접근방식을 사용하여 테일 인덱스를 추정하기 위해 일부 저자는 GEV 분포 또는 파레토 분포를 사용한다. 이들은 최대우도 추정기(MLE)를 적용할 수 있다.
Pickand의 테일 인덱스 추정기
으로(Xn, n1≥)과 같은 독립적인 밀도 기능을 임의 순서{\displaystyle(X_{n},n\geq 1)}F∈ D(H(ξ)){\displaystyle F\in D(H(\xi))}, 최대 유입 Domain[15]의 일반화된 극단 값 밀도 H{H\displaystyle}, ξ ∈ R{\displaystyle \xi\in \mathbb{R}}. 나f n " ( ) _ \} "infty } {\ _} {\fty } {\k(n}) =0}then------ationationationationation--ationationationationationationationation estim estim estim estim estim estim estim estim estim estim estim estim estim estim estim[6][15] estim estim estim estim estim estim estim estim
서X ( -k () +,n ) ( n - () + , , ) { X _ { ( n - ( ) +, n } = \ \ left ( _ { n - ( ) + , n } \ , { n } \ 이 추정치는 로 수렴됩니다.
힐의 꼬리 지수 추정기
, 1) { ( X { , \1) display display displaydisplaydisplaydisplaydisplay display display displaydisplay displaydisplaydisplaydisplay display displaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplay displaydisplay displaydisplaydisplaydisplay displaydisplaydisplay displaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplaydisplay display display display display display display display display display display display 샘플 경로는 X : tn {\ n입니다 .서n\ n은 샘플 크기입니다.{ ( ) { \ { ( )\ k( ){ {, , - 1}, { \ k ( n \ { 1 , n- 1 , ( n ) \ k ( )\ k ( )
서X ( ,) { _{ ( i , ) } { X_ \ , {n 。이 추정치는 확률로})로 수렴되며 n) (\ k}가 고차 규칙 변동[17] [18]특성에 따라 제한될 점근적으로 정규적입니다.일관성과 점근선의 정상적인 상태와 서로 의존하고 sequences,[19][20]관계 없이 여성들의 많은 학급까지 확장하는지 여부 X({\displaystyle X_{t}}이다, 또는computed 잔류 또는 필터링 된 데이터에서 큰 클래스의 모델과 estimators 등mis-specified 모델과 모델들은 에러를 있는 달려 있다.[21][22][23]Pickand와 Hill의 꼬리 지수 추정기 모두 일반적으로 순서 [24]통계량의 대수를 사용합니다.
테일 인덱스의 비율 추정기
테일 인덱스의 비율 추정기(RE-추정기)는 골디와 [25]스미스에 의해 도입되었다.Hill의 추정기와 유사하게 구성되지만 랜덤이 아닌 "튜닝 매개변수"를 사용합니다.
힐형과 RE형 추정기의 비교는 [14]노박에서 확인할 수 있다.
소프트웨어
꼬리 굵기 밀도 추정
무거운 꼬리 및 매우 무거운 꼬리 확률 밀도 함수를 추정하기 위한 비모수적 접근법이 [27]Markovich에서 제공되었다.이들은 가변 대역폭과 긴 꼬리를 가진 커널 추정치에 기초한 접근법입니다. 예비 데이터는 유한 또는 무한 간격으로 새로운 랜덤 변수로 변환되며, 얻은 밀도 추정치의 추정 및 역변환에 더 편리합니다.또한 특정 파라미터를 제공하는 "피칭 투게더 접근법"도 있습니다.밀도 꼬리 모형과 밀도 모드를 근사하는 비모수 모형.비모수 추정기에서는 커널 추정기의 대역폭 및 히스토그램의 빈 폭과 같은 조정(평활) 매개 변수를 적절하게 선택해야 합니다.그러한 선택의 잘 알려진 데이터 중심 방법은 교차 검증과 수정, 평균 제곱 오차(MSE)의 최소화와 점근 및 상한에 [28]기초한 방법이다.분포 함수(dfs)의 공간에서 Kolmogorov-Smirnov, von Mises, Anderson-Darling과 같은 잘 알려진 비모수 통계와 알려진 불확실성 또는 불일치 값으로 이후의 통계의 분위수를 메트릭으로 사용하는 불일치 방법은 [27]에서 찾을 수 있다.부트스트랩은 다른 재샘플 선택 방식에 의한 알 수 없는 MSE 근사치를 사용하여 평활 파라미터를 찾는 또 다른 도구입니다(예:[29]
「 」를 참조해 주세요.
레퍼런스
- ^ a b c Asmussen, S. R. (2003). "Steady-State Properties of GI/G/1". Applied Probability and Queues. Stochastic Modelling and Applied Probability. Vol. 51. pp. 266–301. doi:10.1007/0-387-21525-5_10. ISBN 978-0-387-00211-8.
- ^ Rolski, Schmidli, Scmidt, Teugels, 보험 및 금융을 위한 확률적 프로세스, 1999
- ^ S. Foss, D. Korshunov, S. Zachary, Springer Science & Business Media, 2013년 5월 21일, 헤비테일 및 하위 지수 분포 소개
- ^ Chistyakov, V. P. (1964). "A Theorem on Sums of Independent Positive Random Variables and Its Applications to Branching Random Processes". ResearchGate. Retrieved April 7, 2019.
- ^ Teugels, Jozef L. (1975). "The Class of Subexponential Distributions". University of Louvain: Annals of Probability. Retrieved April 7, 2019.
- ^ a b c d e Embrechts P.; Klueppelberg C.; Mikosch T. (1997). Modelling extremal events for insurance and finance. Stochastic Modelling and Applied Probability. Vol. 33. Berlin: Springer. doi:10.1007/978-3-642-33483-2. ISBN 978-3-642-08242-9.
- ^ Foss, S.; Konstantopoulos, T.; Zachary, S. (2007). "Discrete and Continuous Time Modulated Random Walks with Heavy-Tailed Increments" (PDF). Journal of Theoretical Probability. 20 (3): 581. arXiv:math/0509605. CiteSeerX 10.1.1.210.1699. doi:10.1007/s10959-007-0081-2.
- ^ Wierman, Adam (January 9, 2014). "Catastrophes, Conspiracies, and Subexponential Distributions (Part III)". Rigor + Relevance blog. RSRG, Caltech. Retrieved January 9, 2014.
- ^ Willekens, E. (1986). "Subexponentiality on the real line". Technical Report. K.U. Leuven.
- ^ Falk, M., Hüsler, J. & Reiss, R. (2010). Laws of Small Numbers: Extremes and Rare Events. Springer. p. 80. ISBN 978-3-0348-0008-2.
{{cite book}}
: CS1 maint: 여러 이름: 작성자 목록(링크) - ^ Alves, M.I.F., de Haan, L. & Neves, C. (March 10, 2006). "Statistical inference for heavy and super-heavy tailed distributions" (PDF). Archived from the original (PDF) on June 23, 2007. Retrieved November 1, 2011.
{{cite web}}
: CS1 maint: 여러 이름: 작성자 목록(링크) - ^ John P. Nolan (2009). "Stable Distributions: Models for Heavy Tailed Data" (PDF). Archived from the original (PDF) on 2011-07-17. Retrieved 2009-02-21.
- ^ Stephen Lihn (2009). "Skew Lognormal Cascade Distribution". Archived from the original on 2014-04-07. Retrieved 2009-06-12.
- ^ a b Novak S.Y. (2011). Extreme value methods with applications to finance. London: CRC. ISBN 978-1-43983-574-6.
- ^ a b Pickands III, James (Jan 1975). "Statistical Inference Using Extreme Order Statistics". The Annals of Statistics. 3 (1): 119–131. doi:10.1214/aos/1176343003. JSTOR 2958083.
- ^ Hill B.M.(1975년) 분포의 꼬리에 대한 추론을 위한 간단한 일반 접근법.앤, 주, 대 3, 1163-1174
- ^ Hall, P.(1982) 규칙 변동의 지수에 대한 일부 추정치.J.R. StatSoc. Ser. B., 대 44
- ^ Hausler, E., J. L.Teugels(1985) 정규 변동 지수에 대한 힐 추정기의 점근 정규성에 대하여.앤, 주, 대 13, 743~756
- ^ Hsing, T.(1991) 종속 데이터를 사용한 꼬리 지수 추정.앤, 주, 대 19, 1547년-1569년
- ^ Hill, J. (2010) 종속, 이기종 데이터에 대한 꼬리 지수 추정.에코노메트릭 Th., v. 26, 1398–1436
- ^ 레스닉, S. 및 스타리카, C.(1997).자기 회귀 데이터에 대한 Hill 추정기의 점근 거동입니다.통신. 통계.확률 모델 13, 703–721.
- ^ 링, S. 및 펑, L. (2004)ARMA 모델의 테일 인덱스에 대한 Hill의 추정기.J. 통계.계획. 추론 123, 279–293.
- ^ 힐, J.B. (2015년)필터링된 종속 시계열에 대한 테일 인덱스 추정.성. 신. 25, 609-630
- ^ Lee, Seyoon; Kim, Joseph H. T. (2019). "Exponentiated generalized Pareto distribution: Properties and applications towards extreme value theory". Communications in Statistics - Theory and Methods. 48 (8): 2014–2038. arXiv:1708.01686. doi:10.1080/03610926.2018.1441418.
- ^ Goldie C.M., Smith R.L.(1987) 이론과 응용.쿼트 J 수학옥스퍼드 대 38, 45 대 71
- ^ Crovella, M. E.; Taqqu, M. S. (1999). "Estimating the Heavy Tail Index from Scaling Properties". Methodology and Computing in Applied Probability. 1: 55–79. doi:10.1023/A:1010012224103.
- ^ a b Markovich N.M. (2007). Nonparametric Analysis of Univariate Heavy-Tailed data: Research and Practice. Chitester: Wiley. ISBN 978-0-470-72359-3.
- ^ Wand M.P., Jones M.C. (1995). Kernel smoothing. New York: Chapman and Hall. ISBN 978-0412552700.
- ^ Hall P. (1992). The Bootstrap and Edgeworth Expansion. Springer. ISBN 9780387945088.