신뢰분포

Confidence distribution

통계적 추론에서 신뢰 분포(CD)의 개념은 관심 있는 모수에 대한 모든 수준의 신뢰 구간을 나타낼 수 있는 모수 공간에 분포 함수로 느슨하게 언급되어 왔다. 역사적으로 그것은 전형적으로 모든 수준의 낮은 측면 신뢰구간의 상한선을 뒤집어서 구성되었으며, 순전히 빈도주의 개념이지만, 일반적으로[1] 기준 해석(기준 분포)과도 관련이 있었다.[2] 신뢰 분포는 관심 있는 모수의 확률 분포 함수는 아니지만 추론에 유용한 함수일 수 있다.[3]

최근 몇 년 동안 신뢰 분포에 대한 새로운 관심이 급증하고 있다.[3] 보다 최근의 전개에서는, 신뢰 분포의 개념은 어떠한 기준적 해석이나 추론도 없이 순수하게 빈번한 개념으로 부상하고 있다. 개념적으로 신뢰 분포는 점 추정기 또는 구간 추정기(신뢰 구간)와 다르지 않지만, (점이나 구간 대신) 모수 공간에 표본 종속 분포 함수를 사용하여 관심 모수를 추정한다.

통계적 실무에서 광범위하게 사용되어 온 신뢰 분포의 간단한 는 부트스트랩 분포다.[4] 부트스트랩 분포의 개발과 해석은 어떠한 기준적 추론을 포함하지 않는다. 신뢰 분포의 개념도 마찬가지다. 그러나 신뢰 분포의 개념은 부트스트랩 분포의 개념보다 훨씬 더 광범위하다. 특히 최근 연구 결과가,를 예를 정기적으로 파라메트릭 경우(피셔의 기준 분배의 고전적인 개발의 대부분 리소스)bootstrap하는 것은,p-value functions,[5]정규화된 가능성 기능과, 어떤 경우에는, 베이즈 전과와 베이 시안 요강에 이르기까지 다양한 포함될 것을 제안했다.세인트이층의[6]

베이지안 후방 분포가 모든 유형의 베이지안 추론에 대해 풍부한 정보를 포함하고 있듯이, 신뢰 분포는 점 추정, 신뢰 구간, 임계 값,[7] 통계적 힘 및 p-값을 포함한 거의 모든 유형의 빈번한 추론을 구성하기 위한 풍부한 정보를 포함한다. 최근의 일부 개발은 효과적인 추론 도구로서 CD 개념의 유망한 잠재력을 부각시켰다.[3]

역사

네이먼(1937년)[8]은 신뢰구간에 대한 자신의 논문에 '자신감'이라는 개념을 소개하면서 자주주의 반복성을 명확히 했다. 프레이저에 따르면 신뢰 분포의 씨앗(이상)은 베이즈(1763년)[10]와 피셔(1930년)까지 추적할 수 있다.[9][1] 비록 이 구절이 콕스(1958)에서 처음 사용된 것 같지만.[11] 일부 연구자들은 신뢰 분포를 "피셔에 의해 "엄청난 논쟁"을 일으킨 "피셔의 기준 분포에 대한 네이마니아적 해석"[12]으로 보고 있다.[13] 또한 이러한 '비생산적인 논쟁'과 피셔의 '거친 고집'[13]이 신뢰 분포의 개념이 오랫동안 기준 개념으로 오인되어 빈도주의 틀에서 완전히 발전되지 못한 이유일 수 있다고 생각된다.[6][14] 실제로 신뢰 분포는 순전히 빈도주의적인 해석을 가진 순수 빈도주의 개념이며, 베이지안 추론 개념 및 기준론과도 관련이 있다.

정의

고전적 정의

전형적으로 신뢰 분포는 일련의 낮은 측면 신뢰 구간의 상한선을 뒤집어서 정의된다.[15][16][page needed] 특히.

(0, 1)의 모든 α에 대해 (-α, αn)는 α에 대한 100% 하측 신뢰 구간이 되도록 하며, 여기n α(α) = αnn(X,α)는 연속적이고 각 표본n X에 대해 α가 증가한다. 그렇다면 Hn(•) = ξn−1(•)는 θ에 대한 신뢰 분포다.

Efron은 이 분포가 "0.90과 0.95 신뢰구간의 상위 끝점 사이에 놓여 있는 확률 0.05와 θ을 가정한다"고 언급했으며 "이는 강력한 직관적 매력을 가지고 있다"[16]고 말했다. 고전 문헌에서 신뢰 분포 함수는 변수 θ의 분포 함수로 해석되는데, 빈도 설정에서는 매개변수가 고정되고 랜덤하지 않기 때문에 기준 추론이 개입되지 않는 한 불가능하다.[3]

CD 함수를 빈도론적 관점에서 완전히 해석하고 (고정/비랜덤) 매개변수의 분포 함수로 해석하지 않는 것은 고전적 접근방식에 대한 최근 발전의 주요 출발점 중 하나이다. 신뢰도 분포를 순수하게 빈번한 개념으로 취급하는 것의 좋은 점은 (점 추정기와 유사) 현재 피셔가 기준 분포에 대해 제시한 제한적 제약조건으로부터 자유롭다는 것이다.[6][14]

현대적 정의

다음 정의가 적용된다.[12][17][18] θ은 관심 있는 알 수 없는 매개 변수 θ의 매개 변수 공간이고, χ은 데이터 Xn={X1, ..., Xn:에 해당하는 샘플 공간이다.

× × = → [0, 1] 함수 H(•) = Hnn(Xn, •) = × θ → [0, 1]는 다음과 같은 두 가지 요건을 따르는 경우 θ에 대한 신뢰분포(CD)라고 한다.
  • (R1) 주어진 Xnχ대해n H(•) = Hn(Xn, •)는 θ의 연속 누적분포함수;
  • (R2) 참 매개변수 값 parameter = value, H0n(θ0) ≡ Hn(Xn, θ0)는 표본 X의 함수로서n 균일한 분포 U[0, 1]를 따른다.

또한, U[0, 1] 요구사항이 점증적으로만 참이고 Hn(•)의 연속성 요구사항이 삭제된 경우, 함수 H는 점증상 CD(aCD)이다.

비기술적인 측면에서 신뢰 분포는 모수와 랜덤 표본의 함수로서 두 가지 요건이 있다. 첫 번째 요건(R1)은 단순히 CD가 매개변수 공간에 분포되어야 한다고 요구한다. 두 번째 요구사항(R2)은 신뢰 분포에 기초한 추론(점 추정기, 신뢰 구간 및 가설 검정 등)이 원하는 빈번한 특성을 갖도록 함수에 대한 제한을 설정한다. 이는 편향성, 일관성, 효율성 등 특정한 원하는 특성을 보장하기 위한 점 추정의 제한과 유사하다.[6][19]

신뢰구간의 상한(클래식 정의)을 뒤집어서 도출한 신뢰분포도 위 정의의 요건을 충족하며 이 정의 버전은 고전적 정의와 일치한다.[18]

일반적인 기준 추론과 달리, 특정 설정에 따라 모수를 추정하는 데 둘 이상의 신뢰 분포를 사용할 수 있다. 또한, 고전적인 기준 추론과 달리 최적성은 요구 사항의 일부가 아니다. 설정과 사용하는 기준에 따라 (최적성 측면에서) 고유한 "최적성" 신뢰 분포가 있는 경우도 있다. 그러나 때로는 이용 가능한 최적의 신뢰 분포가 없거나 극단적인 경우에는 의미 있는 신뢰 분포조차 찾을 수 없을 수도 있다. 이것은 점 추정의 관행과 다르지 않다.

측정 가능한 공간이 있는 정의

자신감 측정 가능한 공간에 대한 자신감 지역 한 p{\displaystyle A_{p}의 가족을 위해 수준 p{\d과γ{\displaystyle \gamma}을 위한 것이다 C와 유통 추정자(한 p))p{C(A_{p})=p\displaystyle}}매개 변수 γ{\displaystyle \gamma}에서 C{C\displaystyle}distribution[20].ispl 레벨 < 에 대한 p 자신감 있는 지역의 집안은 독특하지 않다.[21] If only exists for , then is a confidence distribution with level set . Both and all are measurable functions of the data. 는 C (가) 랜덤 측정값이고 A 랜덤 집합임을 의미한다. 요건 ) p 가 동등하게 유지된다면, 신뢰 분포는 정의상 정확하다. 추가로 이(가) 실제 매개 변수라면 측정 이론적 정의는 위의 고전적 정의와 일치한다.

예제 1: 정규 평균 및 분산

정규 표본 Xi~N(μ, μ2), i = 1, 2, ..., n이 주어진다고 가정한다.

(1) 분산 σ2 알 수 있다.

let은 표준 분포의 누적 분포 가 되고 F t n- 학생 - 분포의 분포 함수가 된다. () ) () 의 두 가지 함수 모두 다음과 같다.

CD 정의의 두 가지 요건을 충족하며, 그것들은 μ에 대한 신뢰 분포 함수다.[3] 더 나아가

n→190일 때 점근신뢰분포의 정의를 만족하며, μ에 대한 점근신뢰분포다. The uses of and are equivalent to state that we use and to estimate , res속셈으로

(2) 변동 σ2 알 수 없다.

파라미터 μ의 경우, () 이(가 미지의 파라미터 σ을 포함하고 CD 정의의 두 가지 요건을 위반하므로, 더 이상 μ에 대한 "분산 추정기" 또는 신뢰 분포가 아니다.[3] 그러나 () 은 여전히 μ의 CD이고, H (){\ μ의 aCD이다.

모수 σ2 경우 표본 종속 누적분포함수

σ2 대한 신뢰 분포 함수.[6] 여기서 - 2 }}은 - 분포의 누적분포함수다.

In the case when the variance σ2 is known, is optimal in terms of producing the shortest confidence intervals at any given level. In the case when the variance σ2 is unknown, is an optimal confidence distribution for μ.

예제 2: 이바리산 정규 상관 관계

ρ이변 정규 모집단의 상관 계수를 나타내도록 한다. 피셔 변환에 의해 정의된 피셔의 z는 다음과 같이 잘 알려져 있다.

제한 분포 1+ 1 - 1 - , - 3)을 가지고 있으며 { 2}} \{1 \ \{1 \}} \ \colution)은 샘플 상관 관계, 여기서 n은 n)이다.

함수

ρ에 대한 점근신뢰분포다.[22]


ρ에 대한 정확한 신뢰 밀도는[23][24]

여기서 F (는) 가우스 초지하계 함수와 = n- > 1 이것은 또한 이항 분포의 5개 모수에 대해 이전과 일치하는 베이지스의 후방 밀도다.[25]

피셔가 쓴 고전책의 마지막 공식은

여기서 = - < 0<\ 공식은 C. R. R. Rao에 의해 도출되었다.[26]

예제 3: 이항 평균

를 Y= + U Y에 의해 생성하도록 하십시오. 여기서 {{\}은는) 평면에서 알 수 없는 이고 U{\은(는) 평면에 이항 및 알려진 분포를 가진다. The distribution of defines a confidence distribution for . The confidence regions can be chosen as the interior of ellipses centered at and axes given by the eigenvectors of the covarianc 의 e 매트릭스 신뢰 분포는 이 경우 인 바이노멀이며 신뢰 영역은 다른 여러 가지 방법으로 선택할 수 있다.[27] 이 경우 신뢰 분포는 이전의 오른쪽 하르를 사용하는 베이지안 후방과 일치한다.[28] 이 주장은 무한 차원 힐버트 공간에서 알 수 없는 평균 의 경우를 일반화하지만, 이 경우 신뢰 분포는 베이지안 후방이 아니다.[29]

추론에 신뢰 분포 사용

신뢰구간

CDinference1.png

CD 정의에서 간격- , n- -),[ H - ),) n}^{- [ - 1(/ ), - 1( 1 -/ 2) }^{-1은(는) 모든 α α α에 대해 다른 종류의 100(1 - α)% 수준의 신뢰 구간을 제공한다. 또한[ - 1), - ( 1 - 2) }^{-1은(는) 모든 α1 > 0, α2 > 0, α1 + α2 < 1에 대한 매개변수 θ에 대한 레벨 100(1 - α1 - α2)% 신뢰 구간이다. Here, is the 100β% quantile of or it solves for θ in equation . The same holds for a CD, where the confidence level is achieved in limit. 일부 저자는 적용범위나 성능 목적이 아닌 데이터와 일치하는 매개변수 값을 그래픽으로 보기 위해 이 매개변수를 사용할 것을 제안했다.[30][31]

점 추정

관심 모수에 대한 신뢰도 분포 추정기를 지정할 수도 있다. For example, given Hn(θ) the CD for a parameter θ, natural choices of point estimators include the median Mn = Hn−1(1/2), the mean , and the maximum point of the CD density

어떤 적당한 조건에서는, 다른 특성들 중에서도, 이러한 점 추정기들이 모두 일관성이 있다는 것을 증명할 수 있다.[6][22] 특정 신뢰 분포는 최적 빈도수 추정치를 제공할 수 있다.[32]

가설 검정

신뢰도 분포 H(θ)[6][22]로부터n 매개변수 θ에 관한 단측 또는 양측 검정의 p-값을 도출할 수 있다. 신뢰 분포 함수 p ( )= ( ) =C ( ). 에서 C의 확률 질량을 나타낸다. ps(C)는 CD 추론에서는 "지지"라고 불리며, 기준 문헌에서는 "믿음"이라고도 한다.[33] 우리는 가지고 있다.

(1) 단측검사의 경우0 K: θC vs. K1: θCc, 여기서 C는 (-∞, b] 또는 [b, ∞)의 유형으로 CD 정의에서θCθ supP(ps(C) α) = α. 따라서s p(C) = Hn(C)는 시험의 해당 p-값임을 알 수 있다.

(2) 싱글톤 시험0 경우 K: θ = b vs. K1: θb, P{K0: θ = b}(2 min{ps(Clo)는 CDs 정의에서 p(Cup)} ≤ α) = α. 따라서 2 min{ps(Cloup) = 2s min{Hn(b), 1 - Hn(b)}는 테스트의 해당 p-값이다. 여기서 Clo = (- (-, b] 및 Cup = [b, ∞].

CD 추론의 그래픽 일러스트는 Xie와 Singh(2011)[6]의 그림 1을 참조한다.

구현

몇몇 통계 프로그램은 신뢰도 분포를 구성하고 그래프로 표시할 수 있는 능력을 구현했다.

R을 통해 concurve,[34][35] pvaluefunctions,[36] 그리고 episheet[37] 꾸러미

Excel을 통해 episheet[38]

스타타, 경유 concurve[34]

참고 항목

참조

  1. ^ a b 피셔, R.A. (1930년) "역확률." 프로크 캠브리지 필로스 Soc. 26, 528–535.
  2. ^ 콕스, D.R. (1958) "통계 추론과 관련된 가지 문제", "수학통계연보", "29" 357-372 (제4장 363페이지)
  3. ^ a b c d e f Xie, M. (2013). "신뢰 분포의 재조인자, 매개변수의 빈번한 분포 추정기 - 검토" "국제통계조사, 81, 68-77.
  4. ^ 에프론, B. (1998년) "21세기의 R.A. 피셔" 통계 과학. 13 95–122.
  5. ^ Fraser, D.A.S. (1991) "통계학적 추론: 유의 가능성" 미국통계협회지, 86, 258–265.
  6. ^ a b c d e f g h 시, 엠, 싱, 케이(2013). "신뢰도 분포, 매개변수의 빈도수 분포 추정자 - 검토(토론 포함)" "국제통계조사, 81, 3-39.
  7. ^ Fraser, D. A. S. (2019-03-29). "The p-value Function and Statistical Inference". The American Statistician. 73 (sup1): 135–147. doi:10.1080/00031305.2018.1556735. ISSN 0003-1305.
  8. ^ 네이먼, J. (1937). "고전적 확률 이론에 기초한 통계적 추정 이론의 범위" 필, 트랜스 로이. Soc A237 333–380
  9. ^ Fraser, D.A.S. (2011년) "베이지스는 그저 빠르고 더러운 자신감일까?" 통계학 26, 299-316
  10. ^ 베이즈, T. (1763) "기회론의 문제해결을 위한 에세이" 필, 트랜스 로이. Soc, 런던 53 370–418 54 296–325. 바이오메트리카 45 (1958) 293–315에서 다시 인쇄.
  11. ^ Cox, D. R. (June 1958). "Some Problems Connected with Statistical Inference". The Annals of Mathematical Statistics. 29 (2): 357–372. doi:10.1214/aoms/1177706618. ISSN 0003-4851.
  12. ^ a b 뉴욕 주 슈웨더와 뉴욕 주 하르트(2002년) "자신감과 가능성" 스칸디나비아 통계학 저널. 29 309–332. doi:10.111/1467-9469.00285
  13. ^ a b 자벨, S.L. (1992) "R.A. 피셔와 기준론적 논쟁", 통계분석. 과학, 7,369–387
  14. ^ a b 싱, K.와 시, M. (2011년) "D.A.S. Fraser의 "Bayes is just fast and dirty confidence?"에 대한 토론. 통계학. 제26권 319-321호
  15. ^ Cox, D. R. (2006년). 통계 추론의 원칙, CUP. ISBN 0-521-68567-2(66페이지)
  16. ^ a b 에프론, B. (1993) "신뢰 구간에서의 베이스와 우도 계산. 바이오메트리카, 80 3-26
  17. ^ W.E. Singh, K. Xie, M. and Strawderman, W.E. (2001) "신뢰성 분포—개념, 이론 및 응용" 기술 보고서야, 뎁 통계학, 럿거스 유니브 2004년 개정.
  18. ^ a b W.E. Singh, K. Xie, M. and Strawderman, W.E. (2005) "신뢰 분포를 통한 독립 출처로부터의 정보 결합" 통계 연보, 33, 159–183.
  19. ^ Xie, M, 류, R, 다라무주, C.V., 올산, W. (2012) "이항 임상시험 정보로 전문가 의견 수렴" 적용된 통계 연보. 인쇄 중.
  20. ^ Taraldsen, Gunnar (2021). "Joint Confidence Distributions". doi:10.13140/RG.2.2.33079.85920. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  21. ^ Liu, Dungang; Liu, Regina Y.; Xie, Min-ge (2021-04-30). "Nonparametric Fusion Learning for Multiparameters: Synthesize Inferences From Diverse Sources Using Data Depth and Confidence Distribution". Journal of the American Statistical Association: 1–19. doi:10.1080/01621459.2021.1902817. ISSN 0162-1459.
  22. ^ a b c W.E. Singh, K. Xie, M. and Strawderman, W.E. (2007) 복잡한 데이터 집합 및 역방향 문제 IMS 강의 노트—Monograph Series, 54, (R. Lui, 등)에서 "신뢰 분포(CD)-변수의 분포 추정기" Eds) 132–150.
  23. ^ Taraldsen, Gunnar (2021). "The Confidence Density for Correlation". Sankhya A. doi:10.1007/s13171-021-00267-y. ISSN 0976-8378.
  24. ^ Taraldsen, Gunnar (2020). "Confidence in Correlation". doi:10.13140/RG.2.2.23673.49769. {{cite journal}}: Cite 저널은 필요로 한다. journal= (도움말)
  25. ^ Berger, James O.; Sun, Dongchu (2008-04-01). "Objective priors for the bivariate normal model". The Annals of Statistics. 36 (2). doi:10.1214/07-AOS501. ISSN 0090-5364.
  26. ^ Fisher, Ronald Aylmer, Sir (1973). Statistical methods and scientific inference ([3d ed., rev. and enl.] ed.). New York: Hafner Press. ISBN 0-02-844740-9. OCLC 785822.
  27. ^ Liu, Dungang; Liu, Regina Y.; Xie, Min-ge (2021-04-30). "Nonparametric Fusion Learning for Multiparameters: Synthesize Inferences From Diverse Sources Using Data Depth and Confidence Distribution". Journal of the American Statistical Association: 1–19. doi:10.1080/01621459.2021.1902817. ISSN 0162-1459.
  28. ^ Eaton, Morris L.; Sudderth, William D. (2012). "Invariance, model matching and probability matching". Sankhyā: The Indian Journal of Statistics, Series A (2008-). 74 (2): 170–193. ISSN 0976-836X.
  29. ^ Taraldsen, Gunnar; Lindqvist, Bo Henry (2013-02-01). "Fiducial theory and optimal inference". The Annals of Statistics. 41 (1). doi:10.1214/13-AOS1083. ISSN 0090-5364.
  30. ^ Cox, D. R.; Hinkley, D. V. (1979-09-06). Theoretical Statistics. Chapman and Hall/CRC. doi:10.1201/b14832. ISBN 978-0-429-17021-8.
  31. ^ Rafi, Zad; Greenland, Sander (2020-09-30). "Semantic and cognitive tools to aid statistical science: replace confidence and significance by compatibility and surprise". BMC Medical Research Methodology. 20 (1): 244. arXiv:1909.08579. doi:10.1186/s12874-020-01105-9. ISSN 1471-2288. PMC 7528258. PMID 32998683.
  32. ^ Taraldsen, Gunnar; Lindqvist, Bo Henry (2013-02-01). "Fiducial theory and optimal inference". The Annals of Statistics. 41 (1). doi:10.1214/13-AOS1083. ISSN 0090-5364.
  33. ^ 켄달, M, 스튜어트, A. (1974년) 통계학의 고급 이론, 책 ? (21장). 와일리
  34. ^ a b Rafi [aut, Zad; cre; Vigotsky, Andrew D. (2020-04-20), concurve: Computes and Plots Compatibility (Confidence) Intervals, P-Values, S-Values, & Likelihood Intervals to Form Consonance, Surprisal, & Likelihood Functions, retrieved 2020-05-05
  35. ^ "Concurve plots consonance curves, p-value functions, and S-value functions « Statistical Modeling, Causal Inference, and Social Science". statmodeling.stat.columbia.edu. Retrieved 2020-04-15.
  36. ^ Infanger, Denis (2019-11-29), pvaluefunctions: Creates and Plots P-Value Functions, S-Value Functions, Confidence Distributions and Confidence Densities, retrieved 2020-04-15
  37. ^ Black, James; Rothman, Ken; Thelwall, Simon (2019-01-23), episheet: Rothman's Episheet, retrieved 2020-04-15
  38. ^ "Modern Epidemiology, 2nd Edition". www.krothman.org. Retrieved 2020-04-15.

참고 문헌 목록