적용가능성

Coverage probability

통계에서 신뢰 구간 계산 기법의 적용 확률은 구간이 실제 관심 값을 포함하는 시간의 비율이다.[1] 예를 들어, 우리의 관심사가 특정 유형의 암을 가진 사람들이 화학요법으로 성공적으로 치료한 후 회복되는 평균 월수에 있다고 가정합시다. 신뢰 구간은 주어진 확률로 알 수 없는 평균 완화 기간을 포함하는 것을 목표로 한다. 이것은 신뢰 구간을 구성하는 절차의 "명목 범위 확률"인 생성된 구간의 "신뢰 수준" 또는 "신뢰 계수"이다. "명목 범위 확률"은 종종 0.95로 설정된다. 적용 확률은 구간이 이 예에서 실제 평균 완화 기간을 포함할 실제 확률이다.

신뢰 구간 도출에 사용된 모든 가정이 충족될 경우, 명목 적용 범위 확률은 적용 범위 확률과 같을 것이다(중점에 대해 "참" 또는 "실제" 적용 범위 확률을 말함). 가정을 충족하지 못하면 실제 적용 확률은 명목 적용 확률보다 작거나 클 수 있다. 실제 커버리지 확률이 명목 커버리지 확률보다 클 때 구간을 "보수"라고 하고, 명목 커버리지 확률보다 작을 경우 그 구간을 "반보수" 또는 "영원한"이라고 한다.

연속된 분포와 이산형 분포의 근사치를 할 때 범위 확률과 명목 범위 확률 사이의 불일치가 자주 발생한다. 이항 신뢰구간의 구성은 적용 확률이 공칭 수준과 거의 같지 않은 전형적인 예다.[2][3][4] 이항제의 경우, 간격을 구성하는 몇 가지 기법이 만들어졌다. Wilson 또는 Score 신뢰 구간은 정규 분포를 바탕으로 잘 알려진 구성이다. 다른 구조로는 월드, 정확, 아그레스티-쿠엘 및 우도 구간이 있다. Wilson 구간이 가장 보수적인 추정치는 아닐 수 있지만, 공칭 수준과 동일한 평균 적용 확률을 생성하는 동시에 상대적으로 좁은 신뢰 구간을 산출한다.

커버리지 확률의 "확률"은 전체 데이터 수집 및 분석 절차의 가상 반복 집합과 관련하여 해석된다. 이러한 가상 반복에서는 실제 데이터와 동일한 확률 분포를 따르는 독립적 데이터 세트를 고려하고, 신뢰 구간은 각 데이터 세트에서 계산한다. Neyman 구성을 참조한다. 적용가능성은 이러한 계산된 신뢰구간 중 원하는 매개변수 값을 포함하지만 관측할 수 없지만 관측할 수 없는 매개변수 값을 포함한다.

공식

신뢰 구간을 구성하면 샘플 종속 구간 , T ){\에서 True 매개 변수 을(를) 찾을 확률은 () }임을 보장한다

참고 항목

참조

  1. ^ 닷지, Y. (2003) 옥스포드 통계 용어 사전, OUP. ISBN0-19-920613-9
  2. ^ Agresti, Alan; Coull, Brent (1998). "Approximate Is Better than "Exact" for Interval Estimation of Binomial Proportions". The American Statistician. 52 (2): 119–126. doi:10.2307/2685469. JSTOR 2685469.
  3. ^ Brown, Lawrence; Cai, T. Tony; DasGupta, Anirban (2001). "Interval Estimation for a binomial proportion" (PDF). Statistical Science. 16 (2): 101–117. doi:10.1214/ss/1009213286.
  4. ^ Newcombe, Robert (1998). "Two-sided confidence intervals for the single proportion: Comparison of seven methods". Statistics in Medicine. 17 (2, issue 8): 857–872. doi:10.1002/(SICI)1097-0258(19980430)17:8<857::AID-SIM777>3.0.CO;2-E. PMID 9595616. Archived from the original on 5 January 2013.