정확한 테스트
Exact test이 글은 통계 전문가의 주의가 필요하다. 구체적인 문제는 다음과 같다: 일반적으로 정확한 테스트의 본문에 대한 논의가 필요하다. Statistics가 을 줄 수 있을 이다. (2008년 11월) |
통계에서 정확한 (신호성) 검정은 귀무 가설이 참일 경우 검정 통계량의 분포의 유도 동안에 이루어진 모든 가정이 충족되는 검정이다. 정확한 시험을 사용하면 시험의 타입 I 오류율( )을 원하는 유의 수준에서 유지하는 유의성 시험을 제공한다. 예를 들어 귀무 가설이 참인 많은 표본에 대해 반복될 경우= %의 유의 수준에서 정확한 테스트는 최대 % 5에서 기각된다. 이는 원하는 타입 I 오류율이 근사적으로만 유지되는 근사치 테스트(즉, 테스트가 시간의 5% 이상에서 거부될 수 있음)와 대조되는 반면, 이 근사치는 표본 크기를 충분히 크게 만들어 원하는 대로 스타일 에 가깝게 만들 수 있다.
이산 시험 통계에 근거한 정확한 시험은 보수적일 수 있으며, 이는 실제 거부율이 명목상의 유의 수준 } 이하임을 나타낸다 예를 들어, 피셔의 정확한 시험과 보다 강력한 대안인 보슐루의 시험이다. 시험 통계가 연속적인 경우, 정확히 유의 수준에 도달할 것이다.[citation needed]
정확한 통계에 사용되는 것과 같은 모수적 시험은 모수 가정이 완전히 충족될 때 정확한 시험이지만, 실제로는 정확한(신호성) 시험이라는 용어의 사용은 비모수적 시험, 즉 모수적 가정에[citation needed] 머무르지 않는 시험에 대해 유보된다. 그러나 실제로는 대부분의 비모수 시험 소프트웨어 구현은 유의성 값을 얻기 위해 점근법 알고리즘을 사용하며, 이로 인해 시험이 비확실성이 된다.
따라서, 통계 분석 결과를 "정확한 시험"이라고 부르거나 "정확한 p-값"으로 지정하는 경우, 이는 시험이 모수 가정 없이 정의되고 근사적인 알고리즘을 사용하지 않고 평가된다는 것을 의미한다. 그러나 원칙적으로 이는 모든 모수 가정이 완전히 충족되는 상황에서 모수 시험이 채택되었다는 것을 의미할 수 있지만, 대부분의 경우 실제 상황에서 이것을 완전히 증명하는 것은 불가능하다. 모수 검정이 정확하다는 것이 확실한 예외에는 이항 분포 또는 포아송 분포에 기초한 검정이 포함된다. 순열시험이라는 용어는 정확한 검사의 동의어로 쓰이기도 하지만, 모든 순열시험이 정확한 시험이지만, 모든 정확한 시험이 순열시험은 아니라는 점을 명심해야 한다.
공식화
정확한 테스트의 기초가 되는 기본적인 방정식은
여기서:
- x는 실제 관측된 결과,
- Pr(y)는 잠재적으로 관측된 결과 y의 귀무 가설에서 확률이다.
- T(y)는 결과 y에 대한 검정 통계량의 값이며, T의 큰 값은 개념적으로 귀무 가설에서 더 큰 이탈을 나타내는 경우를 나타낸다.
그리고 합계가 관측된 표본 x에 대해 얻은 검정 통계량의 값이 같은 모든 결과 y(관측된 결과 포함) 또는 더 큰 결과의 범위에 걸쳐 있는 경우.
예제: Pearson의 카이-제곱 검정 대 정확한 검정
이 개념의 간단한 예는 피어슨의 카이-제곱 테스트가 근사적인 테스트라는 관찰을 포함한다. Pearson의 카이-제곱 검정을 사용하여 6면 다이(die)가 "공정"한지 여부를 확인한다고 가정해 보자. 이는 6면 다이(die)가 6개의 가능한 결과를 각각 균등하게 렌더링한다는 것을 나타낸다. 주사위를 n번 던지면, 각 결과를 n/6번씩 볼 수 있는 "예상"을 한다. 검정 통계량은
여기서 X는k 결과 k가 관측된 횟수다. "공정성"이라는 귀무 가설이 참일 경우 표본 크기를 n으로 충분히 크게 만들어 5도의 자유도로 카이-제곱 분포에 원하는 만큼 시험 통계량의 확률 분포를 만들 수 있다. 반면에 n이 작으면 카이-제곱 분포에 기초한 확률은 충분히 가까운 근사치가 아닐 수 있다. 이 시험 통계가 특정 값을 초과할 정확한 확률을 찾으려면 시험 통계의 큰 값을 발생시키는 실험의 모든 결과를 조합하여 열거해야 한다. 그렇다면 동일한 시험 통계를 사용해야 하는지는 의문이다. 우도-비율 검정이 선호될 수 있으며, 검정 통계량은 위 검정의 단조함수가 아닐 수 있다.
예: 피셔의 정확한 검사
1930년대 로널드 피셔와 E. J. G. 핏먼의 작품을 바탕으로 한 피셔의 정확한 테스트는 표본 분포(여백의 조건부)가 정확히 알려져 있기 때문에 정확하다. 이는 Pearson의 카이-제곱 검정과 비교해야 하며, (동일한 null을 검정하지만) 검정 통계량의 분포가 점증적으로만 정확하기 때문에 정확하지 않다.
참고 항목
참조
- Ronald Fisher (1954) 연구 노동자를 위한 통계적 방법. 올리버와 보이드.
- 메타, C.R.; 파텔, N.R. (1998년) "정확한 범주형 데이터에 대한 추론". P. 아미티지 및 T.에서. Colton, eds, 생물통계 백과사전, Chichester: John Wiley, 페이지 1411–1422. 미발표 사전 인쇄
- Corcoran, C. D.; Senchaudhuri, P.; Mehta, C. R.; Patel, N. R. (2005). "Exact Inference for Categorical Data". Encyclopedia of Biostatistics. doi:10.1002/0470011815.b2a10019. ISBN 047084907X.