연속성에 대한 예이츠의 수정
Yates's correction for continuity통계에서, 연속성에 대한 예이츠의 보정(또는 예이츠의 카이-제곱 검정)은 분할표에서 독립성을 시험할 때 특정 상황에서 사용된다. 표의 주파수 이산 확률을 연속 분포(치 제곱)로 근사하게 추정할 수 있다고 가정하여 도입된 오류를 교정하는 것을 목적으로 한다. 예이츠의 교정이 지나치게 조정될 수 있어 현재 이용이 제한되는 경우도 있다.
근사 오차에 대한 보정
Pearson의 카이-제곱 통계량을 해석하기 위해 카이-제곱 분포를 사용하면 표에서 관측된 이항 주파수의 이산 확률을 연속적인 카이-제곱 분포로 근사할 수 있다고 가정할 필요가 있다. 이 가정은 꽤 정확하지 않고, 약간의 오류를 초래한다.
근사치의 오차를 줄이기 위해, 영국의 통계학자 프랭크 예이츠는 2 × 2 보정표에서 각 관측값과 예상값의 차이에서 0.5를 빼서 피어슨의 카이-제곱 검정의 공식을 조정하는 연속성에 대한 보정을 제안했다.[1] 이렇게 하면 얻은 카이-제곱 값이 감소하여 p-값이 증가한다.
예이츠의 교정의 효과는 작은 데이터에 대한 통계적 유의성의 과대평가를 방지하는 것이다. 이 공식은 표의 하나 이상의 셀이 5보다 작은 예상 카운트를 가질 때 주로 사용된다. 불행히도 예이츠의 수정은 지나치게 수정되는 경향이 있을 수 있다. 이로 인해 귀무 가설이 필요할 때(타입 II 오류) 기각하지 못하는 지나치게 보수적인 결과가 발생할 수 있다. 따라서 예이츠의 수정은 다음과 [2]같이 표본 크기가 상당히 낮더라도 불필요하다고 제안한다.
다음은 예이츠가 Pearson의 카이-제곱 통계량을 수정한 버전:
여기서:
- Oi = 관측된 주파수
- Ei = 귀무 가설로 주장되는 기대(이론적) 빈도
- N = 고유 사건 수
2×2표
다음 항목이 포함된 2 × 2 표의 경우 쇼트컷으로,
S | F | ||
---|---|---|---|
A | a | b | a+b |
B | c | d | c+d |
a+c | b+d | N |
우리는 N=a+b+c+d를 쓸 수 있다.
경우에 따라서는 이것이 더 낫다.
참고 항목
참조
- ^ 예이츠, F(1934) "소수 및 χ2 테스트가 포함된 컨퍼런스 테이블" 영국 왕립통계학회지 부록 1(2): 217–235. JSTOR 2983604
- ^ Sokal RR, Rohlf F.J. (1981) 생체 측정: 생물학적 연구에 있어서 통계학의 원칙과 실천. W.H. 프리먼, ISBN0-7167-1254-7.