피어슨의 카이-제곱 검정

Pearson's chi-squared test

Pearson의 카이-제곱 검정( ^{ )은 범주형 데이터 집합에 적용되는 통계 테스트로, 관측된 집합 간의 차이가 우연히 발생할 가능성을 평가한다.이는 많은 카이-제곱 검정(예: 예이츠, 우도비, 시계열에서의 포트만테우 테스트 등) 중에서 가장 널리 사용되는 것으로, 통계적 절차로서, 결과는 카이-제곱 분포를 기준으로 평가된다.그것의 성질은 1900년에 Karl Pearson에 의해 처음 조사되었다.[1]시험 통계량과 그 분포의 구분을 개선하는 것이 중요한 맥락에서 Pearson χ-제곱 검정 또는 통계량과 유사한 이름이 사용된다.

표본에서 관측된 특정 사건빈도 분포가 특정 이론적 분포와 일치한다는 귀무 가설을 검정한다.고려된 이벤트는 상호 배타적이어야 하며 총 확률 1을 가져야 한다.이에 대한 일반적인 경우는 사건들이 각각 범주형 변수의 결과를 포괄하는 경우다.간단한 예로 일반적인 6면 주사위는 "공정"이라는 가설을 들 수 있다(즉, 6면 주사위는 모두 동일하게 발생할 가능성이 있다).

정의

Pearson의 카이-제곱 테스트는 적합도, 동질성, 독립성의 세 가지 비교 유형을 평가하는 데 사용된다.

  • 적합도 검정은 관측된 주파수 분포가 이론적 분포와 다른지 여부를 결정한다.
  • 동질성 테스트는 졸업 후 1년 후 보고된 고등학교 졸업생의 동일한 범주형 변수(예: 대학, 군대, 취업, 여행 등)를 사용하여 둘 이상의 그룹에 대한 카운트 분포를 비교하여 특정 활동을 선택하는 졸업생 수가 학급에서 변경되었는지 여부를 확인한다.계층화 또는 10년에서 10년 사이.[2]
  • 독립성 검사는 우발적 표에 표현된 두 변수에 대한 측정으로 구성된 관측치가 서로 독립되어 있는지 여부를 평가한다(예: 국적이 반응과 관련이 있는지 여부를 확인하기 위해 다른 국적의 사람들의 응답을 조사).

세 가지 테스트 모두에 대해 계산 절차는 다음과 같은 단계를 포함한다.

  1. 관측 빈도와 이론 빈도 사이의 편차 제곱의 정규화된 합과 유사한 카이-제곱 검정 통계량 }를 계산한다(아래 참조).
  2. 해당 통계량의 자유도(df)를 결정한다.
    1. 적합도 검정의 경우 df = Cats - Parms. 여기서 Cats는 모형이 인식하는 관측 범주 수이고 Parms는 모형이 관측치에 가장 잘 적합하도록 조정된 모형의 모수 수입니다.분포에서 적합 모수의 수로 축소된 범주 수입니다.
    2. 동질성 검정의 경우 df = (행 - 1)×(열 - 1) 여기서 은 범주의 수(즉, 관련 분할표의 행)에 해당하고 콜스는 독립된 그룹의 수(즉, 관련 분할표의 열)에 해당한다.[2]
    3. 독립성 검정의 경우 df = (행 - 1)×(열 - 1)×(열 - 1) 여기서 은 한 변수의 범주 수에 해당하고 은 두 번째 변수의 범주 수에 해당한다.[2]
  3. 검정 결과에 대해 원하는 신뢰 수준(신호 수준, p-값 또는 해당 알파 수준)을 선택하십시오.
  4. }}과 df 자유도와 선택된 신뢰도 수준(일방면, 시험이 한 방향에만 있기 때문에 시험 값이 임계 값보다 크나?)을 비교하여 많은 경우 분포에 대한 좋은 근사치를 제공한다. 2
  5. 관측된 주파수 분포가 }}의 임계값을 초과하는지 여부에 기초하여 이론적 분포와 동일하다는 귀무 가설을 유지하거나 거부한다 시험 통계량이 }}의 임계값을 초과하는 경우 귀무 가설 = 분포 사이에 차이가 없음)은 기각될 수 있으며, 대립 가설( 1 1} = 분포 사이에 차이가 있음)은 선택된 신뢰 수준으로 모두 받아들일 수 있다.검정 통계가 임계값 }}값 아래로 떨어지면 명확한 결론에 도달할 수 없으며, 귀무 가설이 지속되는(우리는 귀무 가설을 기각하지 못함)은 반드시 허용되지는 않는다.

분포 적합성 검정

이산 균일 분포

이 경우 관측치는 개의 셀로 나뉜다.단순 적용은 일반 모집단에서 값이 동일한 주파수의 각 셀에서 발생할 것이라는 가설을 검정하는 것이다.따라서 (이산성 균일 분포의 귀무 가설에서) 모든 셀에 대한 "이론적 빈도"는 다음과 같이 계산된다.

그리고 자유도의 감소는 = 이며 개념적으로 관찰된 주파수 에 합치도록 제한되기 때문이다

그것의 적용의 한 가지 구체적인 예는 로그 순위 시험의 적용일 것이다.

기타분포

관측치가 특정 분포 계열에 속하는 랜덤 변수인지 여부를 검정할 때, "이론적 빈도"는 어떤 표준 방법으로 적합된 해당 계열의 분포를 사용하여 계산된다.자유도 감소는 = + 1 로 계산되며 여기서 분포 적합에 사용되는 파라미터 수입니다.예를 들어 3-모수 일반 감마 분포할 때 = 4 p , 정규 분포를 확인할 때(모수가 평균 및 표준 편차인 경우), = , 그리고 포아송 분포를 확인할 때(모수가 예상 값인 경우) = 2{\)}따라서 - p 자유도가 있을 것이며, 여기서 범주의 수입니다.

자유도는 학생의 t 또는 F-분포와 같은 관측치의 수에 근거하지 않는다.예를 들어, 공정한 6면 다이 테스트의 경우, 6개의 범주 또는 매개변수(각 숫자)가 있기 때문에 자유도가 5도일 것이다. 즉, 주사위가 굴려지는 횟수는 자유도에 영향을 미치지 않는다.

검정 통계분석 계산

카이-제곱 분포, X 축에 X2 표시하고 Y 축에 P-값을 표시한다.

검정 통계학 값은

어디에

  • }} = Pearson의 누적 시험 통계량. 분포 점증적으로 접근한다.
  • = i 유형의 관측치 수입니다.
  • = 총 관측치 수
  • = = 모집단에서 type i의 분율이 라는 귀무 가설에 의해 단언되는 형식 i의 예상(이론적) 개수.
  • = 표에 있는 셀 수입니다.

그런 다음 카이-제곱 통계량을 사용하여 통계량의 값카이-제곱 분포와 비교하여 p-값을 계산할 수 있다.자유도는 셀 수 자유도 감소 p {\과 같다

자유도에 대한 결과는 원래 데이터가 다항일 때 유효하며 따라서 추정된 모수가 카이 제곱 통계량을 최소화하는데 효율적이다.그러나 일반적으로 최대우도 추정이 최소 카이-제곱 추정과 일치하지 않을 경우 분포는 n- - p - 1 카이-제곱 분포 사이에 위치한다(예: Chernoff 및 Lehmann, 1954 참조).

베이지안법

베이지안 통계에서, 사람들은 대신 Dirichlet 분포결합 전으로 사용한다.만약 어떤 사람이 이전에 균일성을 취했다면, 모집단 확률에 대한 최대우도 추정치는 관측된 확률이며, 이 추정치나 다른 추정치에 대한 신뢰할 수 있는 영역을 계산할 수 있다.

통계적 독립성 시험

이 경우 "관찰"은 두 결과의 값으로 구성되며 귀무 가설은 이러한 결과의 발생이 통계적으로 독립적이라는 것이다.각 관측치는 두 결과의 값에 따라 2차원 셀 배열의 하나의 셀(비상사태표라고 함)에 할당된다.표에 r 행과 c 열이 있는 경우, 독립의 가설이 주어진 셀에 대한 "이론적 빈도"는 다음과 같다.

여기서 은(는) 총 샘플 크기(표 내 모든 셀의 합계)이며

속성(행 총계의 합계)을 무시하는 i 유형의 관측치 비율이다.

행 속성을 무시하는 j 유형의 관측치 비율(열 총계 값)"빈도"라는 용어는 이미 정규화된 값이라기 보다는 절대수를 말한다.

검정 통계학 값은

}}, = , , j 즉 모든 셀에서 기대치와 실제 관측치 수가 동일한 경우에만 0이라는 점에 유의하십시오.

"독립성" 모형을 적합시키면 자유도가 p = r + c - 1만큼 감소한다.자유도는 (r - 1)(c - 1)로 감소하는 (r - 1) (c - 1)로 감소하는 (r - 1) 세포의 수와 같다.

동질성 검정이라고도 하는 독립성 검정의 경우 0.05 이하(또는 0.05 임계점 이하인 카이 제곱 통계량)의 카이-제곱 확률은 일반적으로 적용 노동자에 의해 행 변수가 v열과 독립적이라는 귀무 가설을 기각하는 정당성으로 해석된다.가리가 [4]있는대립 가설은 이 관계의 구조가 지정되지 않은 관계나 관계를 갖는 변수에 해당한다.

가정

카이-제곱 분포를 적용할 수 있다는 표준 근사치와 함께 사용할 경우 카이-제곱 검정에는 다음과 같은 가정이 있다.[citation needed]

단순 랜덤 표본
표본 데이터는 주어진 표본 크기의 모집단 구성원의 모든 집합이 동일한 선택 확률을 갖는 고정된 분포 또는 모집단에서 무작위로 추출한 것이다.시험의 변형들은 데이터가 가중되는 경우와 같이 복잡한 표본에 대해 개발되었다.자포성 표본 추출과 같은 다른 형식을 사용할 수 있다.[5]
표본 크기(전체 테이블)
충분히 큰 크기의 표본을 가정한다.크기가 더 작은 표본에 대해 카이 제곱 테스트를 수행할 경우, 카이 제곱 테스트는 부정확한 추론을 산출한다.연구자는 작은 표본에 대한 카이 제곱 검정을 사용함으로써 결국 타입 II 오류를 범할 수 있다.작은 표본 크기의 경우 현금 검사를 선호한다.[6][7]
예상세포수
적절한 예상 셀 카운트.5개 이상, 10개 이상 필요한 것도 있다.일반적인 규칙은 2-by-2 테이블의 모든 셀에서 5 이상이고, 큰 테이블에서 셀의 80%에서 5 이상이지만 예상 카운트가 0인 셀은 없다.이 가정이 충족되지 않을 때는 예이츠의 교정이 적용된다.
독립
관측치는 항상 서로 독립적이라고 가정한다.즉, 카이-제곱을 사용하여 상관 관계가 있는 데이터(일치 쌍 또는 패널 데이터 등)를 테스트할 수 없다는 뜻이다.그러한 경우, McNemar의 테스트가 더 적절할 수 있다.

서로 다른 가정에 의존하는 검정은 Fisher의 정확한 검정이다. 고정된 한계 분포에 대한 가정이 충족되면 특히 소수의 관측치가 있는 유의 수준을 얻는 데 훨씬 더 정확하다.대부분의 적용에서 이 가정은 충족되지 않을 것이며, 피셔의 정확한 테스트는 보수적인 것에 비해 지나치게 높을 것이며 정확한 적용범위를 가지고 있지 않을 것이다.[8]

파생

중앙한계정리를 이용한 유도

j 행과 k 열을 갖는 Pearson 통계량의 null 분포는 (k - 1)(j - 1) 자유도를 갖는 카이-제곱 분포로 근사치를 구한다.[9]

이 근사치는 다항 분포에 의해 기대값이 주어지는 경우 귀무 가설에서 참 분포로 발생한다.큰 표본 크기의 경우, 중심 한계 정리에서는 이 분포가 특정 다변량 정규 분포를 지향한다고 말한다.

두 개의 세포

표에 두 개의 셀만 있는 특별한 경우, 기대값은 이항 분포를 따른다.

어디에

p = 확률, 귀무 가설에서
n = 표본의 관측치 수입니다.

위의 예에서 가정된 남성 관측치의 확률은 0.5이며 표본은 100이다.따라서 우리는 50명의 남성들을 관찰할 것으로 기대한다.

n이 충분히 큰 경우, 위의 이항 분포는 가우스 분포(정규 분포)로 근사할 수 있으며, 따라서 Pearson 검정 통계량은 카이 제곱 분포에 근사할 수 있다.

O1 첫 번째 셀에 있는 표본의 관측치 수입니다.Pearson 검정 통계량은 다음과 같이 표현할 수 있다.

다시 로 표현될 수 있는.

이항 분포에 대한 정규 근사치에 의해 이것은 하나의 표준 정규 변수의 제곱이며, 따라서 자유도가 1인 카이 제곱으로 분포한다.분모는 가우스 근사치의 표준 편차 중 하나이므로 기록할 수 있다는 점에 유의하십시오.

따라서 카이-제곱 분포의 의미와 일치하여 평균으로부터 떨어진 표준 편차의 관측 개수가 가우스 근사치(큰 n에 대해 좋은 근사치) 아래에 얼마나 가능성이 있는지 측정하고 있다.

그런 다음 카이-제곱 분포는 통계값 오른쪽에 통합되어 P-값을 얻는데, 이는 귀무 가설을 가정할 때 관측된 통계값과 같거나 더 큰 통계량을 얻을 확률과 같다.

2x2 분할표

두 행과 두 열을 포함하는 분할표에 시험을 적용하는 경우, 이 검정은 비율의 Z 검정에 해당한다.[citation needed]

많은 세포

상기와 대체로 유사한 주장들은 비록 세부사항들이 더 많이 포함되기는 하지만, 원하는 결과를 초래된다.검정 통계량의 한계 총계를 표준 정규 랜덤 변수의 제곱을 하나 더 적게 만들기 위해 변수의 직교 변화를 적용할 수 있다.[10]

관측치의 수가 무한대에 근접함에 따라 가 {2 {\} 분포에 실제로 무증상적으로 접근한다는 것을 증명해 보자.

Let be the number of observations, the number of cells and the probability of an observation to fall in the i-th cell, for . We denote by the configuration where f또는 i마다 i번째 셀에 관측치가 있다.참고:

Let be Pearson's cumulative test statistic for such a configuration, and let be the distribution of this statistic.의 확률은 - }}분포를 자유도로 하여 {\\to 에 접근한다는 것을 보여줄 것이다.

임의 값 T:

우리는 de Moivre-Laplace 정리의 근사치와 유사한 절차를 사용할 것이다. k 로부터의 기여는 n 전대 순서가 있으므로, n {\에 대해서는 의 공식을 n! {\ k 둘 다 사용할 수 있다!다음을 얻으려면}:

대신하여

x i {\에 대한 적분으로 대략 계산할 수 있다 참고:

도착하다

로그 범위를 확장하고 의 주요 용어를 사용함으로써

Pearson's chi, , is precisely the argument of the exponent (except for the -1/2; note that the final term in the exponent's argument is m- ) 2/( n ) 과 같다.

이 주장은 다음과 같이 쓸 수 있다.

(는) 정규 대칭- 1) ( - ) 행렬이므로 대각선이 가능하다.따라서다음과 - 1 {\i의 변수를 선형적으로 변경하여m - 1 새로운 를 얻을 수 있다

이러한 변수의 선형적 변화는 단지 정수 Jacobian에 의해 적분을 곱할 뿐이므로, 다음과 같은 결과를 얻는다.

여기서 C는 상수다.

이것은 평균과 분산이 0인 - 1 독립 정규 분포 변수의 제곱합이 T보다 클 확률로, 즉 - 2도 자유도가 T보다 클 확률이다.

따라서 는 pearson의기 분포가- 자유도로 기 분포에 접근하는 한계를 보여주었다

주사위의 공정성

6면 주사위는 60번 던져진다.1, 2, 3, 4, 5, 6회 착지 횟수는 각각 5, 8, 9, 8, 10, 20회다.Pearson의 카이-제곱 검사에 따르면 95% 및/또는 99%의 유의 수준에서 다이(die)가 편향되어 있는가?

귀무 가설은 다이(die)가 편향되지 않았다는 것이며, 따라서 각 숫자는 동일한 횟수로 발생할 것으로 예상된다. 이 경우,60/n = 10.결과는 다음과 같이 표로 나타낼 수 있다.

1 5 10 −5 25
2 8 10 −2 4
3 9 10 −1 1
4 8 10 −2 4
5 10 10 0 0
6 20 10 10 100
합계 134

그런 다음 카이-제곱 분포표위쪽꼬리 임계값을 참조한다.여기서 표 값은 정규 변수 제곱의 주어진 수(N=60 시험)의 합(평균이 아님)을 의미하므로, 134는 우리가 추정하고자 하는 비적합성(공정 다이 포함)의 실험 결과를 의미한다.



자유
임계값보다 작은 확률
0.90 0.95 0.975 0.99 0.999
60 74.397 79.082 83.298 88.379 99.607

실험 총액 134는 99.9% 유의성 또는 신뢰도(p-값)에서도 임계값을 크게 초과한다.구체적으로, 기대치가 10개에 불과할 때, 6롤 20개를 얻는 것은 공정한 주사위를 가진 극히 가능성이 낮다(임의의 우연한 기회에 1000분의 1 미만).

적합도

이 맥락에서 이론적 분포와 경험적 분포의 빈도는 모두 비정규화된 카운트이며, 카이-제곱 검정의 경우 이 두 분포의 총 표본 N해당 보정표의 모든 셀 합계)이 같아야 한다.

예를 들어, 남녀의 빈도가 같은 모집단에서 무작위로 100명의 표본을 추출했다는 가설을 시험하기 위해, 관측된 남녀의 수는 남성 50명과 여성 50명의 이론적 빈도와 비교될 것이다.표본에 남성이 44명, 여성이 56명이었다면, 그렇다면.

귀무 가설(즉, 남성과 여성이 동등한 확률을 가지고 선택됨)이 참일 경우(남성 빈도를 알면 여성 빈도가 결정되기 때문에) 시험 통계량은 자유도가 1인 카이 제곱 분포에서 도출된다.

자유도 1도에 대한 카이-제곱 분포를 상담한 결과, 인구에서 남성과 여성이 동등하게 많은 경우 이 차이(또는 이보다 더 극단적인 차이)를 관측할 확률은 약 0.23이다.이 확률은 통계적 유의성에 대한 종래의 기준(0.01 또는 0.05)보다 높기 때문에, 일반적으로 우리는 모집단의 남성 수가 여성의 수와 같다는 귀무 가설을 거부하지 않을 것이다(즉, 남성/여성 비율 50/50에 대해 우리가 예상할 수 있는 범위 내에서 우리의 표본을 고려할 것이다).

문제

예상 주파수가 너무 낮으면 카이-제곱 분포에 대한 근사치가 분해된다.이벤트의 20% 이하가 예상 빈도가 5 미만인 경우 일반적으로 허용된다.자유도가 1도 밖에 없는 경우 예상 빈도가 10 미만일 경우 근사치를 신뢰할 수 없다.이 경우 관측 빈도와 기대 빈도 사이의 각 차이의 절대값을 제곱하기 전에 0.5만큼 줄임으로써 더 나은 근사치를 얻을 수 있다. 이를 연속성을 위한 예이츠의 보정이라고 한다.

기대값 E가 작은 것으로 확인되는 경우(소규모 기초 모집단 확률 및/또는 소수의 관측치를 나타냄) 다항 분포의 정규 근사치가 실패할 수 있으며, 이 경우 우도비 기반 검정 통계량인 G-검정을 사용하는 것이 더 적절하다고 확인된다.총 표본 크기가 작을 경우, 일반적으로 이항 테스트 또는 분할표의 경우 피셔의 정확한 테스트와 같은 적절한 정확한 테스트를 사용해야 한다.이 시험은 한계 총계가 주어진 시험 통계량의 조건부 분포를 사용하므로, 여유도가 연구 전에 결정되었다고 가정한다. 이러한 가정을 하지 않는 Boschloo의 시험과 같은 대안은 한결같이 강력하다.

}}회 는 {{\ 테스트의 낮은 순서 근사치임을 알 수 있다.[11]위의 이슈에 대한 위의 이유는 상위 주문 조건을 조사하면 명백해진다.

참고 항목

메모들

  1. ^ Pearson, Karl (1900). "On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling" (PDF). Philosophical Magazine. Series 5. 50 (302): 157–175. doi:10.1080/14786440009463897.
  2. ^ a b c 데이비드 E.Bock, Paul F.벨레만, 리처드 D.드 보(2007)"Stats, Modeling the World," 606-627, 보스턴 피어슨 애디슨 웨슬리, ISBN 0-13-187621-X
  3. ^ "1.3.6.7.4. Critical Values of the Chi-Square Distribution". Retrieved 14 October 2014.
  4. ^ "Critical Values of the Chi-Squared Distribution". NIST/SEMATECH e-Handbook of Statistical Methods. National Institute of Standards and Technology.
  5. ^ Chi Square에 대한 가정을 보려면 을 참조하십시오.
  6. ^ Cash, W. (1979). "Parameter estimation in astronomy through application of the likelihood ratio". The Astrophysical Journal. 228: 939. doi:10.1086/156922. ISSN 0004-637X.
  7. ^ "The Cash Statistic and Forward Fitting". hesperia.gsfc.nasa.gov. Retrieved 19 October 2021.
  8. ^ "A Bayesian Formulation for Exploratory Data Analysis and Goodness-of-Fit Testing" (PDF). International Statistical Review. p. 375.
  9. ^ 응용 프로그램 통계.MIT OpenCourseWare.강의 23.피어슨의 정리.2007년 3월 21일 회수.
  10. ^ "Seven Proofs of the Pearson Chi-Squared Independence Test and its Graphical Interpretation". SSRN (preprint). p. 5-6.
  11. ^ Jaynes, E.T. (2003). Probability Theory: The Logic of Science. C. University Press. p. 298. ISBN 978-0-521-59271-0. (Link는 1996년 3월 단편판이다.)

참조