최소 카이-제곱 추정
Minimum chi-square estimation통계에서 카이-제곱 추정치가 되는 최소 분산은 관측된 데이터를 바탕으로 관측되지 않은 수량을 추정하는 방법이다.[1]
특정 카이-제곱 검정에서는 지정된 검정 통계량이 너무 크면 해당 통계량이 귀무 가설이 참일 경우 카이-제곱 분포를 갖는 경우 모집단 분포에 대한 귀무 가설을 기각한다.최소 카이-제곱 추정에서는 해당 검정 통계량을 가능한 작게 만드는 모수의 값을 찾는다.
그 사용의 결과 중 하나는 실제로 표본 크기가 클 때 검정 통계량이 카이-제곱 분포를 갖는다는 것이다.일반적으로 이 방법으로 추정된 각 모수에 대한 자유도가 1씩 감소한다.
예를 통한 그림
특정 랜덤 변수가 음이 아닌 정수 1, 2, 3, . . . 크기 20의 단순한 랜덤 표본을 추출하여 다음과 같은 데이터 집합을 산출한다고 가정합시다.이 표본을 추출한 모집단이 포아송 분포를 따른다는 귀무 가설을 검정하는 것이 바람직하다.
모집단 평균의 최대우도 추정치는 3.3이다.모집단 분포가 기대값 3.3의 포아송 분포인지 여부에 대한 피어슨의 카이-제곱 검정을 적용할 수 있다.그러나 귀무 가설은 그것이 특정한 포아송 분포라는 것을 명시하지 않고, 다만 어느 정도의 포아송 분포라는 것만을 명시하였으며, 숫자 3.3은 귀무 가설에서 나온 것이 아니라 데이터에서 나온 것이다.경험칙은 모수를 추정할 때 자유도를 1로 줄인다고 하는데, 이 경우 (10개의 셀이 있기 때문에) 9개에서 8개로 줄어든다.귀무 가설이 참일 때 결과 검정 통계량이 대략 카이-제곱 분포를 갖기를 바랄 수 있다.그러나 일반적으로 최대우도 추정을 사용하는 경우는 아니다.그러나 최소 카이-제곱 추정치를 사용할 때는 무증상적으로 사실이다.
최소 카이-제곱 추정치 찾기
모집단 평균 λ의 최소 카이-제곱 추정치는 카이-제곱 통계량을 최소화하는 수입니다.
여기서 a는 "> 8" 셀의 예상 예상 번호로, "20"은 표본 크기 때문에 나타난다.a 값은 포아송 분포 랜덤 변수가 8을 초과할 확률의 20배이며, 0에서 8에 해당하는 확률의 합을 1에서 뺀 값으로 쉽게 계산된다.사소한 대수학으로, 마지막 학기는 간단히 a로 줄어든다.수치 계산을 통해 카이-제곱 통계량을 최소화하는 λ의 값이 약 3.5242라는 것을 알 수 있다.그것은 λ의 최소 카이-제곱 추정치다.that의 해당 값에 대해 카이-제곱 통계량은 약 3.062764이다.10개의 세포가 있다.귀무 가설이 λ 추정을 요구하지 않고 단일 분포를 지정했다면, 검정 통계량의 귀무 분포는 자유도가 10 - 1 = 9인 카이-제곱 분포일 것이다.λ을 추정해야 했기 때문에, 1도의 자유가 추가로 상실된다.자유도가 8인 카이-제곱 랜덤 변수의 기대값은 8이다.따라서 관측치 3.062764는 상당히 겸손하며 귀무 가설은 기각되지 않는다.
참고 및 참조
- ^ Berkson, Joseph (1980). "Minimum Chi-Square, Not Maximum Likelihood!". Annals of Statistics. 8 (3): 457–487. doi:10.1214/aos/1176345003. JSTOR 2240587.