이항 검정
Binomial test통계학에서 이항 검정은 표본 데이터를 사용하여 이론적으로 기대되는 관측치의 분포에서 벗어난 통계적 유의성에 대한 정확한 검정입니다.
사용.
이항 검정은 성공 확률에 가설( \ \pi)을 검정하는 데 유용합니다.
서 0 _은 0 ~1 사이의 사용자 정의 값입니다.
n n의 샘플에서 k k의 성공이 경우 n 0 n _의 이항 분포 공식은 다음 값을 찾을 확률을 제공합니다.
귀무 0이 맞다면 예상되는 성공 횟수는 n 0({ n이 됩니다.이 테스트에서는 가 극단으로 보일 확률을 고려하여p\ p -값을 구합니다.한쪽 꼬리 검정의 경우 계산하기가 쉽습니다. < 0 \ < \ _ { } . if if if if if if if if if if if if if 。그럼 의p-값은
k(\display ) 범위의 합계를 사용하여 0(\ _{0 여부를 테스트하는 경우에도 동일한 계산이 가능합니다.
00.이면 이항 분포가 대칭이 아니기 때문에 양 꼬리 검정의 계산은 조금 더 복잡합니다. 즉, 한쪽 꼬리 검정의 p을 두 배로 늘릴 수는 없습니다.지금까지 본 이벤트보다 극단적이거나 그 이상의 이벤트를 고려해야 하므로 X k 그 의 가 가능성을 고려해야합니다. { : ( ) ) ( 는 이러한 모든 이벤트를 나타냅니다.그런 다음 양 p\style과 같이 계산됩니다.
일반적인 용도
이항 검정의 한 가지 일반적인 용도는 귀무 0: 0.({를 암시하는 귀무 가설이 두 가지 범주에서 동일하게 발생할 가능성이 있는 경우이다. 이 범주에서 한 관측치 수를 제공하는 표는 널리 이용 가능하다.단, 아래 예시와 같이 이항검정은 이 경우에 한정되지 않습니다.
범주가 세 개 이상이고 정확한 검정이 필요한 경우 이항 [1]검정 대신 다항 분포를 기반으로 하는 다항 검정을 사용해야 합니다.
큰 샘플
아래 예제와 같은 큰 표본의 경우 이항 분포는 편리한 연속 분포로 근사되며, 이 분포는 Pearson의 카이 제곱 검정 및 G-검정과 같이 계산 속도가 훨씬 빠른 대체 검정의 기준으로 사용됩니다.그러나 작은 표본의 경우 이러한 근사치가 세분화되어 이항 검정의 대안이 없습니다.
가장 일반적인(그리고 가장 쉬운) 근사치는 표준 정규 분포를 통해 이루어집니다. 이 분포에서는 다음과 같은 통계Z(\ Z에 대한 z-검정이 수행됩니다.
서 k k는 크기(\ n의 표본에서 관찰된 성공 횟수이고,(\는 귀무 가설에 따른 성공 확률입니다.연속성 보정을 도입함으로써 이 근사치를 개선할 수 있습니다.
큰n(\ n의 경우 이 연속성 보정은 중요하지 않지만 정확한 이항 테스트가 작동하지 않는 중간 값의 경우 훨씬 더 정확한 결과를 얻을 수 있습니다.
측정된 샘플 p p {\ 및 샘플 n {\ n에 대한 귀무 가설(서 p^ / {= k} p } = piran이 후방으로 표시될 수 있습니다ge 및 위의 z-test를 다음과 같이 적습니다.
분자와 분모 모두에서 n n으로 나누면 일부 독자들에게 더 친숙한 형태일 수 있습니다.
예
하나의 주사위 굴림에 따라 달라지고 6을 굴리는 데 특별한 중요성을 갖는 보드 게임이 있다고 가정해 봅시다.특정 게임에서는 주사위를 235회 굴려 6이 51회 올라온다.주사위가 공정하다면 6개가 나올 겁니다
주사위가 공정한 주사위일 경우 6의 숫자가 우리가 예상할 수 있는 평균보다 더 많다는 것을 우리는 이제 관찰했다.하지만 주사위의 공정성에 대해 결론을 내릴 수 있을 만큼 그 수치가 상당히 높을까요?이 문제는 이항 검정을 통해 답할 수 있다.우리의 귀무 가설은 금형이 공정하다는 것입니다(금형에 각 숫자가 나올 확률은 1/6입니다).
이항 검정을 사용하여 이 문제에 대한 답을 찾기 위해 이항 분포를 사용합니다.
- ( , /) (f ( , , ) ( ; , ) ) ( ) ( -p ) - - k - f ( , p , p ) pr ( k ) = ( k , 6 )
기대치보다 큰 값을 관측했기 때문에 한쪽 끝의 테스트를 구성하는 늘 아래에서 51개 이상의 6s를 관측할 확률을 고려할 수 있습니다(여기에서는 기본적으로 이 다이가 예상보다 많은 6s를 발생하도록 편향되어 있는지 여부를 테스트하고 있습니다).귀무 가설에서 235 표본에서 51개 이상의 6s의 확률을 계산하기 위해 정확히 51개의 6s를 얻을 확률과 정확히 52개의 6s를 얻을 확률을 합산하여 정확히 235개의 6s를 얻을 확률을 계산합니다.
유의 수준이 5%인 경우, 이 결과(0.02654 < 5%)는 금형이 공정하다는 귀무 가설을 기각할 만큼 유의한 증거가 있음을 나타냅니다.
통상, 다이의 공정성을 테스트할 때는, 다이가, 상기의 한쪽의 테스트에서 설명한 것처럼, 6s를 넘는 것이 아니라, 예상보다 적은 6s를 생성하는 것에 치우쳐 있는 것이 아닌가 하는 것도 중요합니다.두 가지 편견을 모두 고려하기 위해 양 꼬리 테스트를 사용합니다.사건의 확률이 1/2가 아니면 단순히 한쪽 끝의 p-값을 두 배로 늘릴 수 없습니다.그 이유는 확률이 1/2에서 벗어나면 이항 분포가 비대칭이 되기 때문입니다.두 개의 꼬리가 있는 p-값을 정의하는 방법에는 두 가지가 있습니다.한 가지 방법은 사건 발생 횟수의 총 편차가 예상 값보다 크거나 작을 확률을 합산하는 것입니다.이 예에서 이러한 현상이 발생할 확률은 0.0437입니다.두 번째 방법은 기대값으로부터의 편차가 관측값보다 가능성이 낮거나 가능성이 더 낮다는 확률 계산, 즉 확률밀도함수의 비교와 관련이 있다.이로 인해 미묘한 차이가 발생할 수 있지만 이 예에서는 0.0437의 동일한 확률이 산출됩니다.두 경우 모두 양 꼬리 검정은 5% 수준에서 유의성을 나타내며, 이 다이에 대해 관측된 6s의 수가 5% 수준에서 예상된 수와 유의하게 다르다는 것을 나타냅니다.
통계 소프트웨어 패키지
이항 검정은 통계 목적으로 사용되는 대부분의 소프트웨어에서 사용할 수 있습니다.예.
- R에서는 위의 예를 다음 코드로 계산할 수 있습니다.
binom.test(51, 235, 1/6, alternative = "less")
(한쪽 끝 테스트)binom.test(51, 235, 1/6, alternative = "greater")
(한쪽 끝 테스트)binom.test(51, 235, 1/6, alternative = "two.sided")
(양 꼬리 테스트)
- Apache Commons 라이브러리를 사용하는 Java의 경우:
new BinomialTest().binomialTest(235, 51, 1.0 / 6, AlternativeHypothesis.LESS_THAN)
(한쪽 끝 테스트)new BinomialTest().binomialTest(235, 51, 1.0 / 6, AlternativeHypothesis.GREATER_THAN)
(한쪽 끝 테스트)new BinomialTest().binomialTest(235, 51, 1.0 / 6, AlternativeHypothesis.TWO_SIDED)
(양 꼬리 테스트)
- SAS에서는 Frequency 절차에서 테스트를 사용할 수 있습니다.
PROC FREQ DATA=WeightRoll', 테이블 롤 / 이항(P=0.16667) 알파=0.05; EXCRUCT 이항; WEATE Freq; 실행;
- SPSS에서는 [Analyze]> [ Nonparameter test ]> [ Ipariant ]메뉴를 사용하여 테스트를 사용할 수 있습니다.
npar는 /node(.5) = node1 node2를 테스트합니다.
- Python에서는 SciPy의 binomtest를 사용합니다.
scipy.stats.binomtest(51, 235, 1.0/6, alternative='greater')
(한쪽 끝 테스트)scipy.stats.binomtest(51, 235, 1.0/6, alternative='two-sided')
(양 꼬리 테스트)
- MATLAB에서 myBinom을 사용합니다.테스트는 Mathworks 커뮤니티 파일 교환 웹사이트를 통해 제공됩니다.마이바이넘검정은 성공 확률을 가정하여 관측치에 대한 p-값을 직접 계산합니다.
[pout]=myBinomTest(51, 235, 1/6)
(양쪽 꼬리가 있지만 선택적으로 한쪽 꼬리가 있는 테스트를 수행할 수 있습니다). - Stata에서 bitest를 사용합니다.
- Microsoft Excel 에서는, Binom 를 사용합니다.Dist. 함수는 모수(성공 횟수, 시행 횟수, 성공 확률, 누적)를 취합니다."Cumulative" 매개 변수는 True 또는 False를 사용합니다. True는 누적 성공 확률(왼쪽 꼬리 검정)을 제공하고 False는 이 많은 성공을 찾을 확률을 제공합니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Howell, David C. (2007). Statistical methods for psychology (6. ed.). Belmont, Calif.: Thomson. ISBN 978-0495012870.
- "The binomial test". www.graphpad.com.