바르나드 시험
Barnard's test통계에서 Barnard의 검정은 1마진이 고정된 2 × 2 분할표의 분석에 사용되는 정확한 검사다.Barnard의 테스트는 실제로 가설 테스트의 한 종류로, 두 개의 독립 이항 분포에 대한 무조건적인 정확한 테스트로도 알려져 있다.[1][2][3]이러한 테스트는 두 범주형 변수의 연관성을 검사하며 종종 2 × 2 분할표에 대한 Fisher의 정확한 테스트보다 더 강력한 대안이 된다.1945년 G.A. Barnard에 의해 처음 출판된 이 시험은 p값을 계산하는 계산상의 어려움과 피셔의 그럴듯한 거부감 때문에 인기를 얻지 못했다.[4][5]오늘날에는 표본 크기가 작거나 적당한 경우(n ≲ 1,000 ) 컴퓨터가 몇 초 만에 Barnard의 시험을 실시할 수 있는 경우가 많다.
목적과 범위
Barnard의 테스트는 2 × 2 분할표에서 행과 열의 독립성을 테스트하는 데 사용된다.이 테스트에서는 각 반응이 독립적이라고 가정한다.독립성 하에서는 2×2표를 산출하는 세 가지 유형의 연구 설계가 있으며, 두 번째 유형에는 Barnard의 시험이 적용된다.
다양한 설계 유형을 구별하기 위해, 한 연구자가 치료법이 감염을 빨리 치료하는지 여부를 테스트하는 데 관심이 있다고 가정해 보십시오.
- 한 가지 가능한 연구 설계는 100명의 감염 대상자를 표본으로 추출하는 것이 될 것이며, 각 과목에 대해 새로운 치료법을 받았는지 또는 오래된, 표준, 의약품을 받았는지, 그리고 정해진 시간이 지난 후에도 감염이 여전히 존재하는지를 살펴보는 것이다.이러한 유형의 설계는 단면 연구 또는 역학과 같은 '현장 관찰'에서 흔히 볼 수 있다.
- 또 다른 가능한 연구 설계는 50명의 감염 환자, 50명의 감염 환자들에게 위약을 투여하고 정해진 시간이 지난 후에도 감염이 여전히 존재하는지를 확인하는 것이다.이런 종류의 디자인은 임상시험에서 흔히 볼 수 있다.
- 최종 가능한 연구 설계는 50명의 감염 대상자에게 치료제를, 50명의 감염 대상자에게 위약을 투여하고, 미리 정해진 수의 대상자가 감염으로부터 치유되면 실험을 중지하는 것이다.이런 종류의 디자인은 드물지만, R.A.를 이끌었던 티 스터디를 시음하는 아가씨와 구조가 같다. 피셔의 정확한 검정을 만들려면
각 실험 설계의 결과는 거의 동일한 2×2 표로 제시될 수 있지만, 이들의 통계는 서로 다르기 때문에 "중대한" 결과의 기준은 각각 다르다.
- 첫 번째 연구 설계에 따른 2 × 2 표의 확률은 다항 분포에 의해 주어진다. 여기서 총 샘플 수가 유일한 통계적 제약 조건이다.이것은 통제되지 않는 실험, 즉 "현장 관찰"의 한 형태인데, 실험자는 단순히 "데이터를 있는 그대로 가져간다"[a]는 것이다.
- 두 번째 연구 설계는 두 개의 독립적인 이항 분포의 산물에 의해 주어진다. 한 여백의 총계(행 총계 또는 열 총계)는 실험 설계에 의해 구속되지만 다른 여백의 총계는 자유롭다.이것은 실험자가 실험의 일부를 구속하는 가장 일반적인 형태의 실험 설계로, 실험 대상의 절반은 신약으로 제공되고 나머지 절반은 오래된 재래식 의약품을 제공받도록 할당한다고 말하지만, 각 통제 범주에서 후퇴하는 개인의 수는 통제할 수 없다.병으로 쓰러지거나 쓰러지다
- 세 번째 설계는 초기하 분포에 의해 주어진다. 여기서 각 열과 행의 총 숫자는 모두 제한된다.예를 들어, 개인은 8컵의 탄산음료를 맛볼 수 있지만, 각 범주 "브랜드 X"와 "브랜드 Y"에 4개를 할당하여 행 합계와 기둥 합계가 모두 4개로 제한되어야 한다.[b]이런 종류의 실험은 관리하기가 복잡하고, 실제 실험에서는 거의 알려져 있지 않다.
Barnard의 정확한 테스트와 Fisher의 '정확한' 테스트 사이의 작동 차이는 p 값을 계산할 때 공통 성공 확률의 성가신 파라미터를 어떻게 처리하는가 하는 것이다.Fisher의 정확한 테스트는 가능한 결과를 비현실적으로 제약하는 대략적인 보조 통계량인 두 여백에 거짓으로 조건화하여 성가신 매개변수를 추정하는 것을 피한다.Barnard의 테스트는 성가신 파라미터의 모든 합법적인 가능한 값을 고려하고 p 값을 최대화하는 값을 선택한다.시험들 사이의 이론적 차이는 Barnard의 시험이 실제로 그것이 사용되는 이중 이항 분포 테이블에는 정확하지만, Fisher의 시험은 초기하 분포 맛 시험 테이블에는 정확하지 않지만, 가장 자주 적용되는 이항 분포 테이블에는 정확하지 않다는 것이다.
두 테스트 모두 크기가 유형 I 오류율보다 작거나 같다.그러나 Barnard의 테스트는 Fisher의 테스트 절차가 잘못 무시하는 두 번째 여백에 대한 조절을 하지 않음으로써 더 많은 '또는 더 극단적인' 표를 고려하기 때문에 Fisher의 테스트보다 더 강력할 수 있다.실제로 보슐루의 시험이라고 불리는 바르나르드의 시험의 한 변종은 한결같이 피셔의 시험보다 강력하다.[6]바르나르의 시험에 대한 보다 자세한 설명은 메흐타와 센차우드후리(2003)에 의해 주어진다.[7]Barnard의 테스트는 프로젝트 관리 연구에서[8] Fisher의 정확한 테스트와 함께 사용되어 왔다.
비평
피셔가 가르치는 그럴듯한 압박감 하에서, 버나드는 성서 많은 연구자들부터는 통계 보다 실험적인 디자인의 대다수의 강력한 반면 피셔의 정확한 테스트 통계는 conserva, 2×2보정 tables,[10]을 분석하기 위한 피셔의 정확한 시험이 끝나Barnard의 정확한 시험을 선호하는 출판되 paper,[9]에 그의 시험을 철회했다.tive, m그것의 p 값에 의해 나타난 유의성을 배제하면 실험자는 피셔의 정확한 검정의 초기하학적 통계보다는 Barnard의 검정의 덜 보수적인 이중 이항 통계량을 사용하여 통계적으로 유의미할 수 있는 유의미한 결과로서 치부하게 된다.Barnard의 테스트는 두 한계 결과를 모두 구속하는 실험 설계의 드문 경우(예: '맛 테스트')에는 적합하지 않다. 두 한계 총계에 대해 드물고 실험적으로 부과된 제약조건이 표 초기하계에 대한 실제 샘플링 분포를 만든다.
Barnard의 테스트는 더 큰 테이블에 적용할 수 있지만 계산 시간은 증가하고 전력 이점은 빠르게 감소한다.[11]Barnard의 시험을 시행할 때 어떤 시험 통계가 선호되는지는 여전히 불분명하지만, 대부분의 시험 통계는 피셔의 정확한 시험보다 한결같이 더 강력한 시험을 산출한다.[12]
참고 항목
각주
참조
- ^ Mehrotra, D.V.; Chan, I.S.F.; Berger, R.L. (2003). "A cautionary note on exact unconditional inference for a difference between two independent binomial proportions". Biometrics. 59: 441–450.
- ^ Ripamonti, E.; Lloyd, C.; Quatto, P. (2017). "Contemporary frequentist views of the 2 × 2 binomial trial". Statistical Science. 32: 600–615. doi:10.1214/17-STS627.
- ^ Fay, M.P.; Hunsberger, S.A. (2021). "Practical valid inferences for the two-sample binomial problem". Statistics Surveys. 15. arXiv:1904.05416. doi:10.1214/21-SS131.
- ^ Barnard, G.A. (1945). "A new test for 2 × 2 tables". Nature. 156 (3954): 177. doi:10.1038/156177a0. S2CID 186244479.
- ^ Barnard, G.A. (1947). "Significance tests for 2 × 2 tables". Biometrika. 34 (1–2): 123–138. doi:10.1093/biomet/34.1-2.123. PMID 20287826.
- ^ Boschloo, R.D. (1970). "Raised conditional level of significance for the 2 × 2 table when testing the equality of two probabilities". Statistica Neerlandica. 24: 1–35. doi:10.1111/j.1467-9574.1970.tb00104.x.
- ^ Mehta, C.R.; Senchaudhuri, P. (2003). "Conditional versus unconditional exact tests for comparing two binomials".
{{cite journal}}
:Cite 저널은 필요로 한다.journal=
(도움말) - ^ Invernizzi, Diletta Colette; Locatelli, Giorgio; Brookes, Naomi J. (1 January 2019). "An exploration of the relationship between nuclear decommissioning projects characteristics and cost performance" (PDF). Progress in Nuclear Energy. 110: 129–141. doi:10.1016/j.pnucene.2018.09.011. ISSN 0149-1970.
- ^ Barnard, G.A. (1949). "Statistical Inference". Journal of the Royal Statistical Society. Series B. 11 (2): 115–149.
- ^ Lydersen, S.; Fagerland, M.W.; Laake, P. (2009). "Recommended tests for association in 2x2 tables". Statistics in Medicine. 28: 1159–1175.
- ^ Mehta, C.R.; Hilton, J.F. (1993). "Exact power of conditional and unconditional tests: Going beyond the 2 × 2 contingency table". The American Statistician. 47 (2): 91–98. doi:10.1080/00031305.1993.10475946.
- ^ Berger, R.L. (1994). "Power comparison of exact unconditional tests for comparing two binomial proportions". Institute of Statistics. Mimeo Series. No. 2266: 1–19.