바르나드 시험

Barnard's test

통계에서 Barnard의 검정은 1마진이 고정된 2 × 2 분할표의 분석에 사용되는 정확한 검사다.Barnard의 테스트는 실제로 가설 테스트의 한 종류로, 두 개의 독립 이항 분포에 대한 무조건적인 정확한 테스트로도 알려져 있다.[1][2][3]이러한 테스트는 두 범주형 변수의 연관성을 검사하며 종종 2 × 2 분할표에 대한 Fisher의 정확한 테스트보다 더 강력한 대안이 된다.1945년 G.A. Barnard에 의해 처음 출판된 이 시험은 p값을 계산하는 계산상의 어려움과 피셔의 그럴듯한 거부감 때문에 인기를 얻지 못했다.[4][5]오늘날에는 표본 크기가 작거나 적당한 경우(n ≲ 1,000 ) 컴퓨터가 몇 초 만에 Barnard의 시험을 실시할 수 있는 경우가 많다.

목적과 범위

Barnard의 테스트는 2 × 2 분할표에서 행과 열의 독립성을 테스트하는 데 사용된다.이 테스트에서는 각 반응이 독립적이라고 가정한다.독립성 하에서는 2×2표를 산출하는 세 가지 유형의 연구 설계가 있으며, 두 번째 유형에는 Barnard의 시험이 적용된다.

다양한 설계 유형을 구별하기 위해, 한 연구자가 치료법이 감염을 빨리 치료하는지 여부를 테스트하는 데 관심이 있다고 가정해 보십시오.

  1. 한 가지 가능한 연구 설계는 100명의 감염 대상자를 표본으로 추출하는 것이 될 것이며, 각 과목에 대해 새로운 치료법을 받았는지 또는 오래된, 표준, 의약품을 받았는지, 그리고 정해진 시간이 지난 후에도 감염이 여전히 존재하는지를 살펴보는 것이다.이러한 유형의 설계는 단면 연구 또는 역학과 같은 '현장 관찰'에서 흔히 볼 수 있다.
  2. 또 다른 가능한 연구 설계는 50명의 감염 환자, 50명의 감염 환자들에게 위약을 투여하고 정해진 시간이 지난 후에도 감염이 여전히 존재하는지를 확인하는 것이다.이런 종류의 디자인은 임상시험에서 흔히 볼 수 있다.
  3. 최종 가능한 연구 설계는 50명의 감염 대상자에게 치료제를, 50명의 감염 대상자에게 위약을 투여하고, 미리 정해진 수의 대상자가 감염으로부터 치유되면 실험을 중지하는 것이다.이런 종류의 디자인은 드물지만, R.A.를 이끌었던 티 스터디시음하는 아가씨와 구조가 같다. 피셔의 정확한 검정을 만들려면

각 실험 설계의 결과는 거의 동일한 2×2 표로 제시될 수 있지만, 이들의 통계는 서로 다르기 때문에 "중대한" 결과의 기준은 각각 다르다.

  1. 첫 번째 연구 설계에 따른 2 × 2 의 확률은 다항 분포에 의해 주어진다. 여기서 총 샘플 수가 유일한 통계적 제약 조건이다.이것은 통제되지 않는 실험, 즉 "현장 관찰"의 한 형태인데, 실험자는 단순히 "데이터를 있는 그대로 가져간다"[a]는 것이다.
  2. 두 번째 연구 설계는 두 개의 독립적인 이항 분포의 산물에 의해 주어진다. 한 여백의 총계(행 총계 또는 열 총계)는 실험 설계에 의해 구속되지만 다른 여백의 총계는 자유롭다.이것은 실험자가 실험의 일부를 구속하는 가장 일반적인 형태의 실험 설계로, 실험 대상의 절반은 신약으로 제공되고 나머지 절반은 오래된 재래식 의약품을 제공받도록 할당한다고 말하지만, 각 통제 범주에서 후퇴하는 개인의 수는 통제할 수 없다.병으로 쓰러지거나 쓰러지다
  3. 세 번째 설계는 초기하 분포에 의해 주어진다. 여기서 각 열과 행의 총 숫자는 모두 제한된다.예를 들어, 개인은 8컵의 탄산음료를 맛볼 수 있지만, 각 범주 "브랜드 X"와 "브랜드 Y"에 4개를 할당하여 행 합계와 기둥 합계가 모두 4개로 제한되어야 한다.[b]이런 종류의 실험은 관리하기가 복잡하고, 실제 실험에서는 거의 알려져 있지 않다.

Barnard의 정확한 테스트와 Fisher의 '정확한' 테스트 사이의 작동 차이는 p 을 계산할 때 공통 성공 확률의 성가신 파라미터를 어떻게 처리하는가 하는 것이다.Fisher의 정확한 테스트는 가능한 결과를 비현실적으로 제약하는 대략적인 보조 통계량인 두 여백에 거짓으로 조건화하여 성가신 매개변수를 추정하는 것을 피한다.Barnard의 테스트는 성가신 파라미터의 모든 합법적인 가능한 값을 고려하고 p 값을 최대화하는 값을 선택한다.시험들 사이의 이론적 차이는 Barnard의 시험이 실제로 그것이 사용되는 이중 이항 분포 테이블에는 정확하지만, Fisher의 시험은 초기하 분포시험 테이블에는 정확하지 않지만, 가장 자주 적용되는 이항 분포 테이블에는 정확하지 않다는 것이다.

두 테스트 모두 크기가 유형 I 오류율보다 작거나 같다.그러나 Barnard의 테스트는 Fisher의 테스트 절차가 잘못 무시하는 두 번째 여백에 대한 조절을 하지 않음으로써 더 많은 '또는 더 극단적인' 표를 고려하기 때문에 Fisher의 테스트보다 더 강력할 수 있다.실제로 보슐루의 시험이라고 불리는 바르나르드의 시험의 한 변종은 한결같이 피셔의 시험보다 강력하다.[6]바르나르의 시험에 대한 보다 자세한 설명은 메흐타와 센차우드후리(2003)에 의해 주어진다.[7]Barnard의 테스트는 프로젝트 관리 연구에서[8] Fisher의 정확한 테스트와 함께 사용되어 왔다.

비평

피셔가 가르치는 그럴듯한 압박감 하에서, 버나드는 성서 많은 연구자들부터는 통계 보다 실험적인 디자인의 대다수의 강력한 반면 피셔의 정확한 테스트 통계는 conserva, 2×2보정 tables,[10]을 분석하기 위한 피셔의 정확한 시험이 끝나Barnard의 정확한 시험을 선호하는 출판되 paper,[9]에 그의 시험을 철회했다.tive, m그것의 p 값에 의해 나타난 유의성을 배제하면 실험자는 피셔의 정확한 검정의 초기하학적 통계보다는 Barnard의 검정의 덜 보수적인 이중 이항 통계량을 사용하여 통계적으로 유의미할 수 있는 유의미한 결과로서 치부하게 된다.Barnard의 테스트는 두 한계 결과를 모두 구속하는 실험 설계의 드문 경우(예: '맛 테스트')에는 적합하지 않다. 두 한계 총계에 대해 드물고 실험적으로 부과된 제약조건이 표 초기하계에 대한 실제 샘플링 분포를 만든다.

Barnard의 테스트는 더 큰 테이블에 적용할 수 있지만 계산 시간은 증가하고 전력 이점은 빠르게 감소한다.[11]Barnard의 시험을 시행할 때 어떤 시험 통계가 선호되는지는 여전히 불분명하지만, 대부분의 시험 통계는 피셔의 정확한 시험보다 한결같이 더 강력한 시험을 산출한다.[12]

참고 항목

각주

  1. ^ 다항 분포 데이터의 "필드 관측치"의 경우 카이-제곱 검정은 가장 일반적으로 사용되는 분석 방법이며, "통계적으로 올바른" 결과를 생성하지만 정확한 통계량이 아닌 정규 근사치를 기반으로 한다.다른 방법들도 적용되며, 피어슨의 카이-제곱 테스트에 관한 기사에서 논의된다.
  2. ^ 실험 결과는 컵 수의 카운트가 정확하거나 잘못 식별된 상태에서 테이블 내부에서만 나타난다.

참조

  1. ^ Mehrotra, D.V.; Chan, I.S.F.; Berger, R.L. (2003). "A cautionary note on exact unconditional inference for a difference between two independent binomial proportions". Biometrics. 59: 441–450.
  2. ^ Ripamonti, E.; Lloyd, C.; Quatto, P. (2017). "Contemporary frequentist views of the 2 × 2 binomial trial". Statistical Science. 32: 600–615. doi:10.1214/17-STS627.
  3. ^ Fay, M.P.; Hunsberger, S.A. (2021). "Practical valid inferences for the two-sample binomial problem". Statistics Surveys. 15. arXiv:1904.05416. doi:10.1214/21-SS131.
  4. ^ Barnard, G.A. (1945). "A new test for 2 × 2 tables". Nature. 156 (3954): 177. doi:10.1038/156177a0. S2CID 186244479.
  5. ^ Barnard, G.A. (1947). "Significance tests for 2 × 2 tables". Biometrika. 34 (1–2): 123–138. doi:10.1093/biomet/34.1-2.123. PMID 20287826.
  6. ^ Boschloo, R.D. (1970). "Raised conditional level of significance for the 2 × 2 table when testing the equality of two probabilities". Statistica Neerlandica. 24: 1–35. doi:10.1111/j.1467-9574.1970.tb00104.x.
  7. ^ Mehta, C.R.; Senchaudhuri, P. (2003). "Conditional versus unconditional exact tests for comparing two binomials". {{cite journal}}:Cite 저널은 필요로 한다. journal=(도움말)
  8. ^ Invernizzi, Diletta Colette; Locatelli, Giorgio; Brookes, Naomi J. (1 January 2019). "An exploration of the relationship between nuclear decommissioning projects characteristics and cost performance" (PDF). Progress in Nuclear Energy. 110: 129–141. doi:10.1016/j.pnucene.2018.09.011. ISSN 0149-1970.
  9. ^ Barnard, G.A. (1949). "Statistical Inference". Journal of the Royal Statistical Society. Series B. 11 (2): 115–149.
  10. ^ Lydersen, S.; Fagerland, M.W.; Laake, P. (2009). "Recommended tests for association in 2x2 tables". Statistics in Medicine. 28: 1159–1175.
  11. ^ Mehta, C.R.; Hilton, J.F. (1993). "Exact power of conditional and unconditional tests: Going beyond the 2 × 2 contingency table". The American Statistician. 47 (2): 91–98. doi:10.1080/00031305.1993.10475946.
  12. ^ Berger, R.L. (1994). "Power comparison of exact unconditional tests for comparing two binomial proportions". Institute of Statistics. Mimeo Series. No. 2266: 1–19.

외부 링크