웰치의 t-테스트

Welch's t-test

통계에서 Welch의 t-검정 또는 동일하지 않은 분산 t-검정은 2-표본 위치 검정으로, 두 모집단의 평균이 동일하다는 가설을 검정하는 데 사용된다. 이 샘플은 제작자 Bernard Lewis Welch의 이름을 따서 명명되었으며,[1] 학생 t-테스트를 각색한 것으로, 두 표본의 분산이 동일하지 않거나 표본 크기가 동일하지 않을 때 더 신뢰성이 높다.[2][3] 이러한 시험은 비교되는 두 표본의 기초가 되는 통계단위가 비과잉일 때 일반적으로 적용되기 때문에 흔히 "부식" 또는 "독립 표본" t-검정으로 불린다. 웰치의 t-검정은 학생 t-검정보다[2] 덜 인기가 있고 독자들에게는 덜 친숙할 수 있다는 점을 감안할 때, 보다 유익한 이름은 "Welch의 불평등 분산 t-검정" 즉 간결함을 위한 "불평등 분산 t-검정" 또는 "불특정 분산 t-검정"이다.[3]

가정

학생의 t-검정은 두 모집단에 대해 비교되는 모집단 모수가 정규 분포를 따르고 모집단이 동일한 분산을 갖는다고 가정한다. Welch의 t-검정은 불평등한 모집단 분산을 위해 설계되었지만 정규성에 대한 가정은 유지된다.[1] 웰치의 t 테스트는 베렌스-피셔 문제에 대한 대략적인 해결책이다.

계산

Welch의 t-검정은 통계 t를 다음과 같은 공식으로 정의한다.

여기서 표본 표준 편차표본 크기에 i 의 표본 평균표준 오차이다. 학생의 t-검정과는 달리 분모는 합동 분산 추정치에 기초하지 않는다.

이 분산 추정치와 관련된 자유 }은(는) Welch-Satterthwaite 방정식을 사용하여 근사치를 구한다.[4]

2}^{에 걸쳐.

= }} :

.

여기서 = - 은 i번째 분산 추정치와 관련된 자유도다.

카이-제곱 분포의 근사치를 가지고 있기 때문에 통계량은 대략 t-분포에서 나온 것이다. 이 근사치는 N 2 }} 모두 5보다 클 때 더 잘한다.[5][6]

통계시험

t 을(를) 계산한 후, 이러한 통계량을 t-분포와 함께 사용하여 가능한 두 가지 귀무 가설 중 하나를 검정할 수 있다.

  • 두 모집단 평균이 같으며, 이 경우 두 개의 꼬리 시험을 적용한다.
  • 모집단 평균 중 하나가 다른 평균보다 크거나 같으며, 이 경우 한 쪽 꼬리 검정이 적용된다.

대략적인 자유도는 가장 가까운 정수로 반올림된다.[citation needed]

장점과 한계

Welch의 t-검정은 학생의 t-검정보다 강력하며, 균일하지 않은 분산과 정규성 하에서의 불균등한 표본 크기에 대해 제1종 오류율을 공칭에 가깝게 유지한다. 게다가, 인구 분산이 같고 표본 크기가 균형을 이룬 경우에도 웰치의 t 검정력은 학생 t 검정력에 근접한다.[2] Welch의 t-검정은 2-표본 이상으로 일반화할 수 있으며,[7] 이는 일원 분산 분석(ANOVA)보다 강력하다.

등분산 사전 검정을 한 후 학생 t 검정 또는 웰치의 t 검정 중에서 선택하는 것은 권장되지 않는다.[8] 오히려 웰치의 t-테스트는 위에서 언급한 학생 t-테스트를 실질적으로 불이익 없이 직접 적용할 수 있다. Welch의 t-검정은 치우친 분포와 큰 표본 크기에 대해 견고하게 유지된다.[9] 신뢰도는 Welch의 t-검정을 수행할 수 있는 왜곡된 분포와 작은 표본에 대해 감소한다.[10]

다음의 세 가지 예는 웰치의 t-테스트와 학생의 t-테스트를 비교한 것이다. 표본은 R 프로그래밍 언어를 사용한 랜덤 정규 분포에서 추출한 것이다.

세 가지 예에서 모두 모집단 평균은 = 2= 이었다

첫 번째 예는 등분산( = =σ = {\ \}^{동일한 크기 1 =N2= }={15 A1과 A2는 두 개의 랜덤 표본을 나타낸다.

The second example is for unequal variances (, ) and unequal sample sizes (, ). 표본이 작을수록 분산이 크다.

The third example is for unequal variances (, ) and unequal sample sizes (, ). 표본이 클수록 분산:

참조 p-값은 동일한 모집단 평균의 귀무 가설( 1- 2= 에 대한 t 통계 분포를 시뮬레이션하여 얻었다. 결과는 아래 표에 두 개의 꼬리 p-값으로 요약되어 있다.

샘플 A1 샘플 A2 학생 t-테스트 웰치의 t-테스트
1 15 20.8 7.9 15 23.0 3.8 −2.46 28 0.021 0.021 −2.46 24.9 0.021 0.017
2 10 20.6 9.0 20 22.1 0.9 −2.10 28 0.045 0.150 −1.57 9.9 0.149 0.144
3 10 19.4 1.4 20 21.6 17.1 −1.64 28 0.110 0.036 −2.22 24.5 0.036 0.042

Welch의 t-검사와 학생 t-검정은 두 표본의 분산과 표본 크기가 동일할 때 동일한 결과를 얻었다(예 1). 그러나 분산이 동일한 모집단의 데이터를 표본으로 추출하는 경우 표본 분산이 서로 다르며, 두 t 검정의 결과도 마찬가지라는 점에 유의하십시오. 따라서 실제 데이터로, 두 테스트는 거의 항상 다소 다른 결과를 제공할 것이다.

분산이 같지 않은 경우, 학생 t-검정은 작은 표본의 분산이 클 때 p-값(예 2)을 낮추고, 큰 표본의 분산이 클 때 p-값을 높였다(예 3). 불균등 분산의 경우 Welch의 t-검정은 p-값을 시뮬레이션 p-값에 가깝게 제공했다.

소프트웨어 구현

언어/프로그램 함수 문서화
리브레오피스 TTEST(Data1; Data2; Mode; Type) [11]
매트랩 ttest2(data1, data2, 'Vartype', 'unequal') [12]
Microsoft Excel 이전 2010(학생 T 테스트) TTEST(array1, array2, tails, type) [13]
Microsoft Excel 2010 이상(학생의 T 테스트) T.TEST(array1, array2, tails, type) [14]
Minitab 메뉴를 통해 액세스 가능 [15]
SAS(소프트웨어) 기본 출력 위치 proc ttest ("Satterthwaite"라는 레이블)
Python(타사 라이브러리 SciPy를 통해) scipy.stats.ttest_ind(a, b, equal_var=False) [16]
R t.test(data1, data2, alternative="two.sided", var.equal=FALSE) [17]
하스켈 Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2 [18]
JMP Oneway( Y( YColumn), X( XColumn), Unequal Variances( 1 ) ); [19]
줄리아. UnequalVarianceTTest(data1, data2) [20]
스타타 ttest varname1 == varname2, welch [21]
Google 시트 TTEST(range1, range2, tails, type) [22]
그래프패드 프리즘 그것은 t 테스트 대화 상자의 선택이다.
IBM SPSS 통계 메뉴의 옵션 [23][24]
GNU 옥타브 welch_test(x, y) [25][26]

참고 항목

참조

  1. ^ a b Welch, B. L. (1947). "The generalization of "Student's" problem when several different population variances are involved". Biometrika. 34 (1–2): 28–35. doi:10.1093/biomet/34.1-2.28. MR 0019277. PMID 20287819.
  2. ^ a b c Ruxton, G. D. (2006). "The unequal variance t-test is an underused alternative to Student's t-test and the Mann–Whitney U test". Behavioral Ecology. 17 (4): 688–690. doi:10.1093/beheco/ark016.
  3. ^ a b Derrick, B; Toher, D; White, P (2016). "Why Welchs test is Type I error robust" (PDF). The Quantitative Methods for Psychology. 12 (1): 30–38. doi:10.20982/tqmp.12.1.p030.
  4. ^ 7.3.1.프로세스가 동일한 평균을 가지고 있는가?, 엔지니어링 통계 핸드북, NIST. (온라인 소스가 2021-07-30에 액세스)
  5. ^ 2-표본 t-검정에서의 자유도에 대한 새터스와이트 공식(7페이지)
  6. ^ 예이츠, 무어, 그리고 스타네스, 통계학의 실천, 제3편, 페이지 792. W.H. Freeman and Company, 41 Madison Avenue, 뉴욕, NY 10010의 저작권 2008
  7. ^ Welch, B. L. (1951). "On the Comparison of Several Mean Values: An Alternative Approach". Biometrika. 38 (3/4): 330–336. doi:10.2307/2332579. JSTOR 2332579.
  8. ^ Zimmerman, D. W. (2004). "A note on preliminary tests of equality of variances". British Journal of Mathematical and Statistical Psychology. 57 (Pt 1): 173–181. doi:10.1348/000711004849222. PMID 15171807.
  9. ^ Fagerland, M. W. (2012). "t-tests, non-parametric tests, and large studies—a paradox of statistical practice?". BMC Medical Research Methodology. 12: 78. doi:10.1186/1471-2288-12-78. PMC 3445820. PMID 22697476.
  10. ^ Fagerland, M. W.; Sandvik, L. (2009). "Performance of five two-sample location tests for skewed distributions with unequal variances". Contemporary Clinical Trials. 30 (5): 490–496. doi:10.1016/j.cct.2009.06.007. PMID 19577012.
  11. ^ "Statistical Functions Part Five - LibreOffice Help".
  12. ^ "Two-sample t-test - MATLAB ttest2 - MathWorks United Kingdom".
  13. ^ http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx
  14. ^ "T.TEST function".
  15. ^ 2-표본 t 검정에 대한 개요 - Minitab: — Minitab 버전 18에 대한 공식 문서. 2020-09-19.
  16. ^ "Scipy.stats.ttest_ind — SciPy v1.7.1 Manual".
  17. ^ "R: Student's t-Test".
  18. ^ "Statistics.Test.StudentT".
  19. ^ https://www.jmp.com/support/help/
  20. ^ "Welcome to Read the Docs — HypothesisTests.jl latest documentation".
  21. ^ "Stata 17 help for ttest".
  22. ^ "T.TEST - Docs Editors Help".
  23. ^ 제러미 마일즈: 등분산 t 검정 또는 U Mann-Whitney 검정?, 2014-04-11에 액세스
  24. ^ 1-표본 테스트 — SPSS Statistics 버전 24에 대한 공식 문서. 2019-01-22 접속.
  25. ^ "Function Reference: Welch_test".
  26. ^ Excel 테스트