검정통계량

Test statistic

검정 통계량통계 가설 검정에서 사용되는 통계량(표본에서 도출된 수량)이다.[1] 가설 검정은 일반적으로 검정 통계량의 관점에서 지정되며, 데이터를 가설 검정을 수행하는 데 사용할 수 있는 하나의 값으로 감소시키는 데이터 집합의 숫자 요약으로 간주된다. 일반적으로 시험 통계량은 관측된 데이터 내에서 귀무 가설과 대립 가설(대안이 규정된 경우)을 구별할 수 있는 행동을 정량화하거나 명시적으로 명기된 대립 가설이 없는 경우 귀무 가설을 특징짓는 방식으로 선택 또는 정의된다.

검정 통계량의 중요한 특성은 귀무 가설에서의 표본 분포가 정확히 또는 근사적으로 계산 가능해야 하며, 이를 통해 p-값을 계산할 수 있어야 한다는 것이다. 검정 통계량서술적 통계량의 동일한 특성 중 일부를 공유하며, 많은 통계량을 검정 통계량과 서술적 통계로 사용할 수 있다. 그러나, 서술적 통계량의 주요 품질은 쉽게 해석할 수 있다는 데 있는 반면, 시험 통계량은 특히 통계적 시험에 사용하기 위한 것이다. 표본 범위와 같은 일부 유용한 기술 통계량은 표본 분포를 결정하기 어렵기 때문에 좋은 검정 통계량을 만들지 못한다.

널리 사용되는 두 가지 시험 통계량은 t-통계학적 통계량과 F-검정이다.

동전이 공정한지 여부를 시험하는 것이 과제라고 가정하자(즉, 머리나 꼬리를 생산할 확률이 동일하다). 동전을 100번 뒤집고 결과를 기록하면 원시 데이터는 앞면과 뒷면 100개의 시퀀스로 나타낼 수 있다. 꼬리 획득의 한계 확률에 관심이 있다면 꼬리를 생산한 100개의 플립 중 T 숫자만 기록하면 된다. 그러나 T는 다음 두 가지 방법 중 하나로 시험 통계로도 사용될 수 있다.

  • 귀무 가설에서 T의 정확한 표본 분포는 모수가 0.5와 100인 이항 분포다.
  • T 값은 50의 귀무 가설에서 기대값과 비교할 수 있으며, 표본 크기가 크기 때문에 정규 분포를 T의 표본 분포 또는 수정된 시험 통계량 T-50의 표본 분포에 대한 근사치로 사용할 수 있다.

이러한 표본 분포 중 하나를 사용하여 동전이 공정하다는 귀무 가설에 대해 한쪽 꼬리 또는 양쪽 꼬리 p-값을 계산할 수 있다. 이 경우 검정 통계량은 100개의 숫자 집합을 검정에 사용할 수 있는 단일 숫자 요약으로 줄인다는 점에 유의하십시오.

공통 테스트 통계량

표본 1-표본 검정은 표본이 가설의 모집단과 비교될 때 적절하다. 모집단 특성은 이론으로 알거나 모집단에서 계산한다.

2-표본 시험은 과학적으로 통제된 실험의 전형적으로 실험 표본과 대조 표본인 두 표본을 비교하는 데 적합하다.

쌍체 검정은 중요한 변수를 제어할 수 없는 두 표본을 비교하는 데 적합하다. 두 세트를 비교하는 대신, 멤버가 샘플 사이에 짝을 이루어 멤버 간의 차이가 샘플이 된다. 일반적으로 차이의 평균은 0과 비교된다. 쌍체 차이 검정이 적절한 경우에 대한 일반적인 시나리오는 시험 대상의 단일 세트에 적용되는 것이 있고 시험의 효과를 확인하기 위한 것이다.

Z-검정은 정규성과 알려진 표준 편차에 관한 엄격한 조건 하에서 평균을 비교하는 데 적합하다.

t-검정은 완화된 조건 하에서 평균을 비교하는 데 적합하다(적은 것으로 가정한다).

비율 검정은 평균 검정(50% 비율)과 유사하다.

카이-제곱 검정에서는 서로 다른 용도에 대해 동일한 계산과 동일한 확률 분포를 사용한다.

  • 분산에 대한 카이 제곱 검정은 정규 모집단의 분산이 지정되어 있는지 여부를 결정하는 데 사용된다. 귀무 가설은 그렇게 한다는 것이다.
  • 독립성에 대한 카이-제곱 검정은 두 변수가 연관되어 있는지 또는 독립적인지를 결정하는 데 사용된다. 변수는 숫자보다는 범주형이다. 왼손잡이가 높이(또는 높이)와 상관관계가 있는지 여부를 결정하는 데 사용할 수 있다. 귀무 가설은 변수가 독립적이라는 것이다. 계산에 사용되는 숫자는 관측 및 예상 발생 빈도(비상사태표)이다.
  • 적합도 시험은 데이터에 적합한 곡선의 적합성을 결정하는 데 사용된다. 귀무 가설은 곡선 적합성이 적절하다는 것이다. 평균 제곱 오차를 최소화하기 위해 곡선 형태를 결정하는 것이 일반적이므로 적합도 계산이 오차 제곱을 합하는 것이 적절하다.

F-검정(분산 분석, 분산 분석)은 범주별 데이터 그룹화가 유의한지 여부를 결정할 때 일반적으로 사용된다. 클래스 내 왼손잡이 시험 점수의 분산이 클래스 전체의 분산보다 훨씬 작을 경우, 집단으로 왼손잡이를 연구하는 것이 유용할 수 있다. 귀무 가설은 두 개의 분산이 동일하므로 제안된 그룹화는 의미가 없다는 것이다.

아래 표에서 사용된 기호는 표 하단에 정의되어 있다. 다른 많은 시험들은 다른 기사에서 찾을 수 있다. 시험 통계가 적절하다는 증거가 있다.[2]

이름 공식 가정 또는 참고 사항
1-표본 z-검정 (일반 모집단 orn large) 및 σ알고 있음.

(z평균의 표준 편차에 대한 평균으로부터의 거리) 비정규 분포의 경우 k에 대해 k 표준 편차 내에 속하는 모집단의 최소 비율을 계산할 수 있다(Chebyshev의 불평등 참조).

2-표본 z-검정 정규 모집단 및 독립 관측치, σ1 및 σ을2 알 수 있다[clarification needed].
1-표본 t-검정

(일반 모집단 또는 n large) 및 알 수 없음
쌍체 t 검정

(차이의 정규 모집단 또는 큰 모집단 n개) 수 없음
2-표본 합동 t-검정, 등분산


[3]

(정규 모집단 또는 n1 + n2 > 40) 및 독립 관측치 σ1 = σ2 알 수 없음
2-표본 추출되지 않은 t-검정, 불균등한 분산(Welch의 t-검정)

[3]

(정규 모집단 또는 n12 + n > 40) 독립 관측치 및 σ1 σ2 둘 다 알 수 없음
1-비율 z 검정 np .0 > 10 n (1 - p0) > 10이며, SRS(단순 무작위 샘플)이다. 참고 사항을 참조하십시오.
z-검정, H : = p }}:

n1 p1 > 5와 n(11 - p1) > 522 n > 5와 n(12 - p2) > 5와 독립 관측치, 주석을 참조한다.
d 0 > 0 {\d_{}에 대해 풀링 해제됨 n1 p1 > 5와 n(11 - p1) > 522 n > 5와 n(12 - p2) > 5와 독립 관측치, 주석을 참조한다.
분산에 대한 카이-제곱 검정 df = n-1

• 정상 인구

적합도에 대한 카이-제곱 검정 df = k - 1 - # 모수가 추정되며, 이들 중 하나는 고정되어야 한다.

• 모든 예상 카운트는 최소 5이다.[4]

• 모든 예상 카운트는 1보다 작으며 예상 카운트의 20% 이하가 5보다[5] 작음

분산의 동일성에 대한 2-표본 F 검정 정규 모집단
1 2 2}\s_}^{2}^{2 H를0 F> (/, 1- 1, - ) }-)에 대해 거부하십시오
의 회귀 t-검정: R = 0 R > / 2,- - ) 에 대한 거부0 H
*절차에 대한 1번 추론, k 항에는 독립 변수가 포함되어 있다.
일반적으로 첨자 0은 귀무 가설인 H로부터0 얻은 값을 나타내며, 이 값은 시험 통계량을 구성할 때 가능한 한 많이 사용해야 한다. 기타 기호의 정의:
  • 유형 I 오류 확률(사실상 참일 때 귀무 가설 거부)
  • = 표본 크기
  • } = 표본 1 크기
  • }} = 표본 2 크기
  • = 표본 평균
  • = 귀무 가설의 모집단 평균
  • } = 모집단 1 평균
  • = 모집단 2 평균
  • = 모집단 표준 편차
  • }}= 인구 분산
  • = 표본 표준 편차
  • = 합(k 숫자)
  • s = 표본 분산
  • } = 표본 1 표준 편차
  • }} = 표본 2 표준 편차
  • = t 통계량
  • f = 자유도
  • {\ = 차이의 표본 평균
  • = 귀무 가설의 모집단 평균 차이
  • 스타일 = 차이의 표준 편차
  • }}= Chi-squared 통계량
  • p}} = x/n = 표본 비율(별도가 없는 경우)
  • = 귀무 가설의 모집단 비율
  • } = 비율 1
  • }} = 비율 2
  • = 가설에서의 비율 차이
  • { 1, = 최소1 n 2 n
  • = F 통계량

참고 항목

참조

  1. ^ Berger, R. L.; Casella, G. (2001) 통계추론, Duxbury Press, Second Edition (p.374)
  2. ^ Loveland, Jennifer L. (2011). Mathematical Justification of Introductory Hypothesis Tests and Development of Reference Materials (M.Sc. (Mathematics)). Utah State University. Retrieved April 30, 2013. 추상적: "가설 시험에 대한 네이만-페르손 접근법에 초점을 맞췄다. 네이만-페어슨 접근방식의 간략한 역사적 전개는 기준 자료에서 다룬 각 가설 검정에 대한 수학적인 증거가 뒤따른다." 그 증명들은 Neyman과 Pearson에 의해 도입된 개념을 참조하지 않고, 대신에 전통적인 시험 통계량은 그것들에 귀속된 확률 분포를 가지고 있다는 것을 보여준다. 그래서 그러한 분포들이 정확하다고 가정하는 유의성 계산. 논문 정보도 2013년 4월 현재 mathnstats.com에 게재돼 있다.
  3. ^ a b NIST 핸드북: 동일 평균에 대한 2-표본 t-검정
  4. ^ Steel, R. G. D. 및 Torrie, J. H. 생물 과학에 대한 특별 참조를 가진 통계 원리 절차, McGraw Hill, 1960, 페이지 350.
  5. ^ Weiss, Neil A. (1999). Introductory Statistics (5th ed.). pp. 802. ISBN 0-201-59877-9.
  6. ^ NIST 핸드북: 두 표준 편차의 동일성에 대한 F-시험(시험 분산과 동일한 표준 편차 시험)
  7. ^ Steel, R. G. D. 및 Torrie, J. H. 생물 과학에 대한 특별 참조를 가진 통계 원리 절차, McGraw Hill, 1960, 288페이지)