Z 테스트

Z-test
Null-hypothesis-region-eng.png

Z-검정귀무 가설에서 검정 통계량의 분포정규 분포로 근사할 수 있는 통계적 검정입니다.Z-검정은 분포의 평균을 검정합니다.신뢰 구간의 각 유의 수준에 대해 Z 검정에는 단일 임계값(예: 5% 두 꼬리가 있는 경우 1.96)이 있으므로 임계값이 표본 크기에 의해 정의되는 학생 t 검정보다 더 편리합니다(해당 자유도를 통해).Z 검정과 학생의 t-검정은 모두 데이터 집합의 유의성을 확인하는 데 도움이 된다는 점에서 유사합니다.그러나 모집단 편차를 확인하기 어렵기 때문에 z-검정은 실제로 거의 사용되지 않습니다.

적용 가능성

중심 한계 정리 때문에 많은 검정 통계량이 큰 표본에 대해 대략적으로 정규 분포를 따릅니다.따라서 표본 크기가 크거나 모집단 분산이 알려진 경우 많은 통계 검정을 근사 Z 검정으로 편리하게 수행할 수 있습니다.모집단 분산을 알 수 없고(따라서 표본 자체에서 추정해야 하며) 표본 크기가 크지 않은 경우(n < 30) 학생의 t-검정이 더 적절할 수 있습니다.

절차.

T가 귀무 가설에서 근사적으로 정규 분포를 따르는 통계량인 경우 Z 검정을 수행하는 방법은 다음과 같습니다.

우선 귀무 가설 하에서 T기대치 μ를 추정하여 T의 표준편차 추정치 s를 구한다.

다음으로 T : tailed 또는 tailed 2의 속성을 결정합니다.

귀무 가설0 H: μμ0대립 가설1 H: μ0 < μ의 경우, 아래쪽/왼쪽 꼬리(한쪽 꼬리)입니다.

귀무 가설0 H: μμ0 대 대립 가설1 H: μ0> μ의 경우, 위/오른쪽 꼬리(한쪽 꼬리)이다.

귀무 가설0 H: μ0 대 대립 가설1 H: μμμ0 경우, 양쪽 꼬리가 있다.

셋째, 표준 점수를 계산합니다.

단꼬리2-꼬리 p 값은 can(Z)(하단/좌측 테스트), φ(-Z)(상단/우측 테스트) 및 2φ(-Z)로 계산할 수 있습니다. 여기서 φ는 표준 정규 분포 함수입니다.

로케이션 테스트에 사용

  1. "Z-검정"이라는 용어는 표본 분산이 알려진 경우 측정값 집합의 평균을 주어진 상수와 비교하는 1-표본 위치 검정을 가리키는 데 자주 사용됩니다.예를 들어 관찰된 데이터1 X, ..., Xn (i) 독립적이고 (ii) 공통 평균 μ를 가지며 (ii) 공통 분산 θ를2 가지면 표본 평균 X는 평균 μ와 분산 n 스타일이다
  2. 귀무 가설은 X의 평균값이 주어진 숫자0 μ라는 것입니다.X - μ가0 크면 귀무 가설을 기각하여 X를 검정 통계량으로 사용할 수 있습니다.
  3. }}표준 Z)s(X− μ 0¯){\displaystyle Z={\frac{({\bar{X}}-\mu_{0})}{s}통계를 계산하려면, 우리는, haveσ2에 대한 우리가 s2를 계산할 수 있는 개산 가치를 아는)σ 2n{\displaystyle s^{2}={\frac{\sigma ^{2}}{n}}}. 일부 응용 프로그램에서 σ2 알려져 있지만, 이거야.i흔치 않습니다.
  4. 샘플 사이즈가 중간 정도이거나 크면 샘플 분산을 ,로2 대체하여 플러그인 테스트를 할 수 있습니다.표본 분산의 불확실성은 설명되지 않기 때문에 결과 테스트는 정확한 Z-검정이 될 수 없다. 그러나 표본 크기가 작지 않은 한 좋은 근사치가 될 것이다.
  5. t-검정은 데이터가 정확히 정규 분포를 따를 때 표본 분산의 불확실성을 설명하는 데 사용할 수 있습니다.
  6. Z-검정과 t-검정의 차이: Z-검정은 표본 크기가 크거나(n>50), 모집단 분산을 알 수 있을 때 사용되며, t-검정은 표본 크기가 작거나(n<50) 모집단 분산을 알 수 없을 때 사용됩니다.
  7. 일반적으로 샘플 크기가 플러그인 테스트의 사용을 정당화할 정도로 큰 것으로 간주되는 보편적 상수는 없습니다.일반적인 경험 규칙: 표본 크기는 50개 이상의 관측치여야 합니다.
  8. 표본 크기가 큰 경우 t-검정 절차는 Z-검정 절차와 거의 동일한 p-값을 제공합니다.
  9. Z-검정으로 수행할 수 있는 다른 위치 검정으로는 2-표본 위치 검정과 쌍체 차이 검정이 있습니다.

조건들

Z-테스트를 적용하려면 특정 조건이 충족되어야 합니다.

  • 방해 모수를 알고 있거나 높은 정확도로 추정해야 합니다(방해 모수의 예로는 1-표본 위치 검정의 표준 편차가 있습니다).Z-검정은 단일 매개변수에 초점을 맞추고 다른 모든 알 수 없는 매개변수는 실제 값으로 고정된 것으로 간주합니다.실제로, Slutsky의 정리에 따라, 방해 매개변수의 일관된 추정치를 정당화할 수 있습니다.그러나 표본 크기가 충분히 크지 않아 이러한 추정치가 상당히 정확하지 않으면 Z-검정이 제대로 수행되지 않을 수 있습니다.
  • 검정 통계량은 정규 분포를 따라야 합니다.일반적으로 중심 한계 정리에 호소하여 검정 통계량이 정상적으로 변화한다고 가정합니다.테스트 통계가 거의 정상적으로 변화하는 시기에 대한 많은 통계 연구가 있다.검정 통계량의 변동이 매우 비정규적인 경우에는 Z 검정을 사용하면 안 됩니다.

위에서 설명한 대로 방해 모수의 추정치를 삽입할 경우 데이터가 샘플링된 방법에 적합한 추정치를 사용하는 것이 중요합니다.하나 또는 두 개의 표본 위치 문제에 대한 Z 검정의 특별한 경우 데이터가 독립적인 표본으로 수집된 경우에만 일반적인 표본 표준 편차가 적절합니다.

상황에 따라서는 불필요한 파라미터의 플러그인 추정치의 변동을 적절히 설명하는 테스트를 고안할 수 있습니다.표본 위치 문제가 1개 또는 2개인 경우 t-검정을 통해 이 작업을 수행할 수 있습니다.

특정 지리적 영역에서 읽기 테스트 점수의 평균과 표준 편차가 각각 100점이고 12점이라고 가정합니다.우리는 96점이라는 평균 점수를 받은 특정 학교의 55명의 학생들의 점수에 관심이 있습니다.우리는 이 평균 점수가 지역 평균보다 상당히 낮은지, 즉 이 학교의 학생들이 지역 전체의 55명의 단순한 무작위 표본과 비교할 수 있는지, 아니면 그들의 점수가 놀라울 정도로 낮은지 물어볼 수 있다.

먼저 평균의 표준 오차를 계산합니다.

여기서 { 모집단 표준 편차입니다.

그런 다음 표본 평균에서 모집단 평균까지의 거리(표준 오차 단위)인 z 점수를 계산합니다.

이 예제에서는 모집단 평균과 분산을 알려진 대로 취급합니다. 이 경우 해당 지역의 모든 학생이 검정된 경우에 적합합니다.모집단 모수를 알 수 없는 경우 대신 학생의 t-검정을 수행해야 합니다.

강의실 평균 점수는 96으로, 모집단 평균 100에서 -2.47 표준 오차 단위입니다.표준 정규 분포 누적 확률 표에서 z 점수를 찾아보면 -2.47 미만의 표준 정규 값을 관측할 확률은 약 0.5 - 0.4932 = 0.0068입니다.이것은 55명의 학생이 모든 수험생 모집단의 단순 랜덤 표본과 유사하다는 귀무 가설의 단측 p-값입니다.양측 p-값은 약 0.014(단측 p-값의 2배)입니다.

또 다른 표현 방법은 확률이 1 - 0.014 = 0.986일 때 55명의 학생으로 구성된 단순 랜덤 표본의 평균 검정 점수가 모집단 평균의 4단위 내에서 나온다는 것입니다.우리는 또한 98.6%의 자신감으로 55명의 수험생이 수험생 모집단의 단순한 무작위 표본과 비슷하다는 귀무 가설을 기각한다고 말할 수 있다.

Z-검정은 55명의 관심 학생이 비슷한 크기의 대부분의 단순 랜덤 표본에 비해 비정상적으로 낮은 평균 검정 점수를 가지고 있음을 나타냅니다.이 분석의 단점은 4점의 효과 크기가 유의한지 여부를 고려하지 않는다는 것이다.교실 대신 평균 점수가 99인 900명의 학생을 포함하는 하위 영역을 고려한다면 거의 동일한 z-점수와 p-값이 관찰될 것이다.이는 표본 크기가 충분히 클 경우 null 값과의 매우 작은 차이가 통계적으로 매우 유의할 수 있음을 나타냅니다.이 문제에 대한 자세한 내용은 통계 가설 테스트를 참조하십시오.

위치 테스트 이외의 Z 테스트

위치 테스트는 가장 친숙한 Z 테스트입니다.모수 통계 모형의 모수에 대한 최대우도 추정에서 다른 등급의 Z-검정이 발생합니다.최대우도 추정치는 특정 조건에서 거의 정규 분포를 따르며 점근 분산을 피셔 정보를 사용하여 계산할 수 있습니다.최대우도 추정치를 표준 오차로 나눈 값은 모수의 모집단 값이 0이라는 귀무 가설에 대한 검정 통계량으로 사용할 수 있습니다.보다 일반적으로, {\style {\theta}}이(가) parameter의 최대우도 추정치이고, hypothes이0 귀무 가설에서 under의 값인 경우,

Z 검정 통계량으로 사용할 수 있습니다.

최대우도 추정치에 Z 검정을 사용하는 경우 표본 크기가 충분히 크지 않으면 정규 근사가 좋지 않을 수 있다는 점에 유의해야 합니다.Z-검정을 사용하기 위해 표본 크기가 얼마나 커야 하는지를 설명하는 단순하고 보편적인 규칙은 없지만, 시뮬레이션을 통해 Z-검정이 주어진 상황에서 적절한지 알 수 있습니다.

Z-검정은 검정 통계량이 관심 귀무 가설에서 정규 분포를 따른다고 주장할 수 있을 때마다 사용됩니다.U 통계량과 같은 많은 비모수 검정 통계량은 충분히 큰 표본 크기에 대해 거의 정규 분포를 따르므로 종종 Z 검정으로 수행됩니다.

「 」를 참조해 주세요.

레퍼런스

  • Sprinthall, R. C. (2011). Basic Statistical Analysis (9th ed.). Pearson Education. ISBN 978-0-205-05217-2.
  • Casella, G., Berger, R. L. (2002)통계적 추론.Duxbury Press.ISBN 0-534-24312-6.
  • 더글러스 C몽고메리, 조지 C룽거(2014).엔지니어용 통계확률 적용.(제6판).John Wiley & Sons, Inc.ISBN 9781118539712, 9781118645062.