샤피로-윌크 테스트

Shapiro–

샤피로-윌크 검정은 정규성 검정입니다. 1965년 새뮤얼 샌포드 샤피로마틴 윌크에 의해 출판되었습니다.[1]

이론.

샤피로-Wilk 검정에서는 표본 x1, ..., xn 정규 분포 모집단에서 왔다는 귀무 가설을 검정합니다. 검정통계량은

어디에

  • 첨자 인덱스 i를 둘러싸는 괄호가 있는 것은 i번째 순서 통계량, 즉 샘플의llest 번호입니다({\i}}와 혼동하지 마십시오).
  • ( + ⋯ + x n ) / n {\displaystyle {\overlin {x}}=\left(x_{1}+\cdots +x_{n}\right})/n}이 표본 평균입니다.

계수는 다음과 같습니다.[1]

여기서 C벡터 놈입니다.[2]

그리고 벡터 m,

는 표준 정규 분포에서 샘플링된 독립적이고 동일한 분포를 갖는 랜덤 변수차수 통계량기대 값으로 구성됩니다. 마지막으로 이러한 정규 차수 통계량의 공분산 행렬입니다.[3]

분포에 대한 이름이 없습니다 통계에 대한 컷오프 값은 몬테카를로 시뮬레이션을 통해 계산됩니다.[2]

해석

이 검정의 귀무 가설은 모집단이 정규 분포를 따른다는 것입니다. 따라서 p 이 선택한 알파 수준보다 작으면 귀무 가설이 기각되고 검정된 데이터가 정규 분포를 따르지 않는다는 증거가 있습니다. 반면 p 값이 선택한 알파 수준보다 크면 (데이터가 정규 분포 모집단에서 왔다는) 귀무 가설을 기각할 수 없습니다(예: 알파 수준이 .05인 경우 p 값이 다음인 데이터 집합).05는 데이터가 정규 분포 모집단에서 가져온 것이라는 귀무 가설을 기각합니다. 결과적으로 p 값이 .05알파 값보다 큰 데이터 집합은 데이터가 정규 분포 모집단에서 가져온 것이라는 귀무 가설을 기각하지 못합니다.[4]

대부분의 통계적 유의성 검정과 마찬가지로 표본 크기가 충분히 큰 경우 이 검정은 귀무 가설에서 사소한 이탈도 감지할 수 있습니다(즉, 통계적으로 유의한 영향이 있을 수 있지만 실제적으로 유의하기에는 너무 작을 수 있음). 따라서, 효과 크기에 대한 추가 조사(예: 이 경우 Q–Q 그림)가 일반적으로 권장됩니다.[5]

검정력 분석

몬테카를로 시뮬레이션 결과 샤피로는Wilk는 주어진 의미에서 가장 좋은 힘을 가지고 있으며, Shapiro-Wilk, Kolmogorov-Smirnov, 그리고 Lillifors를 비교할 때 Anderson-Darling이 그 뒤를 이었습니다.[6]

근사

Royston은 표본 크기를 50에서 2,000으로 확장한 값을 계산하는 알고리즘을 제공하여 계수 벡터를 계산하는 대안적인 방법을 제안했습니다.[7] 이 기술은 GraphPad Prism, Stata,[8][9] SPSS 및 SAS를 포함한 여러 소프트웨어 패키지에 사용됩니다.[10] Rahman과 Govidarajulu는 샘플 크기를 5,000개까지 더 확장했습니다.[11]

참고 항목

참고문헌

  1. ^ a b p. Shapiro, S. S.; Wilk, M. B. (1965). "An analysis of variance test for normality (complete samples)". Biometrika. 52 (3–4): 591–611. doi:10.1093/biomet/52.3-4.591. JSTOR 2333709. MR 0205384. 593
  2. ^ a b RMD (2022). "The Shapiro-Wilk and related tests for normality" (PDF). Retrieved 2022-06-16.
  3. ^ Davis, C. S.; Stephens, M. A. (1978). The covariance matrix of normal order statistics (PDF) (Technical report). Department of Statistics, Stanford University, Stanford, California. Technical Report No. 14. Retrieved 2022-06-17.
  4. ^ "How do I interpret the Shapiro–Wilk test for normality?". JMP. 2004. Retrieved March 24, 2012.
  5. ^ Field, Andy (2009). Discovering statistics using SPSS (3rd ed.). Los Angeles [i.e. Thousand Oaks, Calif.]: SAGE Publications. p. 143. ISBN 978-1-84787-906-6.
  6. ^ Razali, Nornadiah; Wah, Yap Bee (2011). "Power comparisons of Shapiro–Wilk, Kolmogorov–Smirnov, Lilliefors and Anderson–Darling tests". Journal of Statistical Modeling and Analytics. 2 (1): 21–33. Retrieved 30 March 2017.
  7. ^ Royston, Patrick (September 1992). "Approximating the Shapiro–Wilk W-test for non-normality". Statistics and Computing. 2 (3): 117–119. doi:10.1007/BF01891203. S2CID 122446146.
  8. ^ Royston, Patrick. "Shapiro–Wilk and Shapiro–Francia Tests". Stata Technical Bulletin, StataCorp LP. 1 (3).
  9. ^ 샤피로-Wilk 및 Shapiro-Francia 정규성 검정
  10. ^ Park, Hun Myoung (2002–2008). "Univariate Analysis and Normality Test Using SAS, Stata, and SPSS". [working paper]. Retrieved 29 July 2023.
  11. ^ Rahman und Govidarajulu (1997). "A modification of the test of Shapiro and Wilk for normality". Journal of Applied Statistics. 24 (2): 219–236. doi:10.1080/02664769723828.

외부 링크