그루브스 검정
Grubbs's test통계에서 그루브스의 시험이나 그루브스 시험(Frank[1] E. Grubbs, 1950년 이 시험을 발행한 Frank E. Grubs의 이름을 딴 것)은 최대 표준화 잔차 시험이나 극단적 학생화 편차 시험으로 알려져 있으며, 정규 분포 모집단에서 나온 것으로 가정되는 일변량 데이터 집합에서 특이치를 검출하는 데 사용되는 시험이다.
정의
Grubbs의 검정은 정규성의 가정에 근거한다.즉, Grubbs 시험을 적용하기 전에 먼저 데이터가 정규 분포에 의해 합리적으로 근사하게 추정될 수 있는지 검증해야 한다.[2]
그루브스의 테스트는 한 번에 한 특이치씩을 검출한다.이 특이치는 데이터 집합에서 삭제되며 특이치가 감지되지 않을 때까지 테스트를 반복한다.그러나 다중 반복은 검출 확률을 변경하며, 대부분의 점을 특이치로 자주 태그하기 때문에 6개 이하의 표본 크기에 대해서는 시험을 사용해서는 안 된다.[3]
Grubbs의 검정은 다음과 같은 가설에 대해 정의된다.
- H0: 데이터 집합에 특이치가 없음
- Ha: 데이터 집합에 특이치가 정확히 하나 있음
Grubbs 검정 통계량은 다음과 같이 정의된다.
표본 평균과 표준 편차를 나타내는 Y과({\ s을(를) 각각 사용하여.Grubbs 검정 통계량은 표본 표준 편차의 단위로 표본 평균에서 가장 큰 절대 편차다.
이것은 양면 검정인데, 특이치가 없다는 가설이 유의 수준 α일 경우 기각된다.
자유도 2도 및 유의 수준 α/(2N)으로 t 분포의 임계 상한 값을 나타낸다α/(2N),N−2.
단면 케이스
그럽스 테스트는 α/(2N)를 α/N으로 대체하는 단측 테스트로도 정의할 수 있다.최소값이 특이치인지 여부를 검정하기 위해 검정 통계량은
Y는 최소값을min 나타낸다.최대값이 특이치인지 여부를 검정하려면 검정 통계량은
Y는 최대값을max 나타낸다.
관련 기법
특이치를 검출하기 위해 몇 가지 그래픽 기법을 사용할 수 있으며 사용해야 한다.단순 런 시퀀스 그림, 상자 그림 또는 히스토그램은 명백히 벗어난 점을 표시해야 한다.정규 확률도 또한 유용할 수 있다.
참고 항목
참조
- ^ Grubbs, Frank E. (1950). "Sample criteria for testing outlying observations". Annals of Mathematical Statistics. 21 (1): 27–58. doi:10.1214/aoms/1177729885.
- ^ 엔지니어링 및 통계 핸드북에서 인용한 항목 1.3.5.17, http://www.itl.nist.gov/div898/handbook/eda/section3/eda35h.htm
- ^ Adikaram, K. K. L. B.; Hussein, M. A.; Effenberger, M.; Becker, T. (2015-01-14). "Data Transformation Technique to Improve the Outlier Detection Power of Grubbs' Test for Data Expected to Follow Linear Relation". Journal of Applied Mathematics. 2015: 1–9. doi:10.1155/2015/708948.
추가 읽기
- Grubbs, Frank (February 1969). "Procedures for Detecting Outlying Observations in Samples". Technometrics. Technometrics, Vol. 11, No. 1. 11 (1): 1–21. doi:10.2307/1266761. JSTOR 1266761.
- Stefansky, W. (1972). "Rejecting Outliers in Factorial Designs". Technometrics. Technometrics, Vol. 14, No. 2. 14 (2): 469–479. doi:10.2307/1267436. JSTOR 1267436.
이 글은 국립표준기술원 웹사이트 https://www.nist.gov의 공공 도메인 자료를 통합한 것이다.