던컨의 새로운 다중 범위 테스트

Duncan's new multiple range test

통계에서 던컨의 새로운 다중 범위 검정(MRT)은 데이비드 B가 개발한 다중 비교 절차다. 1955년 던컨Duncan의 MRT는 학생화된 범위 통계 qr 사용하여 평균 집합을 비교하는 다중 비교 절차의 일반 클래스에 속한다.

데이비드 B.던컨은 큰 힘을 가질 수 있는 학생-뉴먼-킬스 방식의 수정으로 이 시험을 개발했다.Duncan의 MRT는 특히 거짓 양성(Type I) 오류를 일으킬 위험이 더 큰 비용을 들여 거짓 음성(Type II) 오류를 방지한다.Duncan의 테스트는 농업과 다른 농업 연구에 일반적으로 사용된다.

시험 결과는 평균의 하위 집합으로, 각 하위 집합 평균이 서로 유의하게 다르지 않은 것으로 밝혀졌다.

정의

가정:
1. 관측된 표본은 각각 "참"의 뜻으로 n 정상 모집단으로부터 독립적으로 그려진 m,m ,. n
2.일반적인 표준 오차 표준 오차는 알 수 없으나, 관측된 수단에 독립적이며 여러 자유도를 바탕으로 한 통상적인 s가 있으며, 2}}. (더 정확히 m , has the property that is distributed as with degrees of freedom, independently of sample means).

테스트의 정확한 정의는 다음과 같다.

평균을 포함하는 각 부분집합과 모든 부분집합의 범위가 = - gamma =( - αp = 1 -α인 경우, n 평균 집합의 두 평균의 차이는 유의하다) property 및 p {\displaystyle 해당 하위 집합의 평균 수입니다.

예외:이 규칙의 유일한 예외는 관련된 두 평균이 모두 유의하지 않은 범위를 갖는 평균의 하위 집합에 포함된 경우 두 평균 간의 차이가 유의하다고 선언할 수 없다는 것이다.

절차

절차는 평균들 간의 일련의 쌍 비교로 구성된다.각 비교는 비교한 두 평균을 분리하는 평균의 수로 정의된 유의 수준 p 에서 수행된다(- 시험은 순차적으로 수행되며, 여기서 시험의 결과는 다음에 수행되는 시험을 결정한다.

시험은 다음 순서로 진행된다: 가장 큰 것 - 가장 작은 것, 가장 큰 것 - 두 번째 것 - 가장 큰 것 - 두 번째 것 - 가장 작은 것 - 두 번째 것 - 가장 작은 것 - 가장 작은 것 등등.

아래에 주어진 한 가지 예외만 제외하고, 각 차이는 해당 최단 유효 범위를 초과할 경우 유의하고, 그렇지 않을 경우 유의하지 않다.여기서 가장 짧은 유의한 범위는 유의한 학생 범위와 표준 오차를 곱한 값이다.최단 유효범위는 , 로 지정되며, 여기서 부분 집합의 숫자 평균이다.이 규칙의 유일한 예외는 관련된 두 평균이 모두 유의하지 않은 범위를 갖는 평균의 하위 집합에 포함된 경우 두 평균 간의 차이가 유의하다고 선언할 수 없다는 것이다.

시험을 수행하기 위한 알고리즘은 다음과 같다.

1.표본 평균의 순위를 가장 큰 값에서 가장 작은 값으로 매긴다. 2.For each  sample mean, largest to smallest, do the following:        2.1 for each sample mean, (denoted ), for smallest up to .        2.1.1 compare  to critical value ,        2.1.2 if  does not exceed the critical value, the subset (가) 크게 다르지 않다고 선언됨: 2.1.2.1 루프 다음 반복으로 이동 2.1.3 그렇지 않으면 루프 2.1로 계속 진행

임계값

Duncan의 다중 범위 테스트는 평균 간 비교를 위한 임계값을 결정하기 위해 학생화된 범위 분포를 이용한다.유의 수준은 해당 평균의 부분 집합 크기에 따라 다르므로 평균 간의 비교가 유의 수준에 따라 다를 수 있다는 점에 유의하십시오.

Let us denote as the quantile of the studentized range distribution, with p observations, and degrees of freedom for the second sample (see studentized range for more informati. r( ,을 규칙으로 주어진 표준 임계값으로 나타내자.

p=2인 경우

기타

The shortest critical range, (the actual critical value of the test) is computed as : . For ->∞, a tabulation exists for an exact value of Q (see link).여기서 주의할 점은 Q와 R에 대한 공지가 문헌 전체에서 같지 않다는 것이다. 여기서 Q는 때때로 가장 짧은 유의한 구간으로 표시되고 R은 학생화된 범위 분포를 위한 유의한 계량형(Duncan의 1955년 논문은 다른 부분에서 모두 공지를 사용한다)이다.

숫자 예제

5가지 치료 수단의 예를 보자.

치료 T1 T2 T3 T4 T5
처리 수단 9.8 15.4 17.6 21.6 10.8
순위 5 3 2 1 4


오차 s= 1 = 표준 오차 추정에 대한 자유도).Q에 대해 알려진 표를 사용하여 (,,α 의 값에 도달한다




이제 다음 공식에 의해 최단 유의한 범위의 값을 얻을 수 있다.

도달:




그런 다음, 관측된 평균 간의 차이를 가장 큰 값과 가장 작은 값에서 시작하여 시험하며, 이는 가장 작은 값 범위 R( )= 과 비교된다다음으로는 가장 큰 것과 두 번째로 작은 것의 차이를 계산하여 R( )= .05.04와 비교한다

관측된 차이가 해당 최단 유의 범위보다 크면 해당 평균 쌍이 유의하게 다르다는 결론을 내린다.관측된 차이가 해당 최단 유의 범위보다 작을 경우 모순을 방지하기 위해 동일한 상위 평균을 공유하는 모든 차이를 대수롭지 않은 것으로 간주한다(구성에 의해 동일한 상위 평균을 공유하는 차이가 더 짧다).

우리의 경우, 비교 결과는 다음과 같다.












(T3,T2)와 (T5,T1)를 제외한 모든 치료 쌍에는 상당한 차이가 있음을 알 수 있다.유의하게 다르지 않은 평균을 나타내는 그래프는 다음과 같다.
T1 T5 T2 T3 T4

자유도에 따른 보호 및 중요도 수준

던컨이 제안한 새로운 다중 범위 테스트는 자유도에 근거한 특별한 보호 수준을 이용한다.γ ,= - 을(를) 두 평균 간의 차이의 유의성을 시험하기 위한 보호 수준이 되도록 한다. 즉, 모집단 평균이 같으면 두 평균 사이의 유의미한 차이가 발견되지 않을 확률이다.Duncan 이유 p는 p-1의 자유도가 p 순위 평균을 시험하기 때문에 p-1 독립 시험을 수행할 수 있으며, 따라서 p-1 독립 시험을 각각 보호 수준 ∆ ,= - 을 사용하여 다음과 같이 한다.

,= = , - 1= ( 1- ) - p - 1 }={p-1 여기서 = - p =

p-1 독립 시험에서 유의미한 차이를 발견하지 못할 확률은 p 모집단이 모두 같다는 가설 에서 각각 보호 수준 2, - =1 - \ \{2,\이다일반적으로: 주어진 평균을 포함하는 각 부분 집합과 모든 부분 의 범위가 {\ _ – 레벨 범위 테스트에 따라 유의하다면 n개의 평균 집합에서 두 개의 평균 사이의 차이는 유의하다. 여기서 p는 해당 부분 집합의 평균 수입니다

= 0. 의 경우 다음과 같이 r의 다양한 값에 대해 보호 수준을 표로 표시할 수 있다.

보호 수준: , : p 을(를) 잘못 기각할 확률
p=2 0.95 0.05
p=3 0.903 0.097
p=4 0.857 0.143
p=5 0.815 0.185
p=6 0.774 0.226
p=7 0.735 0.265

이 절차는 학생화된 범위를 사용하지만, 그의 오류율은 (Tukey's와 마찬가지로) 실험적으로 근거하거나 비교당 근거에 근거하지 않는다.Duncan의 다중 범위 테스트는 패밀리 와이즈 오류율을 제어하지 않는다.자세한 내용은 비판 섹션을 참조하십시오.

Duncan Bayesian 다중 비교 절차

던컨(1965)은 또한 첫 번째 베이시안 다중 비교 절차를 제시했는데, 단방향 레이아웃의 평균들 간의 쌍 비교를 위해서였다.이 다중 비교 절차는 위에서 설명한 것과 다르다.

Duncan의 Bayesian MCP는 순서가 지정된 그룹 평균들 간의 차이를 논의한다. 여기서 해당 통계는 쌍 비교('의미하게 다른' 속성을 가진 하위 집합의 속성에 대해 정의되지 않는다).

Duncan은 두 개 이상의 평균이 동일하다는 결과를 모형화하여 쌍 비교 내에서 또는 전체에서 적층 손실 함수를 사용했다.쌍 비교에서 동일한 손실 함수를 가정할 경우 상수 K를 하나만 지정해야 하며 이는 각 쌍 비교에서 유형 II 오류에 대한 상대적 심각성을 나타낸다.

줄리엣 포퍼 셰퍼(1998)가 수행한 연구는 FWE에 대한 약한 통제를 제공하고 모집단 수단의 분산에 대한 경험적 추정치를 사용하여 Duncan이 제안한 방법이 베이지안적 관점, 최소 위험 방법으로서, 그리고 빈번한 관점 모두에서 좋은 속성을 가지고 있다는 것을 보여주었다.d 평균 전력

또한, 결과는 던컨의 수정 절차와 벤자민이호흐베르크(1995) 거짓 발견률 - 통제 절차 사이의 위험과 평균 전력에서 모두 상당한 유사성을 나타내며, 동일한 약한 가족 오류 통제를 가지고 있다.

비판

던컨의 시험은 헨리 셰페와 존 W를 포함한 많은 통계학자들에게 너무 자유롭다는 비판을 받아왔다. Tukey. Duncan은 실제 세계에서 글로벌 귀무 가설0 H = "모든 수단은 평등하다"는 것이 종종 거짓이기 때문에 전통적인 통계학자들은 아마도 잘못된 귀무 가설을 제1종 오류에 대해 과보호하기 때문에 보다 자유로운 절차가 적절하다고 주장했다.던컨에 따르면, 논의된 문제에 따라 다른 p-mean 비교에 대한 보호 수준을 조정해야 한다.던컨이 1955년 논문에서 논한 예는 2-평균과 3-평균 비교에만 관심이 있을 때 많은 수단(즉 100)의 비교와 일반적인 p-평균 비교(p-평균이 15 이상일 경우)는 특별한 관심이 없다(p가 15 이상일 경우).Duncan의 다중 범위 테스트는 Type I 오류 측면에서 매우 "자유적"이다.다음의 예는 그 이유를 설명한다.

덩컨이 제안한 대로 4호 이하의 하위 집합의 정확한 순위를 가지고 있는 한 사람이 진정으로 관심이 있다고 가정해보자.또한 보호 수준 = 0과(와) 단순 쌍 비교를 수행한다고 가정합시다 전체 평균이 100개인 경우, 검정의 귀무 가설을 살펴보도록 하자.

각 두 평균의 정확한 순위에 대한 가설은( ) 100 2 있다.각 가설의 유의 수준은 - = 이다.

3개 평균의 정확한 순위에 대한 귀무 가설은 ) 3개 있다.각 가설의 유의 수준은 -( ) =

각 4개 평균의 정확한 순위에 대한 귀무 가설은 ) 100 개 있다.각 가설의 유의 수준은 -( ) =

우리가 알 수 있듯이, 이 테스트에는 유형 I 오류와 관련하여 다음과 같은 두 가지 주요 문제가 있다.

  1. Duncan의 테스트는 Newman-Kuuls 절차를 기반으로 하는데, 이 절차는 가족 단위 오류율을 보호하지 않는다(비교 알파 수준당 보호는 하지만).
  2. Duncan의 테스트는 의도적으로 Newman-Keuls 절차의 각 단계에서 알파 (Type I error rate)을 상승시킨다(α α α α α

따라서 논의된 절차는 사용하지 않는 것이 좋다.

던컨은 이후 베이시안 원리에 기초한 던컨-월러 테스트를 개발했다.그것은 귀무 가설의 참일 이전의 확률을 추정하기 위해 F의 획득 값을 사용한다.

문제에 대한 다양한 접근 방식

집단 수단의 유사한 하위 집합을 찾는 문제를 여전히 다루고자 한다면, 다른 해결책이 문헌에서 발견된다.

Tukey의 범위 테스트는 일반적으로 평균 쌍을 비교하는 데 사용되며, 이 절차는 강한 의미에서의 모임별 오류율을 제어한다.

또 다른 해결책은 모든 평균 쌍에 대해 학생의 t-검정을 수행한 다음 FDR 제어 절차를 사용하는 것이다(잘못 거부된 귀무 가설의 예상 비율을 제어하기 위해).

가설 검정을 포함하지는 않지만 하위 집합의 분할 결과를 초래하는 다른 가능한 해결책으로는 클러스터링계층적 클러스터링이 있다.이러한 해결책은 이 방법에서 제시된 접근법과 다르다.

  • 거리/밀도 기반이며 분포 기반은 아니다.
  • 중요한 결과를 얻거나 전체 데이터 집합으로 작업하기 위해 더 큰 평균 그룹이 필요하다.

참조

  • Duncan, D. B. (1955). "Multiple range and multiple F tests". Biometrics. 11 (1): 1–42. doi:10.2307/3001478. JSTOR 3001478.
  • Shaffer, Juliet Popper (1999). "A semi-Bayesian study of Duncan's Bayesian multiple comparison procedure". Journal of Statistical Planning and Inference. 82 (1–2): 197–213. doi:10.1016/S0378-3758(99)00042-7.
  • Berry, Donald A.; Hochberg, Yosef (1999). "Bayesian perspectives on multiple comparisons". Journal of Statistical Planning and Inference. 82 (1–2): 215–227. doi:10.1016/S0378-3758(99)00044-0.
  • Parsad, Rajender. "Multiple comparison Procedures". I.A.S.R.I, Library Avenue, New Delhi 110012. {{cite journal}}:Cite 저널은 필요로 한다. journal=(도움말)
가설 검정에서 범위 및 학생 범위 사용에 대한 표
  • H. Leon Harter, Champaigne, IL; McMaster University, McMaster University, Canada, Hamilton, Hardback - 1997년 10월 27일 출판

외부 링크