더넷의 시험
Dunnett's test통계에서 Dunnett의 검정은 캐나다 통계학자 Charles Dunnett가[2] 개발한 다중 비교 절차로[1], 여러 치료법을 각각 하나의 대조군과 비교하기 위해 개발한 것이다.[3][4]한 대조군에 대한 다중 비교를 다대일 비교라고도 한다.
역사
Dunnett의 테스트는 1955년에 개발되었고,[5] 1964년에 임계값이 업데이트된 표가 발표되었다.[6]
다중 비교 문제
다중 비교, 다중성 또는 다중 시험 문제는 통계적 추론 집합을 동시에 고려하거나 관측된 값에 기초하여 선택한 매개변수의 하위 집합을 주입할 때 발생한다.다중 비교 절차에 대한 모든 논의에서 주요 쟁점은 제1종 오류의 확률에 대한 질문이다.대체 기법들 간의 대부분의 차이는 이러한 오류를 어떻게 통제할 것인가에 대한 다른 접근방식에서 비롯된다.문제는 부분적으로 기술적인 것이지만, 실제로 오류율을 어떻게 정의하고 싶은지, 그리고 가능한 최대 오류율을 얼마만큼 허용할 것인지에 대한 훨씬 더 주관적인 질문이다.[7]Dunnett의 검정은 잘 알려져 있으며 정규성 가정이 타당한 분포로부터 표본을 추출할 때 모든 활성 치료제를 대조군과 동시에 구간 추정 또는 가설 검사에 의해 비교하기 위해 다중 비교 절차에서 널리 사용된다.Dunnett의 테스트는 대조군과 치료군의 다중 비교를 수행할 때 패밀리 와이즈 오류율을 이하에서 유지하도록 설계되었다.[7]
Dunnett의 테스트 사용
다중 비교 문제에 대한 원작은 투키와 셰페에 의해 만들어졌다.그들의 방법은 모든 종류의 쌍별 비교를 고려하는 일반적인 방법이었다.[7]Tukey와 Scheffé의 방법들은 표본 평균들의 집합들 사이에서 어떠한 숫자의 비교도 허용한다.반면 Dunnett의 테스트는 한 그룹을 다른 그룹과만 비교하며 다중 비교 문제의 특별한 경우 즉, 여러 치료 그룹을 단일 대조군 그룹과 쌍으로 비교하는 문제를 다룬다.일반적인 경우 각 쌍을 비교하는 경우 k- 1) / /2서 k는 그룹 수)를 비교하지만, 치료 대 대조군 사례에서는 (- )(k-1)만 비교한다만약 치료와 통제 집단의 경우에 우리가 더 일반적인 투키와 셰페의 방법을 사용한다면, 그것들은 불필요하게 넓은 신뢰 구간을 초래할 수 있다.Dunnett의 검정은 신뢰 구간이 좁아지는 대조군과 치료법을 비교하는 특수 구조를 고려한다.[5]
의료 실험에서 Dunnett의 검사를 사용하는 것은 매우 흔한 일인데, 예를 들어 세 그룹의 동물들에 대한 혈구 수치를 비교하는 일인데, 그 중 하나는 대조군 역할을 하는 반면 나머지 두 개는 두 개의 다른 약물로 치료를 받았다.이 방법의 또 다른 일반적인 용도는 농경학자들 사이에 있다: 농경학자들은 토양에 첨가된 특정 화학물질이 농작물 수확량에 미치는 영향을 연구하기를 원할 수 있기 때문에 일부 플롯은 처리되지 않은 상태로 남겨두고, 화학물질이 토양에 첨가된 플롯(처리 플롯)과 비교할 것이다.
Dunnett의 테스트에 대한 공식 설명
Dunnett의 테스트는 각 실험 또는 치료 그룹에 대한 학생의 t-통계학을 계산하여 수행되며, 통계는 치료 그룹을 단일 대조군과 비교한다.[8][9]각 비교는 공통적으로 동일한 통제력을 가지기 때문에, 절차는 이러한 비교 간의 의존성을 통합한다.특히 t-통계량은 모든 (처리 및 제어) 그룹에 걸쳐 오차에 대한 제곱합을 풀링하여 얻은 오차 분산의 동일한 추정치에서 도출된다.Dunnett 시험에 대한 공식 시험 통계량은 이러한 t-통계량의 절대값에서 가장 크거나(꼬리 2개가 필요한 경우), t-통계 중 가장 음수 또는 양수(꼬리 1개가 필요한 경우)이다.
Dunnett의 테스트에서 우리는 중요한 값의 공통 표를 사용할 수 있지만, 오늘날 R과 같은 많은 통계 패키지에서 더 유연한 옵션을 쉽게 이용할 수 있다.지정된 백분율 포인트에 대한 임계값은 1개 또는 2개 꼬리 테스트 수행 여부, 비교 대상 그룹 수, 전체 시행 횟수 등에 따라 달라진다.
가정
이 분석은 실험 결과가 수치적인 경우를 고려하며, 실험은 p 처리를 대조군과 비교하기 위해 수행된다.The results can be summarized as a set of calculated means of the sets of observations, , while are 처리를 참조하고 의 은(는) 관측치의 제어 세트를 참조하며, 은(는) p+ 1} 관측치의 공통 표준 편차에 대한 독립적인 추정치입니다.+ 1 관측치 집합 X i{\i}}}}은(는) 독립적이며 일반적으로 공통 분산 }}을 의미하며 을 의미한다 에 대해 사용 가능한 가 가정도 있다
계산
Dunnett의 검사의 은p {\ p의 Xi - 0}}}}}-{\ {X_{0 따라서 처리 그룹의 평균과 대조군 평균의 차이를 계산하는 데 기초한 절차다.이 절차를 통해 모든 문 X - X 이(가) 동시에 정확할 확률은 지정된 값 과 동일함을 보장한다 참 값에 대한 한쪽의 신뢰 구간을 계산할 때처리 평균과 제어 그룹 간의 차이의 은(는) 실제 값이 해당 구간의 상한(또는 하한)보다 작을 확률을 구성한다. 신뢰 구간을 계산할 때 P P는 참 값이 상한과 하한 사이에 있을 확률을 구성한다.
첫째, 사용 가능한 N 관측치를 로 표시한다. = 과 j= and estimate the common variance by, for example: when is the mean of group 및 그룹의 수입니다. 및 = -(+ 1) 자유도.앞에서 언급한 바와 같이 는 신뢰 구간에 하는 m m 의 차이가 각각에 대해 별도의 신뢰 한계를 얻으려고 한다. 과(와) 같다
는 p{\} 처리 그룹과 하나의 제어 그룹이 있는 일반적인 경우를 고려할 것이다.다음 사항을 기록하십시오.
또한 다음과 같이 쓰겠다.= 자유도가 n인 학생의 t-통계 분포를 따른다. 처리 효과 m - , = ) (에 대한 공동 신뢰 계수 을(를) 가진 신뢰 하한계는 다음과 같다.
and the constants are chosen so that . Similarly, the upper limits will be given by:
양쪽 방향으로 m - 0 m_{를) 바인딩하는 경우 다음 간격을 취할 수 있다.
언제 나는{\displaystyle d_{나는}"}″ dPr시 b(t1<>d1′., 터 p<>dp′))P{Prob(t_{1}<>d_{1}'..., t_{p}<>d_{p}')=P\displaystyle}을 만족시키기. d의 특정한 값에 대한 해결책은 나는 나는 ′ 양쪽 검정과 d에{\displaystyle d_{나는}"}″ 선택된다.{\displa표에는 단측검사에 대한 가 제시되어 있다.[5]1964년에 중요 가치의 업데이트된 표가 발표되었다.[6]
예
패브릭의[5] 파괴강도
다음 예는 빌라르스[6]가 제공한 예에서 개작한 것이다.이 데이터는 표준 제조 방법과 비교하여 세 가지 다른 화학 공정에 의해 처리된 직물의 파괴 강도에 대한 측정을 나타낸다.
표준의 | 공정 1 | 공정2 | 공정3 | |
---|---|---|---|---|
55 | 55 | 55 | 50 | |
47 | 64 | 49 | 44 | |
48 | 64 | 52 | 41 | |
평균 | 50 | 61 | 52 | 45 |
분산 | 19 | 27 | 9 | 21 |
여기서 p=3과 N=3이다.평균 분산은 = 이며 이는 (p+1)(N-1)=8 자유도를 갖는 4개 세트의 공통 분산을 추정하는 것이다.이는 다음과 같이 계산할 수 있다.
2}+52^{2 { .
표준 편차는 = = s이며 , 두 평균 간의 차이의 추정 표준 오차는 s = 4 = 3. s.
The quantity which must be added to and/or subtracted from the observed differences between the means to give their confidence limits has been called by Tukey an "allowance" and is given by , where t drawn from the Multivariate t-distribution, or can be obtained from Dunnett's Table 1 한 측면 한계를 원하는 경우 또는 Dunnett의 표 2에서 양 측면 한계를 원하는 경우.p=3과 d.f.=8의 경우 t=2.42는 한쪽 측면 한계의 경우, t=2.88은 p=95%의 경우 양 측면 한계의 경우 t=2.88이다.p=99%의 신뢰가 필요한 경우 표에서 t의 유사한 값을 결정할 수 있다.단측 한계의 경우 허용오차는 A=(2.42)(3.56)=9이며 실험자는 다음과 같이 결론을 내릴 수 있다.
- 프로세스 1을 사용한 파단 강도는 최소 - - 9= . 스타일 를 초과한다
- 프로세스 2를 사용하는 파단 강도는 최소 - - 9=- s만큼 표준을 초과한다
- 프로세스 3을 사용한 파단 강도는 최소 - - 9=- 만큼 표준을 초과한다
위의 세 가지 결론으로 구성된 공동선언문은 95% 신뢰계수를 가지고 있다. 즉 장기적으로는 그러한 공동선언의 95%가 실제로 정확할 것이다.세 가지 차이에 대한 상한은 유사한 방식으로 얻을 수 있다.양면 한계의 경우 허용오차는 A=(2.94)(3.56)=11이며 실험자는 다음과 같이 결론을 내릴 수 있다.
- 프로세스 1을 사용한 파단 강도는 다음 사이의 양만큼 표준을 초과한다.
및 - + =
- 프로세스 2를 사용한 파단 강도는 다음 사이의 양만큼 표준을 초과한다.
- - =- s 및 - + = .
- 프로세스 3을 사용한 파단 강도는 다음의 양만큼 표준을 초과한다.
- - =- 및 - + = 이 세 가지 문장에 대한 공동 신뢰 계수는 95% 이상이다.(표 2a와 2b를 계산하여 얻은 근사치 때문에 t의 표 값은 필요 이상으로 다소 커서 실제 p의 달성도가 95와 99%보다 약간 더 크다.표 1a와 1b)를 계산할 때 그러한 근사치는 만들어지지 않았다.
참조
- ^ 업튼 G. & 쿡 I. (2006년)영국 옥스퍼드 대학 출판부의 통계 사전 2e.
- ^ Rumsey, Deborah (2009-08-19). Statistics II for Dummies. Wiley. p. 186. Retrieved 2012-08-22.
dunnett's test developed by.
- ^ 에버렛 B.S. & Shrondal A. (2010)케임브리지 통계사전, 4e, 영국 케임브리지 대학 출판부.
- ^ "Statistical Software University of Kentucky Information Technology". Uky.edu. Archived from the original on 2012-07-31. Retrieved 2012-08-22.
- ^ a b c d Dunnett C. W. (1955). "A multiple comparison procedure for comparing several treatments with a control". Journal of the American Statistical Association. 50: 1096–1121. doi:10.1080/01621459.1955.10501294.
- ^ a b Dunnett C. W.(1964년). "제어장치와의 다중 비교를 위한 새로운 표", 생물측정학, 20:482–491.
- ^ a b c 데이비드 C.Howell, "통계학적 심리학 방법" 8번째 에디션
- ^ Dunnett의 테스트, HyperStat Online:통계 과정 도움말을 위한 통계 입문 교재 및 온라인 튜토리얼
- ^ 다양한 테스트의 역학 - 생물통계 BI 345 2010-06-01 Wayback Machine, Saint Anselm College에 보관