윌콕슨 부호 순위 검정
Wilcoxon signed-rank testWilcoxon 부호 순위 검정은 데이터 표본을 기반으로 모집단의 위치를 검정하거나 일치하는 [1]두 표본을 사용하여 두 모집단의 위치를 비교하는 데 사용되는 비모수 통계 가설 검정입니다.1-표본 버전은 1-표본 학생 t-검정의 [2]목적과 유사한 역할을 합니다.일치하는 두 표본의 경우 쌍체 학생의 t 검정("일치 쌍에 대한 t 검정" 또는 "의존 표본에 대한 t 검정"이라고도 함)과 같은 쌍체 차이 검정입니다.예를 들어 모집단의 중위수가 0이 아닌지 또는 한 모집단의 표본이 다른 모집단의 표본보다 50% 이상 큰지 여부를 검정하려는 경우 Wilcoxon 검정은 t-검정의 좋은 대안이 될 수 있습니다.
역사
이 검정의 이름은 단일 논문에서 [3]두 개의 독립적인 표본에 대한 순위 합산 검정을 제안한 프랭크 윌콕슨(1892–1965)의 이름을 따왔다.이 테스트는 시드니 시겔(1956)이 영향력 있는 비모수 [4]통계 교과서에서 대중화했다.Siegel은 검정 통계량에 기호 T를 사용했으며, 따라서 이 검정을 Wilcoxon T-검정이라고 부르기도 합니다.
테스트 절차
부호 순위 테스트에는 두 가지 종류가 있습니다.이론적 관점에서 쌍체 표본 검정은 데이터를 1-표본 검정의 상황으로 변환하여 수행되므로 1-표본 검정이 보다 기초적입니다.그러나 서명 순위 검정의 대부분의 실용적인 적용은 쌍체 데이터에서 발생한다.
쌍으로 구성된 샘플 테스트의 경우 데이터는 샘플1, 1 ( n n { \로 구성됩니다. 각 샘플은 한 쌍의 측정값입니다.가장 간단한 경우, 측정치는 구간 척도에 있습니다.그런 다음 각 숫자쌍( 을 바꿈으로써 쌍으로 구성된 샘플 테스트를 1-샘플 테스트로 변환할 수 있습니다.는 그 - X_[5]로 구분되며, 일반적으로 쌍 간의 차이를 순위 매길 수 있어야 한다.따라서 데이터는 순서형 척도보다 더 많은 정보를 전달하지만 구간 [6]척도보다 작을 수 있는 척도인 순서형 메트릭 척도에 있어야 합니다.
1-샘플 테스트의 데이터는 X , (\의 일련의 실수 입니다.단순히 말하면 샘플의 절대값이 구별되고 샘플이 0이 되지 않는다고 가정합니다.(제로와 넥타이에는 몇 가지 문제가 있습니다.아래를 참조해 주십시오).테스트는 [7][8]다음과 같이 수행됩니다.
- 을를) 합니다.
- 1, 및 이 정렬 목록을 사용하여 , (\ 가장 작은 관찰의 순위는 1, 다음으로 작은 순위는 2입니다.
- sgn{ 인 1 {\ { 1 {\operatorname {}(x) 1을 테스트 통계는 부호 있는 랭크 T(\T
- 와 귀무 가설의 분포를 하여 pp 을 생성한다
R { R _ { the X \ X }。 :{, , } { , , } \ \ 의 가 랭크 정의되어 있습니다.( 1)< < )( ) \ _ { \ n ) < \ style X _ { \ ( n )、 i = all all all all
부호화된 순위 T(\ T는 다른 두 가지 테스트 통계와 밀접하게 관련되어 있습니다.양의 T + {\ T 및 음의 T- {\T^{-}}은 다음과[9] 같이 정의됩니다.
양수 순위 합계와 음수 순위 합계는 검정 이면에 있는 이론에 유용한 대체 해석을 가지고 있습니다.Walsh j를 j로 합니다.{ { {2} } (그 [11]후, 다음과 같이 입력합니다.
귀무 가설 및 대립 가설
일표본 검정
1-표본 Wilcoxon 부호 순위 검정을 사용하여 데이터가 지정된 [12]중위수를 가진 대칭 모집단에서 가져온 것인지 여부를 검정할 수 있습니다.모집단 중위수를 알고 있으면 데이터가 [13]중심 주위에 대칭인지 여부를 검정하는 데 사용할 수 있습니다.
귀무 가설과 대체 가설을 공식적으로 설명하기 위해 데이터가 F({F의 독립적이고 동일한 분포 표본으로 구성되어 있다고 가정합니다. X 및 2가 F F 분포 랜덤 변수인 F를 합니다. ){ F^ {2) }、 ( X1 + 의 누적분포함수 { displaystyle { {1} {2}X{1} + _ {2} 。설정
- 귀무 가설0 H
- 단측 대립 가설1 H
- 2> 2{\ > {\1} {
- 단측 대립 가설2 H
- 2 < 2\ < { \ 2}。
- 양측 대립 가설3 H
- 2 、 2( _ { ) \ ( 1 2)。
검정할 대립 가설은 검정 통계량이 단측 또는 양측 p-값을 계산하는 데 사용되는지 여부(단측인 경우 어느 쪽인지)에 따라 달라집니다.μ가 미리 정해진 고정량인 , 이 테스트는μstyle 데이터로부터를 하여 Pr의 값 테스트로도 사용할 수 있습니다.
위의 null이고 대안 가설이 사실 p2{\displaystyle p_{2}의 월시 a의 측면에서 볼 때 2T+/n2{\displaystyle 2T^{+}{2}} 것은 일관된 추정자}.[15]그것은 또한 T+{\displaystyle T^{+}의 설명에서 파생될 수 있}과 T−{\displaystyle T^{-}}로부터 파생되었다verages, 이 설명은 Wilcoxon 검정이 [16]Walsh 평균 집합에 적용된 부호 검정과 동일하다는 것을 보여주기 때문입니다.
관심 분포를 제한하면 해석 가능한 귀무 가설과 대립 가설이 더 많아질 수 있습니다. ( 2) { F^ { (2}에는 고유의 중앙값이 있다고 하는 제한적인 가정이 있습니다.이 중앙값은 F F의 의사메디안이라고 불리며, 일반적으로 이 세 가지가 모두 존재하는 경우에도 평균 및 중앙값과는 다릅니다.귀무 가설과 대립 가설 모두에서 고유한 의사 의사 소수가 존재한다고 가정할 수 있는 경우, 이러한 가설은 다음과 같이 재진술할 수 있습니다.
- 귀무 가설0 H
- F{\ F의 의사 의사 진단자는 0에 위치합니다.
- 단측 대립 가설1 H
- F{\ F의 의사메디안은μ < <0에 .
- 단측 대립 가설2 H
- {\ F 의 의사메디안은 μ> {\> 에 .
- 양측 대립 가설3 H
- F{\ F의 의사메디안은 0(\ 0에 .
대부분의 경우 귀무 가설과 대립 가설은 대칭의 가정 하에 언급됩니다.μ({를 고정합니다. F({ F의 랜덤 X({X})가 Pr† -) ( μ \ \ - 를 하는 경우F({})를 으로 합니다 x F F에 밀도 f f가 있는 F는 x x)마다 f[17] +xx)인 에만 에 대해대칭입니다.
F F의 귀무 및 대안 분포를 대칭으로 가정할 수 있는 경우 귀무 및 대안 가설은 다음과 [18]같이 단순화됩니다.
- 귀무 가설0 H
- {\ F는 약 μ {\=의 대칭입니다.
- 단측 대립 가설1 H
- {\ F는 약μ < {\< 의 대칭입니다.
- 단측 대립 가설2 H
- {\ F는 약 0 {\> 의 대칭입니다.
- 양측 대립 가설3 H
- {\ F는 약 0 {\ 0의 대칭입니다.
( ) ( \\ Pr ( X= \ ) 0 에 μ ( \ \ mu}는F ( \ )의 중위수이며, 이 중위수가 고유할 경우 Wilcoxon 부호 순위 합계가 [19]중위수의 위치에 대한 테스트가 됩니다.F F의 을 정의하면 은μ {\이며,[20] 검정도 평균의 위치에 대한 검정입니다.
대립 분포가 대칭이라는 제약은 매우 제한적이지만 단측 검정의 경우 약화될 수 있습니다.만약 F{F\displaystyle}Pr(X<>−))≥ Pr 모든 x≥ 0에(X>)){\displaystyle \Pr(X<, -x)\geq \Pr(X>^)}{\displaystyle x\geq 0}확률 변수 X{X\displaystyle}가 -distributed F{F\displaystyle}확률적으로. 0에 대해 유통 대칭보다 작다. Similarly,.F{) F는Pr (X< - ) Pr( > (< - )\\( > 인 0에 대칭보다 확률적으로 큽니다.그런 다음 Wilcoxon 부호 순위 합 검정을 다음과 같은 귀무 가설 [21][22]및 대립 가설에도 사용할 수 있습니다.
- 귀무 가설0 H
- {\ F는 약 μ {\=의 대칭입니다.
- 단측 대립 가설1 H
- F는 확률적으로 0에 대한 대칭 분포보다 작습니다.
- 단측 대립 가설2 H
- F는 0에 대한 대칭 분포보다 확률적으로 큽니다.
데이터가 IID라는 가설을 약화시킬 수 있습니다.모든 분포가 공통점 0 _0에 대해 연속적이고 대칭적이라고 가정하는 한 각 데이터 포인트는 다른 분포에서 가져올 수 있습니다.다른 관측치의 조건부 분포가 0 _[23]에 대해 대칭인 한 데이터 포인트가 독립적일 필요는 없습니다.
쌍체 데이터 검정
쌍체 데이터 검정은 쌍체 차이를 취함으로써 발생하기 때문에 귀무 가설과 대립 가설은 1-표본 검정의 가설에서 파생될 수 있습니다.어느 경우든 - - - Y_} - Y_에 대한 주장이 됩니다.
( ,) { F ( , ) { style ( {i ) } ( ( ( ( ( ( ( ( 。 FF})가 연속형일 가장 일반적인 귀무 가설 및 대체 가설은 다음과 같이 표현됩니다.
- 귀무 가설0 H
- 단측 대립 가설1 H
- 2> 2{\ > {\1} {
- 단측 대립 가설2 H
- 2 < 2\ < { \ 2}。
- 양측 대립 가설3 H
- 2 、 2( _ { ) \ ( 1 2)。
1-표본 사례와 마찬가지로, 일부 제한 조건에서는 검정이 차이의 의사 의학자가 0에 있는지 여부를 검정하는 것으로 해석할 수 있습니다.
일반적인 제한사항은 차이의 대칭 분포입니다.이 경우 귀무 가설과 대립 가설은 다음과 같습니다.[24][25]
- 귀무 가설0 H
- - i - i - _ { } - Y }는 μ 0 { \ displaystyle \ =}에 대칭이다.
- 단측 대립 가설1 H
- - μ< \ < 에 대해 대칭입니다.
- 단측 대립 가설2 H
- - >0\mu> 에 입니다.
- 양측 대립 가설3 H
- - i - Y i - Y _ { } - Y _ { }는 μ0 { \ \ 0}에 대해 대칭입니다.
이것들은 원래의 [26]쌍으로 보다 직접적으로 표현될 수도 있습니다.
- 귀무 가설0 H
- 는 교환 가능합니다.즉 ( {}) 입니다. 및( {의 분포는 동일합니다.로F (x , ) ( , ){ F ( , y ) =( y, x )} 。
- 단측 대립 가설1 H
- μ < \ < 의 경우 쌍 , }) 및( +μ, -μ)}의 분포는 동일합니다.
- 단측 대립 가설2 H
- >0 \ 0 의 경우 쌍 \ 및( +μ, -μ)}의 분포는 동일합니다.
- 양측 대립 가설3 H
- 0 0의 경우 쌍 및( +μ, -μ)}의 분포는 동일합니다.
교환 가능성에 대한 귀무 가설은 처리 그룹과 관리 그룹을 사용한 일치 쌍 실험으로부터 발생할 수 있습니다.각 쌍 내에서 처리 및 관리를 랜덤화하면 관측치를 교환할 수 있습니다.교환 가능한 분포의 경우 - - - 는 - 한 분포를 가지므로 귀무 가설에서 분포는 [27]0에 대하여 대칭이다.
1-표본 검정을 확률적 우위에 대한 단측 검정으로 사용할 수 있으므로 쌍체 차이 Wilcoxon 검정을 사용하여 다음 [28]가설을 비교할 수 있습니다.
- 귀무 가설0 H
- 은 (는) 교환 가능합니다.
- 단측 대립 가설1 H
- - - Y_ - 는 0에 대한 분포 대칭보다 확률적으로 작습니다.즉, 각 0(\ 0 ( i < -x )Pr ( i > + ) { { i}
- 단측 대립 가설2 H
- - \ X { i } - Y _ { } )는 0에 대한 분포 대칭보다 확률적으로 큽니다.즉, 각 ( \ \ 0) ( >- x + )Pr ( Y + )( \ pr) 。
0과 타이
실제 데이터에는 0 쌍( 인 샘플 가 있는 경우가 있습니다.{ ( X_})= 묶인 샘플이 있을 수도 있습니다.즉, { i \ j} _ { } ( - case))))))))))) ) 또는 - Y j - j - Y _ { } - Y _ { X _ { i } X - { i= X - { = Y _ { J - { } } } { Y _ { Y _ { Y } } } _ { } } } } 입니다.이것은 이산 데이터에 특히 일반적입니다.이 경우 데이터를 고유하게 랭킹할 방법이 없기 때문에 일반적으로 위에서 정의한 테스트 절차는 정의되지 않습니다(단 있고 다른 0이나 동점이 없는 경우는 예외입니다).따라서 테스트 통계량을 수정해야 합니다.
제로
Wilcoxon의 원래 논문은 0과 동일한 관측치(또는 쌍체 표본의 경우 차이)에 대한 문제를 다루지 않았습니다.그러나 이후 조사에서 그는 [29]표본에서 0을 제거할 것을 권고했다.그런 다음 표준 부호 순위 테스트를 동점이 없는 한 결과 데이터에 적용할 수 있습니다.이를 이제 축소 샘플 절차라고 합니다.
Pratt는[30] 축소된 샘플 절차가 역설적인 행동을 일으킬 수 있다고 관찰했다.그는 다음과 같은 예를 든다.1-표본 상황에 있고 다음과 같은 13개의 관측치가 있다고 가정합니다.
- 0, 2, 3, 4, 6, 7, 8, 9, 11, 14, 15, 17, −18.
축소된 샘플 절차는 0을 제거합니다.나머지 데이터에는 부호 있는 순위가 할당됩니다.
- 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, −12.
이 결과 샘플이 유의 수준 α<>긍정적인 것은 아니다;55/212≈ 0.0134{\displaystyle \alpha<>55/2^{12}\approx 0.0134}. 프랫은 사람이 관찰 결과는 감소하고 확실히 하지 않아야 합니다 기대할 것이라고 주장한 55세 이상의 일방적인 p값/212{55/2^{12\displaystyle}}을 가지고 있다. 그 다더 긍정적으로 보입니다.그러나 0 관측치가 2보다 작은 양만큼 감소하거나 모든 관측치가 1보다 작은 양만큼 감소하는 경우 서명된 순위는 다음과 같습니다.
- −1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, −13.
이것은 단측 p-값이 109 109/2이므로 샘플은 유의 > /2 0> 약에서 유의미한 양성으로 판정된다.역설적인 것은가/})과212( 스타일 이면 한 샘플이 감소하면 상당히 양성으로 보인다는 것입니다.
따라서 Pratt는 서명된 순위 0 절차를 제안했다.이 절차에는 샘플의 순위를 매길 때 0이 포함됩니다.그러나 테스트 통계에서 제외되거나 그에 따라 δ ( ) {\)=을 정의한다. Pratt는 사인 순위 0 절차가 축소된 샘플 [31]절차에서 공유되지 않는 몇 가지 바람직한 동작을 가지고 있음을 입증했다.
- 관측치를 늘린다고 해서 유의한 양의 표본이 유의한 음의 표본이 되는 것은 아니며 유의한 표본이 유의한 음의 표본이 되는 것도 아닙니다.
- 관측치의 분포가 대칭인 경우 검정에서 거부하지 않는μ \mu의 값이 을 형성합니다.
- 0이 0이 아닌 임의의 부호가 할당되어 있는 경우에만 유의한 양의 표본이거나 유의한 음의 표본이 되며, 유의하지 않은 관측치보다 절대값이 작은 0이 아닌 값으로 대체되는 경우에만 유의한 양의 표본은 유의한 양의 표본이거나 유의한 음의 값입니다.
- 고정 유의 α {\ 및 α {\ 수준을 가지도록 랜덤화된 테스트의 경우 관측치 집합을 유의하게 양의(각각각 유의하게 음의)로 호출할 확률은 관측치의 비감소(각, 비증가) 함수이다.ns.
Pratt 발언 모든 나는 ≠을 위해서는 j{i\neq j\displaystyle}, Pr(X나는 Xj>+;0){\displaystyle \Pr(X_{나는}+X_{j}>0)}과 Pr(X나는 +는 대안적인 가설에 대해는signed-rank 0절차 관계를 해결하기 위한 6평균 지위 절차로 결합된다면, 결과 시험 것은 일관된 시험이다. Xj > { ( X { } + _ { } < }는 i{ \ i} j { j[32]}와는 적어도 독립된 고정 상수만큼 다릅니다.
signed-rank 제로 프로시저에는 제로 발생 시 테스트 통계 정보의 늘 분포가 변경되므로 p-values 테이블을 사용할 수 없다는 단점이 있습니다.
데이터가 동일한 간격의 범주로 구성된 Likert 척도에 있는 경우 부호 있는 순위 0 절차는 축소된 [33]표본 절차보다 유형 I 오류율을 유지할 가능성이 높습니다.
통계 효율의 관점에서 보면, 0을 처리하는 완벽한 규칙은 없습니다.Conover는 Wilcoxon과 Pratt의 방법 중 어느 것도 다른 방법보다 한결같이 낫다는 것을 보여주는 귀무 가설과 대립 가설의 예를 발견했다.이산형 균등 분포를 확률이 왼쪽에서 오른쪽으로 선형적으로 증가하는 분포와 비교할 때 Pratt의 방법은 Wilcoxon의 방법보다 성능이 우수합니다.0을 중심으로 한 이항 분포를 테스트하여 각 Bernouli 시행의 모수가 1 인지 확인했을 때 Wilcoxon의 방법은 Pratt의 방법을 [34]능가합니다.
타이즈
데이터에 동점이 없는 경우 R_}) 을 사용하여 테스트 통계량을 계산합니다.동점일 경우 순위는 정의되지 않습니다.이를 해결하기 위한 두 가지 주요 접근법이 있습니다.
Wilcoxon이 원래 권장했던 넥타이 처리의 가장 일반적인 절차는 평균 순위 또는 중간 순위 절차라고 불립니다.이 절차에서는 관측치에 1과 n 사이의 숫자를 할당하며, 두 관측치가 절대값이 동일한 경우에만 동일한 번호를 얻습니다.이러한 번호의 집합이 {, 과같지 않은 경우에도 이러한 번호는 일반적으로 랭크라고 불립니다.관찰에 할당된 순위는 가능한 모든 방식으로 동점이 깨진 경우 가질 수 있는 순위의 평균입니다.순위가 지정되면 테스트 통계량은 [35][36]보통과 동일한 방법으로 계산됩니다.
예를 들어, 관측치가 다음을 만족한다고 가정합니다.
평균 순위 절차에서는 null 분포가 [37][38]동점이 있는 경우 다릅니다.또한 평균 순위 절차에는 0에 대한 축소 표본 절차와 유사한 몇 가지 단점이 있습니다.평균 순위 절차로 표본이 유의하게 양성으로 판정될 수 있지만, 일부 값을 증가시켜 동점을 해제하거나 어떤 방식으로든 동점을 해제하면 표본이 [39][40]유의하지 않다고 판단됩니다.그러나 모든 관측치를 같은 양만큼 늘린다고 해서 유의한 양의 결과가 유의한 값으로 바뀌거나 유의하지 않은 결과가 유의한 음의 결과로 바뀔 수는 없습니다.또한 관측치가 대칭적으로 분포되어 있는 경우 테스트에서 거부하지 않는 μ의 값이 을 [41][42]형성합니다.
동점 처리의 다른 일반적인 옵션은 동점 처리 절차입니다.동점 처리 절차에서는 관찰에 세트{ }({n 내의 개별 순위가 할당됩니다.관찰에 할당된 순위는 해당 절대값과 동점 규칙에 따라 달라집니다.절대값이 작은 관측치에는 표준 순위 합 검정의 경우와 마찬가지로 항상 더 작은 순위가 부여됩니다.동점 규칙은 절대값이 동일한 관찰에 순위를 할당하는 데 사용됩니다.동수 규칙의 장점 중 하나는 p-값을 [43]계산하는 데 표준 표를 사용할 수 있다는 것입니다.
무작위로 동점을 깨면 동점이 깨진다.랜덤 타이브레이킹에서는 공분포는 동점이 없는 경우와 동일하지만 테스트 결과는 데이터뿐만 아니라 추가 랜덤 선택에 따라 달라집니다.가능한 랜덤 선택에 대해 순위를 평균화하면 평균 순위 [44]절차가 수행됩니다.또한 모든 무작위 [45]선택에 대한 거부 확률을 보고할 수 있습니다.랜덤 동점 해소에는 일부 관측치가 [46]증가해도 표본이 유의하게 양성으로 판정될 확률이 감소하지 않는다는 장점이 있습니다.보수적 우열을 가리는 것은 귀무 가설에 유리하게 연결된다.음의 값이 더 큰 경향이 있는 단측 테스트를 수행할 때, 음의 관측치에는 낮은 순위를, 양의 관측치에는 높은 순위를 할당함으로써 동점이 해소됩니다.이 의 양수가 유의하면 반대로 동점이해제되고이 유의하면가 가능한 한 동점이 해제된다.프랫은 우열을 가릴 수 없는 상황에서 보수적 우열을 가릴 수 있는 절차는 모든 우열을 [47]가릴 수 없기 때문에 아마도 낮은 힘을 가질 것이라고 말했다.
평균 순위 절차는 동점 처리 절차와 다를 수 있습니다.Pratt는 다음과 같은 [48]예를 제시합니다.관측치가 다음과 같다고 가정합니다.
- 1, 1, 1, 1, 2, 3, −4.
평균 순위 절차는 부호 있는 순위를 할당합니다.
- 2.5, 2.5, 2.5, 2.5, 5, 6, −7.
이 샘플은 단측 / 7 {\=에서 유의한 양의 값입니다. 반면, 동점 규칙은 순위를 할당합니다.
- 1, 2, 3, 4, 5, 6, −7.
같은 단측 /2 \=에서 이것은 유의하지 않다.
동점 처리의 다른 두 가지 옵션은 동점 처리 결과의 평균을 기준으로 합니다.평균 통계량 방법에서는 통계량T(\ T가 가능한 모든 동점자 방법에 대해 계산되며, 최종 통계량은 동점자 통계량의 평균이다.평균 확률 방법에서 p-값은 가능한 모든 연결 해제 방법에 대해 계산되며, 최종 p-값은 연결 해제 p-값의 [49]평균입니다.
Null 분포 계산
p-값을 계산하려면 귀무 가설에서 T T의 를 알아야 합니다.이 [50]배포에 대한 닫힌 공식은 없습니다., 값이 n\n의 경우 분포를 정확하게 계산할 수 있습니다.데이터가 0에 대해 대칭적이라는 귀무 가설에서 X_})는 음수만큼 양수일 가능성이 높습니다.따라서 귀무 가설에서 T {\ T일 은 T {\ T를 산출하는 부호 조합의 수를 { 2의 가능한 부호 수로 나눈 값과 같다.이는 귀무 [51]가설에서한 분포를 계산하는 데 사용할 수 있다.
모든 가능성을 고려하여를 계산하려면 의 (\displaystyle 2가 하며 , 이는 최소n을 한 모든 n(\ n의 합계(\ t^{+})를 계산해야 합니다.단 T +\ T[52][53]의 는 효율적인 재귀가 있습니다.n (+)({n}(을 T+ + { T^{+}= t 조합의 수로 합니다.는 { 1, n}({n의 서브셋의 수와 같습니다.이 값은t {\ t이 됩니다.그 반복의 기지 사건은 진로가 0(0)=1{\displaystyle u_{0}(0)=1}, 너 0(t+)모든 카메라에)0{\displaystyle u_{0}(t^{+})=0}+≠ 0{\displaystyle t^{+}\neq 0}일 경우, 그리고 모든 t<에 너와(t+))0{\displaystyle u_{n}(t^{+})=0};0{\displaystyle t<0}또는 t>n(n+1)./2 t 재귀 공식은 다음과 같습니다.
n ( +) { {displaystyle p_{n}(t^{+}) 샘플이 { n 때 귀무 가설에서T + 이면 +) {은 유사한 [55]재귀를 충족합니다.
큰 nn의 경우 위의 재귀도 너무 느립니다.이 경우 Null 분포는 근사치를 구할 수 있습니다.T{\T + {\ TT- {\ T의 늘 분포는 평균과 [57]분산에 따라 점근적으로 정규 분포를 따릅니다.
Edgeworth 확장을 사용하여 더 나은 근사치를 생성할 수 있습니다.4차 Edgeworth 확장을 사용하면 [58][59]다음이 표시됩니다.
의 모멘트 생성 함수는 정확한 공식입니다.[60]
0이 존재하며 부호 있는 순위 제로 절차가 사용되는 경우 또는 동점이 존재하며 평균 순위 절차가 사용되는 경우 T{\ T의 Null 분포가 변경됩니다.쿠레톤은 이 [61][62]상황에 대한 정규 근사치를 도출했다.원래 관측치 수가 n)이고 0의 수가 z z라고 가정합니다.동점 수정은
대체 통계
Wilcoxon은[63] 원래 Wilcoxon 순위합 통계량을 ,T- )으로 정의했다.\ \ Siegel과 같은[64] 초기 저자는 Wilcoxon을 따랐다.이 값은 양측 가설 검정에는 적합하지만 단측 검정에는 사용할 수 없습니다.
1과 n 사이의 순위를 할당하는 대신 과n - 사이의 순위를 할당할 수도 있습니다({ 이러한 순위를 수정 [65]순위라고 합니다.변경된 부호 순위 T 변경된 양의 순위 T+ { 및 변경된 음의 순위 0- {은T {\+ {\ T와 하게 정의됩니다 T 단, 일반 순위 대신 변경된 순위를 사용합니다.p2의 감안할 때 연속 분포에 제한된 개연성이 두개의 독립적인 F{F\displaystyle}의 합 확률 변수 -distributed 긍정적인 2T0+/(n(n− 1)){\displaystyle 2T_{0}(n(n-1))}로 .[66]추정되고 있어요 이것은 최소 분산 불편 추정량.{\dis.playstyle [67] 입니다.
예
| 절대 차이에 의한 순서 |
|
\은 기호 함수,abs\는 , 는 순위입니다.페어 3과 9는 절대값으로 묶여 있습니다.1위와 2위를 차지하기 때문에 각 등급의 평균은 1.5입니다.
- H \displaystyle\displaystyle})을를) 거부하지 0}) 쌍별 차이의 중앙값이 0과 다릅니다.
- 결과의 p p은 06113(0.
효과 크기
부호 순위 검정의 효과 크기를 계산하기 위해 순위-이계 상관 관계를 사용할 수 있다.
검정 통계량 T가 보고되면 순위 상관 r은 검정 통계량 T를 총 순위합 S로 나눈 값 또는 r = T/S와 같다.[68] 위의 예제를 사용하면 검정 통계량은 T = 9입니다.표본 크기 9의 총 순위 합계는 S = (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9) = 45입니다.따라서 순위 상관 관계는 9/45이므로 r = 0.20입니다.
검정 통계 T가 보고되는 경우, 순위 상관 관계를 계산하는 동등한 방법은 두 순위 합계의 비율 차이, 즉 Kerby(2014) 단순 차이 [68]공식이다.현재 예제를 계속 진행하면 표본 크기가 9이므로 총 순위 합계는 45입니다.T는 두 등급 합계 중 더 작으므로 T는 3 + 4 + 5 + 6 = 18입니다.이 정보만으로 나머지 순위 합계를 계산할 수 있다. 왜냐하면 총합 S - T(이 경우 45 - 18 = 27)이기 때문이다.다음으로, 두 가지 순위 합계의 비율은 27/45 = 60%와 18/45 = 40%입니다.마지막으로, 순위 상관관계는 두 비율 사이의 차이(.60 - .40)이므로 r = .20이다.
소프트웨어 구현
- R은 다음과 같이 테스트의 실시를 포함한다.
wilcox.test(x,y, paired=TRUE)
여기서 x와 y는 같은 [69]길이의 벡터입니다. - ALGLIB에는 C++, C#, Delphi, Visual Basic 등의 Wilcoxon 부호 순위 테스트 구현이 포함됩니다.
- GNU 옥타브에서는 테스트의 다양한 한쪽 및 양쪽 버전을
wilcoxon_test
기능. - SciPy는 Python에서 Wilcoxon 서명 순위 테스트 구현을 포함합니다.
- Acord.NET에는 의 C#에 Wilcoxon 부호 랭크테스트가 실장되어 있습니다.NET 어플리케이션
- MATLAB은 "윌콕슨 순위 합계 검정"을 사용하여 이 검정을 구현합니다. [p,h] = signrank(x,y)도 검정 결정을 나타내는 논리 값을 반환합니다.결과 h = 1은 귀무 가설의 거부를 나타내며, h = 0은 유의 수준 5%에서 귀무 가설을 기각하지 못했음을 나타냅니다.
- 줄리아 가설테스트 패키지에는 "value(Signed Rank Test(x, y)"로서 Wilcoxon 부호 순위 테스트가 포함됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Conover, W. J. (1999). Practical nonparametric statistics (3rd ed.). John Wiley & Sons, Inc. ISBN 0-471-16068-7., 페이지 350
- ^ "Wilcoxon signed-rank test - Handbook of Biological Statistics". www.biostathandbook.com. Retrieved 2021-09-02.
- ^ Wilcoxon, Frank (Dec 1945). "Individual comparisons by ranking methods" (PDF). Biometrics Bulletin. 1 (6): 80–83. doi:10.2307/3001968. hdl:10338.dmlcz/135688. JSTOR 3001968.
- ^ Siegel, Sidney (1956). Non-parametric statistics for the behavioral sciences. New York: McGraw-Hill. pp. 75–83. ISBN 9780070573482.
- ^ 연결, 352페이지
- ^ 시겔, 76페이지
- ^ 연결, 페이지 353
- ^ Pratt, John W.; Gibbons, Jean D. (1981). Concepts of Nonparametric Theory. Springer-Verlag. ISBN 978-1-4612-5933-6., 페이지 148
- ^ 프랫과 기븐스, 페이지 148
- ^ 프랫과 기븐스, 페이지 148
- ^ 프랫과 기븐스, 150페이지
- ^ Connover, 352-357페이지
- ^ Hettmansperger, Thomas P. (1984). Statistical Inference Based on Ranks. John Wiley & Sons. ISBN 0-471-88474-X., 페이지 32, 50
- ^ 프랫과 기븐스, 페이지 153
- ^ 프랫과 기븐스, 페이지 153-154
- ^ 헤트만스퍼거, 38-39페이지
- ^ 프랫과 기븐스, 페이지 146–147
- ^ 프랫과 기븐스, 페이지 146–147
- ^ 헤트만스퍼거, 페이지 30-31
- ^ 연결, 페이지 353
- ^ 프랫과 기븐스, 페이지 155–156
- ^ 헤트만스퍼거, 49-50페이지
- ^ 프랫과 기븐스, 페이지 155
- ^ 연결, 페이지 354
- ^ Hollander, Myles; Wolfe, Douglas A.; Chicken, Eric (2014). Nonparametric Statistical Methods (Third ed.). John Wiley & Sons, Inc. ISBN 978-0-470-38737-5., 페이지 39~41
- ^ 프랫과 기븐스, 페이지 147
- ^ 프랫과 기븐스, 페이지 147
- ^ 헤트만스퍼거, 49-50페이지
- ^ Wilcoxon, Frank (1949). Some Rapid Approximate Statistical Procedures. American Cynamic Co.
- ^ Pratt, J. (1959). "Remarks on zeros and ties in the Wilcoxon signed rank procedures". Journal of the American Statistical Association. 54 (287): 655–667. doi:10.1080/01621459.1959.10501526.
- ^ 프랫, 659페이지
- ^ 프랫, 663페이지
- ^ Derrick, B; White, P (2017). "Comparing Two Samples from an Individual Likert Question". International Journal of Mathematics and Statistics. 18 (3): 1–13.
- ^ Conover, William Jay (1973). "On Methods of Handling Ties in the Wilcoxon Signed-Rank Test". Journal of the American Statistical Association. 68 (344): 985–988. doi:10.1080/01621459.1973.10481460.
- ^ 프랫과 기븐스, 페이지 162
- ^ 연결, 352-353페이지
- ^ 프랫과 기븐스, 페이지 164
- ^ Connover, 358-359페이지
- ^ 프랫, 페이지 660
- ^ 프랫과 기븐스, 168-169페이지
- ^ 프랫, 661~662페이지
- ^ 프랫과 기븐스, 170페이지
- ^ 프랫과 기븐스, 페이지 163, 166
- ^ 프랫, 페이지 660
- ^ 프랫과 기븐스, 페이지 166
- ^ 프랫과 기븐스, 페이지 171
- ^ 프랫, 661페이지
- ^ 프랫, 페이지 660
- ^ Gibbons, Jean D.; Chakraborti, Subhabrata (2011). Nonparametric Statistical Inference (Fifth ed.). Chapman & Hall/CRC. ISBN 978-1-4200-7762-9., 페이지 194
- ^ 헤트만스퍼거, 페이지 34
- ^ 프랫과 기븐스, 페이지 148–149
- ^ 프랫과 기븐스, 148-149페이지, 186-187페이지
- ^ 헤트만스퍼거, 페이지 171
- ^ 프랫과 기븐스, 187페이지
- ^ 프랫과 기븐스, 187페이지
- ^ 프랫과 기븐스, 187페이지
- ^ 프랫과 기븐스, 페이지 149
- ^ a b Kolassa, John E. (1995). "Edgeworth approximations for rank sum test statistics". Statistics and Probability Letters. 24 (2): 169–171. doi:10.1016/0167-7152(95)00164-H.
- ^ 헤트만스퍼거, 37페이지
- ^ 헤트만스퍼거, 페이지 35
- ^ Cureton, Edward E. (1967). "The normal approximation to the signed-rank sampling distribution when zero differences are present". Journal of the American Statistical Association. 62 (319): 1068–1069. doi:10.1080/01621459.1967.10500917.
- ^ 프랫과 기븐스, 193페이지
- ^ 윌콕슨, 페이지 82
- ^ 시겔, 76페이지
- ^ 프랫과 기븐스, 페이지 158
- ^ 프랫과 기븐스, 페이지 159
- ^ 프랫과 기븐스, 191페이지
- ^ a b Kerby, Dave S. (2014), "The simple difference formula: An approach to teaching nonparametric correlation.", Comprehensive Psychology, 3: 11.IT.3.1, doi:10.2466/11.IT.3.1
- ^ Dalgaard, Peter (2008). Introductory Statistics with R. Springer Science & Business Media. pp. 99–100. ISBN 978-0-387-79053-4.
외부 링크
- Wilcoxon 부호 순위 검정(R)
- Wilcoxon 부호 순위 검정 사용 예제
- 테스트의 온라인 버전
- Wilcoxon 부호 순위 검정의 임계값 표
- 실험심리학자인 칼 L.의 간단한 안내입니다. Weunsch - 비모수 효과 크기 추정기(Copyright 2015 by Karl L).원치)
- 커비, D.S. (2014년)간단한 차이 공식:비모수 상관 관계를 가르치는 방법.종합심리학, 제3권, 기사 1. doi:10.2466/11.IT.3.1. 기사 링크