사인 테스트

Sign test

부호 검정은 치료 전후의 피험자의 체중과 같이 관측치 쌍 간의 일관된 차이를 검정하는 통계 방법입니다.각 피험자에 대한 관측치 쌍(예: 체중 전처리 및 후처리)이 주어진 경우, 부호 검정은 쌍의 한 구성 요소(예: 전처리)가 쌍의 다른 구성 요소(예: 후처리)보다 큰(또는 작은) 경향이 있는지 여부를 확인합니다.

쌍체 관측치는 x와 y로 지정할 수 있습니다.만약 비교만 x>로써 표현할 수 있가지 관찰(x, y)의 비교 내용은 부호 검정 가장;y, x)y-<>y. 유용하다로 숫자 수량, 또는 계급(x의 계급)1일, 그건)8일에 계급)()=7, 그건)18)만약, 대신에 관측한 다음 쌍으로 이루어지t-test[1]거나 Wilcoxonsigned-rank test[2]표현될 수 있는데 대개그램을 가질 것이다.일관된 차이를 감지하기 위한 신호 검정보다 먹는 힘이 더 높습니다.

X와 Y가 양적 변수인 경우 X와 Y에서 쌍체 표본[3]추출할 수 있는 상황에서 X와 Y 사이의 차이가 중위수가 0이라는 가설을 검정하는 데 부호 검정을 사용할 수 있습니다.

부호 검정에서는 숫자 집합의 중위수가 지정된 값보다 유의하게 크거나 작은지 여부도 검정할 수 있습니다.예를 들어, 한 반의 학생 성적 목록이 주어지면 부호 검정을 통해 중위수 성적이 100점 만점에 75점과 유의하게 다른지 여부를 확인할 수 있습니다.

부호 테스트는 테스트 대상 분포의 특성에 대해 거의 가정을 하지 않는 비모수 검정입니다. 즉, 매우 일반적인 적용 가능성은 있지만 대체 검정의 통계적 힘이 부족할 수 있습니다.

쌍체-표본 부호 검정의 두 가지 조건은 각 모집단에서 표본을 랜덤하게 선택하고 표본은 종속적이거나 쌍체여야 한다는 것입니다.독립 표본은 유의하게 쌍화할 수 없습니다.검정이 비모수적이므로 표본이 정규 분포 모집단에서 추출될 필요는 없습니다.또한 이 검정은 왼쪽 꼬리, 오른쪽 꼬리 및 양쪽 꼬리 검정에 적용됩니다.

방법

p = Pr(X > Y)로 한 다음 귀무 가설0 H: p = 0.50을 검정합니다.즉, 귀무 가설은 랜덤 측정값 쌍(xi, yi)이 주어진 경우 xii y가 다른 측정값 쌍보다 클 가능성이 동등하다는 것을 나타냅니다.

귀무 가설을 검정하기 위해 독립적인 표본 데이터 1 모집단1 {(x2, y2), (x, yn), ., (x, yn)}에서 수집됩니다.차이가 없는 쌍은 생략되므로 m쌍의 [4]표본이 축소될 가능성이 있습니다.

다음으로 W를 y - xi >0 의 i 수로 합니다.H가0 참이라고 가정하면 W는 이항 분포 W ~ b(m, 0.5)를 따릅니다.

전제 조건

i = 1, ..., n인 경우 Z = YiXi 한다i.

  1. 차이i Z는 독립적이라고 가정합니다.
  2. i Z는 동일한 연속 모집단에서 나옵니다.
  3. X와i Y가 나타내는 값은i 순서(적어도 서수 척도)이므로 "보다 큼", "보다 작음" 및 "같음"의 비교는 의미가 있습니다.

중요도 테스트

검정 통계량은 이항 분포를 따를 것으로 예상되므로 표준 이항 검정을 사용하여 유의성을 계산합니다.이항 분포에 대한 정규 근사는 큰 표본 크기([4]m > 25)에 사용할 수 있습니다.

왼쪽1 꼬리 값은 대체 H: p < 0.50에 대한 p-값인 Pr(W w w)로 계산됩니다.이 대안은 X 측정값이 더 높은 경향이 있다는 것을 의미합니다.

오른쪽 꼬리 값은 대체1 H: p > 0.50의 p-값인 Pr(W w w)에 의해 계산됩니다.이 대안은 Y 측정값이 더 높은 경향이 있다는 것을 의미합니다.

양측 대체1 H의 경우 p-값은 꼬리-값의 두 배입니다.

일치 쌍에 대한 양측 부호 검정 예제

Zar는 일치하는 쌍에 대한 부호 테스트의 예를 다음과 같이 제시합니다.사슴 [5]10마리의 왼쪽 뒷다리와 왼쪽 앞다리 길이에 대한 데이터가 수집되었습니다.

사슴 뒷다리 길이(cm) 앞다리 길이(cm) 차이
1 142 138 +
2 140 136 +
3 144 147
4 144 139 +
5 142 143
6 146 141 +
7 149 143 +
8 150 145 +
9 142 136 +
10 148 146 +

귀무 가설은 사슴의 뒷다리와 앞다리 길이 사이에 차이가 없다는 것이다.다른 가설은 뒷다리 길이와 앞다리 길이 사이에 차이가 있다는 것이다.이것은 한 쪽 꼬리가 아닌 두 쪽 꼬리가 있는 검정입니다.꼬리 두 개 검사의 경우, 대체 가설은 뒷다리 길이가 앞다리 길이보다 크거나 작을 수 있다는 것이다.단측 테스트는 뒷다리 길이가 앞다리 길이보다 커서, 그 차이가 한 방향으로만(보다 클 수 있다) 있을 수 있다.

사슴은 n=10마리입니다.긍정적인 차이가 8개, 부정적인 차이가 2개 있습니다.뒷다리와 앞다리 길이의 차이가 없다는 귀무 가설이 참이면 예상되는 양의 차이는 10개 중 5개입니다.다리 길이의 차이가 없을 경우 8가지 양의 차이 또는 더 극단적인 결과가 관찰될 확률은 얼마입니까?

검정이 양면적이기 때문에 8개의 양수 차이보다 극단적이거나 극단적인 결과에는 8, 9, 10개의 양수 차이와 0, 1, 2개의 양수 차이 결과가 포함됩니다.10마리 사슴 중 8마리 이상, 10마리 사슴 중 2마리 이하일 확률은 페어코인의 10번 공중제비에서 8마리 이상 또는 2마리 이하의 확률과 같다.확률은 앞면 = 뒷면 확률 = 0.5인 이항 검정을 사용하여 계산할 수 있습니다.

  • 공정 동전 10회 공중제비에서 0개 앞면 확률 = 0.00098
  • 공정 동전 10회당 1개의 앞면이 나올 확률 = 0.00977
  • 페어코인 10회 공중제비 2헤드 확률 = 0.04395
  • 페어코인 10회 공중제비 8헤드 확률 = 0.04395
  • 페어코인 10회 공중제비 중 9회 앞면 확률 = 0.00977
  • 페어코인 10회 공중제비에 10개 앞면이 나올 확률 = 0.00098

양수 차이 10개 중 8개만큼 극단적인 결과의 양측 확률은 다음과 같은 확률의 합계입니다.

0.00098 + 0.00977 + 0.04395 + 0.04395 + 0.00977 + 0.00098 = 0.109375.

따라서 다리 길이의 차이가 없는 경우 다리 길이의 10가지 양의 차이 중 8가지만큼 극단적인 결과를 관찰할 확률은 p = 0.109375이다.귀무 가설은 유의 수준 p = 0.05에서 기각되지 않습니다.표본 크기가 크면 증거가 귀무 가설을 기각하기에 충분할 수 있습니다.

관측치는 숫자 수량(실제 다리 길이)으로 표현될 수 있으므로 쌍체 t-검정 또는 Wilcoxon 부호 순위 검정의 검정력은 일반적으로 일관된 차이를 탐지하는 부호 검정보다 큽니다.이 예제의 경우 차이에 대한 쌍체 t-검정은 뒷다리 길이와 앞다리 길이 사이에 유의한 차이가 있음을 나타냅니다(p = 0.007).

10개 비교에서 관측 결과가 9개의 양성 차이인 경우 부호 검정은 유의합니다.앞면이 0, 1, 9, 또는 10개인 동전 던지기만 관측 결과와 같거나 더 극단적입니다.

  • 공정 동전 10회 공중제비에서 0개 앞면 확률 = 0.00098
  • 공정 동전 10회당 1개의 앞면이 나올 확률 = 0.00977
  • 페어코인 10회 공중제비 중 9회 앞면 확률 = 0.00977
  • 페어코인 10회 공중제비에 10개 앞면이 나올 확률 = 0.00098

10가지 양의 차이 중 9가지 극단적인 결과가 나올 확률은 다음과 같은 확률의 합계입니다.

0.00098 + 0.00977 + 0.00977 + 0.00098 = 0.0215.

일반적으로 10개의 양수 차이 중 8개는 유의하지 않지만(p = 0.11), 10개의 양수 차이 중 9개는 유의합니다(p = 0.0215).

일치 쌍에 대한 단측 부호 검정 예제

Connover는[6] 일치하는 쌍에 대해 단측 부호 테스트를 사용하여 다음 예를 보여 줍니다.한 제조업체에서 A와 B의 두 가지 제품을 생산합니다.제조업체에서는 소비자가 제품 A보다 제품 B를 선호하는지 여부를 확인하려고 합니다.10명의 소비자에게 각각 제품 A와 제품 B가 주어지고 어떤 제품을 선호하는지 물었다.

귀무 가설은 소비자들이 제품 A보다 제품 B를 선호하지 않는다는 것이다.또 다른 가설은 소비자들이 제품 A보다 제품 B를 선호한다는 것입니다.이것은 일방적인(방향성) 테스트입니다.

연구 말미에 8명의 소비자가 제품 B를 선호하고 1명의 소비자가 선호하는 제품 A를 선호하며 1명은 선호도가 없다고 보고했다.

  • +의 수(표준 B) = 8
  • –의 수(표준 A) = 1
  • 동점 수(기본 설정 없음) = 1

동점은 분석에서 제외되며, n = + 및 –의 수 = 8 + 1 = 9입니다.

만약 귀무 가설이 참이라면, 소비자가 A보다 B를 선호하지 않는 9쌍에서 8개의 양성만큼 극단적인 결과가 나올 확률은 얼마인가?이는 공정 동전의 9번 공중제비에서 8번 이상의 앞면이 나올 확률이며 p(앞면) = p(뒷면) = 0.5인 이항 분포를 사용하여 계산할 수 있습니다.

P(페어 코인의 9번 공중제비에서 8번 또는 9번 앞면) = 0.0195.귀무 가설은 기각되었고 제조업체는 소비자들이 제품 A보다 제품 B를 선호한다고 결론지었다.

단일 표본의 중위수에 대한 부호 검정 예제

Sprent는 중위수에 대한 부호 검정의 다음 예를 제공합니다.임상 시험에서 비호지킨 림프종이 있는 10명의 피험자에 대해 생존 시간(주)을 수집합니다.연구가 종료된 362주 후에도 생존한 한 피실험자의 정확한 생존 시간은 알려지지 않았다.피실험자의 생존 시간은

49, 58, 75, 110, 112, 132, 151, 276, 281, 362+

플러스 기호는 검사가 끝날 때 피험자가 아직 살아 있음을 나타냅니다.연구자는 중위수 생존 시간이 200주보다 작거나 더 큰지 확인하려고 했습니다.

귀무 가설은 중위수 생존이 200주라는 것입니다.다른 가설은 중위수 생존이 200주가 아니라는 것입니다.이것은 양면 검정입니다. 대체 중위수가 200주보다 크거나 작을 수 있습니다.

중위수 생존이 200주라는 귀무 가설이 참이면 랜덤 표본에서 피실험자의 약 절반은 200주 미만, 절반은 200주 이상 생존해야 합니다.200 미만의 관측치에는 마이너스(-)가 할당되고 200 이상의 관측치에는 플러스(+)가 할당됩니다.대상 생존 시간의 경우 200주(-) 미만의 관측치가 7개이고 n=10개 대상의 경우 200주(+) 이상의 관측치가 3개 있습니다.

관측치 하나가 모집단 중위수보다 크거나 낮을 가능성이 같으므로 플러스 점수 수는 평균 = 0.5인 이항 분포를 가집니다.10명 중 7명이 중위수 아래에 있을 정도로 극단적인 결과가 나올 확률은 얼마입니까?이는 페어코인 10번 던지면 7번 앞면이 나올 확률과 정확히 동일합니다.이것은 양면 검정이기 때문에 극단적인 결과는 3개 또는 7개 이상일 수 있습니다.

p(앞면) = 0.5인 공정 동전의 10번 동전 던지기에서 k개의 앞면을 관찰할 확률은 이항식으로 구할 수 있다.

Pr(머리 수 = k) = 선택(10, k) × 0.5^10

k의 값에 대한 확률은 아래 표에 나와 있습니다.

k 0 1 2 3 4 5 6 7 8 9 10
PR 0.0010 0.0098 0.0439 0.1172 0.2051 0.2461 0.2051 0.1172 0.0439 0.0098 0.0010

10번의 토스에서 0, 1, 2, 3, 7, 8, 9, 또는 10번의 헤드가 나올 확률은 개별 확률의 합계입니다.

0.0010 + 0.0098 + 0.0439 + 0.1172 + 0.1172 + 0.0439 + 0.0098 + 0.0010 = 0.3438.

따라서 중위수 생존이 200주인 경우 생존 데이터에서 3개 이하의 플러스 기호 또는 7개 이상의 플러스 기호를 관측할 확률은 0.3438입니다.귀무 가설이 참인 경우 예상되는 플러스 기호 수는 5입니다.3개 이하 또는 7개 이상의 플러스를 관측하는 것은 5와 유의하게 다르지 않습니다.귀무 가설은 기각되지 않습니다.표본 크기가 매우 작기 때문에 이 표본은 차이를 탐지하는 데 검정력이 낮습니다.

소프트웨어 구현

부호 검정은 귀무 가설에서 성공 확률이 p=0.5인 이항 검정의 특수한 경우입니다.따라서, 부호 테스트는 대부분의 통계 소프트웨어 프로그램에서 제공되는 이항 테스트를 사용하여 수행할 수 있다.사인 테스트용 온라인 계산기는 "사인 테스트 계산기"를 검색하여 찾을 수 있습니다.많은 웹 사이트가 이항 테스트를 제공하지만 일반적으로 양면 버전만 제공합니다.

사인 테스트용 Excel 소프트웨어

Excel을 사용한 사인 테스트 템플릿은 http://www.real-statistics.com/non-parametric-tests/sign-test/에서 구할 수 있습니다.

부호 테스트용 R 소프트웨어

R에서는 다음 함수를 사용하여 이항 검정을 수행할 수 있습니다.binom.test().

함수의 구문은 다음과 같습니다.

binom.test(x, n, p = 0.5, 대안 = c("양면", '적음', "실패"), conf.level = 0.95) 

어디에

  • x= 성공 횟수 또는 각각 성공 횟수 및 실패 수를 나타내는 길이 2의 벡터
  • n= 시행 횟수. x의 길이가 2이면 무시됩니다.
  • p=가설화된 성공 확률
  • alternative=대안 가설을 제시하고 "2.side", "displicate" 또는 "less" 중 하나여야 합니다.
  • conf.level= 반환된 신뢰 구간에 대한 신뢰 수준.

R 함수 바이넘을 사용한 부호 검정 예제입니다.시험

Zar의 사인 테스트 예는 사슴의 뒷다리와 앞다리의 길이를 비교했습니다.사슴 10마리 중 8마리의 뒷다리가 앞다리보다 길었다.따라서 n=10번의 시행에서 x=8번의 성공이 있습니다.뒷다리와 앞다리의 길이가 다르지 않다는 귀무 가설에서 성공 확률은 p = 0.5이다.대안 가설은 뒷다리 길이가 앞다리 길이보다 크거나 작을 수 있다는 것이다. 이는 alternative="2"로 지정된 양면 테스트이다.side"를 클릭합니다.

R 명령어binom.test(x=8, n=10, p=0.5, alternative="two.sided")는 예시와 같이 p=0.1094를 나타냅니다.

Conover의 부호 테스트 예에서는 제품 A와 제품 B에 대한 소비자의 선호도를 조사했습니다.귀무 가설은 소비자들이 제품 A보다 제품 B를 선호하지 않는다는 것이었다.대안 가설은 소비자들이 일방적인 검정인 제품 A보다 제품 B를 선호한다는 것이었다.이 연구에서 선호도를 나타낸 9명의 소비자 중 8명은 제품 A보다 제품 B를 선호했다.

R 명령어binom.test(x=8, n=9, p=0.5, alternative="greater")는 예시와 같이 p=0.01953을 나타냅니다.

역사

Conover와[6] Sprent는[7] John Arbuthnot이 1710년에 부호 테스트를 사용한 것을 설명합니다.아르부스노트는 1629년부터 1710년까지 82년 동안 런던에서 출생 기록을 조사했다.매년 런던에서 태어난 남자들의 수가 여자들의 수를 넘어섰다.출생아 수가 같다는 귀무 가설이 참일 경우, 관측 결과의 확률은 1/2이므로82, Arbuth는 남성과 여성의 출생 확률이 정확히 동일하지 않다고 결론짓지 않았다.

1692년과 1710년의 그의 출판으로, Arbuthnot은 "… 유의성 검정의 첫 번째 사용…",[8] 통계적 의미와 도덕적 확실성에 대한 추론의 첫 번째 예와 "… 아마도 비모수 검정의 첫 번째 출판 보고서…"[6]로 인정된다.

Hald는 Arbuthnot의 연구의 영향에 대해 더 자세히 설명한다.

"니콜라스 베르누이(1710–1713)는 연간 남성 출생아 수의 변동 중 큰 부분이 p = 18/35인 이항으로 설명될 수 있다는 것을 보여줌으로써 아르부스노트의 데이터 분석을 완료했다.이것은 데이터에 이항형을 적합시키는 첫 번째 예제입니다.따라서 여기에서는 p = 0.5 가설을 거부하는 유의성 검정을 거쳐 p의 추정과 적합도에 대한 논의를 진행합니다."

기타 통계 테스트와의 관계

윌콕슨 부호 순위 검정

부호 검정에서는 쌍에 포함된 관측치의 순서만 지정하면 됩니다(: x > y).경우에 따라 모든 피험자에 대한 관측치에 순위 값(1, 2, 3, ...)을 할당할 수 있습니다.관측치에 순위를 매길 수 있고 쌍에 있는 각 관측치가 대칭 분포의 랜덤 표본이면 Wilcoxon 부호 순위 검정이 적절합니다.일반적으로 Wilcoxon 검정은 부호 검정보다 차이를 탐지하는 검정력이 더 큽니다.이러한 상황에서 Wilcoxon 부호 순위 검정에 대한 부호 검정의 점근적 상대 효율은 0.[6]67입니다.

쌍체 t-검정

쌍체 관측치가 숫자 수량(Zar 예의 뒷다리와 앞다리의 실제 길이 등)이고 쌍체 관측치 간의 차이가 단일 정규 분포의 랜덤 표본인 경우 쌍체 t-검정이 적절하다.쌍체 t-검정은 일반적으로 부호 검정보다 차이를 탐지하는 검정력이 더 큽니다.이러한 상황에서 쌍체 t-검정에 대한 부호 검정의 점근적 상대 효율은 0.637입니다.그러나 쌍 간 차이의 분포가 정규 분포가 아니라 두꺼운 꼬리(광체 분포)인 경우, 부호 검정은 쌍체 t-검정에 대해 2.0의 점근적 상대 효율과 Wilcoxon 부호 순위 [6]검정에 대해 1.3의 상대 효율로 쌍체 t-검정보다 더 큰 검정력을 가질 수 있습니다.

맥네마 검정

일부 응용 프로그램에서는 각 쌍 내의 관측치가 0 또는 1 값만 취할 수 있습니다.예를 들어 0은 실패를 나타내고 1은 성공을 나타냅니다.가능한 쌍은 4개입니다. {0,0}, {0,1}, {1,0} 및 {1,1}.이 경우 부호 검정과 동일한 절차가 사용되지만 McNemar [6]검정으로 알려져 있습니다.

프리드먼 검정

데이터는 (제품 A, 제품 B)와 같은 쌍체 관측치 대신 세 개 이상의 수준(제품 A, 제품 B, 제품 C)으로 구성될 수 있습니다.개별 관측치의 순서를 부호 검정과 같은 방법으로 지정할 수 있는 경우(예: B > C > A) Friedman 검정을 사용[5]수 있습니다.

삼항 검정

Bianc, McAleer 및[10] Wong은 2011년에 많은 수의 동점이 있을 때 쌍으로 구성된 데이터에 대한 비파라미터 테스트를 제안했습니다.그들은 그들의 삼항식 테스트가 동점일 때 부호 검정보다 우수하다는 것을 보여주었다.

「 」를 참조해 주세요.

  • Wilcoxon 부호 순위 검정 – 부호 검정의 보다 강력한 변형이지만 대칭 분포 및 구간 데이터도 가정합니다.
  • 중위수 검정 – 부호 검정 대신 짝을 이루지 않은 검정입니다.

레퍼런스

  1. ^ 를 클릭합니다Baguley, Thomas (2012), Serious Stats: A Guide to Advanced Statistics for the Behavioral Sciences, Palgrave Macmillan, p. 281, ISBN 9780230363557.
  2. ^ 를 클릭합니다Corder, Gregory W.; Foreman, Dale I. (2014), "3.6 Statistical Power", Nonparametric Statistics: A Step-by-Step Approach (2nd ed.), John Wiley & Sons, ISBN 9781118840429.
  3. ^ 중위수에 대한 부호 검정 // STAT 415 수학 통계 소개.펜 주립 대학교.
  4. ^ a b Mendenhall W, Wackerly DD, Scheaffer RL (1989), "15: Nonparametric statistics", Mathematical statistics with applications (Fourth ed.), PWS-Kent, pp. 674–679, ISBN 0-534-92026-8
  5. ^ a b c Zar, Jerold H. (1999), "Chapter 24: More on Dichotomous Variables", Biostatistical Analysis (Fourth ed.), Prentice-Hall, pp. 516–570, ISBN 0-13-081542-X
  6. ^ a b c d e f g Conover, W.J. (1999), "Chapter 3.4: The Sign Test", Practical Nonparametric Statistics (Third ed.), Wiley, pp. 157–176, ISBN 0-471-16068-7
  7. ^ a b Sprent, P. (1989), Applied Nonparametric Statistical Methods (Second ed.), Chapman & Hall, ISBN 0-412-44980-3
  8. ^ Bellhouse, P. (2001), "John Arbuthnot", in Statisticians of the Centuries by C.C. Heyde and E. Seneta, Springer, pp. 39–42, ISBN 0-387-95329-9
  9. ^ a b Hald, Anders (1998), "Chapter 4. Chance or Design: Tests of Significance", A History of Mathematical Statistics from 1750 to 1930, Wiley, p. 65
  10. ^ Bian G, McAleer M, Wong WK (2011), A trinomial test for paired data when there are many ties., Mathematics and Computers in Simulation, 81(6), pp. 1153–1160
  • 기븐스, J.D. 및 차크라보티, S.(1992)비모수 통계 추론.마르셀 데커 주식회사, 뉴욕
  • 주방, L.J. (2003)기초 통계 및 데이터 분석.덕스베리.
  • 코노버, W. J. (1980년)실용 비모수 통계량, 두 번째 ed.와일리, 뉴욕
  • 레만, E. L. (1975년)비파라미터: 순위에 근거한 통계 방법.샌프란시스코의 홀든 앤 데이요