순차 확률비 검정

순차 확률비 시험(SPRT)은 아브라함 월드가^[1] 개발한 특정 순차 가설 시험으로 나중에 월드와 제이콥 울포위츠가 최적임을 입증했다.^[2] 네이먼과 피어슨의 1933년 결과는 월드가 그것을 순차적 분석 문제로 재조명하도록 고무시켰다. 반면 Neyman-Pearson 보조정리기는 모든 데이터가 수집될 때(그리고 그 가능성을 알 수 있는 비율)에 대한 경험 법칙을 제공한다.

SPRT는 원래 제조 분야의 품질관리 연구에 사용하기 위해 개발되었지만, 인간 수험생들의 컴퓨터화된 시험에서 종료 기준으로 사용하기 위해 만들어졌다.^[3]^[4]^[5]

이론

고전적 가설 검정에서와 같이 SPRT는 귀무 가설과 대립 가설의 경우 $H_{1}$ $H_{0}$ H $H_{1}$ ${\$ 및 $H_{0}$ $H_{1}$ 1 ${\$ }라고 하는 가설 쌍으로 시작한다. 이들 항목은 다음과 같이 명시해야 한다.

H_{0}p=p_{0}

{\displaystyle H_{1}:p=p_{1}.

다음 단계는 로그 우도비의 누적 $\log \Lambda _{i}$ 인 $\log \Lambda _{i}$ $\log \Lambda _{i}$ ⁡ $\log \Lambda _{i}$ ${\$ 를 $\log \Lambda _{i}$ 계산하여 $S_{0}=0$ 데이터가 도착하면 S $S_{0}=0$ = $S_{0}=0$ $S_{0}=0$ 을 사용한 다음 $S_{0}=0$ i ${\displaystyle$ i $}$ =1,2,...

S_{i}=S_{i-1}+\log \Lambda _{i}

중지 규칙은 단순 임계값 지정 체계:

$a<S_{i}<b$ < $a<S_{i}<b$ $a<S_{i}<b$ < $a<S_{i}<b$ ${\displaystyle a<S_{i}>$ : 계속 모니터링(심각한 불평등)
$S_{i}\geq b$ $S_{i}\geq b$ $S_{i}\geq b$ $S_{i}\geq b$ $S_{i}\geq b$ : $H_{1}$ 1 ${\$ } 수용
$S_{i}\leq a$ $S_{i}\leq a$ $S_{i}\leq a$ $S_{i}\leq a$ $S_{i}\leq a$ : $H_{0}$ $H_{0}$ ${\$ 수락

여기서 ${\displaystyle$ $a$ $}$ 및 $a$ $b$ ${\displaystyle$ b $proty })$ 는 원하는 유형 I 및 $유형$ II $오류, α$ $\alpha$ 및 $\alpha$ $\beta$ $\beta$ 에 따라 달라진다 $\beta$ 다음과 같이 선택할 수 있다.

$a\approx \log {\frac {\beta }{1-\alpha }}$ $a\approx \log {\frac {\beta }{1-\alpha }}$ $a\approx \log {\frac {\beta }{1-\alpha }}$ $a\approx \log {\frac {\beta }{1-\alpha }}$ 1 - $a\approx \log {\frac {\beta }{1-\alpha }}$ {\ $displaystyle a\약 \log {\frac {}{1-\property },$ $b\approx \log {\frac {1-\beta }{\alpha }}$ ≈ $b\approx \log {\frac {1-\beta }{\alpha }}$ 1 $b\approx \log {\frac {1-\beta }{\alpha }}$ - $b\approx \log {\frac {1-\beta }{\alpha }}$ $b\approx \log {\frac {1-\beta }{\alpha }}$ ${\$

$\beta$ , 임계값을 적절히 설정하려면 $α$ {\ $displaystyle \$ alpha }과 β {\displaystyle $\beta$ }을 $($ 를 $\alpha$ $)$ 미리 결정해야 한다 $\beta$ . 그 수치는 신청서에 따라 달라질 것이다. 근사치일 뿐인 이유는 이산형 사례에서 신호가 표본 사이의 임계값을 교차할 수 있기 때문이다. 따라서 오류 발생의 벌칙과 샘플링 빈도에 따라 임계값을 보다 적극적으로 설정할 수 있다. 정확한 한계는 연속적인 경우 정확하다.

예

교과서적인 예는 확률 분포 함수의 모수 추정이다. 지수 분포를 고려하십시오.

f_{\theta }(x)=\the ^{-1}e^{-{\frac {x}{\theta }}}}\qquad x,\theta >0

가설은

{\displaysty}H_{0}:\theta =\theta _{0}\\H_{1}:\theta =\theta _{1}\end{case}}\qquad \theta _{1}}\theta _{0}.

그런 다음 한 표본에 대한 로그 우도 함수(LLLF)는 다음과 같다.

{\begin{aligned}\log \Lambda (x)&=\log \left({\frac {\theta _{1}^{-1}e^{-{\frac {x}{\theta _{1}}}}}{\theta _{0}^{-1}e^{-{\frac {x}{\theta _{0}}}}}}\right)\\&=\log \left({\frac {\0}{0}{\theta _{1}e^{\fract {x}{0}-{0}-{\fract {x}{\theta _{1}}}}}오른쪽)\\&, =\log \left({\frac{\theta_{0}}{_{1}}\theta}\right)+\log \left(e^{{\frac{x}{_{0}}}-{\frac{x}{_{1}}\theta}}\right\theta)\\&, =-\log \left({\frac{\theta_{1}}{_{0}}\theta}\right)+\left({\frac{x}{_{0}}}\theta-{\frac{x}{\theta_{1}}}\right)\\&, =-\log \left({\frac{\theta_{1}}{_{0}}\theta}\right)+\left({\frac{\theta_{1}-\theta._{0}}{\theta _{0}\theta _{1}\오른쪽)x\end{arged}}

모든 $x$ 에 대한 LLF의 누적 합계는

S_{n}=\sum _{i=1}^{n}\log \Lambda (x_{i})=-n\log \left({\frac {\theta _{1}}{\theta _{0}}}\right)+\left({\frac {\theta _{1}-\theta _{0}}{\theta _{0}\theta _{1}}}\right)\sum _{i=1}^{n}x_{i}

따라서 중지 규칙은 다음과 같다.

{\\n\log \frac \\\theta _{1}{0}\right)+\leftan\frac{1}-{1}-\theta _{0}{0}{0}\theta _{1}{1}}}\sum _{i=1}x_{i}b}

재구성한 후에 우리는 마침내 찾을 수 있다.

a+n\log \left({\frac {\theta _{1}}{\theta _{0}}}\right)<\left({\frac {\theta _{1}-\theta _{0}}{\theta _{0}\theta _{1}}}\right)\sum _{i=1}^{n}x_{i}<b+n\log \left({\frac {\theta _{1}}{\theta _{0}}}\right)

임계값은 경사 $\log(\theta _{1}/\theta _{0})$ ⁡ $\log(\theta _{1}/\theta _{0})$ ( $\log(\theta _{1}/\theta _{0})$ 1 $\log(\theta _{1}/\theta _{0})$ / $\log(\theta _{1}/\theta _{0})$ 0 $\log(\theta _{1}/\theta _{0})$ ) ${\displaystyle \log(\theta \{1}/\theta _{0})$ 가 있는 두 개의 평행선일 뿐이다 $\log(\theta _{1}/\theta _{0})$ 샘플의 합계가 연속 샘플링 영역 밖으로 이동할 때 샘플링이 중지되어야 한다.

적용들

제조업

시험은 비율 측정법으로 수행되며 변수 p가 두 개의 원하는 점 중 하나(p₁₂ 또는 p)와 동일한지 검정한다. 이 두 지점 사이의 지역은 무관심 지역(IR)으로 알려져 있다. 예를 들어, 공장 로트의 위젯에 대한 품질 관리 연구를 수행한다고 가정합시다. 관리 부서에서는 로트의 불량률이 3% 이하인 것을 원하지만 1% 이하가 가장 이상적인 로트라고 한다. 이 예제에서 p₁ = 0.01 및 p = 0₂.03이며, 경영진은 이러한 로트를 한계로 간주하고 어느 쪽이든 분류해도 괜찮기 때문에 그 사이의 영역은 IR이다. 테스트가 허용 가능한 오류 수준 내에서 로트가 이상적이거나 거부되어야 한다고 판단할 때까지 위젯은 로트에서 한 번에 하나씩 샘플링된다(순차 분석).

수험생 시험

SPRT는 현재 가변 길이 컴퓨터 분류 시험(CCT)에서 수험생을 분류하는 주요 방법이다.^{[citation needed]} 두 매개변수는 p와₁ p로₂, 정확한 비율의 측정지표에 대한 수험생의 컷스코어(임계값)를 결정하고, 컷스코어 위와 아래의 점을 선택하여 지정한다. 예를 들어, 컷스코어가 테스트의 70%로 설정되어 있다고 가정해 보십시오. 우리는₁ p = 0.65와 p₂ = 0.75를 선택할 수 있다. 그런 다음 이 테스트는 해당 메트릭스에 대한 수험자의 실제 점수가 이 두 점 중 하나와 같을 가능성을 평가한다. 수험생이 75%로 결정되면 합격하고, 65%로 결정되면 불합격한다.

이 점들은 완전히 임의로 명시되지 않았다. 컷스코어는 항상 수정된 앤고프 절차와 같이 법적으로 방어할 수 있는 방법으로 설정되어야 한다. 다시 말하지만, 무관심 영역은 시험 설계자가 어느 쪽이든 괜찮다고 생각하는 점수 영역을 나타낸다(합격 또는 불합격). 상위 매개변수 p는₂ 개념적으로 시험 설계자가 불합격(아래 모든 사람이 불합격할 가능성이 높기 때문에)으로 받아들이려고 하는 최상위 수준이고, 하위 매개변수₁ p는 합격에 대해 시험 설계자가 기꺼이 받아들이려고 하는 최저 수준이다(위 모든 사람이 합격을 할 가능성이 충분하기 때문이다). 이러한 정의가 상대적으로 작은 부담으로 보일 수 있지만, 의사 면허 시험의 중요한 사례를 고려해 보십시오: 어떤 시점에서 우리는 누군가가 이 두 가지 수준 중 하나라고 생각해야 하는가?

SPRT는 이전 단락에서와 같이 고전적인 시험 이론의 시대에 처음으로 시험에 적용되었지만, 레카세(1983)는 항목₁ 반응 이론을 사용하여 p와₂ p 매개변수를 결정할 것을 제안했다. 컷스코어 및 무관심 영역은 잠재 능력(teta) 메트릭에 대해 정의되며, 계산을 위한 비율 메트릭으로 변환된다. 그 이후 CCT에 대한 연구는 다음과 같은 몇 가지 이유로 이 방법론을 적용했다.

대형 품목 은행은 IRT로 교정되는 경향이 있다.
이를 통해 파라미터의 정확한 사양을 얻을 수 있다.
항목별로 항목별 응답 기능을 활용하면 항목별로 매개변수가 쉽게 달라질 수 있다.

비정상적인 의료 결과의 감지

슈피겔할터 ^[6]외 SPRT는 의사, 외과의사 및 기타 의료진의 성과를 모니터링하는 데 사용될 수 있으며, 이는 잠재적으로 변칙적인 결과를 조기에 경고하기 위한 것이다. 2003년 논문에서, 그들은 해롤드 시프먼이 실제로 밝혀지기 훨씬 전에 어떻게 그가 살인자라는 것을 밝혀낼 수 있었는지 보여주었다.

확장

맥스프렛

더 최근에는 2011년에 SPRT 방법의 확장인 MaxSPRT가 도입되었다.^[7] MaxSPRT의 두드러진 특징은 복합적인 단측 대립 가설을 허용하고 상부 정지 경계를 도입하는 것이다. 이 방법은 여러 의학 연구에 사용되었다.^[8]

참고 항목

참조

^ Wald, Abraham (June 1945). "Sequential Tests of Statistical Hypotheses". Annals of Mathematical Statistics. 16 (2): 117–186. doi:10.1214/aoms/1177731118. JSTOR 2235829.
^ Wald, A.; Wolfowitz, J. (1948). "Optimum Character of the Sequential Probability Ratio Test". The Annals of Mathematical Statistics. 19 (3): 326–339. doi:10.1214/aoms/1177730197. JSTOR 2235638.
^ 퍼거슨, 리처드 L. (1969년). 개별적으로 규정된 지침 프로그램에 대한 컴퓨터 지원 분기 시험의 개발, 구현 및 평가. 피츠버그 대학의 미발표 박사학위 논문.
^ 셈세, M. D. (1983). 맞춤형 테스트를 사용하여 의사 결정을 내리는 절차. D. J. Weiss (Ed.)에서는 시험의 새로운 지평: 잠재 특성 이론과 컴퓨터화된 적응 시험 (pp. 237-254)을 참조한다. 뉴욕: 아카데미 프레스.
^ Eggen, T. J. H. M. (1999). "Item Selection in Adaptive Testing with the Sequential Probability Ratio Test". Applied Psychological Measurement. 23 (3): 249–261. doi:10.1177/01466219922031365.
^ 위험 조정 순차 확률비 시험: 브리스톨, 시프먼 및 성인 심장수술 슈피겔할터, D. 등 J Qual Health Care vol 15-7-13(2003)^{[데드링크]}
^ Kulldorff, Martin; Davis, Robert L.; Kolczak†, Margarette; Lewis, Edwin; Lieu, Tracy; Platt, Richard (2011). "A Maximized Sequential Probability Ratio Test for Drug and Vaccine Safety Surveillance". Sequential Analysis. 30: 58–78. doi:10.1080/07474946.2011.539924.
^ 섹션 1의 2번째 단락에서 마지막 단락: http://www.tandfonline.com/doi/full/10.1080/07474946.2011.539924 의약품 및 백신 안전 감시 Kulldorff, M. et al 순차 분석을 위한 최대 순차 확률 비율 테스트: 설계 방법 및 응용 프로그램 vol 30, 1호

추가 읽기

Ghosh, Bhaskar Kumar (1970). Sequential Tests of Statistical Hypotheses. Reading: Addison-Wesley.
Holger Wilker: Der Praxis, BoD, Norderstedt 2012, ISBN 978-3848232529.

외부 링크

Stéphane Bottine에 의한 R에 대한 월드의 순차 확률비 검정
제닝 유의 파이썬에 대한 월드의 순차 확률비 시험

[1] Wald, Abraham (June 1945). "Sequential Tests of Statistical Hypotheses". Annals of Mathematical Statistics. 16 (2): 117–186. doi:10.1214/aoms/1177731118. JSTOR 2235829.

[2] Wald, A.; Wolfowitz, J. (1948). "Optimum Character of the Sequential Probability Ratio Test". The Annals of Mathematical Statistics. 19 (3): 326–339. doi:10.1214/aoms/1177730197. JSTOR 2235638.

[3] 퍼거슨, 리처드 L. (1969년). 개별적으로 규정된 지침 프로그램에 대한 컴퓨터 지원 분기 시험의 개발, 구현 및 평가. 피츠버그 대학의 미발표 박사학위 논문.

[4] 셈세, M. D. (1983). 맞춤형 테스트를 사용하여 의사 결정을 내리는 절차. D. J. Weiss (Ed.)에서는 시험의 새로운 지평: 잠재 특성 이론과 컴퓨터화된 적응 시험 (pp. 237-254)을 참조한다. 뉴욕: 아카데미 프레스.

[Eggen1999-5] Eggen, T. J. H. M. (1999). "Item Selection in Adaptive Testing with the Sequential Probability Ratio Test". Applied Psychological Measurement. 23 (3): 249–261. doi:10.1177/01466219922031365.

[6] 위험 조정 순차 확률비 시험: 브리스톨, 시프먼 및 성인 심장수술 슈피겔할터, D. 등 J Qual Health Care vol 15-7-13(2003)^{[데드링크]}

[7] Kulldorff, Martin; Davis, Robert L.; Kolczak†, Margarette; Lewis, Edwin; Lieu, Tracy; Platt, Richard (2011). "A Maximized Sequential Probability Ratio Test for Drug and Vaccine Safety Surveillance". Sequential Analysis. 30: 58–78. doi:10.1080/07474946.2011.539924.

[8] 섹션 1의 2번째 단락에서 마지막 단락: http://www.tandfonline.com/doi/full/10.1080/07474946.2011.539924 의약품 및 백신 안전 감시 Kulldorff, M. et al 순차 분석을 위한 최대 순차 확률 비율 테스트: 설계 방법 및 응용 프로그램 vol 30, 1호

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

Search