순차 확률비 검정

Sequential probability ratio test

순차 확률비 시험(SPRT)은 아브라함 월드[1] 개발한 특정 순차 가설 시험으로 나중에 월드와 제이콥 울포위츠가 최적임을 입증했다.[2] 네이먼과 피어슨의 1933년 결과는 월드가 그것을 순차적 분석 문제로 재조명하도록 고무시켰다. 반면 Neyman-Pearson 보조정리기는 모든 데이터가 수집될 때(그리고 그 가능성을 알 수 있는 비율)에 대한 경험 법칙을 제공한다.

SPRT는 원래 제조 분야의 품질관리 연구에 사용하기 위해 개발되었지만, 인간 수험생들의 컴퓨터화된 시험에서 종료 기준으로 사용하기 위해 만들어졌다.[3][4][5]

이론

고전적 가설 검정에서와 같이 SPRT는 귀무 가설대립 가설의 경우 H 1 }라고 하는 가설 쌍으로 시작한다. 이들 항목은 다음과 같이 명시해야 한다.

다음 단계는 로그 우도비의 누적 계산하여 데이터가 도착하면 S = 을 사용한 다음 i i=1,2,...

중지 규칙은 단순 임계값 지정 체계:

  • < < : 계속 모니터링(심각한 불평등)
  • : 1 } 수용
  • : 수락

여기 b는 원하는 유형 I 및 II 에 따라 달라진다 다음과 같이 선택할 수 있다.

1 - {\ 1-

, 임계값을 적절히 설정하려면 {\alpha }과 β {\displaystyle }을 미리 결정해야 한다. 그 수치는 신청서에 따라 달라질 것이다. 근사치일 뿐인 이유는 이산형 사례에서 신호가 표본 사이의 임계값을 교차할 수 있기 때문이다. 따라서 오류 발생의 벌칙과 샘플링 빈도에 따라 임계값을 보다 적극적으로 설정할 수 있다. 정확한 한계는 연속적인 경우 정확하다.

교과서적인 예는 확률 분포 함수모수 추정이다. 지수 분포를 고려하십시오.

가설은

그런 다음 한 표본에 대한 로그 우도 함수(LLLF)는 다음과 같다.

모든 x에 대한 LLF의 누적 합계는

따라서 중지 규칙은 다음과 같다.

재구성한 후에 우리는 마침내 찾을 수 있다.

임계값은 경사 ( 1/ 0) 가 있는 두 개의 평행선일 뿐이다 샘플의 합계가 연속 샘플링 영역 밖으로 이동할 때 샘플링이 중지되어야 한다.

적용들

제조업

시험은 비율 측정법으로 수행되며 변수 p가 두 개의 원하는 점 중 하나(p12 또는 p)와 동일한지 검정한다. 이 두 지점 사이의 지역은 무관심 지역(IR)으로 알려져 있다. 예를 들어, 공장 로트의 위젯에 대한 품질 관리 연구를 수행한다고 가정합시다. 관리 부서에서는 로트의 불량률이 3% 이하인 것을 원하지만 1% 이하가 가장 이상적인 로트라고 한다. 이 예제에서 p1 = 0.01 및 p = 02.03이며, 경영진은 이러한 로트를 한계로 간주하고 어느 쪽이든 분류해도 괜찮기 때문에 그 사이의 영역은 IR이다. 테스트가 허용 가능한 오류 수준 내에서 로트가 이상적이거나 거부되어야 한다고 판단할 때까지 위젯은 로트에서 한 번에 하나씩 샘플링된다(순차 분석).

수험생 시험

SPRT는 현재 가변 길이 컴퓨터 분류 시험(CCT)에서 수험생을 분류하는 주요 방법이다.[citation needed] 두 매개변수는 p1 p2, 정확한 비율의 측정지표에 대한 수험생의 컷스코어(임계값)를 결정하고, 컷스코어 위와 아래의 점을 선택하여 지정한다. 예를 들어, 컷스코어가 테스트의 70%로 설정되어 있다고 가정해 보십시오. 우리는1 p = 0.65p2 = 0.75를 선택할 수 있다. 그런 다음 이 테스트는 해당 메트릭스에 대한 수험자의 실제 점수가 이 두 점 중 하나와 같을 가능성을 평가한다. 수험생이 75%로 결정되면 합격하고, 65%로 결정되면 불합격한다.

이 점들은 완전히 임의로 명시되지 않았다. 컷스코어는 항상 수정된 앤고프 절차와 같이 법적으로 방어할 수 있는 방법으로 설정되어야 한다. 다시 말하지만, 무관심 영역은 시험 설계자가 어느 쪽이든 괜찮다고 생각하는 점수 영역을 나타낸다(합격 또는 불합격). 상위 매개변수 p2 개념적으로 시험 설계자가 불합격(아래 모든 사람이 불합격할 가능성이 높기 때문에)으로 받아들이려고 하는 최상위 수준이고, 하위 매개변수1 p는 합격에 대해 시험 설계자가 기꺼이 받아들이려고 하는 최저 수준이다(위 모든 사람이 합격을 할 가능성이 충분하기 때문이다). 이러한 정의가 상대적으로 작은 부담으로 보일 수 있지만, 의사 면허 시험의 중요한 사례를 고려해 보십시오: 어떤 시점에서 우리는 누군가가 이 두 가지 수준 중 하나라고 생각해야 하는가?

SPRT는 이전 단락에서와 같이 고전적인 시험 이론의 시대에 처음으로 시험에 적용되었지만, 레카세(1983)는 항목1 반응 이론을 사용하여 p2 p 매개변수를 결정할 것을 제안했다. 컷스코어 및 무관심 영역은 잠재 능력(teta) 메트릭에 대해 정의되며, 계산을 위한 비율 메트릭으로 변환된다. 그 이후 CCT에 대한 연구는 다음과 같은 몇 가지 이유로 이 방법론을 적용했다.

  1. 대형 품목 은행은 IRT로 교정되는 경향이 있다.
  2. 이를 통해 파라미터의 정확한 사양을 얻을 수 있다.
  3. 항목별로 항목별 응답 기능을 활용하면 항목별로 매개변수가 쉽게 달라질 수 있다.

비정상적인 의료 결과의 감지

슈피겔할터 [6] SPRT는 의사, 외과의사 및 기타 의료진의 성과를 모니터링하는 데 사용될 수 있으며, 이는 잠재적으로 변칙적인 결과를 조기에 경고하기 위한 것이다. 2003년 논문에서, 그들은 해롤드 시프먼이 실제로 밝혀지기 훨씬 전에 어떻게 그가 살인자라는 것을 밝혀낼 수 있었는지 보여주었다.

확장

맥스프렛

더 최근에는 2011년에 SPRT 방법의 확장인 MaxSPRT가 도입되었다.[7] MaxSPRT의 두드러진 특징은 복합적인 단측 대립 가설을 허용하고 상부 정지 경계를 도입하는 것이다. 이 방법은 여러 의학 연구에 사용되었다.[8]

참고 항목

참조

  1. ^ Wald, Abraham (June 1945). "Sequential Tests of Statistical Hypotheses". Annals of Mathematical Statistics. 16 (2): 117–186. doi:10.1214/aoms/1177731118. JSTOR 2235829.
  2. ^ Wald, A.; Wolfowitz, J. (1948). "Optimum Character of the Sequential Probability Ratio Test". The Annals of Mathematical Statistics. 19 (3): 326–339. doi:10.1214/aoms/1177730197. JSTOR 2235638.
  3. ^ 퍼거슨, 리처드 L. (1969년). 개별적으로 규정된 지침 프로그램에 대한 컴퓨터 지원 분기 시험의 개발, 구현 평가. 피츠버그 대학의 미발표 박사학위 논문.
  4. ^ 셈세, M. D. (1983). 맞춤형 테스트를 사용하여 의사 결정을 내리는 절차. D. J. Weiss (Ed.)에서는 시험의 새로운 지평: 잠재 특성 이론과 컴퓨터화된 적응 시험 (pp. 237-254)을 참조한다. 뉴욕: 아카데미 프레스.
  5. ^ Eggen, T. J. H. M. (1999). "Item Selection in Adaptive Testing with the Sequential Probability Ratio Test". Applied Psychological Measurement. 23 (3): 249–261. doi:10.1177/01466219922031365.
  6. ^ 위험 조정 순차 확률비 시험: 브리스톨, 시프먼 및 성인 심장수술 슈피겔할터, D. 등 J Qual Health Care vol 15-7-13(2003)[데드링크]
  7. ^ Kulldorff, Martin; Davis, Robert L.; Kolczak†, Margarette; Lewis, Edwin; Lieu, Tracy; Platt, Richard (2011). "A Maximized Sequential Probability Ratio Test for Drug and Vaccine Safety Surveillance". Sequential Analysis. 30: 58–78. doi:10.1080/07474946.2011.539924.
  8. ^ 섹션 1의 2번째 단락에서 마지막 단락: http://www.tandfonline.com/doi/full/10.1080/07474946.2011.539924 의약품 및 백신 안전 감시 Kulldorff, M. et al 순차 분석을 위한 최대 순차 확률 비율 테스트: 설계 방법응용 프로그램 vol 30, 1호

추가 읽기

외부 링크