유형 I 및 유형 II 오류

Type I and type II errors

통계적 가설 검정에서 유형 I 오류는 실제 참된 귀무 가설("허위 양성" 발견 또는 결론으로 알려져 있다. 예: "무고한 사람이 유죄판결을 받는다")을 잘못 기각한 이고, 유형 2 오류는 실제 거짓 귀무 가설("허위 음성" 발견 또는 결론"이라고도 함)을 잘못 수용한 것이다.usion; 예: "죄를 지은 사람은 유죄가 선고되지 않는다").[1] 대부분의 통계 이론은 이러한 오류들 중 하나 또는 둘 다의 최소화에 초점을 맞추고 있다. 비록 그 결과가 알려진 관찰 가능한 인과 과정에 의해 결정되지 않는다면, 둘 중 하나를 완전히 제거하는 것은 통계적으로 불가능하다. 낮은 임계값(컷오프) 값을 선택하고 알파(p) 수준을 수정함으로써 가설 검정의 품질을 높일 수 있다.[2] 제1종 오류와 제2종 오류에 대한 지식은 의학, 생물 측정학, 컴퓨터 공학에서 널리 사용되고 있다.[clarification needed]

직관적으로 유형 I 오류는 커미션의 오류로 생각할 수 있다. 즉, 연구자는 불행하게도 무언가가 사실이라고 결론짓는다. 예를 들어, 연구자들이 위약과 약물을 비교하는 연구를 생각해 보자. 약을 투여받은 환자가 위약을 투여받은 환자보다 우연한 기회에 좋아진다면 약효가 있는 것으로 보일 수 있지만, 사실 결론은 부정확하다. 반대로 타입 II 오류는 생략 오류다. 위의 예에서, 위약을 받은 환자들보다 더 높은 비율로 나아지지 않았지만, 이것은 무작위 요행이었다면, 그것은 제2종 오류일 것이다. 유형 II 오류의 결과는 누락된 결정의 크기와 방향 및 상황에 따라 달라진다. 백만 명 중 한 명의 환자에게 값비싼 치료법은 비록 그것이 정말로 치료법이라고 할지라도 중요하지 않을 수도 있다.

정의

통계적 배경

통계적 시험 이론에서 통계적 오류의 개념은 가설 시험의 필수적인 부분이다. 이 테스트는 H로0 표시된 귀무 가설과 H로1 표시된 대안 가설이라는 가지 경쟁적 명제를 선택하는 것이다. 이는 개념적으로 법원 재판에서의 판결과 유사하다. 귀무 가설은 피고인의 입장에 해당하는데, 유죄가 입증될 때까지 무죄로 추정되듯이, 자료가 이에 대한 설득력 있는 증거를 제시하기 전까지는 귀무 가설도 사실로 추정된다는 것이다. 대립 가설은 피고에게 불리한 입장에 해당한다. 특히 귀무 가설에는 차이가 없거나 연관성이 없는 경우도 포함된다. 따라서 귀무 가설은 결코 차이나 연관성이 있다는 것이 될 수 없다.

만약 시험 결과가 현실과 일치한다면, 올바른 결정을 내린 것이다. 그러나 시험 결과가 현실과 일치하지 않으면 오류가 발생한 것이다. 결정이 잘못된 두 가지 상황이 있다. 그 귀무 가설은 사실일 수도 있지만, 우리는0 H를 기각한다. 반면에, 대립 가설1 H는 사실일 수 있지만, 우리는0 H를 거부하지 않는다. 두 가지 유형의 오차가 구별된다. Ⅰ유형 오류와 Ⅱ유형 오류.[3]

1종 오류

첫 번째 종류의 오류는 귀무 가설을 시험 절차의 결과로 잘못 기각한 것이다. 이런 종류의 오류를 유형 I 오류(허위 양성)라고 하며, 때로는 제1종 오류라고 부른다.

법정 사례로 볼 때 제1형 오류는 무고한 피고인을 유죄로 판결하는 것과 일치한다.

II형 오류

두 번째 유형의 오차는 귀무 가설을 시험 절차의 결과로 잘못 수용한 것이다. 이러한 종류의 오류를 타입 II 오류(거짓 음성)라고 하며, 제2종 오류라고도 한다.

법정 사례로 볼 때, 제2형 오류는 범죄자를 무죄로 판결하는 것과 일치한다.[4]

교차 오류율

교차 오류율(CER)은 제1종 오류와 제2종 오류가 동일한 지점이며 생체 측정의 효과를 측정하는 최선의 방법을 나타낸다. CER 값이 더 낮은 시스템은 CER 값이 더 높은 시스템보다 더 높은 정확도를 제공한다.

거짓 긍정 및 거짓 부정

자세한 내용 보기: 잘못된 긍정잘못된 부정

거짓 긍정과 거짓 부정의 관점에서, 양의 결과는 귀무 가설을 거부하는 것에 해당하며, 음의 결과는 귀무 가설을 기각하지 않는 것에 해당한다. "거짓말"은 도출된 결론이 부정확하다는 것을 의미한다. 따라서 제1형 오류는 거짓 양성과 같고, 제2형 오류는 거짓 음성과 같다.

오류 유형 표

귀무 가설의 진실성/명확성과 검정 결과 사이의 표로 나타낸 관계:[5]

오류 유형 표
귀무 가설(H0)은
진실의 거짓의
결정
거의 무효인.
가설(H0)
하지 마
퇴짜 놓다

올바른 추론
(진정한 음수)

(probability = 1−α)

II형 오류
(거짓 음성)
(probability = β)
거부하다 1종 오류
(거짓 긍정)
(probability = α)

올바른 추론
(진정 양성)

(probability = 1−β)

오류율

음의 표본(왼쪽 곡선)에서 얻은 결과는 양의 표본(오른쪽 곡선)에서 얻은 결과와 겹친다. 결과 컷오프 값(수직 막대)을 이동함으로써 거짓 음성(FN)의 수를 올리는 데 드는 비용에서 거짓 양성(FP)의 비율을 감소시킬 수 있고, 반대로 거짓 양성(TP = 참 양성, TPR = 참 양성, FPR = 참 양성 비율, FPR = 참 음성)의 비율을 감소시킬 수 있다.

완벽한 테스트는 거짓 긍정도 없고 거짓 부정도 없을 것이다. 그러나 통계적 방법은 확률론적이며, 통계적 결론이 정확한지는 확실하지 않다. 불확실성이 있을 때마다 오류를 범할 가능성이 있다. 통계과학의 이러한 특성을 고려할 때 모든 통계적 가설 검정에는 유형 I과 유형 II의 오차가 발생할 가능성이 있다.[6]

  • I형 오류율 또는 유의 수준은 참이라는 귀무 가설을 기각할 확률이다. 그리스 문자 α(알파)로 표시되며 알파 수준이라고도 한다. 일반적으로 유의 수준은 0.05(5%)로 설정되어 있어 실제 귀무 가설을 잘못 기각할 확률을 5%로 할 수 있음을 시사한다.[7]
  • 타입 II 오류의 속도는 그리스 문자 β(베타)로 표시되며, 1-β와 같은 시험의 힘과 관련된다.[8]

이 두 가지 유형의 오류율은 서로 교환된다: 주어진 샘플 세트에 대해, 한 유형의 오류를 줄이려는 노력은 일반적으로 다른 유형의 오류를 증가시킨다.[9]

가설 검정 품질

같은 아이디어는 정확한 결과의 비율로 표현될 수 있으며 따라서 오류율을 최소화하고 가설 검정의 품질을 개선하는 데 사용된다. 제1종 오류를 범할 확률을 줄이기 위해 알파(p) 값을 더 엄격하게 만드는 것은 매우 간단하고 효율적이다. 분석의 검정력과 밀접하게 연관된 제2종 오류를 범할 확률을 감소시키기 위해 검정의 표본 크기를 늘리거나 알파 수준을 완화하면 분석의 검정력이 증가할 수 있다.[10] 제1종 오류율이 제어되는 경우, 시험 통계량은 강력하다.

다양한 임계값(차단) 값을 사용하여 시험을 보다 구체적이거나 민감하게 하여 시험 품질을 높일 수 있다. 예를 들어, 실험자가 혈액 샘플에서 특정 단백질의 농도를 측정할 수 있는 의학 테스트를 상상해 보십시오. 실험자는 임계치(그림의 검은색 수직선)를 조정할 수 있으며, 이 특정 한계치 이상에서 어떤 숫자가 검출되면 사람들은 병에 걸린 것으로 진단될 것이다. 영상에 따르면 임계값을 변경하면 곡선의 움직임에 해당하는 잘못된 긍정과 잘못된 부정의 변화가 발생한다.[11]

실제 실험에서는 모든 타입 I과 타입 II 오류를 피할 수 없기 때문에, H를0 거짓으로 거부하거나 H를0 받아들이기 위해 기꺼이 감수할 위험의 양을 고려하는 것이 중요하다. 이 질문에 대한 해결책은 통계량의 p-값 또는 유의 수준 α를 보고하는 것이다. 예를 들어, 시험 통계 결과의 p-값이 0.0596으로 추정되면 H를0 거짓으로 기각할 확률이 5.96%가 된다. 또는, 통계량이 0.05와 같이 수준 α에서 수행된다고 하면 H를0 5%로 거짓으로 기각할 수 있다. 유의 수준 α 0.05는 비교적 일반적이지만, 모든 시나리오에 맞는 일반적인 규칙은 없다.

차량 속도 측정

미국의 고속도로 제한속도는 시속 120km이다. 지나가는 차량의 속도를 측정하기 위한 장치가 설정되어 있다. 기기가 무작위 샘플 X, X12, X로3 기록하면서 지나가는 차량의 속도를 세 번 측정한다고 가정합시다. 교통경찰은 평균 X의에 따라 운전자들에게 벌금을 부과하거나 부과하지 않을 것이다 즉, 시험 통계인 것이다

또한 X1, X2, X를3 정규 분포 N(μ,4)으로 모형화한다고 가정한다. 그 다음, T는 N(μ,4/3)을 따라야 하며 매개변수 μ는 통과 차량의 실제 속도를 나타낸다. 이 실험에서 귀무 가설 H와0 대립 가설 H는1 다음과 같아야 한다.

H0: μ=120 대 H1: μ1>120.

통계 수준을 α=0.05로 수행할 경우 임계 값 c를 계산하여 해결해야 한다.

정규 분포에 대한 표준 단위 변경 규칙에 따름. Z-테이블을 참조하면

여기, 임계 지역. 즉, 차량의 기록된 속도가 임계치 121.9보다 크면 운전자에게 과태료가 부과된다. 하지만 기록된 평균 속도가 121.9보다 크지만 실제 속도는 120을 넘지 않기 때문에 여전히 5%의 운전자들이 거짓으로 벌금을 물리고 있다. 우리가 말하는 타입 I 오류다.

Ⅱ유형 오류는 차량의 실제 속도가 시속 120㎞를 넘지만 운전자에게 과태료가 부과되지 않는 경우에 해당한다. 예를 들어 차량의 실제 속도가 μ=125일 경우 운전자가 벌금형을 받지 않을 확률을 다음과 같이 계산할 수 있다.

즉, 차량의 실제 속도가 125일 경우 기록된 평균 속도가 121.9보다 낮기 때문에 수준 125에서 통계가 수행될 때 운전자는 벌금을 피할 수 있는 0.36%의 확률을 갖는다. 실제 속도가 125보다 121.9에 가까우면 벌금을 피할 확률도 높아진다.

제1종 오류와 제2종 오류 간의 트레이드오프도 고려해야 한다. 즉, 이 경우 교통경찰이 무고한 운전자에게 허위로 벌금을 부과하지 않으려면 레벨 α를 0.01과 같이 더 작은 값으로 설정할 수 있다. 다만 그렇다고 한다면 125명처럼 실제 속도가 시속 120㎞를 넘는 운전자가 더 많은 경우 벌금형을 피할 가능성이 높다.

어원

로 플로렌스 나이팅게일은 데이비드"형용사를 'r을 기억할 필요가 있다고 말했다 1928년에, 예지 네이만(1894–1981)과 에곤 피어슨(1895–1980), 둘 다 저명한 통계 학자들과 문제점들이"여부를 특별한 샘플은 결정도 가능성이 무작위로 특정 집단을 보고그린으로 판단할 수 있"과 관련된:[12]에 대해 논의했다.andom'['표본 추출'이라는 용어는 표본을 그리는 방법에 적용되어야 하며 표본 자체에는 적용해서는 안 된다."[13]

그들은 "두 가지 오류 발생원" 즉, 다음을 식별자는 다음과 같다.

(a) 기각되지 않아야 할 가설을 기각하는 오류 및
(b) 기각했어야 하는 가설을 기각하지 못한 오류

1930년에 그들은 다음과 같이 말하면서 이 두 가지 오류의 원인을 상세히 설명했다.

...시험 가설에서 두 가지 고려사항을 반드시 염두에 두어야 하며, 우리는 실제 가설을 거부할 가능성을 원하는 만큼 낮출 수 있어야 한다. 시험은 거짓일 가능성이 있을 때 시험된 가설을 기각할 수 있도록 고안되어야 한다.

1933년, 그들은 이러한 문제들이 "진실과 거짓 가설을 확실히 구별할 수 있는 그런 형태로 거의 제시되지 않는다"는 것을 관찰했다. 그들은 또한 "대안 가설의 집합"인1 H, H2... 중에서 특정 가설을 기각하거나 기각할지를 결정할 때 다음과 같은 오류를 범하는 것이 쉽다는 점에 주목하였다.

...[그리고] 이 오류는 두 가지 종류가 될 것이다.

(나) 우리는0 H [즉, 시험할 가설]이 사실일 때 이를 기각한다.[14]
(II) 일부 대립 가설 HA 또는 H가1 참일 때 H를0 기각하지 않는다. (대안에 대한 다양한 명언이 있다.)

네이먼과 피어슨이 공동 집필한 모든 논문에서 H라는0 표현은 항상 "시험할 가설"을 나타낸다.

동일한 논문에서 그들은 이 두 가지 오류 원인, 즉 유형 I의 오류와 유형 II의 오류라고 부른다.[15]

관련 용어

귀무 가설

통계학자가 세계(또는 그 거주자)의 관측된 현상에 관한 「계산 가설」을 뒷받침할 수 있는지 없는지를 판단하기 위해 시험을 실시하는 것이 표준관행이다. 그러한 시험의 결과는 특정 결과 집합이 추정 가설과 합리적으로 일치하는지(또는 일치하지 않는지)를 결정한다.

항상 통계적 관례에 의해 추측된 가설은 틀리고 관측된 현상들이 우연히 발생한다는 이른바 "null 가설"을 전제로 하며, 그 결과, 추측된 작용자는 아무런 영향도 없다는 것을 전제로 – 이 가설의 옳고 그름을 검정하게 될 것이다. 이것이 시험 중인 가설을 종종 귀무 가설이라고 부르는 이유인데, 그것은 시험에 의해 무효가 되거나 무효가 되지 않는 이 가설이기 때문이다(1935, 페이지 19). 귀무 가설이 무효화되면 데이터가 '대체 가설'(원래 추측된 가설)을 뒷받침한다고 결론 내릴 수 있다.

Neyman과 Pearson의 관습에 의한 "시험할 가설"(또는 "무효 가설")을 H라는0 표현으로 나타내는 통계학자들의 일관된 적용은 많은 사람들이 "귀무 가설"이라는 용어를 "nil 가설"이라는 의미로 이해하는 상황을 초래했다 – 문제의 결과가 발생했다는 진술. 우연한 기회에 이는 반드시 그렇지는 않다. 피셔(1966)에 따르면 "귀무 가설은 반드시 정확해야 하며, 모호성과 모호성이 없어야 하며, 이는 유의성의 시험이 해결책인 '분포의 문제'의 기초를 제공해야 하기 때문이다."[16] 그 결과, 실험 과학에서 귀무 가설은 일반적으로 특정 치료에는 영향이 없다는 진술이다. 관찰 과학에서 귀무 가설은 특정 측정 변수의 값과 실험 예측 값 사이에 차이가 없다는 것이다.

통계적 유의성

귀무 가설이 사실이라고 가정할 때 얻어진 결과만큼 극단적인 결과를 얻을 확률은 미리 정해진 컷오프 확률(예: 5%)보다 낮으면 그 결과는 통계적으로 유의미하며 귀무 가설이 기각된다고 한다.

영국의 통계학자 로널드 아일머 피셔(1890~1962) 경은 "null 가설"을 다음과 같이 강조했다.

...은 결코 입증되거나 확립된 적이 없지만, 실험 과정에서 반증되었을 가능성이 있다. 모든 실험은 사실들에 귀무 가설을 반증할 기회를 주기 위해서만 존재한다고 말할 수 있다.

Fisher, 1935, p.19

응용 프로그램 도메인

의학의 실천에서는 검사시험의 응용의 차이가 상당하다.

검진

스크리닝은 많은 사람들에게 주어지는 비교적 값싼 검사를 포함하며, 그 중 어느 것도 질병의 임상적 징후를 나타내지 않는다(예: Pap smears).

검사는 훨씬 더 비싸고 종종 침습적인, 질병의 어떤 임상적 징후를 보이는 사람들에게만 주어지는 절차를 포함하며, 의심스러운 진단을 확인하기 위해 가장 자주 적용된다.

예를 들어, 미국의 대부분의 주에서는 신생아에게 페닐케톤뇨증과 갑상선 기능저하증을 검사하도록 요구한다.

가설: "신생아들은 페닐케톤뇨증과 갑상선 기능저하증을 가지고 있다"

귀무 가설(H0) : "신생아들은 페닐케톤뇨증과 갑상선 기능저하증을 가지고 있지 않다.

Type I 오류(false positive): 사실 신생아들은 페닐케톤뇨증과 갑상선 기능저하증이 없지만 우리는 자료에 따르면 그들이 장애를 가지고 있다고 생각한다.

유형 II 오류(거짓 음수): 사실은 신생아들이 페닐케톤뇨증과 갑상선 기능저하증을 가지고 있지만 우리는 자료에 따르면 그들이 장애를 가지고 있지 않다고 생각한다.

비록 그들이 높은 양의 거짓 양성 비율을 나타내지만, 선별 검사는 훨씬 더 이른 단계에서 이러한 장애를 발견할 가능성을 크게 증가시키기 때문에 가치 있는 것으로 간주된다.

HIV간염의 가능한 헌혈자들을 검사하기 위해 사용되는 간단한 혈액 검사는 상당한 양의 잘못된 양성 비율을 가지고 있지만, 의사들은 한 사람이 실제로 이러한 바이러스에 감염되었는지 여부를 결정하기 위해 훨씬 더 비싸고 훨씬 더 정확한 검사를 사용한다.

아마도 의학 검진에서 가장 널리 논의되고 있는 거짓 양성반응은 유방암 검진 절차 유방조영술에서 나온 것일 것이다. 미국의 거짓 양성 유방조영술 비율은 최대 15%로 세계 최고 수준이다. 미국에서 높은 허위 양성률의 한 가지 결과는, 어떤 10년 동안, 검진된 미국 여성의 절반이 거짓 양성 유방조영술을 받는다는 것이다. 거짓 양성 유방조영술은 미국에서 매년 1억 달러 이상이 후속 검사 및 치료에 지출될 정도로 비용이 많이 든다. 그들은 또한 여성들에게 불필요한 걱정을 끼친다. 미국에서 허위 양성률이 높은 결과, 양성 유방조영술을 받은 여성의 90~95%가 이 질환을 가지고 있지 않다. 세계에서 가장 낮은 비율은 네덜란드로 1%이다. 가장 낮은 비율은 일반적으로 유방 촬영 필름을 두 번 읽고 추가 검사를 위한 높은 임계값이 설정된 북유럽에서 나타난다(높은 임계값은 테스트의 힘을 감소시킨다).

이상적인 인구 선별 검사는 비용이 저렴하고, 관리하기 쉬우며, 가능하다면 거짓 부정행위도 전혀 발생하지 않을 것이다. 그러한 테스트는 대개 더 많은 거짓 긍정을 발생시키며, 이는 결과적으로 더 정교한 (그리고 비용이 많이 드는) 테스트에 의해 분류될 수 있다.

건강검진

잘못된 부정과 잘못된 긍정은 의료검사에서 중요한 이슈다.

가설: "환자들은 특정한 질병을 가지고 있다."

귀무 가설(H0) : "환자들은 특정 질환을 가지고 있지 않다."

Type I 오류(false positive): 실제 환자들은 특정 질환이 없지만 검사결과에 따라 내과 의사들이 질병이 있었다고 판단하고 있다.

허위 긍정도 검진에서처럼 검색되는 상태가 드물 때 심각하고 직관에 반하는 문제를 일으킬 수 있다. 검사에서 1만분의 1의 거짓 양성률이 있지만 100만 개의 표본(또는 사람) 중 1개만 참 양성인 경우, 해당 검사에서 검출된 양성반응의 대부분은 거짓이 된다. 관찰된 양성 결과가 거짓 양성일 확률은 베이즈의 정리를 이용하여 계산할 수 있다.

유형 II 오류(거짓 음수): 그는 "실제로 질병이 존재하지만 검사 보고서가 환자들과 의사들에게 질병이 없다는 거짓 안심할 수 있는 메시지를 제공하고 있다"고 말했다.

거짓 부정은 특히 찾고 있는 조건이 흔한 경우 심각하고 직관에 반하는 문제를 낳는다. 실제 발생률이 70%인 모집단을 테스트할 때 거짓 음성률이 10%에 불과한 테스트를 사용하면 해당 테스트에서 검출된 음성 중 상당수가 거짓이 된다.

이것은 때때로 환자와 그들의 질병 모두를 부적절하거나 부적절한 치료로 이끈다. 심장 스트레스 테스트가 진전된 협착증으로 인한 관상동맥 혈류 한계만 감지하는 것으로 알려져 있음에도 불구하고 관상동맥 동맥경화증을 검출하기 위해 심장 스트레스 테스트에 의존하는 것이 일반적인 예다.

생체 측정학

지문 인식, 안면 인식 또는 홍채 인식과 같은 생체 인식 일치는 타입 I과 타입 II 오류에 취약하다.

가설: "입력이 검색된 사람 목록에 있는 사람을 식별하지 않음"

귀무 가설: "입력이 검색된 사람 목록에서 누군가를 식별함"

유형 I 오류(허위 거부 비율): "정확한 사실은 그 사람이 검색대상에 있는 사람이지만 그 사람이 그 자료에 따르면 아니라고 시스템이 결론을 내린다는 것이다."

유형 II 오류(허위 일치 비율): "진짜 사실은 그 사람이 검색된 목록에 있는 사람이 아니라 그 사람이 우리가 찾고 있는 사람이라는 것이 시스템에 의해 결론지어진다는 것이다."

I형 오류의 확률을 "허위 거부율"(FRR) 또는 거짓 불일치율(FNMR)이라고 하고, 반면, II형 오류의 확률을 "허위 수용률"(FAR) 또는 거짓 일치율(FMR)이라고 한다.

시스템이 용의자와 거의 일치하지 않도록 설계된 경우, 타입 II 오류의 확률을 "허위 경보 속도"라고 할 수 있다. 한편, 시스템을 검증(그리고 수용이 표준)에 사용하는 경우 FAR은 시스템 보안의 척도인 반면 FRR은 사용자 불편 수준을 측정한다.

보안심사

주요기사 : 폭발물탐지금속탐지기

공항 보안 심사에서는 매일 잘못된 긍정이 일상적으로 발견되는데, 이는 궁극적으로 육안 검사 시스템이다. 설치된 보안경보기는 무기가 항공기에 반입되는 것을 방지하기 위한 것이지만, 키, 벨트 버클, 느슨한 거스름돈, 휴대전화, 신발의 선반과 같은 사소한 물품에 대해 하루에 여러 번 경보를 울릴 정도로 높은 감도로 설정되어 있는 경우가 많다.

여기서 가설은 '품목은 무기'이다.

귀무 가설: "그 물건은 무기가 아니다."

Type I 오류(false positive): "진정한 사실은 그 물건이 무기가 아니라 시스템이 여전히 경보를 울린다는 것이다."

제2종 오류(거짓 음성) "진정한 사실은 그 물건이 무기지만 이 때 시스템은 침묵을 지키고 있다."

따라서 (무고한 여행자를 테러리스트로 식별) 거짓 긍정과 진정한 긍정(테러리스트가 될 가능성이 있는 사람을 감지)의 비율은 매우 높고, 거의 모든 경보는 거짓 양성이기 때문에 이러한 선별 시험의 긍정적 예측 값은 매우 낮다.

거짓 결과의 상대적 비용은 시험 작성자가 이러한 사건 발생을 허용할 가능성을 결정한다. 이 시나리오에서 거짓 음성 비용이 매우 높은 반면(비행기에 폭탄을 반입하지 않으면 수백 명의 사망자가 발생할 수 있음) 거짓 양성 비용은 상대적으로 낮기 때문에(합리적으로 간단한 추가 검사), 가장 적절한 시험은 통계 특수성은 낮지만 통계 민감도는 높은 시험이다().최소의 거짓 부정의 대가로 높은 비율의 잘못된 긍정을 허용하는 것).

컴퓨터

거짓 긍정과 거짓 부정의 개념은 컴퓨터 보안, 스팸 필터링, 멀웨어, 광학 문자 인식 등을 포함한 컴퓨터 및 컴퓨터 응용 분야의 광범위한 통화를 가지고 있다.

예를 들어, 스팸 필터링의 경우, 여기서의 가설은 메시지가 스팸이라는 것이다.

따라서, 귀무 가설: "메시지는 스팸이 아니다."

Type I 오류(false positive): "스팸 필터링이나 스팸 차단 기술은 합법적인 전자 메일 메시지를 스팸으로 잘못 분류하여 결과적으로 배달에 지장을 준다."

대부분의 안티스팸 전술은 원하지 않는 전자 메일을 높은 비율로 차단하거나 필터링할 수 있지만, 중요한 잘못된 긍정 결과를 만들지 않고 그렇게 하는 것은 훨씬 더 까다로운 작업이다.

유형 II 오류(거짓 음수): "스팸 전자 메일은 스팸으로 탐지되지 않고 비 스팸으로 분류된다." 잘못된 부정의 수가 적은 것은 스팸 필터링의 효율성을 나타내는 지표다.

참고 항목

참조

  1. ^ "Type I Error and Type II Error". explorable.com. Retrieved 14 December 2019.
  2. ^ Chow, Y. W.; Pietranico, R.; Mukerji, A. (27 October 1975). "Studies of oxygen binding energy to hemoglobin molecule". Biochemical and Biophysical Research Communications. 66 (4): 1424–1431. doi:10.1016/0006-291x(75)90518-5. ISSN 0006-291X. PMID 6.
  3. ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.CS1 maint: 기타(링크)
  4. ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.CS1 maint: 기타(링크)
  5. ^ Sheskin, David (2004). Handbook of Parametric and Nonparametric Statistical Procedures. CRC Press. p. 54. ISBN 1584884401.
  6. ^ Smith, R. J.; Bryant, R. G. (27 October 1975). "Metal substitutions incarbonic anhydrase: a halide ion probe study". Biochemical and Biophysical Research Communications. 66 (4): 1281–1286. doi:10.1016/0006-291x(75)90498-2. ISSN 0006-291X. PMID 3.
  7. ^ Lindenmayer, David. (2005). Practical conservation biology. Burgman, Mark A. Collingwood, Vic.: CSIRO Pub. ISBN 0-643-09310-9. OCLC 65216357.
  8. ^ Chow, Y. W.; Pietranico, R.; Mukerji, A. (27 October 1975). "Studies of oxygen binding energy to hemoglobin molecule". Biochemical and Biophysical Research Communications. 66 (4): 1424–1431. doi:10.1016/0006-291x(75)90518-5. ISSN 0006-291X. PMID 6.
  9. ^ Smith, R. J.; Bryant, R. G. (27 October 1975). "Metal substitutions incarbonic anhydrase: a halide ion probe study". Biochemical and Biophysical Research Communications. 66 (4): 1281–1286. doi:10.1016/0006-291x(75)90498-2. ISSN 0006-291X. PMID 3.
  10. ^ Smith, R. J.; Bryant, R. G. (27 October 1975). "Metal substitutions incarbonic anhydrase: a halide ion probe study". Biochemical and Biophysical Research Communications. 66 (4): 1281–1286. doi:10.1016/0006-291x(75)90498-2. ISSN 0006-291X. PMID 3.
  11. ^ Moroi, K.; Sato, T. (15 August 1975). "Comparison between procaine and isocarboxazid metabolism in vitro by a liver microsomal amidase-esterase". Biochemical Pharmacology. 24 (16): 1517–1521. doi:10.1016/0006-2952(75)90029-5. ISSN 1873-2968. PMID 8.
  12. ^ NEYMAN, J.; PEARSON, E. S. (1928). "On the Use and Interpretation of Certain Test Criteria for Purposes of Statistical Inference Part I". Biometrika. 20A (1–2): 175–240. doi:10.1093/biomet/20a.1-2.175. ISSN 0006-3444.
  13. ^ C.I.K.F. (July 1951). "Probability Theory for Statistical Methods. By F. N. David. [Pp. ix + 230. Cambridge University Press. 1949. Price 155.]". Journal of the Staple Inn Actuarial Society. 10 (3): 243–244. doi:10.1017/s0020269x00004564. ISSN 0020-269X.
  14. ^ H0 식의 첨자는 0(null을 나타냄)이며 "O"(원본을 나타냄)가 아니라는 점에 유의하십시오.
  15. ^ Neyman, J.; Pearson, E. S. (30 October 1933). "The testing of statistical hypotheses in relation to probabilities a priori". Mathematical Proceedings of the Cambridge Philosophical Society. 29 (4): 492–510. Bibcode:1933PCPS...29..492N. doi:10.1017/s030500410001152x. ISSN 0305-0041.
  16. ^ 피셔, R.A. (1966년) 실험의 설계. 제8판 하프너:에든버러의

참고 문헌 목록

  • 베츠, M.A. & Gabriel, K.R., "타입 IV 오류 및 단순 효과 분석", 교육 통계 저널, Vol.3, No.2, (1978년 여름), 페이지 121–144.
  • 데이비드, F.N., "대안 순서의 무작위성 테스트를 위한 전력 함수", 바이오메트리카, 34권, 3/4권, (1947년 12월), 페이지 335–339.
  • 피셔, R.A., The Design of Experties, Oliver & Boyd (Edinburg), 1935.
  • W, Gambrill, "신생아 질병 테스트에 대한 잘못된 긍정" 건강의 날 (2006년 6월 5일) [1]
  • H.F. Kaiser, "방향 통계 결정", 심리학적 검토, Vol.67, No.3, (1960년 5월), 페이지 160–167.
  • A.W. Kimball, "통계컨설팅에서의 제3종 오류" 미국통계학회지 제5권, 제278호, (1957년 6월), 페이지 133~142.
  • 루빈, A, "중대한 상호작용의 해석", 교육심리 측정, 제21권, 제4권, (1961년 겨울), 페이지 807–817.
  • Marascuilo, L.A. & Levin, J.R. "분산 분석 설계에서 교호작용 및 내포된 가설에 대한 적절한 사후 임시 비교: 유형-IV 오류의 제거", 미국 교육 연구 저널, Vol.7, No.3, (70년 5월), 페이지 397–421.
  • Mitroff, I.I. & Feedingham, T.R., "시스템적 문제 해결과 제3종류의 오류", 행동과학, 제19권, 제6권, (74년 11월), 페이지 383–393.
  • Mosteller, F, "극한 모집단을 위한 k-표본 미끄러짐 시험", 수학 통계 연보, 19권, 1권, (1948년 3월), 58-65페이지.
  • Moulton, R.T., "네트워크 보안", Datamation, Vol.29, No.7, (1983년 7월), 페이지 121-127.
  • Raiffa, H, 의사결정 분석: 불확실성 하에서의 선택에 대한 입문 강의, 애디슨-웨슬리, (읽기), 1968.

외부 링크