기준 환율 오류
Base rate fallacy기준금리[1] 무시 또는 기준금리 편향이라고도 하는 기준금리 오류는 사람들이 개별화된 정보(특정 [2]사례와 관련된 정보)를 선호하기 위해 기준금리(즉, 일반적인 보급률)를 무시하는 경향이 있는 오류의 한 유형이다.기준금리 경시는 보다 일반적인 확장경시의 특정 형태이다.
거짓 긍정 역설
기준금리 오류의 예는 거짓 긍정 역설이다.이 역설은 실제 양성보다 거짓 양성 검사 결과가 더 많은 상황을 설명합니다.예를 들어 얼굴인식 카메라가 수배자를 99% 정확하게 식별할 수 있지만 하루에 1만 명을 분석한다면, 높은 정확도는 검사 횟수보다 더 중요하며, 프로그램의 범죄자 명단은 사실보다 훨씬 더 많은 거짓 양성이 있을 것이다.양성 테스트 결과의 확률은 테스트의 정확성뿐만 아니라 표본 [3]모집단의 특성에 의해서도 결정됩니다.특정 조건을 가진 사람의 비율인 유병률이 검사의 거짓 양성률보다 낮으면, 개별 사례에서 거짓 양성 값을 줄 위험이 매우 낮은 검사라도 전체적으로 [4]거짓 양성 값보다 더 많은 거짓 양성 값을 줄 것이다.그 역설은 대부분의 [5]사람들을 놀라게 한다.
특히 고위험군으로부터 도출된 양성 결과를 처리한 후 저우선도 모집단에 [4]대한 테스트에서 양성 결과를 해석하는 경우에는 직관에 반한다.테스트의 거짓 양성 비율이 해당 조건을 가진 새로운 모집단의 비율보다 높을 경우, 높은 확률의 모집단에서 테스트한 경험이 있는 테스트 관리자는 경험에서 양성 테스트 결과가 일반적으로 양성 피험자를 나타내며, 실제로 거짓 양성 반응이 멀리 있을 때 결론을 내릴 수 있다.e가 발생했을 가능성이 있습니다.
예
예 1: 질병
고위험군
번호 사람의 | 감염. | 감염되지 않았다 | 총 |
---|---|---|---|
시험 긍정의 | 400 (진정한 긍정) | 30 (false positive) | 430 |
시험 아니요. | 0 (false negative) | 570 (진정한 음수) | 570 |
총 | 400 | 600 | 1000 |
40%가 감염되는 1000명의 모집단 A에 대해 감염증 검사를 실행한다고 가정해 보십시오.검정의 거짓 양수 비율은 5%(0.05)이고 거짓 음수 비율은 없습니다.모집단 A에 대한 1000개 검정의 예상 결과는 다음과 같습니다.
- 감염 및 검사에서 질병 소견(진정한 양성)
- 1000 ×40/100 = 400명이 진정한 긍정을 받게 됩니다.
- 비감염 및 검사에서 질병(거짓 양성)이 관찰됩니다.
- 1000 × 100 – 40/100 × 0.05 = 30명이 거짓 양성을 받을 것이다.
- 나머지 570개의 테스트는 올바르게 음성입니다.
따라서 모집단 A에서 양성 검사를 받은 사람은 93% 이상(400/30+400) 감염을 정확하게 나타낼 수 있습니다.
저인시던스 모집단
번호 사람의 | 감염. | 감염되지 않았다 | 총 |
---|---|---|---|
시험 긍정의 | 20 (진정한 긍정) | 49 (false positive) | 69 |
시험 아니요. | 0 (false negative) | 931 (진정한 음수) | 931 |
총 | 20 | 980 | 1000 |
이제 2%만 감염되는 모집단 B에 적용되는 동일한 검사를 생각해 보십시오.모집단 B에 대한 1000개 검정의 예상 결과는 다음과 같습니다.
- 감염 및 검사에서 질병 소견(진정한 양성)
- 1000 × 2/100 = 20명이 진정한 긍정을 받는다.
- 비감염 및 검사에서 질병(거짓 양성)이 관찰됩니다.
- 1000 × 100 – 2/100 × 0.05 = 49명이 거짓 양성을 받을 것이다.
- 나머지 931(= 1000 - (49 + 20) 테스트는 올바르게 음성입니다.
모집단 B에서는 양성 반응이 나온 69명 중 20명만 실제로 감염됐다.따라서, 감염되었다고 전해진 후에 실제로 감염될 확률은 "95% 정확"으로 보이는 테스트의 경우 29%(20/20+49)에 불과합니다.
그룹 A의 경험이 있는 검사자는 그룹 B에서 일반적으로 정확하게 감염을 나타내던 결과가 현재 일반적으로 잘못된 양성이라는 것을 역설적으로 발견할 수 있다.감염 후 확률과 위양성을 받을 확률을 혼동하는 것은 건강을 위협하는 검사 결과를 받은 후의 자연스러운 오류이다.
예 2: 음주 운전자
- 한 무리의 경찰관들이 음주측정기를 소지하고 있는데 운전자가 술을 마시지 않은 경우 5%가 거짓 음주상태입니다.하지만 음주 측정기는 반드시 진정으로 취한 사람을 감지합니다.운전자 천 명 중 한 명이 음주운전을 하고 있다.경찰관이 음주 측정을 실시하기 위해 무작위로 운전자를 정지시킨다고 가정합니다.운전자가 음주 상태임을 나타냅니다.우리는 당신이 그들에 대해 아무것도 모른다고 생각합니다.그들이 정말로 술에 취했을 확률은 얼마나 될까?
95%까지 대답하는 경우가 많지만, 정확한 확률은 약 2%입니다.
이에 대한 설명은 다음과 같습니다.테스트 대상 드라이버는 평균 1,000개입니다.
- 음주운전자는 1명이고, 그 운전자에 대한 진정한 양성 테스트 결과가 있는 것은 100% 확실하므로, 하나의 진정한 양성 테스트 결과가 있습니다.
- 음주운전자는 999명이며, 음주운전자는 오양성검사 결과가 5%이므로 오양성검사 결과가 49.95명이다.
따라서 1 + 49.95 = 50.95 양성 테스트 결과 중 하나의 드라이버가 실제로 술에 취했을 확률은1/0.1/0.입니다.
그러나 이 결과의 타당성은 경찰관이 운전을 잘못해서가 아니라 정말로 무작위로 운전자를 정지시켰다는 최초 가정의 타당성에 달려 있다.만약 그것이나 운전자를 정지시키는 다른 비임의적인 이유가 존재한다면, 그 계산에는 음주운전자가 능숙하게 운전하고 비음주운전자가 능숙하게 운전할 확률도 포함된다.
좀 더 형식적으로, 대략 0.02의 같은 확률은 베이즈의 정리를 사용하여 구할 수 있다.목표는 음주 측정기가 음주 상태임을 감안할 때 운전자가 음주 상태일 가능성을 찾는 것입니다. 이는 다음과 같이 나타낼 수 있습니다.
여기서 D는 음주 측정기가 운전자가 음주 상태임을 나타냅니다.베이즈의 정리는 우리에게 말한다
첫 번째 단락에서는 다음과 같이 설명했습니다.
- ( n ) \ p ( \ \ } ) } 、
공식에서 알 수 있듯이, Bayes의 정리에는 p(D)가 필요합니다. p(D)는 총 확률의 법칙을 사용하여 이전 값에서 계산할 수 있습니다.
그러면
이 숫자들을 베이즈 정리에 대입하면
예 3: 테러리스트 식별
백만 명의 주민이 사는 도시에는 100명의 테러리스트와 999,900명의 비테러리스트가 있다.예를 간단히 하자면, 도시에 있는 모든 사람들이 거주자라고 가정한다.따라서 무작위로 선택된 도시의 거주자가 테러리스트일 확률은 0.0001이고, 같은 거주자가 비테러리스트일 확률은 0.9999이다.테러범들을 잡기 위해, 시는 감시 카메라와 자동 얼굴 인식 소프트웨어를 갖춘 경보 시스템을 설치한다.
이 소프트웨어에는 1%의 두 가지 장애율이 있습니다.
- 거짓 음의 비율:카메라가 테러리스트를 스캔하면 99%의 시간 동안 벨이 울리고 1%의 시간 동안 벨이 울리지 않습니다.
- 거짓 양수 비율:카메라가 비테러리스트를 스캔하면 벨이 99% 울리지는 않지만 1%가 울립니다.
거주자가 알람을 울린다고 가정해 봅시다.그 사람이 테러리스트일 확률은 얼마나 되나요?즉, 종이 울릴 때 테러리스트가 탐지되었을 가능성은 얼마인가?기준금리 오류를 범하는 사람은 적발된 사람이 테러리스트일 확률이 99%라고 추론할 것이다.비록 그 추론이 타당해 보이지만, 사실 그것은 잘못된 추론이고, 아래의 계산은 테러리스트의 확률이 99%가 아니라 1%에 가깝다는 것을 보여줄 것이다.
이 오류는 두 가지 다른 고장률의 특성을 혼동하는 데서 발생합니다.'테러리스트 100명당 비테러리스트 수'와 '테러리스트 100명당 비테러리스트 수'는 관련이 없는 양이다.한쪽이 다른 쪽과 같을 필요는 없으며, 거의 같을 필요도 없습니다.이를 보여주기 위해 테러리스트가 전혀 없는 제2의 도시에 동일한 경보 시스템이 설치되면 어떻게 되는지 생각해 보라.첫 번째 도시와 마찬가지로, 비테러리스트 주민 100명 중 1명꼴로 경보가 울리지만, 첫 번째 도시와 달리 테러리스트에게는 경보가 울리지 않는다.따라서 경보가 울리는 모든 경우의 100%는 비테러리스트를 위한 것이지만 허위 음성은 계산조차 할 수 없다.그 도시의 '100개 종당 비테러리스트 수'는 100개이지만, P(TB) = 0%이다.종이 울리는 것으로 보아 테러리스트가 잡혔을 가능성은 전혀 없다.
첫 번째 도시의 인구 100만 명이 카메라 앞을 지나가는 것을 상상해 보세요.100명의 테러리스트 중 약 99명이 경보를 울릴 것이며, 999,900명의 비테러리스트 중 약 9999명도 경보를 울릴 것이다.따라서 약 10,098명이 경보를 울릴 것이며, 그 중 약 99명이 테러리스트가 될 것이다.그래서 실제로 경보를 울리는 사람이 테러리스트일 확률은 1만98분의 99에 불과합니다. 1%도 안되고, 우리가 처음 예상한 99%에도 훨씬 못 미칩니다.
기준율 오류는 테러리스트보다 비테러리스트가 훨씬 더 많고, 거짓 긍정(테러리스트로서 스캔된 비테러리스트)의 수가 진정한 긍정(테러리스트로서 스캔된 테러리스트)보다 훨씬 많기 때문에 이 예에서 매우 오해의 소지가 있다.
심리학 연구 결과
실험에서,[6][7][8] 사람들은 일반적인 정보보다 개별 정보를 더 선호하는 것으로 밝혀졌다.
몇몇 실험에서, 학생들은 가상의 학생들의 성적 평균(GPA)을 추정하도록 요구받았다.GPA 분포에 대한 관련 통계를 제공했을 때, 학생들은 새로운 서술적 정보가 학교 성적과 [7]거의 관련이 없거나 전혀 관련이 없는 경우에도 특정 학생에 대한 서술적 정보를 제공한다면 무시하는 경향이 있었다.이 결과는 면접관들이 기본적인 통계치보다 더 나은 합격자를 뽑을 수 없기 때문에 면접은 대학 입학 과정의 불필요한 부분이라고 주장하는데 사용되어 왔다.
심리학자 다니엘 카네만과 아모스 트베르스키는 이 발견을 대표성이라고 불리는 단순한 규칙 혹은 "휴리스틱"의 관점에서 설명하려고 시도했다.그들은 가능성, 또는 인과관계에 관한 많은 판단은 어떤 것이 다른 것 또는 [7]범주를 얼마나 대표하는지에 기초한다고 주장했다.Kahneman은 기준금리 경시를 연장 [9]경시의 특정 형태로 간주한다.Richard Nisbett은 근본적인 귀인 오류와 같은 일부 귀인 편견이 기준 비율 오류의 예라고 주장했습니다. 즉, 사람들은 다른 사람들이 비슷한 상황에서 어떻게 행동했는지에 대한 "컨센서스 정보" (기준 비율)를 사용하지 않고 대신 단순한 기질적 [10]속성을 선호합니다.
심리학에서는 사람들이 기준금리 [11][12]정보를 감사하거나 감사하지 않는 조건에 대해 상당한 논쟁이 있다.휴리스틱스 앤 바이어스 프로그램의 연구원들은 사람들이 기준율을 무시하고 베이즈의 정리처럼 확률론적 추론의 특정 규범에 위배되는 추론을 하는 경향이 있다는 것을 보여주는 경험적 발견을 강조해왔다.이 연구 라인에서 도출된 결론은 인간의 확률론적 사고는 근본적으로 결함이 있고 오류가 발생하기 [13]쉽다는 것이었다.다른 연구자들은 인지 과정과 정보 형식 사이의 연관성을 강조하면서 그러한 결론은 일반적으로 [14][15]정당화되지 않는다고 주장한다.
위에서 예 2를 다시 생각해 봅시다.필요한 추론은 음주 측정기 테스트가 양성이라는 점을 고려할 때 (무작위로 선택된) 운전자가 음주했을 확률을 추정하는 것입니다.형식적으로 이 확률은 위와 같이 베이즈 정리를 사용하여 계산할 수 있다.그러나 관련 정보를 표시하는 방법은 다르다.다음과 같은 형식상 동등한 문제의 변형을 고려합니다.
- 운전자 1000명 중 1명은 음주운전을 하고 있다.음주측정기는 반드시 진짜 취객을 감지한다.음주측정기는 999명의 운전자 중 50명이 음주상태로 거짓으로 나타난다.경찰이 운전자를 무작위로 세우고 음주 측정을 강요한다고 가정해 보자.그것은 그들이 술에 취했음을 나타낸다.우린 당신이 그들에 대해 아무것도 모른다고 생각합니다.그들이 정말로 술에 취했을 확률은 얼마나 될까?
이 경우 관련 수치 정보(p(drunk), p(D druck), p(D drucken), p(D makeen))는 특정 기준 클래스에 대한 고유 주파수로 표시됩니다(참조 클래스 문제 참조).경험적 연구에 따르면 정보가 이런 식으로 제시될 때 사람들의 추론은 베이즈의 규칙에 더 밀접하게 일치하며, 평신도와[15] [16]전문가들의 기준금리 경시를 극복하는 데 도움이 된다.그 결과 Cochrane Collaboration과 같은 조직은 건강 통계를 [17]전달하기 위해 이러한 형식을 사용할 것을 권장합니다.사람들에게 이러한 종류의 베이지안 추론 문제를 자연 주파수 형식으로 변환하도록 가르치는 것은 단순히 확률(또는 백분율)을 베이즈의 [18]정리에 끼워 넣는 것을 가르치는 것보다 더 효과적이다.또한 자연 주파수(예: 아이콘 배열)의 그래픽 표현은 사람들이 더 나은 [18][19][20]추론을 하는 데 도움이 되는 것으로 나타났다.
고유 주파수 형식이 도움이 되는 이유는 무엇입니까?한 가지 중요한 이유는 이 정보 형식이 필요한 계산을 단순화하기 때문에 필요한 추론을 용이하게 하기 때문이다.이는 필요한 확률 p(drunk D)를 계산하는 다른 방법을 사용하면 알 수 있습니다.
여기서 N(음주 d D)은 음주운전자의 수를 나타내며, N(D)은 음주측정 결과가 양인 경우의 총수를 나타냅니다.위의 방정식과 이 방정식의 등가는 확률론의 공리에서 비롯되며, 이에 따라 N(술취한 D) = N × p (D 취함) × p (p)이다.중요한 것은, 이 방정식이 공식적으로 베이즈의 법칙과 동등하지만, 심리적으로는 동등하지 않다는 것입니다.자연 주파수를 사용하면 정규화된 분수(예: 확률) 대신 자연수에 대해 필요한 수학적 연산이 수행될 수 있기 때문에 추론을 단순화할 수 있다. 이는 높은 수의 거짓 긍정을 보다 투명하게 만들고 자연 주파수가 "내포된 집합 구조"[21][22]를 나타내기 때문이다.
모든 주파수 형식이 베이지안 [22][23]추론을 용이하게 하는 것은 아닙니다.자연 주파수란 기본 속도 정보(예: 운전자의 무작위 표본을 추출할 때 음주 운전자의 수)를 보존하는 자연 [24]샘플링에서 발생하는 주파수 정보를 말한다.이는 기본 비율이 선험적으로 고정되는 체계적 표본 추출과는 다르다(예: 과학 실험에서).후자의 경우 음주 측정기 양성 결과를 얻은 전체 인구 수와 비교하여 음주 측정기 양성 반응을 보이는 운전자의 수를 비교함으로써 사후 확률 p(음주 양성 테스트)를 추론할 수 없다. 왜냐하면 기본 속도 정보는 보존되지 않고 Bayes의 이론을 사용하여 명시적으로 재도입해야 하기 때문이다.em.
「 」를 참조해 주세요.
레퍼런스
- ^ Welsh, Matthew B.; Navarro, Daniel J. (2012). "Seeing is believing: Priors, trust, and base rate neglect". Organizational Behavior and Human Decision Processes. 119 (1): 1–14. doi:10.1016/j.obhdp.2012.04.001. hdl:2440/41190. ISSN 0749-5978.
- ^ "Logical Fallacy: The Base Rate Fallacy". Fallacyfiles.org. Retrieved 2013-06-15.
- ^ Rheinfurth, M. H.; Howell, L. W. (March 1998). Probability and Statistics in Aerospace Engineering (PDF). NASA. p. 16.
MESSAGE: False positive tests are more probable than true positive tests when the overall population has a low prevalence of the disease. This is called the false-positive paradox.
- ^ a b Vacher, H.L.(도 될까 2003년)."정량적 사용 능력-약물 검사, 암 검사, 그리고 화성암의 식별".저널 Geoscience 교육:2.얼핏 보기에는 이:학생들은 전체 사용 스테로이드를 덜 가질 가능성이 더 높아지는 학생 사용자로 식별될 수 있는 non-user 것 같다.이것은 FalsePositive패러독스-말을 인용하여:라고 불려 왔다.Gonick, L.;스미스, W.(1993년).통계에 이 만화 가이드입니다.뉴욕:하퍼 콜린스. 페이지의 주 49.
- ^ Madison, B. L. (August 2007). "Mathematical Proficiency for Citizenship". In Schoenfeld, A. H. (ed.). Assessing Mathematical Proficiency. Mathematical Sciences Research Institute Publications (New ed.). Cambridge University Press. p. 122. ISBN 978-0-521-69766-8.
The correct [probability estimate...] is surprising to many; hence, the term paradox.
- ^ Bar-Hillel, Maya (1980). "The base-rate fallacy in probability judgments" (PDF). Acta Psychologica. 44 (3): 211–233. doi:10.1016/0001-6918(80)90046-3.
- ^ a b c Kahneman, Daniel; Amos Tversky (1973). "On the psychology of prediction". Psychological Review. 80 (4): 237–251. doi:10.1037/h0034747. S2CID 17786757.
- ^ Kahneman, Daniel; Amos Tversky (1985). "Evidential impact of base rates". In Daniel Kahneman, Paul Slovic & Amos Tversky (ed.). Judgment under uncertainty: Heuristics and biases. Science. Vol. 185. pp. 153–160. doi:10.1126/science.185.4157.1124. PMID 17835457. S2CID 143452957.
- ^ Kahneman, Daniel (2000). "Evaluation by moments, past and future". In Daniel Kahneman and Amos Tversky (ed.). Choices, Values and Frames. ISBN 0-521-62749-4.
- ^ Nisbett, Richard E.; E. Borgida; R. Crandall; H. Reed (1976). "Popular induction: Information is not always informative". In J. S. Carroll & J. W. Payne (ed.). Cognition and social behavior. Vol. 2. pp. 227–236. ISBN 0-470-99007-4.
- ^ Koehler, J. J. (2010). "The base rate fallacy reconsidered: Descriptive, normative, and methodological challenges". Behavioral and Brain Sciences. 19: 1–17. doi:10.1017/S0140525X00041157. S2CID 53343238.
- ^ Barbey, A. K.; Sloman, S. A. (2007). "Base-rate respect: From ecological rationality to dual processes". Behavioral and Brain Sciences. 30 (3): 241–254, discussion 255–297. doi:10.1017/S0140525X07001653. PMID 17963533. S2CID 31741077.
- ^ Tversky, A.; Kahneman, D. (1974). "Judgment under Uncertainty: Heuristics and Biases". Science. 185 (4157): 1124–1131. Bibcode:1974Sci...185.1124T. doi:10.1126/science.185.4157.1124. PMID 17835457. S2CID 143452957.
- ^ Cosmides, Leda; John Tooby (1996). "Are humans good intuitive statisticians after all? Rethinking some conclusions of the literature on judgment under uncertainty". Cognition. 58: 1–73. CiteSeerX 10.1.1.131.8290. doi:10.1016/0010-0277(95)00664-8. S2CID 18631755.
- ^ a b Gigerenzer, G.; Hoffrage, U. (1995). "How to improve Bayesian reasoning without instruction: Frequency formats". Psychological Review. 102 (4): 684. CiteSeerX 10.1.1.128.3201. doi:10.1037/0033-295X.102.4.684.
- ^ Hoffrage, U.; Lindsey, S.; Hertwig, R.; Gigerenzer, G. (2000). "Medicine: Communicating Statistical Information". Science. 290 (5500): 2261–2262. doi:10.1126/science.290.5500.2261. PMID 11188724. S2CID 33050943.
- ^ Akl, E. A.; Oxman, A. D.; Herrin, J.; Vist, G. E.; Terrenato, I.; Sperati, F.; Costiniuk, C.; Blank, D.; Schünemann, H. (2011). Schünemann, Holger (ed.). "Using alternative statistical formats for presenting risks and risk reductions". The Cochrane Database of Systematic Reviews (3): CD006776. doi:10.1002/14651858.CD006776.pub2. PMC 6464912. PMID 21412897.
- ^ a b Sedlmeier, P.; Gigerenzer, G. (2001). "Teaching Bayesian reasoning in less than two hours". Journal of Experimental Psychology: General. 130 (3): 380. doi:10.1037/0096-3445.130.3.380. hdl:11858/00-001M-0000-0025-9504-E.
- ^ Brase, G. L. (2009). "Pictorial representations in statistical reasoning". Applied Cognitive Psychology. 23 (3): 369–381. doi:10.1002/acp.1460. S2CID 18817707.
- ^ Edwards, A.; Elwyn, G.; Mulley, A. (2002). "Explaining risks: Turning numerical data into meaningful pictures". BMJ. 324 (7341): 827–830. doi:10.1136/bmj.324.7341.827. PMC 1122766. PMID 11934777.
- ^ Girotto, V.; Gonzalez, M. (2001). "Solving probabilistic and statistical problems: A matter of information structure and question form". Cognition. 78 (3): 247–276. doi:10.1016/S0010-0277(00)00133-5. PMID 11124351. S2CID 8588451.
- ^ a b Hoffrage, U.; Gigerenzer, G.; Krauss, S.; Martignon, L. (2002). "Representation facilitates reasoning: What natural frequencies are and what they are not". Cognition. 84 (3): 343–352. doi:10.1016/S0010-0277(02)00050-1. PMID 12044739. S2CID 9595672.
- ^ Gigerenzer, G.; Hoffrage, U. (1999). "Overcoming difficulties in Bayesian reasoning: A reply to Lewis and Keren (1999) and Mellers and McGraw (1999)". Psychological Review. 106 (2): 425. doi:10.1037/0033-295X.106.2.425. hdl:11858/00-001M-0000-0025-9CB4-8.
- ^ Kleiter, G. D. (1994). "Natural Sampling: Rationality without Base Rates". Contributions to Mathematical Psychology, Psychometrics, and Methodology. Recent Research in Psychology. pp. 375–388. doi:10.1007/978-1-4612-4308-3_27. ISBN 978-0-387-94169-1.
외부 링크
- 기본 환율 오류 오류 파일