치우침(통계량)
Bias (statistics)![]() |
통계적 편향은 결과와 사실 사이의 차이를 야기하는 체계적 경향이다.편차는 데이터의 출처, 선택된 추정기, 데이터 분석 방법 등 데이터 분석 과정의 숫자에 존재합니다.예를 들어, 사람들의 구매 습관을 조사하기 위해 편견은 결과에 심각한 영향을 미칠 수 있습니다.표본 크기가 충분하지 않으면 결과가 모든 사람들의 구매 습관을 대표하지 못할 수 있습니다.즉, 조사 결과와 실제 결과 사이에 불일치가 있을 수 있습니다.따라서 통계적 편견의 출처를 이해하는 것은 관찰된 결과가 실제 결과에 가까운지 평가하는 데 도움이 될 수 있다.
바이어스는 정확도(기기 고장/부적절), 데이터 부족 또는 전사 오류(타이포)와 같은 다른 실수와 구별될 수 있습니다.치우침은 데이터 선택이 수집 기준에 의해 왜곡되었을 수 있음을 의미합니다.
편견은 다른 실수의 존재를 배제하지 않는다.잘못 설계된 샘플, 부정확한 측정 장치, 데이터를 동시에 기록할 때 오타가 발생할 수 있습니다.
또한 "오류"라는 용어가 공정(검정 중인 가설의 기각 또는 수용 오류)보다는 결과를 구체적으로 가리킨다는 것을 인식하는 것이 유용합니다.결함 또는 실수를 사용하여 절차 오류를 이러한 특별히 정의된 결과 기반 용어와 구별하는 것이 좋습니다.
추정기의 치우침
통계적 편향은 통계적 기법 또는 그 결과의 특징이며, 결과의 기대값은 추정되는 실제 기본 정량적 매개변수와 다르다.모수 추정기의 바이어스는 정밀도가 표본오차의 척도이기 때문에 정밀도와 혼동해서는 안 된다.바이어스는 다음과 같이 정의됩니다.T{\ T}는 파라미터 에 사용되는 통계정보이며, E ) { {}(는 T{\ T의 을 .
는 의 바이어스라고 불립니다 에 대해서).바이어스 ( , ) \ { ( T , \ )= }이면T { T는 \ 의 바이어스 없는 추정치라고 .
T의 바이어스는 항상 추정에 사용되는 파라미터에 상대적이지만, 추정한 내용이 컨텍스트에서 명확할 경우 파라미터는 생략되는 경우가 많습니다.
종류들
통계적 편향은 데이터 분석의 모든 단계에서 발생합니다.다음과 같은 바이어스의 원천은 각 단계에서 별도로 열거된다.
data 선택
선택 편향은 개인이 다른 사람보다 연구에 더 많이 선택될 가능성이 높기 때문에 샘플을 편중시킵니다.이것은 선택 효과, 표본 바이어스 및 버크소니언 [1]바이어스라고도 불립니다.
- 스펙트럼 편향은 편향된 환자 표본에 대한 진단 테스트 평가에서 발생하며, 테스트의 민감도와 특수성을 과대평가한다.예를 들어, 연구 집단에서 질병 유병률이 높으면 양의 예측 값이 증가하므로 예측 값과 실제 [2]값 사이에 편향이 발생합니다.
- 관찰자 선택 편향은 제시된 증거가 관찰자에 의해 사전 필터링되었을 때 발생하며, 이는 소위 인위적 원칙이다.수집된 데이터는 실험 설계뿐만 아니라 연구를 수행하는 사람이 [3]있어야 한다는 필수 전제 조건에 의해 필터링됩니다.예로는 과거에 지구의 영향이 있다.그 충돌 사건은 지능이 높은 동물의 멸종을 야기하거나 그 당시에는 지능이 있는 동물이 없었다.따라서 일부 충격 이벤트가 관찰되지 않았지만 [4]과거에 발생했을 수 있습니다.
- 자원봉사의 편견은 자원봉사가 연구의 [5]대상 집단과 본질적으로 다른 특성을 가지고 있을 때 발생한다.연구에 따르면 자원봉사는 사회경제적 [6]지위가 높은 가정 출신이 많은 것으로 나타났다.게다가, 다른 연구는 여성들이 [7]남성들보다 연구에 자원할 가능성이 더 높다는 것을 보여준다.
- 자금 편중으로 인해 연구의 재정 [8]후원자에게 유리한 결과, 테스트 표본 또는 테스트 절차를 선택할 수 있다.
- 예를 들어,[9] 연구 중 후속 조치의 손실과 같은 참가자의 손실로 인해 소모 편향이 발생한다.
- 리콜 편견은 과거 사건에 대한 참가자 기억의 정확도 또는 완전성의 차이로 인해 발생한다. 예를 들어, 환자는 정확히 지난 주에 얼마나 담배를 피웠는지 기억하지 못하여 과대 추정 또는 과소 추정으로 이어진다.
가설 검정
통계 가설 검정의 유형 I 및 유형 II 오류는 잘못된 [10]결과를 초래합니다.I형 오류는 귀무 가설이 올바르지만 기각될 때 발생합니다.예를 들어, 평균 주행 속도 제한이 75 ~ 85km/h이면 과속으로 간주되지 않는다는 귀무 가설이 있다고 가정합니다.한편, 평균 속도가 그 범위에 있지 않으면 과속으로 간주됩니다.만약 누군가가 평균 주행 속도가 7km/h인 티켓을 받는다면, 의사결정자는 제1종 오류를 범한 것이다.즉, 평균 주행 속도는 귀무 가설을 충족하지만 기각됩니다.반대로, 유형 II 오류는 귀무 가설이 정확하지 않지만 받아들여질 때 발생합니다.
견적자 선택
추정기의 치우침은 추정기의 기대값과 추정할 모수의 실제 값 사이의 차이입니다.비편향 추정기는 이론적으로 편향 추정기보다 선호되지만, 실제로는 편향이 작은 편향 추정기가 자주 사용된다.편향된 추정치는 여러 가지 이유로 더 유용할 수 있습니다.첫째, 추가적인 가정 없이는 편향되지 않은 추정기가 존재할 수 없습니다.둘째, 때때로 편향되지 않은 추정기를 계산하기 어렵다.셋째, 편향된 추정기는 평균 제곱 오차 값이 낮을 수 있습니다.
- 치우친 추정치는 포아송 [11][12]분포에서 발생하는 치우치지 않은 추정치보다 좋습니다.치우친 추정기의 값은 항상 양의 값이고 평균 제곱 오차는 치우치지 않은 값보다 작기 때문에 치우친 추정기의 정확도가 더 높습니다.
- 생략-변수 치우침은 회귀 분석에서 가정된 규격에서 모형에 있어야 하는 독립 변수를 제외할 때 모수의 추정치에 나타나는 치우침입니다.
분석 방법
- 검출 편향은 특정 연구 대상 집합에 대해 현상이 관찰될 가능성이 더 높을 때 발생합니다.예를 들어, 비만과 당뇨병과 관련된 증후군은 의사들이 마른 환자들보다 비만 환자들에게 당뇨병을 더 많이 찾는다는 것을 의미할 수 있으며, 이는 왜곡된 발견 노력으로 인해 비만 환자들 사이에서 당뇨병의 인플레이션을 초래한다.
- 교육 측정에서 편향은 "시험 내용, 시험 관리 및/또는 채점 절차의 체계적 오류"로 정의되며, 이는 일부 수험생이 실제 [13]능력보다 더 낮거나 더 높은 점수를 받게 할 수 있습니다.편향의 출처는 테스트가 측정하려는 특성과는 무관합니다.
- 관찰자 편향은 연구자가 인지 편향으로 인해 무의식적으로 실험에 영향을 미칠 때 발생하며, 여기서 판단은 실험 수행 방법/결과 기록 방법을 바꿀 수 있다.
해석
보고 편향은 특정 종류의 관측치가 보고될 가능성이 더 높도록 데이터 가용성의 편차를 수반합니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Rothman, Kenneth J.; Greenland, Sander; Lash, Timothy L. (2008). Modern Epidemiology. Lippincott Williams & Wilkins. pp. 134–137.
- ^ Mulherin, Stephanie A.; Miller, William C. (2002-10-01). "Spectrum bias or spectrum effect? Subgroup variation in diagnostic test evaluation". Annals of Internal Medicine. 137 (7): 598–602. doi:10.7326/0003-4819-137-7-200210010-00011. ISSN 1539-3704. PMID 12353947. S2CID 35752032.
- ^ Bostrom, Nick (2013-05-31). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. doi:10.4324/9780203953464. ISBN 978-0-203-95346-4.
- ^ Ćirković, Milan M.; Sandberg, Anders; Bostrom, Nick (2010). "Anthropic Shadow: Observation Selection Effects and Human Extinction Risks". Risk Analysis. 30 (10): 1495–1506. doi:10.1111/j.1539-6924.2010.01460.x. ISSN 1539-6924. PMID 20626690. S2CID 6485564.
- ^ Tripepi, Giovanni; Jager, Kitty J.; Dekker, Friedo W.; Zoccali, Carmine (2010). "Selection Bias and Information Bias in Clinical Research". Nephron Clinical Practice. 115 (2): c94–c99. doi:10.1159/000312871. ISSN 1660-2110. PMID 20407272. S2CID 18856450.
- ^ "Volunteer bias". Catalog of Bias. 2017-11-17. Retrieved 2021-12-18.
- ^ Alex, Evans (2020). "Why Do Women Volunteer More Than Men?". Retrieved 2021-12-22.
- ^ Krimsky, Sheldon (2013-07-01). "Do Financial Conflicts of Interest Bias Research?: An Inquiry into the "Funding Effect" Hypothesis". Science, Technology, & Human Values. 38 (4): 566–587. doi:10.1177/0162243912456271. ISSN 0162-2439. S2CID 42598982.
- ^ Higgins, Julian P. T.; Green, Sally (March 2011). "8. Introduction to sources of bias in clinical trials". In Higgins, Julian P. T.; et al. (eds.). Cochrane Handbook for Systematic Reviews of Interventions (version 5.1). The Cochrane Collaboration.
- ^ Neyman, Jerzy; Pearson, Egon S. (1936). "Contributions to the theory of testing statistical hypotheses". Statistical Research Memoirs. 1: 1–37.
- ^ Romano, Joseph P.; Siegel, A. F. (1986-06-01). Counterexamples in Probability And Statistics. CRC Press. ISBN 978-0-412-98901-8.
- ^ Hardy, Michael (2003). "An Illuminating Counterexample". The American Mathematical Monthly. 110 (3): 234–238. doi:10.2307/3647938. ISSN 0002-9890. JSTOR 3647938.
- ^ National Council on Measurement in Education (NCME). "NCME Assessment Glossary". Archived from the original on 2017-07-22.