샘플링 바이어스

Sampling bias

통계학에서 표본편향은 의도된 모집단의 일부 구성원이 다른 모집단보다 더 낮거나 더 높은 표본확률을 가지도록 표본이 수집되는 편향이다.이는 모든 개인 또는 사례가 동등하게 [2]선택되지 않은 모집단(또는 비인간적 요인)의 편향[1] 표본을 초래한다.이것을 설명하지 않으면, 결과는 표본 추출 방법보다는 연구 중인 현상에 잘못 기인할 수 있다.

의료계에서는 표본편향을 [3][4]확인편향이라고 부르기도 한다.확인편향은 기본적으로 동일한 [5][6]정의를 가지고 있지만,[5] 때때로 별도의 유형의 편견으로 분류되기도 한다.

선택편향과의 구별

표본편향은 일반적으로 선택편향의 [7]하위 유형으로 분류되며,[8][9][10] 때로는 표본선택편향이라고도 하지만,[11] 일부에서는 별도의 유형의 편향으로 분류하기도 한다.표본편향의 구별은 보편적으로 인정되지는 않지만, 표본편향은 검정의 외부 타당성(전체 모집단으로 일반화될 수 있는 결과의 능력)을 저해하는 반면, 선택편향은 주로 가까운 표본에서 발견된 차이 또는 유사성에 대한 내부 타당성을 다룬다.이러한 의미에서, 표본 또는 코호트를 수집하는 과정에서 발생하는 오류는 표본 편향을 일으키는 반면, 그 이후의 모든 과정의 오류는 선택 편향을 일으킨다.

단, 선택편향과 표본편향은 [12]동의어로 사용되는 경우가 많다.

종류들

  • 특정 실제 영역에서 선택.예를 들어, 십대들의 불법 약물 사용을 측정하기 위해 고등학생들을 대상으로 한 조사는 집에서 공부하는 학생이나 중퇴자들을 포함하지 않기 때문에 편향된 표본이 될 것이다.표본은 특정 구성원이 모집단에서 다른 구성원에 비해 적게 대표되거나 지나치게 대표되는 경우에도 편향됩니다.예를 들어, 특정 장소를 지나가는 사람들을 선택하는 "길 위의 남자" 인터뷰는 지병을 앓고 있는 사람들보다 집 밖에 있을 가능성이 더 높은 건강한 개인들에 대한 과도한 표현을 갖게 될 것이다.모집단의 특정 구성원은 표본에서 완전히 제외되기 때문에(즉, 선택될 확률이 0임) 이는 편향된 표본 추출의 극단적인 형태일 수 있습니다.
  • 자기 선택 편향(무응답 편향 참조)은 연구 대상 그룹이 참여 여부에 대한 통제 형태를 가질 때마다 가능하다(인간-주체 연구 윤리의 현재 표준이 많은 실시간 및 일부 종단적 형태의 연구를 요구하기 때문에).참가자의 참여 결정은 연구에 영향을 미치는 특성과 관련이 있을 수 있으며, 참가자는 비대표 표본이 될 수 있다.예를 들어, 강한 의견이나 실질적인 지식을 가진 사람들은 그렇지 않은 사람들보다 조사에 응답하는 데 더 많은 시간을 할애할 수 있다.또 다른 예로는 온라인전화 접속 폴링이 있습니다.이것은 응답자가 스스로 선택되기 때문에 편향된 샘플입니다.응답 의욕이 강한 사람, 일반적으로 강한 의견을 가진 사람, 과잉 대표되는 사람, 무관심하거나 무관심한 사람은 응답할 가능성이 적다.이는 종종 극단적인 관점에 대한 응답의 양극화로 이어지며 요약에서 불균형적인 가중치가 부여된다.결과적으로, 이러한 유형의 여론조사는 비과학적인 것으로 간주됩니다.
  • 제외 편향은 표본에서 특정 그룹의 제외, 예를 들어 최근에 연구 영역으로 이동한 피험자의 제외에서 비롯된다(이는 원천 모집단을 식별하는 데 사용되는 등록부에서 신규 모집단을 사용할 수 없을 때 발생할 수 있다).후속 조치 중에 연구 영역 밖으로 이동하는 피험자를 제외하면 오히려 중퇴 또는 무응답에 해당하며, 오히려 연구의 내부 타당성에 영향을 미친다는 점에서 선택 편향이다.
  • 건강한 사용자 편향, 연구 집단이 일반 모집단보다 건강할 가능성이 높은 경우.예를 들어, 건강이 좋지 않은 사람은 육체 노동자로서의 직업을 가질 가능성이 낮다.
  • 버크슨의 오류는 연구 집단이 병원에서 선정되어 일반 집단에 비해 덜 건강하다는 것이다.이것은 질병들 사이에 거짓된 음의 상관관계를 야기할 수 있다: 당뇨병이 없는 병원 환자는 애초에 그들이 병원에 입원할 이유가 있었어야 했기 때문에 담낭염과 같은 또 다른 질병에 걸릴 가능성이 더 높다.
  • 오버매칭, 실제로 노출의[clarification needed] 결과인 명백한 교란 요인에 대한 매칭.대조군은 일반 모집단보다 피폭과 관련하여 사례와 더 유사해진다.
  • 생존자 편중, 시야에서 벗어난 대상은 무시하고 생존자만 선택하는 생존자만 선택하는 생존자 편중.예를 들면, 현재의 기업의 실적을 업황이나 경제의 지표로 삼는 것은, 실패해 없어져 버린 사업을 무시한다.
  • Malmquist bias, 본질적으로 밝은 물체를 우선적으로 검출하는 관측 천문학의 효과.

증상 기반 샘플링

의학적 상태에 대한 연구는 일화적인 보고서로부터 시작된다.그 성격상, 그러한 보고서에는 진단과 치료를 위해 언급된 보고서만 포함됩니다.학교에서 제 기능을 하지 못하는 아이는 힘들지만 합격하는 아이보다 난독증 진단을 받을 확률이 높다.한 가지 상태에 대해 검사된 아이는 다른 상태에 대해 검사되고 진단될 가능성이 높으며, 이로 인해 동반병 통계치가 왜곡됩니다.특정 진단이 행동 장애나 지적 장애와 관련되면서 부모들은 자녀들이 오명을 쓰는 것을 막으려고 노력하면서 더 많은 편견이 생겨나고 있다.전체 인구에서 신중하게 선택된 연구는 많은 질병들이 이전에 믿었던 것보다 훨씬 더 흔하고 보통 훨씬 온화하다는 것을 보여준다.

혈통 검사에서 선택 항목 잘라내기

표본 편중의 단순한 혈통 예

유전학자들은 인간에게서 데이터를 얻는 방법에 한계가 있다.예를 들면, 인간의 특성을 생각해 봅시다.우리는 그 특성이 단순한 멘델의 특성으로 유전되는지 여부를 결정하는 데 관심이 있다.멘델 유전의 법칙에 따라, 가족 중 부모가 특성을 가지고 있지 않지만 그에 대한 대립 유전자를 가지고 있다면, 그들은 매개체이다(예: 비표현적 이형 접합체).이 경우 자녀는 각각 25%의 확률로 특성을 나타낼 수 있습니다.문제는 어떤 가정이 부모 모두를 보균자로 두고 있는지 알 수 없기 때문에 발생합니다.그 서술은 서튼의 [13]교과서를 따른다.

이 그림은 부모가 보균자일 때 두 아이를 가진 모든 가능한 가족의 혈통을 보여준다(Aa).

  • 실행 중지 선택.완벽한 세상에서 우리는 단지 보균자를 포함한 유전자를 가진 모든 가족을 발견할 수 있을 것이다.이 상황에서 분석은 확인 편견으로부터 자유로워지고 혈통은 "비확정 선택"을 받게 된다. 실제로 대부분의 연구는 가족을 대상으로 한 연구에서 가족을 식별하고 포함시킨다.
  • 선택 영역을 잘라냅니다.문제가 있는 개인이 연구에 포함될 확률이 같을 때, 이것은 유전자 보균자인 가족의 의도하지 않은 제외(분열)를 나타내는 잘라내기 선택이라고 불린다.선택은 개인 수준에서 수행되기 때문에 영향을 받는 자녀가 둘 이상인 가정은 연구에 포함될 확률이 더 높습니다.
  • 전체 잘라내기 선택은 영향을 받는 자녀가 있는 패밀리가 스터디에 대해 선택될 확률이 동일한 특수한 경우입니다.

각 가족이 선택될 확률은 그림에 나와 있으며, 영향을 받는 어린이의 표본 빈도도 나와 있습니다.이 간단한 사례에서, 연구자는 빈도를 찾을 것이다.사용된 잘라내기 선택 유형에 따라 특성을 나타내는 4/7 또는 5/8.

원시인 효과

선택 편향의 예는 "동굴 효과"라고 불립니다.선사시대 사람들에 대한 우리의 이해의 대부분은 거의 4만년 전에 만들어진 동굴 벽화와 같은 동굴에서 나온다.나무, 동물 가죽, 산허리에 현대 그림이 있었다면 오래 전에 떠내려갔을 것이다.마찬가지로 화구, 난간, 매장지 등의 증거는 동굴에서 현대에 이르기까지 온전하게 남아 있을 가능성이 높다.선사시대 사람들은 동굴과 관련이 있는데, 그 이유는 그곳이 자료가 아직 존재하는 곳이기 때문이지, 그들 대부분이 [14]삶의 대부분을 동굴에서 살았기 때문만은 아니기 때문이다.

표본편중으로 인한 문제

표본 치우침은 표본에 대해 계산된 통계량이 체계적으로 잘못될 수 있기 때문에 문제가 있습니다.표본 편중으로 인해 모집단에서 해당 모수가 체계적으로 과대평가되거나 과소평가될 수 있다.표본 추출에서 완벽한 무작위성을 보장하는 것은 사실상 불가능하기 때문에 표본 추출 편향은 실제로 발생합니다.오표시의 정도가 작을 경우 표본은 무작위 표본에 대한 합리적인 근사치로 취급할 수 있다.또한 표본의 측정 수량이 현저하게 다르지 않은 경우에도 편향된 표본이 합리적인 추정치가 될 수 있습니다.

편견이라는 단어는 부정적인 의미를 강하게 내포하고 있다.사실, 편견은 때때로 오도하려는 의도적인 의도나 다른 과학적 사기로부터 온다.통계적 용법에서 편향은 의도적인 것인지 무의식적인 것인지 또는 관측에 사용된 기구의 결함 때문인지에 관계없이 수학적 속성을 나타낸다.일부 개인은 잘못된 결과를 얻기 위해 편향된 표본을 의도적으로 사용할 수 있지만, 더 자주 편향된 표본은 측정 또는 분석 과정에서 진정으로 대표적인 표본을 얻기 어렵거나 편향에 대한 무지의 반영일 뿐이다.편견에 대한 무지가 어떻게 존재할 수 있는가에 대한 한 예는 생물학에서 차이를 측정하는 것으로서 비율(일명 접힘 변화)을 널리 사용하는 것이다.주어진 차이를 가진 두 개의 작은 숫자로 큰 비율을 달성하는 것이 더 쉽고, 더 큰 차이를 가진 두 개의 큰 숫자로 큰 비율을 달성하는 것이 상대적으로 더 어렵기 때문에, 상대적으로 큰 숫자 측정값을 비교할 때 큰 유의한 차이를 놓칠 수 있습니다.일부에서는 차이(추상) 대신 비율(분할)을 사용하면 분석 결과가 과학에서 의사 과학으로 제거되기 때문에 이것을 '분할 편향'이라고 부른다(분계 문제 참조).

일부 표본은 모수를 추정할 수 있는 편향된 통계 설계를 사용합니다.예를 들어, 미국 국립보건통계센터는 이러한 [15]집단 내 추정치에 대한 충분한 정밀도를 얻기 위해 많은 전국적인 조사에서 의도적으로 소수 집단으로부터 과잉표본을 추출했다.이러한 조사에서는 모든 민족 집단에서 적절한 추정치를 산출하기 위해 표본 가중치(나중에 언급)를 사용해야 한다.특정 조건이 충족될 경우(가중이 올바르게 계산되고 사용되는 경우) 이러한 표본은 모집단 매개변수를 정확하게 추정할 수 있다.

과거의 예

편향된 샘플의 예: 2008년 6월 현재 사용 중인 웹 브라우저(Internet Explorer)의 55%가 Acid2 테스트를 통과하지 못했습니다.테스트의 특성상 샘플은 대부분 웹 [16]개발자로 구성되었습니다.

편향된 표본과 그것이 만들어낸 잘못된 결과의 전형적인 예는 1936년에 발생했다.여론조사 초반 미국 문학 다이제스트지는 200만 건이 넘는 우편 설문조사를 취합해 공화당 대선 후보인 앨프 랜던이 현 대통령인 프랭클린 루스벨트를 큰 표차로 이길 것으로 전망했다.결과는 정반대였다.Literature Digest 조사는 이 잡지의 독자들로부터 수집된 샘플을 나타내며, 등록된 자동차 소유자와 전화 사용자의 기록으로 보충되었다.이 샘플에는 집단으로 공화당 후보에게 투표할 가능성이 높은 부유층의 과잉대표가 포함되어 있었다.반면 조지 갤럽이 뽑은 시민 5만 명을 대상으로 실시한 여론조사는 성공적 예측에 성공해 갤럽 여론조사의 인기로 이어졌다.

또 다른 전형적인 사례는 1948년 대선에서 발생했다.선거 당일 밤 시카고 트리뷴은 '듀이가 트루먼을 꺾는다'는 헤드라인을 실었는데, 이는 잘못된 것으로 드러났다.아침이 되자 활짝 웃고 있는 대통령 당선자 해리 S. 트루먼이 이 표제를 실은 신문을 들고 있는 모습이 사진에 찍혔습니다.트리뷴이 틀린 이유는 편집자가 전화 조사 결과를 신뢰했기 때문이다.당시 조사 연구는 초기 단계에 있었고, 전화 사용자의 표본이 일반 인구를 대표하지 않는다는 것을 아는 학자는 거의 없었다.전화는 아직 보급되어 있지 않고, 그것을 가지고 있는 사람은, 번영하고 안정된 주소를 가지는 경향이 있었다.(많은 도시에서 벨 시스템 전화번호부에는 소셜 레지스터와 동일한 이름이 포함되어 있습니다).게다가, 트리뷴이 헤드라인을 근거로 삼은 갤럽 여론조사는 인쇄 [17]당시 2주 이상 된 것이었다.

대기 품질 데이터에서 오염 물질(일산화탄소, 일산화질소, 이산화질소 또는 오존 등)은 동일한 화학적 공정에서 발생하므로 높은 상관 관계를 보이는 경우가 많습니다.이러한 상관관계는 공간(즉, 위치)과 시간(즉, 기간)에 따라 달라집니다.따라서 오염물질 분포가 반드시 모든 장소와 기간에 대표되는 것은 아니다.저비용 측정기가 필드 데이터로 다변량 방식으로 교정될 경우, 보다 정확하게 기준 기기 옆에 있는 코리케이션에 의해 다른 화합물 간의 관계가 교정 모델에 통합된다.측정기 위치를 변경하면 잘못된 결과가 발생할 [18]수 있습니다.

보다 최근의 예는 COVID-19 대유행으로, COVID-19 테스트의 표본 편중 변화는 국가 [19][20]간 환자 사망률과 환자 연령 분포 모두에서 큰 차이를 설명하는 것으로 나타났다.

치우친 표본에 대한 통계적 보정

모집단의 전체 세그먼트가 표본에서 제외되면 전체 모집단을 대표하는 추정치를 산출할 수 있는 조정은 없다.그러나 일부 집단이 불충분하게 표현되어 있고 표현 부족의 정도를 정량화할 수 있다면 표본 가중치는 편향을 수정할 수 있다.그러나 보정의 성공은 선택된 선택 모델로 제한됩니다.특정 변수가 누락되면 치우침을 보정하는 데 사용되는 방법이 [21]부정확할 수 있습니다.

예를 들어, 가상의 인구에는 1,000만 명의 남성과 1,000만 명의 여성이 포함될 수 있습니다.환자 100명의 편향된 표본에 남성 20명과 여성 80명이 포함된다고 가정합니다.연구자는 남성 한 명당 2.5, 여성 한 명당 0.625의 체중을 달아 이러한 불균형을 교정할 수 있었다.이는 남성과 여성이 [citation needed]조사에 참여할 가능성이 다른 경우를 제외하고 정확히 50명의 남성과 50명의 여성이 포함된 표본과 동일한 기대치를 달성하기 위해 모든 추정치를 조정할 것이다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ "Sampling Bias". Medical Dictionary. Archived from the original on 10 March 2016. Retrieved 23 September 2009.
  2. ^ "Biased sample". TheFreeDictionary. Retrieved 23 September 2009. Mosby's Medical Dictionary, 8th edition
  3. ^ Weising K (2005). DNA fingerprinting in plants: principles, methods, and applications. London: Taylor & Francis Group. p. 180. ISBN 978-0-8493-1488-9.
  4. ^ Ramírez i Soriano A (29 November 2008). Selection and linkage desequilibrium tests under complex demographies and ascertainment bias (PDF) (Ph.D. thesis). Universitat Pompeu Fabra. p. 34.
  5. ^ a b Panacek EA (May 2009). "Error and Bias in Clinical Research" (PDF). SAEM Annual Meeting. New Orleans, LA: Society for Academic Emergency Medicine. Archived from the original (PDF) on 17 August 2016. Retrieved 14 November 2009.
  6. ^ "Ascertainment Bias". Medilexicon Medical Dictionary. Archived from the original on 6 August 2016. Retrieved 14 November 2009.
  7. ^ "Selection Bias". Dictionary of Cancer Terms. Archived from the original on 9 June 2009. Retrieved 23 September 2009.
  8. ^ Ards S, Chung C, Myers SL (February 1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–15. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.
  9. ^ Cortes C, Mohri M, Riley M, Rostamizadeh A (2008). "Sample Selection Bias Correction Theory" (PDF). Algorithmic Learning Theory. Lecture Notes in Computer Science. 5254: 38–53. arXiv:0805.2775. CiteSeerX 10.1.1.144.4478. doi:10.1007/978-3-540-87987-9_8. ISBN 978-3-540-87986-2. S2CID 842488.
  10. ^ Cortes C, Mohri M (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. CiteSeerX 10.1.1.367.6899. doi:10.1016/j.tcs.2013.09.027.
  11. ^ Fadem B (2009). Behavioral Science. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.
  12. ^ Wallace R (2007). Maxcy-Rosenau-Last Public Health and Preventive Medicine (15th ed.). McGraw Hill Professional. p. 21. ISBN 978-0-07-159318-2.
  13. ^ Sutton HE (1988). An Introduction to Human Genetics (4th ed.). Harcourt Brace Jovanovich. ISBN 978-0-15-540099-3.
  14. ^ Berk RA (June 1983). "An Introduction to Sample Selection Bias in Sociological Data". American Sociological Review. 48 (3): 386–398. doi:10.2307/2095230. JSTOR 2095230.
  15. ^ "Minority Health". National Center for Health Statistics. 2007.
  16. ^ "Browser Statistics". Refsnes Data. June 2008. Retrieved 2008-07-05.
  17. ^ Lienhard JH. "Gallup Poll". The Engines of Our Ingenuity. Retrieved 29 September 2007.
  18. ^ Tancev G, Pascale C (October 2020). "The Relocation Problem of Field Calibrated Low-Cost Sensor Systems in Air Quality Monitoring: A Sampling Bias". Sensors. 20 (21): 6198. Bibcode:2020Senso..20.6198T. doi:10.3390/s20216198. PMC 7662848. PMID 33143233.
  19. ^ Ward D (20 April 2020). Sampling Bias: Explaining Wide Variations in COVID-19 Case Fatality Rates. Preprint (Report). Bern, Switzerland. doi:10.13140/RG.2.2.24953.62564/1.
  20. ^ Böttcher L, D'Orsogna MR, Chou T (May 2021). Using excess deaths and testing statistics to determine COVID-19 mortalities. European Journal of Epidemiology (Report). Vol. 36. pp. 545–558. doi:10.1007/s10654-021-00748-2.
  21. ^ Cuddeback G, Wilson E, Orme JG, Combs-Orme T (2004). "Detecting and Statistically Correcting Sample Selection Bias". Journal of Social Service Research. 30 (3): 19–33. doi:10.1300/J079v30n03_02. S2CID 11685550.