선택편향

Selection bias

선택 편향은 적절한 무작위화가 달성되지 않는 방식으로 분석을 위한 개인, 그룹 또는 데이터의 선택에 의해 도입된 편향이다. 따라서 얻어진 표본이 [1]분석 대상 모집단을 대표하는지 확인하지 못한다.선택 효과라고도 합니다."선택 편향"이라는 문구는 표본 수집 방법에 따른 통계 분석의 왜곡을 가장 자주 언급한다.선택 편향을 고려하지 않으면 연구의 일부 결론이 잘못될 수 있습니다.

종류들

샘플링 바이어스

표본추출편향은 모집단의 [2]비랜덤 표본으로 인한 체계적 오류이며, 모집단의 일부 구성원이 다른 표본보다 포함될 가능성이 낮아 모든 참가자가 동등하게 균형을 이루거나 객관적으로 표현되지 [3]않는 모집단통계 표본(또는 비인간적 요인)으로 정의되는 편향된 표본이 발생한다.이것은 대부분 선택 [4]바이어스의 하위 유형으로 분류되며, 때로는 표본 선택 [5][6][7]바이어스라고 불리기도 하지만, 일부에서는 별도의 유형의 [8]바이어스로 분류하기도 한다.

표본편향(일반적으로 인정되지 않음)의 구별은 검정의 외부 타당성(결과의 나머지 모집단으로 일반화할 수 있는 능력)을 저해하는 반면, 선택편향은 주로 가까운 표본에서 발견된 차이 또는 유사성에 대한 내부 타당성을 다룬다.이러한 의미에서, 표본 또는 코호트를 수집하는 과정에서 발생하는 오류는 표본 편향을 일으키는 반면, 그 이후의 모든 과정의 오류는 선택 편향을 일으킨다.

표본편향의 예로는 자가선택, 시험 참가자의 사전 스크리닝, 최근 연구영역에 출입한 피험자를 제외함으로써 완료 및 이행편향에 이르지 못한 시험 대상자/테스트 할인, 예후가 더 나은 서서히 발병하는 질병이 감지되는 시간편향, 리드타임편향 등이 있다.질병이 비교 모집단보다 더 일찍 진단되지만, 질병의 평균 경로는 같다.

시간 간격

  • 결과가 원하는 결론을 뒷받침하는 시점에 시행을 조기에 종료합니다.
  • 시행은 극단적인 값(종종 윤리적 이유)으로 조기에 종료될 수 있지만, 모든 변수의 평균이 비슷하더라도 편차가 가장 큰 변수에 의해 극단적인 값에 도달할 가능성이 높다.

노출

  • 감수성 바이어스
    • 임상적 감수성 편견, 한 질병이 두 번째 질병에 걸리고 첫 번째 질병에 대한 치료가 두 번째 질병에 잘못 걸리게 되는 경우.예를 들어 폐경 후 증후군은 자궁내막암에 걸릴 확률이 높기 때문에 폐경 후 증후군에 주어지는 에스트로겐은 [9]자궁내막암을 유발하는 실제보다 더 높은 비난을 받을 수 있다.
    • 원발성 편견, 질병 또는 다른 결과의 첫 번째 증상에 대한 치료가 결과를 야기하는 것으로 나타날 때.첫 번째 증상부터 실제 진단 [9]전 치료 시작까지 지연 시간이 있을 때 발생할 수 있는 편견입니다.지연,[10] 즉 진단 전 특정 기간에 발생한 노출 제외를 통해 완화될 수 있습니다.
    • 노출이 적응증에 의존할 때 원인과 결과 사이의 잠재적 혼재인 적응증 편견. 예를 들어 질병 발병 위험이 높은 사람들에게 치료가 제공되어 잠재적으로 질병 발병자 중 치료 대상자의 우세를 야기한다.이로 인해 치료법이 질병의 [11]원인인 것처럼 잘못 보일 수 있습니다.

데이터.

  • 파티션의 내용에 대한 지식으로 데이터를 분할(분할)한 후 무작정 선택한 파티션용으로 설계된 테스트를 통해 데이터를 분석합니다.
  • 다음과 같은 자의적 또는 주관적인 이유에 따라 데이터를 포함하는 사후 변경:
    • 체리 피킹은 실제로 선택 편향이 아니라 확인 편향이므로, 결론을 뒷받침하기 위해 특정 데이터 집합이 선택될 때(예: 안전하게 완료되는 비행의 훨씬 일반적인 예는 무시한 채, 항공기 추락의 예를 인용한다).참조: 가용성 경험적 접근)
    • (1) 이전에 명시되거나 일반적으로 합의된 기준에 따라 또는 (2) "야생"[12] 관측에서 도출될 수 있는 중요한 정보를 고려하지 않은 통계적 근거로 "외계인"을 폐기하는 대신, 임의적 근거로 불량 데이터를 거부하는 행위.

스터디

  • 메타 분석에 포함할 스터디를 선택합니다(조합 메타 분석 참조).
  • 반복 실험을 수행하고 가장 유리한 결과만 보고하며, 다른 실험의 실험실 기록을 "교정 테스트", "계장 오류" 또는 "예비 조사"로 다시 명명할 수 있습니다.
  • 데이터 준설의 가장 중요한 결과를 단일 실험인 것처럼 제시(이러한 결과는 이전 항목과 논리적으로 동일하지만 훨씬 덜 부정직하다고 생각됨).

소모

소모 편향은 소모(참가자 [13]손실)로 인해 발생하는 선택 편향의 일종으로, 완료되지 않은 시험 대상/테스트를 할인합니다.이것은 프로세스를 "살아남은" 대상만 분석 또는 실패 편견에 포함되며, 프로세스 "실패" 대상만 포함되는 생존 편향과 밀접하게 관련되어 있다.여기에는 드롭아웃, 무응답(낮은 응답률), 철수프로토콜 편차 변수가 포함됩니다.노출 및/또는 결과와 관련하여 불평등한 경우 편향된 결과를 제공합니다.예를 들어, 다이어트 프로그램의 테스트에서, 연구자는 단지 시험에서 탈락하는 모든 사람을 거절할 수도 있지만, 대부분의 탈락자들은 그것이 효과가 없었던 사람들이다.개입 및 비교 그룹에서 피험자의 상실이 다르면 연구[13]개입에 관계없이 이러한 그룹과 결과의 특성이 바뀔 수 있다.

후속 조치의 손실은 소모 편견의 또 다른 형태로, 주로 장기간에 걸친 의학 연구에서 발생한다.무응답 또는 보존 편향은 부, 교육, 이타주의, 연구의 초기 이해 및 [14]요구사항과 같은 많은 유형 및 무형 요소에 의해 영향을 받을 수 있습니다.또한 최초 모집 [15]및 연구 단계에서 수집된 식별 정보 및 연락처 세부 정보가 불충분하여 후속 연락을 수행할 수 없을 수도 있습니다.

옵서버 선택

철학자 Nick Bostrom은 데이터는 연구 설계와 측정뿐만 아니라 연구를 하는 누군가가 있어야 한다는 필수 전제조건에 의해 필터링된다고 주장했다.관찰자 또는 연구의 존재가 데이터와 상관되는 상황에서는 관찰 선택 효과가 발생하며,[16] 인위적 추론이 필요하다.

예를 들어, 지구의 과거 충돌 사건 기록이다. 큰 충돌이 대멸종을 야기하고 지능형 관찰자의 진화를 장기간 방해하는 생태학적 교란을 야기한다면, 아무도 최근 큰 충돌의 증거를 관찰하지 못할 것이다(지적 관찰자의 진화를 방해했을 것이기 때문이다).그러므로 지구의 [17]충돌 기록에는 잠재적인 편견이 있다.천문학적 실존적 위험도 마찬가지로 선택 편향으로 인해 과소평가될 수 있으며, 인위적 보정이 [18]도입되어야 한다.

자원봉사자의 편견

자기 선택 편향 또는 연구의 자발적 편향은 이러한 참가자들이 연구의 [19]대상 모집단과 본질적으로 다른 특성을 가질 수 있기 때문에 연구의 유효성에 추가적인 위협을 제공한다.연구에 따르면 자원봉사자들은 낮은 사회 경제적 배경보다 [20]높은 사회적 지위에서 오는 경향이 있다.게다가, 다른 연구는 여성들이 남성들보다 연구에 자원할 가능성이 더 높다는 것을 보여준다.자원봉사에 대한 편견은 모집에서 후속 조치까지 연구 라이프사이클 전반에 걸쳐 뚜렷하게 나타난다.보다 일반적으로 말하면, 자원봉사자의 반응은 개인의 이타심, 승인욕, 연구 주제와의 개인적인 관계, 그리고 다른 [20][14]이유들로 귀결될 수 있다.대부분의 사례에서와 마찬가지로 자원자 편중 사례의 완화도 표본 크기를 [citation needed]증가시킨다.

경감

일반적인 경우, Heckman 보정은 특별한 경우에 사용될 수 있지만, 기존 데이터의 통계 분석만으로는 선택 편견을 극복할 수 없다.외인성(배경) 변수와 치료 지표 간의 상관관계를 조사함으로써 선택 바이어스의 정도를 평가할 수 있다.그러나 회귀 모델에서 결과의 비관측 결정요인과 표본 선택의 비관측 결정요인 사이의 상관관계이며, 비관측 가능 간의 상관관계는 관찰된 치료 [21]결정요인에 의해 직접 평가할 수 없다.

적합 또는 예측 목적으로 데이터를 선택하면 데이터 변수의 모든 하위 집합에 적합 또는 예측 정확도 함수를 정의할 수 있도록 연합 게임을 설정할 수 있습니다.

관련 문제

선택 편향은 다음과 밀접하게 관련되어 있습니다.

  • 출판 편향 또는 보고 편향, 재미없는(보통 부정적인) 결과를 발표하지 않음으로써 커뮤니티 인식 또는 메타 분석에서 생성된 왜곡, 또는 실험자의 편견, 후원자의 이익 또는 지역사회의 기대에 반하는 결과.
  • 확인 편견, 인간이 우리의 기존 관점을 확인하는 것에 더 많은 관심을 기울이는 일반적인 경향, 또는 특히 실험 과학에서는 가설을 반증하려고 하는 대신 확인 증거를 찾도록 설계된 실험에 의해 만들어진 왜곡.
  • 배제의 기초가 되는 연구 참여 자격/다른 변수와 관련하여 사례와 통제에 다른 기준을 적용한 결과.

「 」를 참조해 주세요.

  • 버크슨의 역설 – 조건부 확률과 관련된 통계 실험을 잘못 해석하는 경향
  • 블랙 스완 이론 – 깜짝 이벤트에 대한 대응 이론
  • 체리 따기 – 불완전한 증거의 오류
  • 주파수 착시 – 인지편향
  • 자금 편중 – 자금 제공자의 이익을 지원하는 과학적 연구 경향
  • 인지편향 목록 – 규범 또는 판단의 합리성에서 벗어난 체계적인 패턴
  • 참여편향 –편향 유형
  • 출판 편향 – 출판 결과가 유의미한 결과를 나타낼 가능성이 높음
  • 보고 편향 – 정보 보고 편향
  • 표본추출편향 – 모집단 표본추출편향
  • 표본 추출 확률 – 유한 모집단에서 표본 추출에 관한 이론
  • 선택적 노출 이론 – 심리학 실습 내의 이론
  • 자기충족적 예언– 자신을 실현하는 예측
  • 서바이벌쉽 바이어스– 논리 오류, 선택 바이어스 형식

레퍼런스

  1. ^ 용어 사전 선택 편향.2009년 9월 23일에 취득.
  2. ^ 의학사전 - 2009년 9월 23일 '표본편향' 취득
  3. ^ FreeDictionary 편향된 샘플입니다.2009-09-23에 취득.사이트에는 다음 항목이 표시됩니다.모스비의학사전 제8판
  4. ^ 용어 사전 선택 편향.2009년 9월 23일에 취득.
  5. ^ Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.
  6. ^ Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). Sample Selection Bias Correction Theory (PDF). Algorithmic Learning Theory. Lecture Notes in Computer Science. Vol. 5254. pp. 38–53. arXiv:0805.2775. CiteSeerX 10.1.1.144.4478. doi:10.1007/978-3-540-87987-9_8. ISBN 978-3-540-87986-2. S2CID 842488.
  7. ^ Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. CiteSeerX 10.1.1.367.6899. doi:10.1016/j.tcs.2013.09.027.
  8. ^ Fadem, Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.
  9. ^ a b Feinstein AR; Horwitz RI (November 1978). "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer Res. 38 (11 Pt 2): 4001–5. PMID 698947.
  10. ^ Tamim H; Monfared AA; LeLorier J (March 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiol Drug Saf. 16 (3): 250–8. doi:10.1002/pds.1360. PMID 17245804. S2CID 25648490.
  11. ^ Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. p. 159. ISBN 978-1-930513-58-7.
  12. ^ Kruskal, William H. (1960). "Some Remarks on Wild Observations". Technometrics. 2 (1): 1–3. doi:10.1080/00401706.1960.10489875.
  13. ^ a b Jüni, P.; Egger, Matthias (2005). "Empirical evidence of attrition bias in clinical trials". International Journal of Epidemiology. 34 (1): 87–88. doi:10.1093/ije/dyh406. PMID 15649954.
  14. ^ a b Jordan, Sue; Watkins, Alan; Storey, Mel; Allen, Steven J.; Brooks, Caroline J.; Garaiova, Iveta; Heaven, Martin L.; Jones, Ruth; Plummer, Sue F.; Russell, Ian T.; Thornton, Catherine A. (2013-07-09). "Volunteer Bias in Recruitment, Retention, and Blood Sample Donation in a Randomised Controlled Trial Involving Mothers and Their Children at Six Months and Two Years: A Longitudinal Analysis". PLOS ONE. 8 (7): e67912. Bibcode:2013PLoSO...867912J. doi:10.1371/journal.pone.0067912. ISSN 1932-6203. PMC 3706448. PMID 23874465.
  15. ^ Small, W. P. (1967-05-06). "Lost to Follow-Up". The Lancet. Originally published as Volume 1, Issue 7497. 289 (7497): 997–999. doi:10.1016/S0140-6736(67)92377-X. ISSN 0140-6736. PMID 4164620.
  16. ^ Bostrom, Nick (2002). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. ISBN 978-0-415-93858-7.
  17. ^ Ćirković, M. M.; Sandberg, A.; Bostrom, N. (2010). "Anthropic Shadow: Observation Selection Effects and Human Extinction Risks". Risk Analysis. 30 (10): 1495–506. doi:10.1111/j.1539-6924.2010.01460.x. PMID 20626690.
  18. ^ Tegmark, M.; Bostrom, N. (2005). "Astrophysics: Is a doomsday catastrophe likely?". Nature. 438 (7069): 754. Bibcode:2005Natur.438..754T. doi:10.1038/438754a. PMID 16341005. S2CID 4390013.
  19. ^ Tripepi, Giovanni; Jager, Kitty J.; Dekker, Friedo W.; Zoccali, Carmine (2010). "Selection Bias and Information Bias in Clinical Research". Nephron Clinical Practice. 115 (2): c94–c99. doi:10.1159/000312871. ISSN 1660-2110. PMID 20407272.
  20. ^ a b "Volunteer bias". Catalog of Bias. 2017-11-17. Retrieved 2020-10-29.
  21. ^ Heckman, J. J. (1979). "Sample Selection Bias as a Specification Error". Econometrica. 47 (1): 153–161. doi:10.2307/1912352. JSTOR 1912352.