포크 경로 문제

Forking paths problem

포크 경로의 정원은 연구자들이 너무 많은 자유도를 남김으로써 실험된 가설에 대해 의도치 않게 거짓 양성을 생성할 수 있는 빈도주의 가설 테스트의 문제입니다.예상되거나 명백하게 중요한 결과만 발표되는 데이터 준설과 같은 낚시 탐사와는 달리, 이는 관찰되고 처리되는 데이터에 의해 자체적으로 정보를 제공되는 방법과 분석을 구현하는 방법에 대한 일련의 선택을 통해 하나의 실험만 실행되는 경우에도 유사한 효과를 허용합니다.[1]

역사

데이터를 분석하는 동안 포킹 의사결정 트리를 탐색하는 것은 한 시점에서 잘못된 통계적 방법의 한 예로 다중 비교 문제와 함께 그룹화되었습니다.그러나 Gelman과 Loken은 단일 비교만 하고 자신의 데이터를 한 번만 평가하는 모범 사례를 연구자들이 인식함으로써 이러한 현상이 암묵적으로 발생할 수 있음을 보여주었습니다[2].

오류는 분석이 데이터의 일부 또는 전부를 보고 난 후에 방법을 선택하는 데 충분한 자유도를 가지고 있었음에도 불구하고 여러 개의 비교가 없다고 믿는 것입니다.자유도에는 주효과 또는 교호작용 중 선택, 데이터 제외 방법, 여러 연구의 결합 여부 및 데이터 분석 방법이 포함될 수 있습니다.

참고 항목

참고문헌

  1. ^ "Garden of forking paths". FORRT - Framework for Open and Reproducible Research Training. Retrieved 2023-07-28.
  2. ^ Gelman, Andrew; Loken, Eric (November 14, 2013). "The garden of forking paths: Why multiple comparisons can be a problem, even when there is no "fishing expedition" or "p-hacking" and the research hypothesis was posited ahead of time" (PDF).