GRIM 테스트

GRIM(Granularity Related Inconsistency of Means) 테스트는 데이터 세트 분석에서 불일치를 식별하기 위해 사용되는 간단한 통계 테스트입니다.테스트는 N개의 정수값을 포함하는 데이터셋이 주어진 경우 산술 평균(일반적으로 단순히 평균이라고 함)은 몇 개의 가능한 값으로 제한된다는 사실에 의존합니다. 즉, 항상 정수 분자와 분모 N을 가진 분수로 표현되어야 합니다. 보고된 평균이 이 설명에 맞지 않으면 오류가 있을 수 있습니다.re; 그러한 오류에 대한 선호 용어는 "우선성"으로, 최초 발견 시 그 출처가 일반적으로 불분명함을 강조한다.GRIM의 불일치는 의도하지 않은 데이터 입력 오류 또는 인쇄 오류 또는 과학적 부정으로 인해 발생할 수 있습니다.GRIM 테스트는 연구자들이 일반적으로 작은 그룹을 사용하고 종종 측정치가 정수인 심리학 같은 분야에서 가장 유용합니다.GRIM 테스트는 일부 ^[1]과학 분야의 복제 위기에 대한 인식이 높아짐에 따라 2016년 Nick Brown과 James Heathers에 의해 제안되었습니다.

절차.

GRIM 테스트는 간단합니다.논문의 각 보고 평균에 대해 표본 크기(N)를 구하고 분모가 N인 모든 분수를 계산한다.그런 다음 평균을 이 목록과 비교하여 확인합니다(값이 일관되지 않게 반올림될 수 있음: 상황에 따라 1.125의 평균을 1.12 또는 1.13으로 보고할 수 있음).평균이 이 목록에 없으면 수학적으로 ^[2]^[3]불가능한 것으로 강조 표시됩니다.

예

공정한 주사위를 20번 굴리는 실험을 생각해보자.각 롤은 1과 6 사이의 정수 하나를 생성하며 귀무 가설의 평균 값은 3.5입니다.그런 다음 롤의 결과는 함께 평균화되고 평균은 3.48로 보고됩니다.이 값은 기대치에 가깝고 가설을 뒷받침하는 것으로 보입니다.그러나 GRIM 검정에 따르면 보고된 평균은 수학적으로 불가능하다는 것을 알 수 있습니다. 즉, 소수점 2자리로 적은 정수를 20으로 나눈 결과는 X 형식이어야 합니다.X0 또는 X.X5; 정수를 20으로 나누어 소수점 둘째 ^[4]자리에 "8"을 붙이는 것은 불가능하다.

해석 및 제한

데이터가 GRIM 테스트에 실패하더라도 이는 자동으로 조작의 징후가 아닙니다.평균 오차는 시험자 측의 오류, 인쇄 오류, 계산 및 프로그래밍 실수 또는 표본 ^[2]크기의 부적절한 보고로 인해 발생할 수 있습니다.그러나 일부 데이터가 부적절하게 제외되었거나 결과가 더 유의한 것처럼 보이기 위해 평균이 불법적으로 위조되었다는 징후일 수 있습니다.고장 위치는 근본 원인을 나타낼 수 있습니다. 고립된 불가능한 평균은 오류로 인해 발생할 수 있으며 표의 같은 행에 있는 여러 불가능한 값은 낮은 응답률을 나타내며, 동일한 열에 있는 여러 불가능한 값은 주어진 표본 크기가 올바르지 않음을 나타냅니다.테이블 전체에 분산된 여러 오류는 더 심각한 문제의 징후일 수 있으며, 기타 통계 테스트를 사용하여 의심스러운 ^[5]데이터를 분석할 수 있습니다.

GRIM 검정은 표본 크기가 상대적으로 작고, 합성 측정의 하위 성분 수도 작으며, 평균이 소수점 여러 ^[2]자릿수에 보고되는 데이터 세트에 가장 적합합니다.어떤 경우에는 입력 데이터가 예상대로 분해되지 않으면 유효한 평균이 검정에 실패한 것처럼 보일 수 있습니다. 예를 들어, 뷔페에서 몇 조각의 피자를 먹었는지 묻는 경우,^[5] 일부 사람들은 예상한 정수 대신 "3.5"와 같은 분수로 응답할 수 있습니다.

적용들

브라운과 헤더는 실험 심리학 저널에 실린 260개의 논문에 이 테스트를 적용했다. General, and Journal of Personality and Social Psychology.이 기사들 중 71개는 GRIM 테스트 분석에 적합했다. 이 중 36개는 적어도 하나의 불가능한 값을 포함했고 16개는 복수의 불가능한 ^[3]값을 포함했다.

Grim 테스트는 Brian Wansink가 이끄는 Cornell University Food and Brand Lab의 출판물의 오류를 밝혀내는 데도 중요한 역할을 했습니다.GRIM 테스트 결과, 피자 뷔페에서 가격이 소비에 미치는 영향에 관한 일련의 기사에서 불가능한 수단이 다수 포함되어 있는 것이 밝혀졌습니다.원데이터의 상세 분석 결과, 대부분의 경우 샘플 사이즈가 잘못 기재되어 있고 값이 ^[1]^[5]잘못 계산되어 있는 것이 밝혀졌습니다.

레퍼런스

^ ^a ^b Bartlett, Tom (17 March 2017). "Spoiled Science". The Chronicle of Higher Education. Retrieved 19 October 2017.
^ ^a ^b ^c Heathers, James (23 May 2016). "The GRIM test—a method for evaluating published research". Medium. Retrieved 19 October 2017.
^ ^a ^b Brown, Nicholas J. L.; Heathers, James A. J. (18 October 2016). "The GRIM Test: A Simple Technique Detects Numerous Anomalies in the Reporting of Results in Psychology" (PDF). Social Psychological and Personality Science. 8 (4): 363–369. doi:10.1177/1948550616673876.
^ "GRIM Plot (mean: 3.48, size: 20)". PrePubMed. Retrieved 19 October 2017.
^ ^a ^b ^c Anaya, Jordan; van der Zee, Tim; Brown, Nick (14 June 2017). "Statistical infarction: A postmortem of the Cornell Food and Brand Lab pizza publications". PeerJ Preprints. doi:10.7287/peerj.preprints.3025v1. Retrieved 19 October 2017.

외부 링크

온라인 GRIM 테스트 계산기

[Chron-1] Bartlett, Tom (17 March 2017). "Spoiled Science". The Chronicle of Higher Education. Retrieved 19 October 2017.

[Medium-2] Heathers, James (23 May 2016). "The GRIM test—a method for evaluating published research". Medium. Retrieved 19 October 2017.

[GRIMPaper-3] Brown, Nicholas J. L.; Heathers, James A. J. (18 October 2016). "The GRIM Test: A Simple Technique Detects Numerous Anomalies in the Reporting of Results in Psychology" (PDF). Social Psychological and Personality Science. 8 (4): 363–369. doi:10.1177/1948550616673876.

[4] "GRIM Plot (mean: 3.48, size: 20)". PrePubMed. Retrieved 19 October 2017.

[Infarction-5] Anaya, Jordan; van der Zee, Tim; Brown, Nick (14 June 2017). "Statistical infarction: A postmortem of the Cornell Food and Brand Lab pizza publications". PeerJ Preprints. doi:10.7287/peerj.preprints.3025v1. Retrieved 19 October 2017.

[1]

[2]

[3]

[4]

[5]

Search

GRIM 테스트

네임스페이스

더

목차

절차.

예

해석 및 제한

적용들

레퍼런스

외부 링크