반복성

Repeatability

반복성 또는 시험 재시도 신뢰성[1] 동일한 측정 조건에서 수행될 때 동일한 측정의 연속 측정 결과 사이의 일치의 근접성이다.[2] 즉, 동일한 조건에서 단기간에 동일한 항목에서 한 사람 또는 금융상품에 의해 측정된다.완벽하지 않은 테스트-최신 신뢰성은 테스트-최신 변동성의 원인이 됩니다.이러한 변동은 예를 들어 개인 내 변동이나 서버 간 변동에 의해 발생할 수 있습니다.이 변동이 미리 결정된 합격 기준보다 작을 경우 측정이 반복 가능하다고 할 수 있다.

테스트-최신 변동성은 예를 들어 조건의 의료 모니터링에 실질적으로 사용된다.이러한 상황에서는 종종 미리 결정된 "중요한 차이"가 존재하며, 이 중요 차이보다 작은 모니터링 값의 차이에 대해서는 예를 들어 질병이나 [3]치료법의 변경과 더불어 차이의 유일한 원인으로서의 변동 가능성을 고려할 수 있다.

조건들

반복성을 확립하기 위해서는 다음 조건을 충족해야 한다.

  • 같은 실험 도구
  • 같은 관찰자
  • 동일한 조건에서 사용되는 동일한 측정기
  • 같은 장소
  • 짧은 시간 동안 반복됩니다.
  • 같은 목적

반복성 방법은 Bland와 Altman(1986)[5]에 의해 개발되었다.

테스트의 개별 관리 간의 상관관계가 높을 경우(를 들어 이 크론바흐의 알파 내부 일관성[6] 에서와 같이 0.7 이상), 테스트-재시도 신뢰성이 우수합니다.

반복성 계수는 95%의 확률로 두 개의 반복 테스트 결과 사이의 절대적인 차이가 예상되는 값을 나타내는 정밀 측정값입니다.

반복성 조건에서의 표준 편차는 정밀도정확성일부입니다.

결점 데이터베이스에 대한 계수형 합치도 분석

계수형 합치도 분석은 반복성과 재현성이 정확도에 미치는 영향을 동시에 평가하기 위해 설계되었습니다.이를 통해 분석가는 여러 검토자가 여러 시나리오를 여러 번 검토할 때 여러 검토자의 응답을 검토할 수 있습니다.평가자가 자신과 일치할 수 있는 능력(반복성), 서로 일치할 수 있는 능력(반복성), 각 특성에 대해 알려진 마스터 값 또는 올바른 값(전체 정확도)을 평가하는 통계량을 반복적으로 생성합니다.[7]

심리 테스트

동일한 테스트를 두 번 시행하고 모든 테스트는 자체와 평행하므로 테스트 점수와 재시험 점수의 차이는 오로지 측정 오류에 기인해야 합니다.이러한 주장은 많은 물리적 측정에서 사실일 수 있습니다.그러나, 이 주장은 종종 심리적인 측정에는 부적절하다. 왜냐하면 [8]첫 번째와 평행한 측정으로 테스트의 두 번째 관리를 고려하는 것은 불가능하기 때문이다.

심리 테스트의 두 번째 투여는 다음과 같은 [8]이유로 첫 번째 투여와 체계적으로 다른 점수를 산출할 수 있습니다.

  1. 측정 중인 속성은 첫 번째 테스트와 다시 테스트 사이에서 변경될 수 있습니다.예를 들어, 9월에 3학년 학급에 시행되는 읽기 시험은 6월에 재시험을 치렀을 때 다른 결과가 나올 수 있다.그 기간 동안 아이들의 읽기 능력에 변화가 있을 것으로 예상할 수 있는데, 낮은 시험-재시도 상관관계는 속성 자체의 실제 변화를 반영할 수 있다.
  2. 시험을 본 경험 자체가 사람의 진짜 점수를 바꿀 수 있다.예를 들어, 불안 인벤토리를 완성하는 것은 개인의 불안 수준을 높이는 데 도움이 될 수 있다.
  3. 이월 효과(특히 테스트와 테스트 사이의 간격이 짧은 경우)재시험할 때, 사람들은 그들의 원래 답을 기억할 수 있고, 이것은 2번째 정부의 답변에 영향을 미칠 수 있다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ 신뢰성의 종류 조사 방법의 놀리지 베이스.최종 개정일 : 2006년 10월 20일
  2. ^ a b JCGM 100:2008. Evaluation of measurement data – Guide to the expression of uncertainty in measurement (PDF), Joint Committee for Guides in Metrology, 2008
  3. ^ Fraser, C. G.; Fogarty, Y. (1989). "Interpreting laboratory results". BMJ (Clinical Research Ed.). 298 (6689): 1659–1660. doi:10.1136/bmj.298.6689.1659. PMC 1836738. PMID 2503170.
  4. ^ Taylor, Barry N.; Kuyatt, Chris E. (1994), NIST Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results Cover, Gaithersburg, MD, USA: National Institute of Standards and Technology
  5. ^ "Statistical methods for assessing agreement between two methods of clinical measurement".
  6. ^ George, D., & Mallery, P. (2003)Windows용 SPSS 단계별:간단한 가이드 및 레퍼런스. 11.0 업데이트 (제4판)보스턴:앨린과 베이컨.
  7. ^ "Attribute Agreement Analysis for Defect Databases iSixSigma".
  8. ^ a b Davidshofer, Kevin R. Murphy, Charles O. (2005). Psychological testing : principles and applications (6th ed.). Upper Saddle River, N.J.: Pearson/Prentice Hall. ISBN 978-0-13-189172-2.

외부 링크