기준 참조 테스트
Criterion-referenced test기준 참조 테스트는 시험 점수를 사용하여 해당 점수를 가진 사람이 기대할 수 있는 행동에 대한 진술을 생성하는 시험 스타일이다. 학교 교사들이 작성하는 대부분의 시험과 퀴즈는 기준 참조 시험으로 간주할 수 있다. 이 경우 목표는 단순히 학생이 자료를 배웠는지 확인하는 것이다. 기준 참조 평가는 표준 참조 평가 및 도입 평가와 대조될 수 있다.
기준 참조 테스트는 1970년대 정신측정학 연구의 주요 초점이었다.[1]
기준의 정의
그 용어에 대한 일반적인 오해는 기준의 의미다. 대부분의 경우, 기준 참조 시험에는 컷스코어가 포함되는데, 컷스코어를 초과하면 수험생이 합격하고 컷스코어를 초과하면 불합격하는 경우(흔히 마스터 테스트라고 함) 기준은 컷스코어가 아니며, 기준은 시험이 평가하도록 설계된 주제 영역이다. 예를 들어, 그 기준은 "학생들은 한 자리 숫자의 두 숫자를 정확하게 추가할 수 있어야 한다"일 수 있고, 컷스코어는 학생들이 통과하기 위해 최소한 80%의 질문에 정확하게 답해야 한다는 것일 수 있다.
시험 점수의 기준 참조 해석은 주제와의 관계를 식별한다. 숙련된 시험의 경우, 이것은 수험자가 점수를 컷스코어와 비교하여 과목의 특정 수준을 "정확하게" 측정했는지 여부를 확인하는 것을 의미한다. 그러나 모든 기준 참조 테스트가 컷스코어를 갖는 것은 아니며, 점수란 단순히 대상 영역에 있는 사람의 위치를 가리킬 수 있다.[2] ACT는 이것의 한 예다; 컷스코어는 없고, 단순히 고등학교 수준의 과목에 대한 학생들의 지식을 평가하는 것이다.
이러한 일반적인 오해 때문에, 기준 참조 시험은 학생들이 국가가 정의한 대로 "알아야" 하는 것을 정의하는 기준에 대해 평가되기 때문에 일부 교육 기관에서는 표준 기반 평가라고도 불린다.[3][4]
기준 참조, 도메인 참조 및 표준 참조 테스트 비교
학생의 답 | 기준 참조 평가 | 표준 참조 평가 |
---|---|---|
학생 #1: 제2차 세계대전은 히틀러와 독일이 폴란드를 침공하여 일어났다. | 이 답은 정확하다. | 이 답은 2번 학생의 답보다 못하지만 3번 학생의 답보다 낫다. |
2번 학생: 제2차 세계대전은 대공황과 일반 경제상황, 민족주의, 파시즘, 제국주의 팽창주의 등 여러 가지 요인과 제1차 세계대전과 관련된 풀리지 않은 원한에 의해 야기되었다. 유럽에서의 전쟁은 독일의 폴란드 침공으로 시작되었다. | 이 답은 정확하다. | 이 답은 학생 #1과 학생 #3의 답보다 낫다. |
3번 학생: 제2차 세계대전은 페르디난드 대공의 암살로 야기되었다. | 이 대답은 틀렸다. | 이 답은 1번 학생의 답과 2번 학생의 답보다 못하다. |
기준 참조와 표준 참조는 모두 원래 로버트 글레이저에 의해 만들어졌다.[5] 기준 기준 시험과 달리, 표준 기준 시험은 시험자가 시험을 치른 다른 사람보다 더 잘했는지 또는 못했는지 여부를 나타낸다. 예를 들어, "학생들은 한 자리 숫자의 두 숫자를 올바르게 추가할 수 있어야 한다"라는 기준이 있는 경우, 합리적인 시험 문제는 " 3= ? 또는 "+ 5= 9 ?}처럼 보일 수 있다 기준 참조 시험은 개별 시험의 여부에 따라 학생의 성적을 엄격하게 보고할 것이다. 학생은 이러한 질문에 정확하게 답하였다. 표준 기준 시험은 주로 이 학생이 그룹의 다른 학생들에 비해 더 많은 문제에 정답이 있는지 여부를 보고할 것이다. 유사한 주제를 시험할 때에도, 숙달성을 정확하게 평가하도록 설계된 시험은 상대적인 순위를 보여주기 위한 문제와는 다른 문제를 사용할 수 있다. 어떤 문항은 학생들의 실제 성취도를 반영하는데 더 좋고, 어떤 시험문항은 가장 우수한 학생과 가장 나쁜 학생을 구분하는데 더 좋기 때문이다.(많은 문항은 둘 다 할 것이다) 기준 참조 시험은 특정 자료를 알고 있는 학생들이 정답을 맞힌 문제를 사용한다. 표준 기준 시험은 "최우수" 학생이 정답이 맞으며 "최악" 학생이 정답이 아닌 문제를 사용한다(예: 캠브리지 대학의 입학 전 'S' 논문). 일부 시험은 실제 성취도 및 상대적 순위에 대한 유용한 정보를 제공할 수 있다. ACT는 대학에서의 성공 가능성을 높이기 위해 어떤 수준이 필요하다고 생각되는지를 나타내는 순위 및 지표 모두를 제공한다.[6] 시험 자체뿐만 아니라 점수의 해석을 참조할 수 있기 때문에 '기준 참조 시험'이라는 용어가 잘못된 용어라는 주장도 있다.[7] 앞의 예에서 ACT의 동일한 점수는 표준 참조 또는 기준 참조 방식으로 해석할 수 있다.
도메인 참조 테스트는 기준 참조 테스트와 유사하며, 점수로 이 영역의 어느 정도 숙달되었는지 알 수 있을 정도로 특정 연구 영역을 포괄하는 평가다. 따라서 개인이 도메인 참조 또는 기준 참조 테스트에서 90%의 항목을 수정했다면, 이는 테스트에 포함된 내용에 대한 깊이 있는 지식과 이해를 나타내는 높은 점수가 될 것이다. 이러한 종류의 시험은 표준 기준 시험과 대조되는데, 점수는 시험을 치른 다른 시험과 비교하여 시험 응시자가 항목에서 얼마나 잘 수행했는지를 나타낸다.[8][9]
고점 검사와의 관계
많은 이목을 끄는 기준 참조 테스트는 또한 높은 점수를 받은 시험이며, 시험 결과가 개별 수험생에게 중요한 영향을 미친다. 예를 들어, 고등학교 졸업시험과 면허시험은 의사나 변호사가 되기 위해서와 같은 직업에서 일하기 위해 통과되어야 한다. 단, 높은 시험이라고 해서 특별히 기준 참조 시험의 특징이 아니다. 대신 교육기관이나 정부기관이 시험 결과를 어떻게 활용할지 보여주는 특징이다. 게다가 그것은 개별적인 유형의 시험이다.
예
- 운전 시험은 기준 참조 시험으로, 한 수험생이 다른 수험생보다 더 숙련된지를 보는 것이 아니라, 운전면허를 취득할 수 있을 정도로 숙련된지를 확인하는 것이 목표이기 때문이다.
- 시민권 시험은 보통 기준 참고 시험으로, 한 수험생이 다른 수험생보다 학식이 높은지 아닌, 새로운 나라의 역사와 정부에 충분히 숙지하고 있는지를 확인하는 것이 목표이기 때문이다.
참고 항목
참조
- ^ Weiss, D.J.; Davison, M.L. (1981). "Test Theory and Methods". Annual Review of Psychology. 32: 1. doi:10.1146/annurev.ps.32.020181.003213.
- ^ [1] 웨이백 머신 질문 마크 용어집에 2008-10-08 보관
- ^ Malcolm Venter 박사가 웨이백 머신에 보관한 2006-08-29 결과 기반 교육의 평가. 남아프리카 공화국의 케이프타운. "OBE는 기준 기반 시스템을 옹호하는데, 이는 종 곡선을 없애고, 등급 평균과 비교 등급을 단계적으로 폐지하는 것을 의미한다."
- ^ 웨이백머신에 보관된 홈스쿨 월드 2006-09-06: "교육기준 운동은 사립학교와 가정학교의 문제를 야기한다"
- ^ Glaser, R. (1963). "Instructional technology and the measurement of learning outcomes". American Psychologist. 18 (8): 519–522. doi:10.1037/h0049294.
- ^ 크론바흐, L. J. (1970년) 심리 테스트의 필수 사항(3차 개정판) 뉴욕: 하퍼 & 로우.
- ^ Haertel, E. (1985). "Construct validity and criterion-referenced testing". Review of Educational Research. 55 (1): 23–46. doi:10.3102/00346543055001023. S2CID 145124784.
- ^ "Domain-referenced test". APA Dictionary of Psychology. Washington, DC: American Psychological Association. n.d. Retrieved 2021-02-19.
- ^ Denham, Carolyn H. (1975). "Criterion-Referenced, Domain-Referenced and Norm-Referenced Measurement: A Parallax View". Educational Technology. 15 (12): 9–13. ISSN 0013-1962.