표준화된 시험

Standardized test
폴란드의 젊은이들은 마투라 시험을 보기 위해 앉아 있다. 마투라는 대학들이 전국 학생들의 성적을 쉽게 비교할 수 있도록 표준화되어 있다.

표준화된 시험은 일관성 있는 또는 "표준" 방식으로 관리되고 채점되는 시험이다. 표준화된 시험은 문제, 관리 조건, 채점 절차 및 해석이 일관되고[1] 미리 정해진 표준 방식으로 관리되고 채점되는 방식으로 설계된다.[2]

모든 수험생에게 동일한 방식으로 동일한 시험을 주고 모든 수험생에게 동일한 방식으로 채점하는 모든 시험은 표준화된 시험이다. 표준화된 시험은 고득점 시험, 시간제한 시험 또는 객관식 시험일 필요는 없다. 표준화된 시험은 필기 시험, 구술 시험 또는 실기 수행 시험과 같은 모든 유형의 시험일 수 있다. 질문은 간단하거나 복잡할 수 있다. 학령기 학생들의 과목은 자주 학업 능력이지만, 운전 시험, 창의성, 운동성, 성격, 직업 윤리 또는 다른 속성을 포함한 거의 모든 주제에 대해 표준화된 시험이 주어질 수 있다.

표준화된 시험의 반대는 비표준화된 시험으로, 다른 수험자에게 현저하게 다른 시험을 주거나, 같은 시험을 현저하게 다른 조건에서 배정(예: 한 그룹은 다음 그룹보다 시험을 완료하는 데 훨씬 적은 시간을 허용)하거나 다르게 평가(예: 동일한 안스웨)하는 것이다.r은 한 학생에게는 옳지만, 다른 학생에게는 그른 것으로 간주된다.

대부분의 일상적 퀴즈와 학교생활 중 치르는 시험은 표준화된 시험의 정의를 충족시킨다: 모든 반 학생들이 같은 상황에서 같은 시간에 같은 시험을 치르며, 모든 학생들은 같은 방식으로 선생님에 의해 등급이 매겨진다. 그러나 표준화된 시험이라는 용어는 특정한 종류의 직업을 갖기 위해 자격증을 취득하고자 하는 모든 성인 또는 특정 연령의 모든 학생들이 치르는 시험과 같이 더 큰 그룹에 주어지는 시험을 가리키는 데 가장 일반적으로 사용된다.

모든 사람이 동일한 시험과 동일한 등급제를 받기 때문에 표준화된 시험은 비표준화된 시험보다 공정하다고 인식되는 경우가 많다. 그러한 시험은 종종 어떤 학생들은 더 쉬운 시험을, 다른 학생들은 더 어려운 시험을 보는 시스템보다 더 공정하고 더 객관적이라고 여겨진다. 표준화된 시험은 모든 수험생이 동일한 시험을 치르기 때문에 모든 수험생의 결과를 신뢰성 있게 비교할 수 있도록 설계된다.[3] 그러나 일부 사람들은 일반적인 시험과 특정한 표준화된 시험 모두를 비판한다. 예를 들어, 일부 학생들의 학교가 같은 학습 기준을 가지고 있지 않다면, 모든 학생들에게 같은 질문을 하는 것은 불공평하다고 믿는 사람들도 있다.

정의

Two men perform CPR on a CPR doll
두 명의 남자가 진짜, 비문헌, 기준 참조 표준화된 표준화된 시험을 치른다. 정확한 속도와 압력으로 마네킹에 심폐소생술을 하면 이번 시험에 합격한다.

표준화된 시험의 정의는 시간이 지나면서 다소 바뀌었다.[4] 1960년에 표준화된 시험은 시험을 언제, 어디서, 누가 치르는지와 관계없이 시험을 치르는 모든 사람에게 조건과 내용이 동일한 것으로 정의되었다. 이 표준화의 목적은 시험 응시자가 문제에 대한 답을 모르는 경우 어떻게 해야 하는지에 대한 다른 지침과 같이 점수가 측정되는 능력이나 기술을 신뢰성 있게 표시하지 않도록 하는 것이다.[4]

21세기 초에 이르러, 초점은 조건의 엄격한 동일성에서 벗어나 조건의 평등한 공정성으로 옮겨갔다.[4] 예를 들어, 손목이 부러진 수험생은 부상 때문에 더 느리게 글을 쓸 수 있고, 시간이 제한된 시험의 답안을 적는 데 몇 분만 더 주어진다면, 그것이 더 공평하고, 시험 응시자의 실제 지식에 대한 더 신뢰할 수 있는 이해를 얻을 수 있을 것이다. 영구적 또는 일시적 장애에 대해서는 공정성을 향상시키되 평가의 요점을 훼손하지 않는 방식으로 시험 조건을 변경하는 것을 수용이라고 한다. 그러나, 시험의 목적이 학생이 얼마나 빨리 글을 쓸 수 있는지 보는 것이라면, 수험자에게 시간을 더 주는 것은 내용의 수정이 되고, 더 이상 표준화된 시험이 아니다.

표준화 및 비표준화 테스트의 예
제목 포맷 표준화된 시험 비표준화시험
역사 구강 각 학생에게 동일한 문제가 주어지고, 그들의 답은 같은 방식으로 채점된다. 선생님은 방 안을 돌아다니며 각 학생에게 다른 질문을 한다. 어떤 질문들은 다른 질문들보다 어렵다.
운전 실기 운전하는 학생 한 명 한 명 한 명 한 명에게 같은 일을 시키고, 모두 같은 기준으로 평가를 받는다. 어떤 운전하는 학생들은 고속도로를 운전해야 하지만, 다른 학생들은 블록을 천천히 돌기만 하면 된다. 한 직원은 "나쁜 태도" 때문에 점수를 깎는다.
수학 쓰여진 각 학생에게 동일한 문제가 주어지고, 그들의 답은 같은 방식으로 채점된다. 이 교사는 가난한 학생들을 위한 쉬운 시험, 대부분의 학생들을 위한 또 다른 시험, 그리고 최고의 학생들을 위한 어려운 시험 등 다른 문제들을 학생들에게 준다.
음악 오디션 모든 음악가들은 같은 음악을 연주한다. 심사위원들은 시기와 표현, 음악성 등 요소들이 얼마나 중요한지 미리 의견을 모았다. 각각의 음악가들은 연주할 다른 음악을 선택한다. 심사위원들은 그들이 가장 좋아하는 음악가를 선택한다. 한 판사는 의상을 입은 음악가들에게 가산점을 준다.

역사

중국

표준화된 시험의 가장 초기 증거는 한나라 때 중국에서 있었는데,[5] 제국주의 시험은 음악, 활쏘기, 기마술, 산술, 글쓰기, 공적인 부분과 사적인 부분의 의식과 의식에 대한 지식을 포함하는 육예에 관한 것이었다. 이 시험들은 국가 관료제도에 맞는 직원을 뽑는데 사용되었다.

후에, 군사 전략, 민법, 세입과 세금, 농업과 지리에 관한 섹션이 시험에 추가되었다. 이런 형태로, 이 시험은 1천년 이상 동안 제도화되었다.

오늘날, 표준화된 시험들은 널리 사용되고 있는데, 가장 유명한 것은 가오카오 시스템이다.

영국

표준화된 시험은 19세기 초에 중국 만다린 시험을 모델로 하여 유럽에 도입되었는데,[6] 그 중 가장 '영구적'인 영국의 광저우 주재 영국 영사 토마스 테일러 메도우스의 지지를 통해 이루어졌다.[6] 메도우스는 제국 전역에서 표준화된 시험이 즉시 시행되지 않으면 대영제국이 붕괴될 것이라고 경고했다.[6]

그들이 채택되기 전에, 표준화된 시험은 전통적으로 서양의 교육학에서 한 부분이 아니었다. 고대 그리스에서 물려받은 회의적이고 개방적인 토론의 전통을 바탕으로 서양의 학계는 학생들이 쓴 에세이를 이용한 비표준화된 평가를 선호했다. 그 때문에, 표준화된 시험의 첫 번째 유럽 구현이 유럽에서는 제대로 이루어지지 않고, 영국령 인도에서 이루어졌기 때문이다.[7] 중국의 표준화된 시험 활용에 고무된 19세기 초 영국의 "회사 경영자들은 부패와 편애를 막기 위해 경쟁시험에 기반한 직원들을 고용하고 승진시켰다"[7]고 한다. 표준화된 시험의 이러한 관행은 후에 영국 본토에 의해 19세기 후반에 채택되었다. 이어진 의회 토론은 '중국 만다린 시스템'을 많이 언급했다.[6]

표준화된 실험이 영국 영연방 전역뿐만 아니라 유럽 및 그 다음에 미국으로 확산된 것은 영국으로부터였다.[6] 그것의 확산은 산업혁명에 의해 촉진되었다. 산업 혁명 중·후반 학생 수의 증가는 의무 교육법의 결과, 본질적으로 주관적인 성격 때문에 객관적으로 양산·평가가 어려웠던 개방형 평가의 활용을 줄였다.

A man sorts small objects into a wooden tray
영국 군인들은 2차 세계대전 동안 표준화된 시험을 치렀다. 이 신입 사원은 기계에 대한 그의 이해를 시험하기 위해 기계 부품을 분류하고 있다. 그의 유니폼은 그의 작품의 점수를 편향시킬 수 있는 이름, 순위, 다른 표시들을 보여주지 않는다.

제2차 세계 대전 동안 영국 육군을 위해 육군 장교 훈련 및 기타 임무를 위한 지원자를 선발하기 위해 전관 선발 위원회와 같은 표준화된 시험이 개발되었다.[8] 이 시험은 군인들의 정신 능력, 기계 기술, 다른 사람들과 함께 일하는 능력, 그리고 다른 자질들을 조사했다. 이전의 방법들은 편견에 시달렸고 장교 훈련을 위해 잘못된 군인들을 선택하는 결과를 낳았다.[8]

미국

표준화된 시험은 19세기 이후 미국 교육의 일부였지만, 미국의 학교에서 표준화된 시험에 대한 광범위한 의존은 대부분 20세기의 현상이다.

19세기 중반의 이민은 미국에서 표준화된 시험의 성장에 기여했다.[9] 표준화된 시험은 사람들이 사회적 역할을 시험하고 사회적 권력과 지위를 찾기 위해 미국에 처음 들어왔을 때 사용되었다.[10]

대학입시위원회는 1900년까지 대학입시와 대학입시를 위한 표준화된 시험을 제공하지 않았다. 그들의 첫 시험은 1901년에 9개 과목에 걸쳐 시행되었다. 이 시험은 북동부 엘리트 대학에 미국을 위한 표준화된 입학전형을 만들자는 생각으로 시행되었다. 원래, 이 시험은 교과과정을 표준화하기 위해 상위권 기숙학교를 위한 것이기도 했다.[11] 원래 표준화된 시험은 에세이로 만들어졌고 광범위한 시험을 위한 것이 아니었다.[citation needed]

제1차 세계 대전 동안, 육군 알파베타 테스트는 그들의 평가된 지능 수준에 기초하여 적절한 임무에 신입 사원을 배치하는 것을 돕기 위해 개발되었다.[12] IQ를 위한 현대 표준화된 시험의 초판인 스탠포드-비넷 인텔리전스 테스트는 1916년에 등장했다. 그 후 College Board는 1926년에 SAT를 설계했다. 첫 번째 SAT 시험은 육군 IQ 시험을 바탕으로 출제되었으며, 수험생의 지능, 문제 해결 능력, 비판적 사고력을 판단하는 것을 목표로 하고 있다.[13] 1959년에 에버렛 린드퀴스트는 처음으로 ACT(American College Testing)를 제안했다.[14] 2020년 현재, ACT는 영어, 수학, 독해, 과학을 시험하기 위한 객관식 문제를 포함한 4개의 주요 섹션과 선택적인 쓰기 영역을 포함하고 있다.[15]

개별 주는 1970년대에 공립학교 제도를 통해 많은 수의 어린이와 청소년들을 시험하기 시작했다. 1980년대까지 미국의 학교들은 전국적으로 평가되고 있었다.[16] 2012년 45개 주에서 대규모 연간 학업성취도 시험에서 학생 1인당 평균 27달러, 총 6억6900만 달러를 지급했다.[17] 그러나 교사들에게 시험을 준비하기 위해 돈을 지불하는 것과 같은 다른 비용들과 시험 시행에 드는 수업 시간에 드는 비용은 시험 자체의 비용을 크게 초과한다.[17]

연방정부가 고도로 탈중앙화된(로컬하게 통제되는) 공교육 시스템을 통해 의미 있는 비교를 해야 한다는 필요성은 대규모 표준화된 시험의 사용을 장려하고 있다. 1965년 초·중등교육법은 공립학교에서 일부 표준화된 시험을 요구하였다. 2001년의 '낙제아동 방지법'은 공립학교 기금과 표준화된 시험의 결과를 연계시켰다.

공립학교에서 소수민족과 소수민족이 아닌 어린이들 사이의 교육 성취도 차이를 포함해 학교와 교사들에게 학생 성취에 대한 책임을 물어 미국의 교육 시스템을 개선하는 것이 'No Child Left'의 목표였다. 미국 교육 시스템의 또 다른 요인은 시험 대상 학생들의 사회경제적 배경이다. 국립빈곤아동센터에 따르면 18세 미만 아동의 41%가 저소득층 출신이다.[18] 이 학생들은 학교와 표준화된 시험에서 좋은 성적을 거두기 위해 특별한 관심을 필요로 한다.[19]

이러한 연방법에 따르면, 학교 커리큘럼은 여전히 각 주에 의해 정해져 있었지만, 연방정부는 주정부에게 학교와 교사가 표준화된 시험으로 얼마나 잘 주정부급 자료를 가르치고 있는지를 평가하도록 요구하였다.[20] 대규모 표준화된 시험에 대한 학생들의 결과는 학교에 자금과 다른 자원들을 할당하고, 형편없는 성적을 거둔 학교를 폐쇄하는 데 사용되었다. 모든 학생이 성공하는 법은 2015년 말에 NCLB를 대체했다.[21] 그 무렵, 이러한 대규모 표준화된 시험들은 학교 시스템과 교사들을 위한 높은 점수를 받는 시험이었기 때문에 미국에서 논란이 되었다.[22]

호주.

호주 국가 평가 프로그램 – NAPLAN(National Assessment Programme and Mumacy) 표준화된 시험은 "국가 교육과정, 국가 평가 프로그램 및 국가 데이터 수집 및 보고의 책임을 지고 있는 호주 교육과정, 평가 및 보고 기관"에 의해 2008년에 시작되었다.나는 모든 호주 학생들을 위해 21세기 학습을 지원한다.[23]

이 시험에는 국가 시험을 사용하여 평가되는 호주 학교의 3, 5, 7, 9학년 모든 학생들이 포함된다. 이 시험에서 다루는 과목은 읽기, 쓰기, 언어 규약(말하기, 문법, 구두법)과 수학을 포함한다.

이 프로그램은 학부모들이 자녀들의 학교생활 과정에서의 진보를 알 수 있도록 고안된 학생 수준 보고서를 제시하고, 교사들이 학생들의 개별적인 학습 기회를 개선할 수 있도록 돕는다. 학생 및 학교 수준 데이터도 가장 필요로 하는 학교에 대한 구체적인 지원 및 자원을 목표로 할 수 있다는 점에 착안하여 적절한 학교 시스템에 제공된다. 교사와 학교는 이 정보를 다른 정보와 함께 사용하여 학생들이 얼마나 잘 수행하는지 판단하고 도움이 필요한 부분을 식별한다.

비록 현재의 호주식 접근법이 미국과 영국의 현재 교육 정책 구조에 기원을 두고 있다고 말할 수 있지만, 학생 성취 테스트의 개념은 새로운 것이 아니다. 호주 NAPLAN과 영국 및 미국 전략 사이에는 몇 가지 주요 차이점이 있다. 호주의 맥락에서 성과가 저조한 것으로 밝혀진 학교들은 현행 연방정부 정책에 따라 재정지원을 받게 된다.

콜롬비아

1968년 콜롬비아 교육평가연구소 - ICFES는 고등교육을 규제하기 위해 태어났다. 기존의 기관 및 대학 프로그램에 대한 운영 인가와 법적 인정을 위한 공적 평가 제도가 시행되었다.

콜롬비아에는 자국의 교육 수준을 평가하는 몇 가지 표준화된 시험이 있다. 이 시험들은 ICFES에 의해 수행된다.

3학년, 5학년, 9학년 학생들은 "사버 3°5°9"를 탄다.°" 시험. 이 테스트는 현재 통제 표본과 인구 조사 표본으로 컴퓨터에 제시되어 있다.

고교생을 떠나자 마자 전국 각 대학에 입학할 수 있는 '사버11'을 선보인다. 집에서 공부하는 학생들은 고등학교를 졸업하기 위해 이 시험을 보고 학위 증명서와 졸업장을 받을 수 있다.

대학을 졸업하는 학생들은 '세이버 프로' 시험을 봐야 한다.

캐나다

캐나다는 교육에서 벗어나고, 그 결과로 표준화된 시험을 지방 관할 하에 둔다. 각 주는 온타리오 주 학생들에게 필수 표준화된 시험이 없는 것에서부터 뉴펀들랜드 주와 래브라도 주 최종 고등학교 성적의 50%에 달하는 시험까지 도 차원의 표준화된 시험 체제를 갖추고 있다.[citation needed]

설계 및 점수 매기기

디자인

가장 일반적으로, 주요 학업 테스트는 사람 점수와 컴퓨터 점수의 두 부분을 포함한다.

표준화된 시험은 객관식 문제, 참 거짓 문제, 논술 문제, 진정성 있는 평가 또는 거의 모든 다른 형태의 평가로 구성될 수 있다. 객관식 및 참 거짓 항목은 컴퓨터 또는 컴퓨터 적응형 시험을 통해 읽을 수 있는 특수 답안지를 사용하여 값싸고, 빠르고, 신뢰할 수 있는 점수를 주고 받을 수 있기 때문에 수천 명이 치르는 시험에 종종 선택된다. 일부 표준화된 시험은 응답에 부여할 등급을 결정하기 위해 루브릭(규칙 또는 지침)과 벤치마크 논문(가능한 점수별 논문의 예)을 사용하는 독립 평가자가 점수를 할당하는 단답형 또는 논술형 구성요소가 있다.

모든 주제

A blank form with many checkboxes
영국의 주행 테스트를 위한 채점 양식. 운전면허증을 원하는 사람은 누구나 같은 시험을 보고 같은 방법으로 점수를 받는다.

모든 표준화된 시험들이 답안지를 포함하지는 않는다. 운동 실력에 대한 진정한 평가는 정해진 시간 동안 달리거나 일정 거리를 두고 을 드리블하는 형태를 취할 수 있다. 의료 전문가들은 의료 절차를 수행할 수 있다는 것을 증명하는 테스트를 통과해야 한다. 운전 면허증을 소지한 응시자들은 자동차를 운전할 수 있다는 것을 보여주는 표준화된 시험을 통과해야 한다. 캐나다 표준화된 피트니스 시험은 시험 응시자들이 얼마나 신체적으로 적합한지를 결정하기 위해 의학 연구에 사용되어 왔다.[24][25]

기계 및 인적 채점

일부 표준화된 시험은 채점이 비교적 저렴한 객관식 시험을 사용하지만 어떤 형태의 평가도 사용할 수 있다.

20세기 후반 이후, 컴퓨터에 의한 객관식 시험의 쉽고 저비용에 의해 대규모 표준화된 시험들이 부분적으로 형성되었다. 대부분의 국가 및 국제 평가는 사람에 의해 충분히 평가되지 않는다.

사람들은 컴퓨터로 쉽게 채점할 수 없는 항목(에세이 등)을 채점하는 데 익숙하다. 예를 들어, 대학원 기록 시험은 쓰기 부분을 제외하고 사람에 의한 채점이 필요 없는 컴퓨터 적응 평가다.[26]

인간의 채점은 상대적으로 비싸고 가변적인 경우가 많기 때문에 실현 가능할 때 컴퓨터 채점이 선호된다. 예를 들어, 일부 비평가들은 급여가 낮은 직원들이 시험을 잘 보지 못할 것이라고 말한다.[27] 채점자 간 합의는 시험과 채점 세션에 따라 60~85% 정도 차이가 날 수 있다. 학교 내 대규모 시험의 경우, 일부 수험자들은 2명 이상의 채점자가 각 논문을 읽도록 돈을 지불하고, 그들의 점수가 일치하지 않으면 그 논문은 추가 채점자에게 넘겨진다.[27]

객관식 시험을 전자적으로 채점하는 것보다 과정이 더 어렵지만 에세이는 컴퓨터로 채점할 수도 있다. 다른 경우에, 에세이와 다른 개방적인 응답은 훈련된 학년 학생들이 미리 정한 평가 루브릭에 따라 등급이 매겨진다. 예를 들어 피어슨에서는 모든 논술고객이 4년제 대학 학위를 가지고 있으며, 대다수가 현재 또는 이전 교실 교사들이다.[28]

공정성을 위한 루브릭 사용

루브릭을 사용하는 것은 학생의 성적을 평가할 때 공정성을 높이기 위한 것이다. 표준화된 시험에서 측정 오류(시험 채점 시 오류와 편중의 일관된 패턴)는 표준화된 시험에서 쉽게 판단할 수 있다. 비표준화된 평가에서, 학년들은 더 많은 개인 재량권을 가지고 있기 때문에 무의식적인 편견을 통해 불공정한 결과를 산출할 가능성이 더 높다. 점수가 학년 개개인의 선호도에 따라 달라질 때, 학생 개개인이 받는 결과는 누가 시험을 치르느냐에 따라 달라진다. 표준화된 시험은 또한 평가에서 선생님들의 편견을 제거한다. 연구에 따르면 교사들은 학생들에 대한 평가에서 일종의 자기 충족적 예언을 만들어 내고, 그들이 기대하는 것은 높은 점수로 성취할 것이고, 더 낮은 점수로 낙제할 것으로 예상하는 사람들에게 주어진다.[29]

종료된 기록 질문에 대한 샘플 점수:
학생의 답 표준화된 등급 비표준화 등급
정지 루브릭: 다음 중 하나 이상을 언급하는 경우 정답으로 표시해야 한다. 독일의 폴란드 침공, 일본의 중국 침공, 또는 경제 문제. 채점 기준 없음. 각 교사는 정답, 노력의 양, 학생의 학력, 언어 능력, 태도 등 교사가 선택하는 요소를 고려해 원하는 대로 점수를 매긴다.
#1 학생: 제2차 세계대전은 히틀러와 독일이 폴란드를 침공하여 일어났다.

교사 #1: 이 답에는 필수 항목 중 하나가 언급되어 있으므로 정답이다.
2번 선생님: 이 답은 정확하다.

#1 선생님: 이 대답이 충분히 좋은 것 같으니까 정확하게 표시해야겠다.
2번 선생님: 이 답은 맞지만, 이 좋은 학생은 그보다 더 잘 할 수 있어야 하니 부분적인 학점만 주겠다.

#2 학생: 제2차 세계대전은 대공황과 일반 경제 상황, 국가사회주의의 부상, 파시즘, 제국주의 팽창주의 등 여러 가지 요인과 WWI와 관련된 미해결된 원한에 의해 야기되었다. 유럽에서의 전쟁은 독일의 폴란드 침공으로 시작되었다.

교사 #1: 이 답에는 필수 항목 중 하나가 언급되어 있으므로 정답이다.
2번 선생님: 이 답은 정확하다.

#1 선생님: 이 대답이 정확하고 완전하다고 느껴서 온전히 인정하겠다.
2번 선생님: 이 답이 맞으니 만점을 주겠다.

#3 학생: 제2차 세계대전은 아치두케 페르디난드의 암살에 의해 일어났다.

교사 #1: 이 답에는 필요한 항목이 전혀 언급되어 있지 않다. 무득점.
2번 선생님: 이 대답은 틀렸다. 외상 사절.

선생님 #1: 이 대답은 틀렸다. 무득점.
2번 선생님: 이 답은 틀렸지만 이 학생은 열심히 노력했고 문법적으로 문법이 맞으니 노력하면 1점을 주겠다.

비교에 점수 사용

표준화된 시험 점수 해석에는 표준 기준 점수 해석과 기준 기준 기준 점수 해석의 두 가지 유형이 있다.

  • 표준 참조 점수 해석은 수험생을 동료의 표본과 비교한다. 학생들을 다른 학생들보다 잘하거나 못하다고 평가하는 것이 목표다. 표준 기준 시험 점수 해석은 전통적인 교육과 관련이 있다. 남들보다 성적이 좋은 학생은 시험에 합격하고, 남보다 성적이 나쁜 학생은 낙제한다.
  • 기준 참조 점수 해석은 다른 수험생의 점수에 관계없이 수험생을 기준(내용에 대한 공식적인 정의)에 비교한다. 이러한 평가들은 표준 기반 교육 개혁 운동과 일치하기 때문에 표준 기반 평가라고도 할 수 있다.[30] 기준 참조 점수 해석은 오직 이 특정 학생의 답이 정확하고 완전한지 여부에 관한 것이다. 기준 참조 시스템에서는 모든 학생이 시험에 합격하거나 모든 학생이 시험에 불합격하는 것이 가능하다.

이들 시스템 중 하나는 표준화된 시험에 사용될 수 있다. 표준화된 시험에서 중요한 것은 모든 학생들이 동등한 상황에서 동등한 질문을 받고 동등한 등급을 받는지 여부다. 표준화된 시험에서 주어진 답이 한 학생에게 맞는다면 모든 학생에게 맞는 답이다. 학생들은 한 학생에게 충분히 좋은 답을 주지 않지만 다른 학생에게는 불충분한 같은 대답을 거부한다.

규범적 평가라는 용어는 시험관 한 명을 또래와 비교하는 과정을 말한다. 표준 기준 시험(NRT)은 미리 정의된 모집단에서 시험된 개인의 위치에 대한 추정치를 산출하는 시험, 평가 또는 평가의 한 유형이다. 추정치는 모집단에서 추출한 표본에서 시험 점수 및 기타 관련 데이터를 분석하여 도출한다. 이러한 유형의 시험은 응시자가 이 시험을 보는 다른 학생들보다 더 잘했는지 혹은 더 못했는지 여부를 확인한다. 기준기준시험(CRT)은 시험 성적을 이용해 시험 응시자가 주어진 과제를 잘 수행했는지를 보여주는 시험 방식이지 다른 수험생에 비해 얼마나 잘 수행했는지를 보여주는 것이 아니다. 학교 교사들이 작성하는 대부분의 시험과 퀴즈는 기준 참조형 시험이다. 이 경우 단순히 학생이 질문에 정확하게 답할 수 있는지 확인하는 것이 목적이다. 선생님은 보통 각 학생의 결과를 다른 학생들과 비교하려고 하지 않는다.

이것은 학교가 전국 또는 전 세계의 학생들을 비교하려고 노력하는 고등교육에서 표준화된 시험을 입학 목적에 유용하게 만든다. 그러한 국제 벤치마크 시험의 예로는 국제 수학 및 과학 연구의 동향(TIMMS)과 국제 독서 리터러시 연구의 진전(PIRLS)이러한 국제 벤치마크 시험의 예는 다음과 같다. 이러한 시험의 성과는 CCSS와 같은 표준이 전 세계 상위 국가들과 일렬로 정렬하는 방식에 따라 바뀔 것으로 추측되어 왔다.

그 결과는 다른 학교들 간에 비교될 수 있기 때문에, 국가 표준화된 시험의 결과를 어떤 분야에서 개선이 필요한지 결정하는 데 사용할 수 있다. 모든 사람이 치르는 시험은 정부가 어떤 학교와 어떤 학생들이 가장 힘들어하는지 결정하는데 도움을 줄 수 있다.[31] 이 정보로, 그들은 문제를 해결하기 위한 해결책을 실행할 수 있고, 학생들이 학업 환경에서 배우고 성장할 수 있도록 한다.[31]

표준

유효성신뢰성에 대한 고려사항은 일반적으로 표준화된 시험의 품질을 결정하기 위한 필수 요소로 간주된다. 그러나 전문적 및 실무적 협회는 표준을 개발하고 주어진 맥락 안에서 표준화된 시험의 품질에 대한 전반적인 판단을 할 때 이러한 우려를 더 넓은 맥락 안에 자주 배치하였다.

평가기준

평가 분야, 특히 교육평가 분야에서는 공동교육평가위원회[32] 평가 기준 3세트를 발표했다. 인사평가기준[33] 1988년, 프로그램평가기준(2판)[34]은 1994년, 학생평가기준[35] 2003년에 각각 발표되었다.

각 간행물은 다양한 교육 환경에서 사용하기 위한 일련의 표준을 제시하고 상세히 기술한다. 이 표준은 확인된 평가 형식을 설계, 구현, 평가 및 개선하기 위한 지침을 제공한다. 각 표준은 적절하고 유용하며 실현 가능하고 정확한 교육 평가를 촉진하기 위해 네 가지 기본 범주 중 하나에 배치되었다. 이러한 표준 집합에서 유효성 및 신뢰성 고려사항은 정확도 항목에서 다룬다. 그러나 이 시험은 학생 평가가 학생들의 학습과 수행에 관한 건전하고 정확하며 신뢰할 수 있는 정보를 제공할 수 있도록 하기 위한 것이다. 표준화된 시험은 학생들의 성공 가능성을 부정확하게 측정하기 때문에 많은 형태의 지능에 대한 좁은 정보를 제공하고 학생들에게 해를 끼친다.[36]

시험표준

심리측정학 분야에서 교육심리검사기준[37] 측정오류장애인수용과 관련된 이슈와 함께 유효성과 신뢰성에 관한 기준을 제시한다. 세 번째 및 마지막 주요 주제는 시험 애플리케이션, 자격 증명 및 프로그램 평가 및 공공 정책에서의 시험과 관련된 표준을 다룬다.

통계적 타당성

표준화된 시험의 주요 장점 중 하나는 결과를 경험적으로 문서화할 수 있다는 것이다. 따라서 시험 점수는 일반화 및 반복 가능한 결과뿐만 아니라 상대적인 유효성과 신뢰성도 가질 수 있다.[38] 이것은 종종 개별 교사들에 의해 배정되는 학교 성적과 대조된다. 학교 간 교육문화 차이, 주어진 교사 커리큘럼의 어려움, 교수 스타일의 차이, 그리고 성적에 영향을 미치는 기술과 편견을 설명하기는 어려울 수 있다.

또 다른 장점은 집합이다. 잘 설계된 표준화된 시험은 어느 정도 종합 수준에서 유용한 정보를 제공하는 지식 또는 기술 영역에 대한 개인의 숙달에 대한 평가를 제공한다. 즉, 개별 평가가 실제 목적을 위해 충분히 정확하지 않을 수 있지만, 표본 크기를 증가시킴으로써 달성된 오류의 감소로 인해 학급, 학교, 지점 또는 다른 그룹의 평균 점수는 유용한 정보를 제공할 수 있다.

수험생

획일화되긴 했지만 시험이 학생 개개인에게 불공평하다는 비판은 학생들 스스로에게 있다. 어떤 학생들은 "나쁜 수험생"인데, 이것은 그들이 긴장하고 시험에 집중하지 않는다는 것을 의미한다. 따라서 시험이 표준이고 공정한 결과를 제공해야 하는 반면, 학생들이 자신의 지식과 문제해결 능력을 증명할 수 있는 다른 시험 대안이 없기 때문에 수험생들은 불리하지만 달리 그들의 지식을 증명할 방법이 없다.

시험불안에 시달리는 학생도 있다. 시험 불안은 또한 표준화된 시험에도 적용된다. 시험 불안이 없을 수 있는 학생들은 정기적으로 위험이 너무 높을 때 수행해야 하는 엄청난 압박감을 느낀다. 수능, PARCC, ACT와 같은 시험들이 높은 점수를 받는 표준화된 시험들로서, 성적 통과나 대입에서 좋은 성적을 거두어야 한다.

학교의 연간 표준화된 시험

표준화된 시험은 학생의 과거 학업 성취도와 미래의 잠재력을 결정하는 매우 흔한 방법이다. 그러나 높은 시험(표준화 여부를 불문하고)은 불안감을 유발할 수 있다. 교사나 학교가 시험의 더 나은 수행에 대해 보상을 받을 때, 그 보상들은 교사들로 하여금 풍부하고 폭넓은 교과과정을 제공하는 대신에 "시험에 임하도록" 장려한다. 2007년에 Au Wayne의 질적 연구는 표준화된 시험이 커리큘럼을 좁히고 학생 중심 학습 대신에 교사 중심 교육을 장려한다는 것을 증명했다.[39]

시험의 타당성, 품질 또는 사용, 특히 교육에 공통적인 연간 표준화된 시험들은 계속해서 널리 지지되거나 비판되어 왔다. 시험 자체와 마찬가지로, 시험에 대한 지지와 비판은 종종 다양하며 부모, 수험생, 강사, 기업 그룹, 대학 또는 정부 감시 기관과 같은 다양한 출처에서 나올 수 있다.

교육에서 대규모 표준화된 시험을 지지하는 사람들은 종종 교육에서 시험을 촉진하는 다음과 같은 이유를 제공한다.

  • 수험자의 성적에[40] 대한 피드백 또는 진단
  • 공정하고 효율적인[41]
  • 책임성[40][41] 강화
  • 예측 및 선택[40]
  • 성능[40] 향상

교육에서 표준화된 시험에 대한 비평가들은 종종 교육에서 표준화된 시험을 수정하거나 제거하는 다음과 같은 이유를 제공한다.

학교에 미치는 영향

과거 표준화된 시험지로서 객관식 문항을 사용하여 위와 같은 형태로 답한다.

표준화된 시험은 공교육에 대한 더 강력한 책임 대책을 수립하기 위한 공공 정책 전략으로 사용된다. NAEP(National Assessment of Education Progress)는 미국 전역의 임의 학교에 정기적으로 표준화된 시험을 시행함으로써 약 30년 동안 교육 바로미터 역할을 해왔지만, 지난 10년 동안 주 및 연방 차원의 노력은 모든 학교에 대해 연간 표준화된 시험 관리를 의무화했다.전국 각지의 학교들을 [55]괴롭히다

표준화된 시험정책 운동의 이면에 있는 생각은 시험이 자료 수집을 통해 학교, 교수실무, 교육방법 등을 향상시키는 첫걸음이라는 것이다. 찬성론자들은 표준화된 시험에 의해 생성된 데이터가 지역사회의 성적표와 같은 역할을 한다고 주장하면서, 지역 학교들이 얼마나 좋은 성적을 내고 있는지를 보여준다. 그러나 이러한 움직임에 대한 비판자들은 시험 유효성 및 신뢰성과 잘못된 상관관계 문제를 포함하여 현재 상태 표준화된 시험 관행에서 발생하는 다양한 불일치를 지적한다(심슨의 역설 참조).

실제 시험을 관리하고 점수를 매기는 것과 함께, 어떤 경우에는 선생님들이 자신의 학생들이 얼마나 시험을 잘 치르는지 점수를 매기고 있다. 교사들은 그들이 직업을 유지할 가치가 있다는 것을 증명하기 위해 지속적으로 점수를 올려야 한다는 압력을 받고 있다. 이러한 접근방식은 학생들 사이에 가정 폭력, 굶주림, 노숙자 등 학생들의 학업성취도에 영향을 미치는 외부 요인이 너무 많기 때문에 비판을 받아왔다.[36]

성과급은 학생들이 시험을 잘 보면 교사들이 더 많이 받아야 하고, 성적이 좋지 않으면 덜 받아야 한다는 생각이다.[56] 크리스 크리스티 뉴저지 주지사는 교사들에게 "시험에 임하도록" 압박할 뿐만 아니라, 그들의 학생들이 그들의 봉급과 고용 안정의 잠재적인 비용으로 수행하도록 하는 교육 개혁을 뉴저지 주에서 제안했다. 이 개혁안은 학생들의 표준화된 시험 성적과 교육적 이득에 따라 달라지는 성과급제를 요구했다.[57]

점수가 낮은 학교는 폐쇄되거나 축소될 예정인데, 이것은 정부가 점수를 올리기 위해 위협, 부정행위, 정보 수집과 같은 위험한 전술로 귀결되는 직접적인 영향을 준다.[56]

표준화된 시험 점수를 교사와 학교 성적을 평가하기 위해 무비판적으로 사용하는 것은 부적절하다. 왜냐하면 학생들의 점수는 학생들이 학교에서 배우는 것, 학생들이 학교 밖에서 배우는 것, 학생들의 선천적인 지능의 세 가지 영향을 받기 때문이다.[58] 학교는 이 세 가지 요소 중 하나만 통제할 수 있다. 이러한 비판에 대처하기 위해 선천적 능력과 학교 밖 상황적 요인에 대해 통계적으로 통제함으로써 부가가치 모델링이 제안되었다.[59] 분석가들은 시험 점수를 해석하는 부가가치 시스템에서 학생 자신의 이전 시험 점수, 기본 언어 또는 사회경제적 상태와 같은 요인을 바탕으로 학생 개개인의 예상 점수를 추정한다. 학생의 예상 점수와 실제 점수의 차이는 주로 교사의 노력 때문인 것으로 추정된다.

학생들에게 가르치는 것에 영향을 미침

  • 교사들에게 지도를 제공한다. 표준화된 시험은 교사들이 그들의 학생들이 한국의 다른 학생들에 비해 어떻게 수행하는지 볼 수 있게 해줄 것이다. 이것은 학생들이 기준을 충족시킬 수 있도록 돕기 위해 필요하다면 그들의 교수법을 개정하는 데 도움이 될 것이다.[31]
  • 학생들이 자신의 진보를 볼 수 있도록 한다. 학생들은 자신의 점수를 되돌아보고, 자신의 강점은 물론 약점이 어디에 있는지 볼 수 있는 기회가 주어진다.[31]
  • 부모에게 자녀에 대한 정보를 제공하십시오. 이 점수는 부모들로 하여금 그들의 아이가 한국의 같은 또래의 다른 모든 사람들과 비교해서 학업적으로 어떻게 지내고 있는지에 대한 아이디어를 얻을 수 있게 해준다.[60]

비평가들은 또한 표준화된 시험이 창의성과 시험에 포함되지 않은 과목의 심층적인 커버리지를 희생시키면서 "시험에 대한 가르침"을 장려한다고 주장한다. 객관식 시험은 쓰기 등 실력을 평가하지 못해 비판을 받는다. 게다가, 학생의 성공은 교사의 상대적 성과로 추적되어, 학생의 학업 성과로 교사의 성공에 따라 교사 진급이 이루어지고 있다. 도덕적이고 경제적인 문제들은 명백히 성적이 낮거나 덜 떨어진 학생들과 표준화된 시험에 직면했을 때 발생한다.

비평가들은 이러한 시험의 과용과 오용은 교육과정을 좁힘으로써 교육과 학습에 해를 끼친다고 주장한다. 그룹 FairTest에 따르면, 표준화된 시험이 책임성의 주요 요소일 때, 학교들은 커리큘럼을 좁게 정의하고 지시를 집중하기 위해 이 시험을 이용한다. 책임성은 수행하라는 엄청난 압력을 발생시키고 이것은 표준화된 시험의 오용과 오역으로 이어질 수 있다.[61]

비평가들은 "시험에 대한 가르침"이 더 높은 수준의 학습을 거부한다고 말한다; 그것은 선생님들이 가르칠 수 있는 것을 바꾸고 학생들이 몇 년 동안 배우는 다른 정보의 양을 크게 제한한다.[56] 표준화된 시험은 내용만으로 교과과정과 교육이 결정되도록 하지 않고 사용할 수 있지만, 자주 시험하지 않는 것은 가르쳐지지 않고, 어떻게 시험하는지는 과목의 가르침의 모델이 되는 경우가 많다.

비평가들은 또한 전형적으로 학교에서 시험하는 자료의 유형에 반대한다. 창의적 사고의 토런스 테스트와 같은 비학문적 속성에 대한 표준화된 테스트가 존재하지만 학교는 주도성, 창의성, 상상력, 호기심, 선의, 윤리적 반영 또는 기타 가치 있는 성향과 속성을 측정하기 위해 표준화된 테스트를 제공하는 경우는 거의 없다.[62] 대신에, 학교에서 주는 시험은 도덕이나 인성 발달에 덜 중점을 두는 경향이 있고, 개인 식별 가능한 학업 능력에 더 중점을 두는 경향이 있다.

Cathy Davidson은 그녀의 책 "Now You See it"에서 표준화된 시험을 비판한다. 그녀는 우리의 젊음을 "조립선 모델 위의 조립 라인 키즈"로 묘사하고 있는데, 이는 획일화된 시험을 모든 면에서 적합한 교육 모델의 일부로 사용하는 것을 의미한다. 그녀는 또한 시험되는 기술의 협소함을 비판하고 이러한 기술이 없는 아이들을 실패 혹은 장애 학생으로 분류한다.[63] 널리 퍼지고 조직적인 부정행위는 문화가 성장해 왔다.[64]

교육 이론가 빌 에이어스는 표준화된 시험의 한계에 대해 "표준화된 시험은 창의성, 상상력, 개념적 사고, 호기심, 노력, 아이러니, 판단력, 헌신, 뉘앙스, 선의, 윤리적 반영 또는 기타 가치 있는 성향과 속성을 측정할 수 없다"고 말했다. 이들이 측정하고 셀 수 있는 것은 고립된 기술, 구체적인 사실 및 기능, 내용 지식, 학습의 가장 흥미와 중요성이 낮은 측면들이다."[65] 조나단 코졸은 저서 '국가의 수치'에서 표준화된 시험에 출품된 학생들은 '인지적 참수'의 피해자라고 주장한다. 고졸은 시간, 시기, 역사적 사건에 대한 공간적 기억이 없는 도심 속 많은 아이들에게 말을 한 후 이러한 깨달음을 얻게 된다. 이것은 특히 자금 부족과 엄격한 책임 정책 때문에 학교가 의무 시험의 경합에 초점을 맞추기 위해 예술, 역사, 지리 같은 과목들을 없앤 학교의 경우에 해당된다.[66]

TIMMS(이하 "A+ 국가")에서 가장 우수한 성과를 거둔 국가(이하 "A+ 국가")를 측정하는 지표는 집중력, 일관성, 엄격성 등 3가지다. 포커스는 각 등급에서 다루는 주제 수로 정의된다. 각 등급에서 다루는 주제가 적을수록 각 주제에 더 많은 포커스를 부여할 수 있다는 생각이다. 일관성의 정의는 수학의 자연적 진보나 논리적 구조를 따르는 일련의 주제들을 고수하고 있다. CCSSM은 현재 상태 표준과 A+ 국가 표준 둘 다와 비교되었다. 평균적으로 가장 많은 주제를 다루면서, 현재 주 표준은 가장 낮은 초점을 가지고 있었다.[67] 공통 핵심 표준은 교육자들이 학생들이 관련 없는 주제에 집중하지 않고 배워야 할 것에 초점을 맞추도록 함으로써 이러한 불일치를 해결하는 것을 목표로 한다. 그들은 교육 자료들이 광범위한 주제들을 얕게 다루는 것에서 훨씬 더 깊이 있게 몇 가지 주제들에 이르도록 장려한다.[68]

시간과 돈

표준화된 시험은 학생과 학교의 교육 수준을 광범위하게 측정하는 방법이다. 유치원에서 12학년까지, 대부분의 미국 학생들은 매년 표준화된 시험에 참여한다. 평균적인 학생은 이러한 시험들 중 약 10개를 본다(예: 독해력 시험 1, 2회 수학 시험, 쓰기 시험, 과학 시험 등).[69] 평균 시험량은 전체 수업 시간의 약 2.3%(연간 약 4일)가 소요된다.[70]

표준화된 시험은 관리하는데 비용이 많이 든다. 미국은 이 실험에 연간 약 17억 달러를 지출한다고 보고되었다.[71] 2001년에는 주 단위 시험의 96%를 디자인하는 업체(하커트 교육측정, CTB 맥그로힐, 리버사이드 출판)만 3개사로 보고되기도 했다.[72]

교육적 결정

시험 점수는 일부 경우에 입학이나 인증의 유일한, 의무 또는 기본 기준으로 사용된다. 예를 들어, 일부 미국의 주들은 고등학교 졸업 시험을 요구한다. 고등학교 졸업을 위해서는 이들 졸업시험에 대한 적절한 점수가 필요하다. General Education Development는 미국에서 고등학교 졸업장의 대안으로 자주 사용되는 표준화된 시험을 시험한다.

다른 지원에는 추적(학생을 과정의 "빠른" 또는 "느린" 버전에 등록해야 하는지의 여부 결정)과 장학금 지급이 포함된다. 미국의 많은 대학과 대학들은 자동으로 고급 배치 시험의 점수를 대학 학점, 졸업 요구 사항의 만족도 또는 더 고급 과정에서의 배치로 변환한다. SATGRE와 같은 일반화된 시험은 입학 결정을 내릴 때 여러 가지 방법 중 하나로 더 자주 사용된다. 일부 공공기관은 지원자의 수업을 만들어 자동으로 합격하거나 불합격시키는 SAT, 내신 또는 등급에 대한 점수를 깎기도 한다.

의사결정을 위한 표준화된 시험에 크게 의존하는 것은 위에서 언급한 이유 때문에 종종 논란이 된다. 비평가들은 종종 교실 성적이나 선생님들의 간단한 개별 평가(산문)와 같은 누적되거나 심지어 비수치적인 조치를 강조할 것을 제안한다. 지지자들은 시험 점수가 등급 인플레이션에 대한 가치 있는 점검 역할을 하는 명확하고 객관적인 기준을 제공한다고 주장한다.[73]

국립과학원은 주요 교육 결정이 단일 시험 점수에만 근거하지 않도록 권고하고 있다.[74] 시험 점수는 학점수, 필수과목, 출석률 등과 같은 다른 최소 기준과 거의 항상 결합되기 때문에 입학이나 졸업을 위한 최소점수의 사용은 단일 기준을 의미하지 않는다. 시험 점수는 단순히 가장 어렵거나 다른 기준의 충족이 자동으로 가정된다는 이유만으로 "솔루 기준"으로 인식되는 경우가 많다. 이 규칙의 한 가지 예외는 검정고시인데, 이것은 많은 사람들이 전통적인 기준을 충족시키지 못하더라도 그들의 실력을 인정받을 수 있도록 허용해 왔다.[citation needed]

일부 교사들은 표준화된 시험은 한 학생의 현재 지식을 측정하는 것일 뿐이며 이는 학생들의 연초부터의 진보를 반영하지 않는다고 주장할 것이다.[75] 학생의 정규 수업의 일부가 아닌, 다른 나이에 학생들이 알아야 할 것을 결정하는 전문가들에 의해 만들어진 결과. 게다가, 교사들은 최고의 시험 작성자와 촉진자가 그들 자신이라는 것에 동의한다. 그들은 그들이 학생들의 능력, 능력, 그리고 필수품들을 가장 잘 알고 있기 때문에 과목들을 더 오래 듣거나 정규 교과과정을 진행할 수 있다고 주장한다.

불우학생에 미치는 영향

국립공정시험원 몬티 닐 소장은 영어를 제2외국어로 구사하거나 장애가 있거나 저소득층 출신 학생들이 시험 점수로 인해 졸업장을 불균형하게 거부하는데 이는 불공정하고 유해하다고 주장한다. 예를 들어, 미국에서 졸업 시험이 시작된 1970년대 후반, 많은 흑인 학생들이 법에 의해 분리된 학교에 다녔기 때문에 졸업 시험에서 시험받은 자료에 대해 공정한 기회를 갖지 못했다는 소송이 있었다. "비례적으로 학위나 학년 승진을 부정하는 학교들이며 이들이 다니는 학교는 시험 성적이 저조하고 구조조정 등 제재에 직면할 가능성이 가장 높다"는 닐의 주장처럼 "자원 부족 학교와 시험의 상호작용은 유색인종 학생들에게 가장 큰 타격을 준다"고 말했다. [76]

저널 The Progression에서 바바라 마이너는 세 권의 다른 책을 분석함으로써 표준화된 시험의 단점을 설명한다. 라이스 대학교 교육 센터의 공동 책임자와 교육 교수인 린다 맥닐은 자신의 저서 학교 개혁의 모순에서 다음과 같이 말했다. 표준화된 시험의 교육비용은 "교육 표준화는 교육과 학습에 해를 끼치고 장기적으로 인종과 계층에 의한 교육을 억제한다"고 쓰고 있다. 맥닐은 시험에 기반을 둔 교육 개혁이 유색인종 학생들에게 더 높은 기준을 부여한다고 믿는다. Miner에 따르면, McNeil은 "시험에 기반한 개혁이 어떻게 기업과 정치 엘리트들의 손에 권력을 집중시키는지 보여주는데, 이것은 교육 개혁에 대한 기업과 보수적인 영향력이 증가하는 이 시기에 특히 무서운 발전이다." 그러한 시험 위주의 개혁은 특히 유색인종 학생들에게 배움을 무디게 했다.[77]

FairTest는 시험 오용의 부정적인 결과에는 학생들을 학교 밖으로 내몰고, 교사들을 직업에서 몰아내고, 학생들의 참여와 학교 풍토를 훼손하는 것이 포함되어 있다고 말한다.[61]

대학입시에서 표준화된 시험의 사용

표준화된 시험은 개인 진술서, 내신, 추천서 등 다른 입증 자료와 함께 지원서의 일부로 대학들이 검토한다. 고등교육학자인 Nathan Kuncel은 대학 입학, SAT, ACT 및 기타 표준화된 시험에서 압도당한 입학사정관들이 추가적인 평가를 위해 엄청난 수의 지원자들을 풀로 나누는 것을 도와준다는 것을 알아챘다. 고득점이 어디에도 입학이 보장되지 않고, 저득점이 이를 배제하지 않지만 학교들은 이 시험을 진지하게 받아들인다." [78]

연구는 이 시험이 단지 1학년 성적과 학생이 수강할 것 같은 과정의 수준 이상의 것을 예측한다는 것을 보여준다. 과학자들에 의해 행해진 종방향 연구는 시험 점수가 높은 학생들이 대학을 통해 도전적인 길을 택할 가능성이 더 높다는 것을 보여준다.[79] 시험은 또한 교수진 평가, 연구 성과, 학위 취득, 종합 시험 수행 및 전문 인가를 포함하여 대학 이외의 학생들의 결과를 나타낼 수 있다.[80]

내신 성적은 학교마다, 심지어 같은 학교에 있는 두 학생에게도 차이가 있기 때문에, 시험 점수에 의해 제공되는 공통적인 척도가 더 유용하다.

그러나, 1995년 4월 교육 심리 측정 저널에 발표된 "메타 분석"에서, 토드 모리슨과 멜라니 모리슨은 미국의 거의 모든 석사 또는 박사 과정에 들어가기 위해 필요한 시험의 유효성 연구인 대학원 기록 검사(GRE)를 24차례 조사했다. 이 연구는 지난 30년간 5,000명 이상의 수험생을 대상으로 했다. 저자들은 대학원 성적 변동의 6%만 GRE 점수가 차지한다는 사실을 발견했다. GRE는 "예측 관점에서 볼 때 사실상 쓸모없는 것 같다"고 저자들은 썼다. 로스쿨 입학시험(LSAT)에 대한 반복적인 연구도 같은 사실을 발견한다.

시험이 다른 요인들이 많아 일과 삶의 장기적인 성공을 나타낼 수 있을지 논란이 있지만 독해, 쓰기, 수학 등 기본적인 실력은 직무 수행과 관련이 있다.

2007년의 종적 연구는, 교육 기회를 고려한 후에도, 소설 출판이나 특허 기술 같은 주요 삶의 성취가 시험 점수와도 연관되어 있다는 것을 보여주었다. 심지어 이러한 기술들이 직장에서 효과적인 리더십과 창의적인 성과와 관련이 있다는 많은 증거들이 있다. 텍스트를 읽고 이해할 수 있는 능력과 강력한 양적 추론을 갖는 것은 현대 정보경제에서 매우 중요하다.[80]

많은 주장들은 시험의 기술이 유용하지만, 단지 어느 정도까지만 유용하다고 제안한다.

그러나 2008년 사이언티픽 사이언스지에 발표된 주목할 만한 종방향 연구는 13세 때 상위 1%의 점수를 받은 학생들을 조사했다. 20년 후, 그들은 평균적으로 매우 높은 성과를 거두었고, 높은 수입, 주요 상, 그리고 어떤 부모도 자랑스러워 할 만한 경력을 가지고 있었다.[81]

입학사정관들은 학생을 종합적으로 평가하기 위해 추천서, 면접, 학생논술, 내신, 시험, 개인 진술서 등 지원 자료의 조합에 의존한다. 그러나 이러한 도구의 대부분은 미래의 성공을 보장하지 않는다. 전통적인 인터뷰와 추천서의 문제점이 너무 만연하여 많은 학교들이 더 나은 선택지를 찾고 있다.[82]

시험 성적과 사회 계층 사이에는 상관관계가 있지만, 표준화된 시험과 대학에서의 성공은 단순히 수업에만 의존하는 것이 아니다. 이 연구는 "사회경제적 계층을 통제할 때에도 이 테스트는 유효했다"고 보여준다. 가정환경과 상관없이 시험성적이 좋고 내신성적이 높은 학생이 낮은 학생보다 대학에서 더 잘한다고 말했다.[83]

사회 계층과 표준화된 시험과 관련된 또 다른 비판은 부유한 사람들만 시험 준비와 코칭을 받는다는 것이다. 그러나 조사관들은 이 문제를 시험하기 위해 실험 연구와 통제된 현장 연구를 혼합하여 실시하였다. 이들은 일반적으로 시험 준비로 인한 이득이 일부 시험 준비 업체가 주장하는 100~200점이 아닌 5~20점 수준이라는 결론을 내렸다. [84]

더 중요한 것은, 많은 사람들이 소수자들이 다른 대표 그룹에 비해 시험에서 낮은 점수를 받기 때문에 입학의 다양성을 막는다는 의견을 가지고 있다. 2012년 한 연구는 입학시험이 지원자의 선택 과목인 학교를 조사하여 이를 사용하는 학교와 비교한 결과, "최근의 연구 결과에서 선택 과목인 학교들이 점점 더 다양한 학생 단체를 등록하고 있는 것으로 나타났다. 하지만 시험이 필요한 학교도 마찬가지라고 말했다.[85]

반대론자들은 표준화된 시험이 오용되고 지적 능력과 성능에 대한 비판적이지 않은 판단이라고 주장하지만 지지자들은 표준화된 시험의 부정적인 것이 아니라 잘못 설계된 시험 체제에 대한 비판이라고 주장한다. 그들은 시험이 교육의 가장 중요한 측면(예: 미리 정의된 지식과 기술)에 교육자원을 집중해야 하며, 그 밖의 측면은 덜 중요하거나 시험 계획에 추가되어야 한다고 주장한다.

증거는 흑인과 히스패닉 학생들이 평균적으로 백인이나 아시아인보다 낮은 점수를 받는다는 것을 보여준다. 따라서 SAT와 같은 수학과 읽기 표준 시험은 진보주의자들의 증가하는 공격에 직면해 있다. 그러나, Napolitano씨가 의뢰하여 2020년에 발표한 UC 교수회의 전체 보고서는 이 시험이 차별적이지 않으며 교육의 질을 보호하는 데 중요한 역할을 한다는 것을 발견했다.[86]

이 보고서는 특히 부유한 고등학교에서 학년 인플레이션을 악화시키는 것이 표준 평가를 특히 중요하게 한다고 제안했다.[86]

대학입시에서 SAT, ACT와 같은 표준시험을 떨어뜨리려는 UC학교의 의도와 관련해서는 논술, 과외와 같은 주관적이고 맞춤형 시험은 쉽게 맞춤형으로 출제될 수 있고 그 과정에 익숙하지 않은 학생들에게 해가 될 수 있다. 시험을 치르지 않는 입학은 연줄이 좋은 학생에게 유리하게 기울어질 수 있다.[87]

2020년 1월, 캘리포니아 대학의 교수진 상원은 UC 시스템이 표준화된 시험을 입학 요건으로 유지할 것을 권고했다.[86] 이 보고서는 표준화된 수학 시험과 독해 시험이 대학 성적을 예측하는 데 유용하다고 말한다. 보고서는 UC시스템에 있는 학생들의 자료를 바탕으로 "현재 시험 점수는 고등학교 평균 점수보다 1학년 내신 성적에 대한 더 나은 예측 변수"라고 결론짓는다. [86] 이 보고서는 대학 내신 총합과 졸업 가능성을 점수도 잘 예측하고 있다는 내용을 담고 있다. 보고서는 '시험성적 예측력이 높아졌다'는 평가가 나오는 반면 '고교 내신 예측력이 떨어졌다'고 덧붙인다. [86]

시험 점수는 UC 학교들이 "더 높은 점수를 얻고 정시에 졸업할 가능성이 더 높은 잘 표현되지 않은 그룹의 학생들을 선발할 수 있게 한다." [86] 보고서는 "SAT의 원래 의도는 대학에서 성공할 가능성이 있는 상대적으로 특권층 밖에서 온 학생들을 식별하는 것이었다"고 말한다.[86] SAT의 제조업체인 ETS는 이제 SAT가 "적응성" 테스트가 아니라 "발달된 능력"[88]에 대한 평가라고 주장한다.

미국 내 유색인종, 장애인, 저소득층 학생을 위한 테스트

논란

표준화된 시험과 대학 입학을 위한 그러한 시험의 요구사항은 논쟁의 여지가 있는 주제다. 이러한 시험들이 학생들의 경제적 지위, 인종, 심지어 능력 지위에 따라 불평등한 기회를 만들 수 있기 때문에 논란이 되고 있다. 유색인종, 장애인, 저소득층 출신은 학생 성취도가 낮은 것이 일반적이다. 이는 '제외주택, 교육, 경제정책의 발전' 때문일 가능성이 크다.[89] 이러한 성취 격차는 새로운 개념이 아니다. 1991년 백인 학생과 흑인 학생의 평균 점수 차이는 .91 표준 편차였고, 2020년에는 .79 표준 편차로 격차가 줄었다.[89]

테스트 응시 비용

표준화된 시험은 준비 과정/지도사와 실제 시험을 치르는 데 있어 학생들에게 많은 비용이 들 수 있다. ACTSAT는 각각 55-70달러와 52-68달러의 비용이 들 수 있다.[90] 결국 여러 차례 시험을 치르면서 자신이 받을 수 있는 최고의 점수를[91] 보게 되는 많은 학생들이, 각 부문별 자신의 최고 점수로 구성된 '초점수'나 점수를 제출하게 된다. 저소득 지역 사회의 학생들이 항상 시험을 여러 번 볼 수는 없다.

테스트 준비 비용

저소득 지역사회의 학생들은 종종 더 부유한 배경을 가진 또래들이 시험 준비를 위해 가지고 있는 것과 같은 자원을 가지고 있지 않다. 이용 가능한 자원의 이러한 불일치는 다른 인종 배경을 가진 학생들의 점수에 큰 차이를 야기한다. 브루킹스 연구소가 실시한 분석에서 백인 학생의 59%와 아시아 시험 응시자의 80%가 SAT 기준으로 '대학 진학 준비'[92]로 평가되는 데 비해 흑인 학생의 25% 이하와 히스패닉/라티노 학생의 33% 이하가 '대학 진학 준비'로 평가되는 것으로 나타났다. College Board는 사회경제적 요인이 학생의 성적에 직접적인 영향을 미치지는 않는다고 보고하지만, 그것은 시험 점수에 큰 영향을 미칠 수 있는 준비 과정과 더 나은 학교 교육을 통해 간접적으로 영향을 미칠 수 있다.

장애학생

장애와 특별한 필요가 있는 학생들에 관한 한, 이러한 시험들이 항상 지식이나 준비 상태를 측정하는 적절한 방법은 아니다. 장애가 있는 학생들에게는 한 번에 몇 시간씩 책상에 앉아 묵묵히 시험을 치르기를 기대하는 것이 항상 현실적인 것은 아니다. 이를 반박하기 위해 장애학생들은 시험공부 시간을 연장하는 등 숙소를 얻을 수 있다.[93]

참고 항목

주요 주제

기타 항목

참조

  1. ^ 실반 학습 용어집, 온라인 검색, 출처 더 이상 없음
  2. ^ Popham, W.J. (1999). "Why standardized tests don't measure educational quality". Educational Leadership. 56 (6): 8–15.
  3. ^ Phelps, Richard P. "Role & Importance of Testing". nonpartisaneducation.org. Retrieved 2016-05-17.
  4. ^ a b c Olson, Amy M.; Sabers, Darrell (October 2008). "Standardized Tests". In Good, Thomas L. (ed.). 21st Century Education: A Reference Handbook. SAGE Publications. pp. 423–430. doi:10.4135/9781412964012.n46. ISBN 9781452265995.
  5. ^ "Chinese civil service". Encyclopædia Britannica. Retrieved 2 May 2015.
  6. ^ a b c d e 마크와 보이어(1996), 9-10.
  7. ^ a b 카진, 에드워즈, 로스만 (2010), 142.
  8. ^ a b Trahair, Richard (2015-06-01). Behavior, Technology, and Organizational Development: Eric Trist and the Tavistock Institute. Transaction Publishers. ISBN 9781412855495.
  9. ^ 존슨, 로버트. "표준화된 테스트." 교육개혁과 반대 백과사전. SAGE 출판물, INC. 2010. 853–856.
  10. ^ 게리슨, 마크 J. 실패의 척도: 표준화된 시험의 정치적 기원. 알바니: 2009년 뉴욕 주립 대학교 인쇄하다
  11. ^ Darity Jr, William. "International Encyclopedia of the Social Sciences". Encyclopedia for Background Information. Gale Cengage Learning. Retrieved 25 January 2017.
  12. ^ 굴드, S. J., "모론의 나라", 뉴 사이언티스트 (1982년 5월 6일), 349–352.
  13. ^ Darity Jr, William. "International Encyclopedia of the Social Sciences". Encyclopedias for Background Information. Gale Cengage Learning. Retrieved 25 January 2017.
  14. ^ 플레처, 댄 "표준화된 테스트" Time. Time Inc., 2009년 12월 11일. 웹. 2014년 3월 9일.
  15. ^ "ACT의 내용" ACT 테스트 섹션 2014년 5월 05일, N.d. Web.
  16. ^ Stiggins, Richard (2002). "Assessment Crisis: The Absence Of Assessment FOR Learning" (PDF). Phi Delta Kappan. 83 (10): 758–765. doi:10.1177/003172170208301010. S2CID 145683785.
  17. ^ a b Strauss, Valerie (March 11, 2015). "Five Reasons Standardized Testing Isn't Going to Let Up". The Washington Post. The Washington Post. Retrieved 26 January 2017.
  18. ^ 코발, H.와 장, Y., 2018.
  19. ^ 코발, H.와 장, Y. (2018) 저소득 아동에 대한 기본적 사실. http://www.nccp.org/publications/pub_1194.html에서 검색됨
  20. ^ "뒤처진 아이가 없는 역사와 배경" Bright Hub Education 2015년 6월 9일. 웹. 2015년 10월 12일. http://www.brighthubeducation.com/student-assessment-tools/3140-history-of-the-no-child-left-behind-act/
  21. ^ "Every Student Succeeds Act (ESSA) U.S. Department of Education".
  22. ^ 클라이본, 찰스 "높은 위험 테스트". 영재, 창조성, 재능의 백과사전. SAGE Publications, 2009. 2014년 4월 9일.
  23. ^ "Home – The Australian Curriculum v8.1". www.australiancurriculum.edu.au. Retrieved 2016-05-17.
  24. ^ Horowitz, M. R.; Montgomery, D. L. (January 1993). "Physiological profile of fire fighters compared to norms for the Canadian population". Canadian Journal of Public Health. 84 (1): 50–52. ISSN 0008-4263. PMID 8500058.
  25. ^ Canadian Standardized Test of Fitness (CSTF): for 15 to 69 years of age: interpretation and counselling manual. Canadian Association of Sports Sciences, Fitness Appraisal Certification and Accreditation Program, Canadian Society for Exercise Physiology, Fitness Canada. Gloucester, Ontario: Canadian Society for Exercise Physiology. 1987. ISBN 0-662-15736-2. OCLC 16048356.CS1 maint: 기타(링크)
  26. ^ ETS 웹페이지에서 GRE 점수 매기기.
  27. ^ a b Houtz, Jolayne"(8월 27일 2000년)Temps 국가 시험 AWASL 수학 문제 골을 넣기 위해, 20초 수필집 2.mw-parser-output .frac{white-space:nowrap}.mw-parser-output.frac.num,.mw-parser-output.frac .den{:80%;line-height:0;vertical-align:슈퍼 font-size}.mw-parser-output.frac .den{vertical-align:서브}.mw-parser-output .sr을 그냥분을 보낸다.-only{국경:0;클립:rect(0,0,0,0), 높이:1px, 마진:-1px, 오버 플로: 숨어 있었다. 패딩:0;위치:절대, 너비:1px}1⁄2 minutes". 시애틀 타임즈 "몇 분 안에, 시간당 10달러의 임시직원이 당신의 아이의 시험에 점수를 할당한다.
  28. ^ Rich, Motoko (2015-06-22). "Grading the Common Core: No Teaching Experience Required". The New York Times. ISSN 0362-4331. Retrieved 2015-10-06.
  29. ^ Lee, Jussim (1989). "Teacher expectations: Self-fulfilling prophecies, perceptual bias, and accuracy". Journal of Personality and Social Psychology. 57 (3): 469–480. doi:10.1037/0022-3514.57.3.469.
  30. ^ Where We stand: 표준 기반 평가 및 책임 (American Federation of Teacles) [1] 2006년 8월 24일 웨이백 기계보관
  31. ^ a b c d "Pros & Cons of Standardized Tests". Oxford Learning. 2014-10-29. Retrieved 2018-02-19.
  32. ^ "Joint Committee on Standards for Educational Evaluation". Archived from the original on 15 October 2009. Retrieved 2 May 2015.
  33. ^ 교육평가기준공동위원회. (1988). 인사 평가 표준: 교육자 평가를 위한 시스템 평가 방법. 2005-12-12-12년, 웨이백 머신 뉴베리 파크, CA: 세이지 출판물에 보관.
  34. ^ 교육평가기준공동위원회. (1994). 프로그램 평가 표준, 제2판. CA: 세이지 출판물 웨이백 머신 뉴베리 파크에 보관된 2006-02-22.
  35. ^ 교육 평가 표준 위원회. (2003). 학생 평가 기준: 학생들의 평가를 향상시키는 방법. 2006-05-24년, CA: 코윈 프레스 웨이백 머신 뉴베리 파크보관.
  36. ^ a b Morgan, Hani (2016). "Relying on High-Stakes Standardized Tests to Evaluate Schools and Teachers: A Bad Idea". The Clearing House: A Journal of Educational Strategies, Issues and Ideas. 89 (2): 67–72. doi:10.1080/00098655.2016.1156628. S2CID 148015644.
  37. ^ "The Standards for Educational and Psychological Testing". www.apa.org. Retrieved 2 May 2015.
  38. ^ Kuncel, N. R.; Hezlett, S. A. (2007). "ASSESSMENT: Standardized Tests Predict Graduate Students' Success". Science. 315 (5815): 1080–81. doi:10.1126/science.1136618. PMID 17322046. S2CID 143260128.
  39. ^ Au, Wayne (2007-06-01). "High-Stakes Testing and Curricular Control: A Qualitative Metasynthesis". Educational Researcher. 36 (5): 258–267. doi:10.3102/0013189X07306523. ISSN 0013-189X. S2CID 507582.
  40. ^ a b c d Phelps, Richard (2005). Defending standardized testing. London: Psychology Press. ISBN 978-0-8058-4912-7.
  41. ^ a b Hirsch Jr., Eric (1999). The Schools We Need: And Why We Don't Have Them. New York: Anchor. ISBN 978-0-385-49524-0.
  42. ^ "Goswami U (1991) Put to the Test: The Effects of External Testing on Teachers. Educational Researcher 20: 8-11". Archived from the original on 2013-02-02.
  43. ^ "FairTest criticism of the SAT". fairtest.org.
  44. ^ "Standardized tests not always best indicator of success".
  45. ^ Paton, Graeme (July 6, 2010). "Universities criticise exam 'grade inflation'". The Daily Telegraph. London.
  46. ^ Vasagar, Jeevan (August 2, 2010). "Fears for state pupils as top universities insist on A* at A-level". The Guardian. London.
  47. ^ Finch, Julia (March 10, 2010). "They can't read, can't write, keep time or be tidy: Tesco director's verdict on school-leavers". The Guardian. London.
  48. ^ Hedges, Larry V.; Laine, Richard D.; Greenwald, Rob (1994). "Hedges LV (1994) An Exchange: Part I*: Does Money Matter? A Meta-Analysis of Studies of the Effects of Differential School Inputs on Student Outcomes". Educational Researcher. 23 (3): 5–14. doi:10.3102/0013189X023003005. S2CID 36771659.
  49. ^ 코클란, 숀. 2013년 10월 16일 BBC, Bright people '수십동안 감금' 2013년 10월 17일에 검색됨.
  50. ^ "The Neuroscience of Standardized Test-Taking".
  51. ^ "Standardized Tests Don't Show What Kids Know".
  52. ^ "Standardized Tests Not A Good Indication of Fluid Intelligence According to New Research".
  53. ^ "Standardized Tests Don't Measure Intelligence or Ability".
  54. ^ "Observations: Standardized test scores do not reflect students' abilities".
  55. ^ "NAEP Nations Report Card - National Assessment of Educational Progress - NAEP". nces.ed.gov. Retrieved 2018-02-19.
  56. ^ a b c Williams, Mary (2015). "Standardized Testing Is Harming Student Learning". go.galegroup.com. Retrieved March 28, 2018.
  57. ^ Arco, Matt (June 12, 2015). "Christie Education Speech in Iowa". NJ.com. Retrieved July 25, 2016.
  58. ^ Popham, W.J. (1999). "Why Standardized Test Scores Don't Measure Educational Quality". Educational Leadership. 56 (6): 8–15.
  59. ^ 하셀, B. & Rosch, J. (2008) "오하이오 부가가치 프라이머" 포드햄 재단. http://www.edexcellence.net/doc/Ohio_Value_Added_Primer_FINAL_small.pdf[permanent dead link]
  60. ^ "Pros and Cons of Standardized Testing" (PDF). Columbia University. Spring 2013. Archived from the original (PDF) on 2018-01-27. Retrieved February 19, 2018.
  61. ^ a b Holloway, J. H. (2001). "The Use and Misuse of Standardized Tests". Educational Leadership. 59 (1): 77.
  62. ^ Kohn, Alfie (2000). The Case Against Standardized Testing: Rising the Scores, Ruining the Schools. 361 Hanover Street Portsmouth, NH 03801-3912: Heinemann. ISBN 978-0325003252.CS1 maint: 위치(링크)
  63. ^ Davidson, Cathy (2011). Now You See It: How the Brain Science of Attention Will Transform the Way We Live, Work, and Learn. New York: Viking.
  64. ^ U.S. News (2 May 2015). "Cheating scandal: Feds say teachers hired stand-in to take their certification tests". NBC News. Retrieved 2 May 2015.
  65. ^ 가르칠 대상: 윌리엄 에이어스, 교사 대학 출판부, 1993, ISBN 0-8077-3985-5, ISBN 978-0-8077-3985-3, 페이지 116
  66. ^ Kozol, Jonathan (2005). The Shame of the Nation: The Restoration of Apartheid Schooling in America. Print: Random House. pp. 118–119. ISBN 9781415924167.
  67. ^ Schmidt, William H.; Houang, Richard T. (2012). "Curricular Coherence and the Common Core Standards for Mathematics". Educational Researcher. 41 (8): 294–308. doi:10.3102/0013189x12464517. S2CID 121779439.
  68. ^ Porter, A.; McMaken, J.; Hwang, J.; Yang, R. (2011). "Common Core Standards: The New U.S. Intended Curriculum". Educational Researcher. 40 (7): 103–116. doi:10.3102/0013189x11405038. S2CID 51453603.
  69. ^ Layton, Lyndsey (October 24, 2015). "Study says standardized testing is overwhelming nation's public schools". The Washington Post. Retrieved July 26, 2015.
  70. ^ Doering, Christopher (October 25, 2015). "Obama plan limits standardized testing to no more than 2% of class time". USA Today. Retrieved July 26, 2016.
  71. ^ Kuczynski-Brown, Alex. "표준화된 테스트 비용 1년에 17억 달러, Study Finds." 허핑턴 포스트. TheHuffingtonPost.com, 2012년 11월 29일. 웹. 2014년 4월 7일.
  72. ^ "The Testing Industry's Big Four". PBS Frontline. PBS. 2001. Retrieved 2015-01-21.
  73. ^ Buckley, Jack; Letukas, Lynn; Wildavsky, Ben (2017), Measuring Success: Testing, Grades, and the Future of College Admissions, Baltimore: Johns Hopkins University Press, p. 344, ISBN 9781421424965
  74. ^ "Browse All Topics – The National Academies Press". Archived from the original on 2008-04-18. Retrieved 2 May 2015.
  75. ^ "Pros and Cons of Standardized Testing" (PDF). Columbia University. 21 November 2017.
  76. ^ Neill, Monty (Fall 2009). Standardized Tests Are Unfair and Harmful. Detroit: Farmington Hills, MI : Greenhaven Press. pp. 28–35. ISBN 9780737747812. Retrieved 4 December 2016.
  77. ^ Miner, Barbara (August 2000). "Standardized Minds: The High Price of America's Testing Culture and what we can do to Change it / Contradictions of School Reform: Educational Costs of Standardized Testing.". The Progressive. 64: 40–43. ProQuest 231959849.
  78. ^ Kuncel, Nathan; Sackett, Paul (March 8, 2018). "The Truth About the SAT and ACT". The Wall Street Journal.
  79. ^ Kuncel, Nathan; Hezlett, Sarah A. (2007). "Standardized Tests Predict Graduate Students' Success". Science. 315 (5815): 1080–1. doi:10.1126/science.1136618. PMID 17322046. S2CID 143260128.
  80. ^ a b Kuncel, Nathan; Hezlett, Sarah A. (2007). "Standardized Tests Predict Graduate Students' Success". Science. 315: 1080–1081. doi:10.1126/science.1136618. PMID 17322046. S2CID 143260128.
  81. ^ Park, Gregory; Lubinski, David; Benbow, Camilla P. (October 1, 2008). "Ability Differences Among People Who Have Commensurate Degrees Matter for Scientific Creativity". Psychological Science. 19 (10): 957–961. doi:10.1111/j.1467-9280.2008.02182.x. PMID 19000201. S2CID 6443429.
  82. ^ Murphy, Sara C; Klieger, David M; Borneman, Matthew J; Kuncel, Nathan R. (2009). "The Predictive Power of Personal Statements in Admissions: A Meta-Analysis and Cautionary Tale". College and University. 84: 83–86, 88.
  83. ^ Kuncel, Nathan; Arneson (2009). "Does socioeconomic status explain the relationship between admissions tests and post-secondary academic performance?". Psychological Bulletin: 1–22.
  84. ^ Connelly, Brian S.; Kuncel, Nathan (November 3, 2012). "Balancing Treatment and Control Groups in Quasi‐Experiments: An Introduction to Propensity Scoring". Personnel Psychology. 66 (2): 407–442. doi:10.1111/peps.12020.
  85. ^ Kuncel, Nathan; Sackett, Paul; Beatty, Adam S. (August 2, 2012). "The Role of Socioeconomic Status in SAT-Grade Relationships and in College Admissions Decisions". Psychological Science. 23 (9): 1000–7. doi:10.1177/0956797612438732. PMID 22858524. S2CID 22703783.
  86. ^ a b c d e f g UNIVERSITY OF CALIFORNIA, ACADEMIC SENATE (January 2020). "Report of the UC Academic Council Standardized Testing Task Force" (PDF).
  87. ^ The Editorial Board (May 17, 2020). "California Defines Testing Down". The Wall Street Journal.
  88. ^ 토드 모리슨과 멜라니 모리슨. "예측 타당성에 대한 메타 분석적 평가...1995년 교육 및 심리 측정 저널 구성 요소http:///epm.sagepub.com/content/55/2/309.abstract.
  89. ^ a b Smith, Ember. "SAT math scores mirror and maintain racial inequity". Brookings Institution.
  90. ^ "Why we should do away with standardized testing". The Daily Cardinal. Retrieved 2021-09-27.
  91. ^ "Retaking the Test". www.manhattanreview.com. Retrieved 2021-10-04.
  92. ^ Geiser, Saul (October 2015). "The Growing Correlation Between Race and SAT Scores" (PDF). Cite 저널은 필요로 한다. journal= (도움말)
  93. ^ "Standardized Tests and Learning Disabilities - Test Limits, & Challenges". neurohealthah.com. 2020-11-19. Retrieved 2021-10-04.

추가 읽기

외부 링크