사이코메트리 소프트웨어

사이코메트리 소프트웨어는 잠재된 정신교육 변수를 반영하는 시험, 설문지 또는 재고에서 얻은 데이터의 심리측정학 분석에 사용되는 소프트웨어다. 일부 정신측정학 분석은 SPSS와 같은 표준 통계 소프트웨어로 수행할 수 있지만, 대부분의 분석에는 전문화된 도구가 필요하다.^{[citation needed]}

원천

연구자들과 교육자들에 의해 개발된 많은 무료 도구들이 있다. 무료 정신측정학 소프트웨어를 위한 중요한 웹사이트는 다음과 같다.

미국 아이오와 대학교 CASMA
미국 매사추세츠 대학교 REMP
해롤드 도런의 소프트웨어
브래드 핸슨의 소프트웨어
John Ueversax의 소프트웨어
J. Patrick Meyer
목표 측정 연구소의 소프트웨어 디렉터리
Lihua Yao의 소프트웨어
래리 넬슨의 소프트웨어
Matthew Courtney, Kevin Chang, Eric Mei, Kane Meissel, Luke Rawe, Laila Issayeva의 소프트웨어

또한 CRAN 태스크 보기에서 찾을 수 있는 R용 패키지의 수가 증가하고 있다. 사이코메트릭 모델 및 방법

고전 시험 이론

고전적 시험 이론은 항목 반응 이론보다 가정이 약하고 더 작은 표본 크기에 더 적합한 심리학적 분석에 대한 접근법이다.

부검을 하다

부검은 CTT(Classic Test Irony)와 Rasch 모델링을 수행하기 위한 여러 기능을 가진 무료 오픈소스 웹 앱이다. CTT 함수는 각 항목 범주에 대한 정확한 백분율, 관측된 점수, 항목-총 상관 계수, 항목-재설정 상관 계수(사용자 지정 신뢰 구간 포함), 항목-휴식점 이위/폴리시리얼 상관 계수, Cronbach의 알파, 알파-if-deleted 및 전체 Pearson 상관 행렬(항목 행렬)을 포함한다.. 부검 앱은 DIF에 대한 기본 Rasch 다면 분석, 이분법 항목-반응 매트릭스에 해당하는 고정 항목, 일원 분산 분석, 층간 신뢰도 분석 등 다양한 Rasch 기반 기능도 수행한다. ^[1]

씨타스

CITAS(Classical Item and Test Analysis 스프레드시트)는 강의실 시험의 채점 및 통계 분석을 제공하기 위해 고안된 무료 Excel 워크북이다. 항목 응답(ABCD)과 키를 입력하거나 워크북에 붙여넣으면 출력이 자동으로 채워지는데, CITAS는 다른 프로그램과 달리 '실행'이나 심리분석 경험이 필요 없어 학교 교사와 교수들이 접근할 수 있다.

j메트리크

jMetrik은 포괄적인 정신측정학 분석을 수행하기 위한 무료 오픈소스 소프트웨어다. 그것은 버지니아 대학의 J. Patrick Meyer에 의해 개발되었다. 현재 방법으로는 고전적 항목 분석, 차등 항목 기능(DIF) 분석, 확인 요인 분석, 항목 반응 이론, IRT 등가, 비모수 항목 반응 이론 등이 있다. 항목 분석에는 모든 반응 옵션에 대한 비율, 점 이변량 및 이변량 통계량이 포함된다. 신뢰도 계수로는 크론바흐 알파, 구트만의 람다, 펠트-길머 계수, 펠트-브렌난 계수, 의사결정 일관성 지수, 측정의 조건부 표준 오차, 항목 삭제 시 신뢰성이 포함된다. DIF 분석은 비모수 품목 특성 곡선과 Mantel-Haenszel 절차를 기반으로 한다. DIF 효과 크기와 ETS DIF 분류는 출력에 포함된다. 확인 인자 분석은 착향성, 타우 등가 및 병렬 측정에 대한 공통 인자 모델로 제한된다. 적합 통계량은 인자 적재 및 오차 분산과 함께 보고된다. IRT 방법에는 Rasch, 부분 신용 및 등급 척도 모델이 포함된다. IRT 동일 방법에는 평균/평균, 평균/시그마, 해바라 및 스타킹-로드 절차가 포함된다.

jMetrik은 또한 IRT 일러스트레이터, 기초 기술 통계학, 막대 차트, 파이 차트, 히스토그램, 커널 밀도 추정치, 선 플롯을 생성하는 그래픽 기능도 포함한다.

jMetrik은 순수 Java 애플리케이션으로 32비트 및 64비트 버전의 Windows, Mac, Linux 운영 체제에서 실행되며, jMetrik는 호스트 컴퓨터에 Java 1.6이 필요하다.

항목

Iteman은 클래식 테스트 분석을 위해 특별히 고안된 상용 윈도우 프로그램이다. 그래픽, 내러티브, 임베디드 테이블로 ASCII 출력이 아닌 마이크로소프트 워드(ub) 기술 보고서를 만든다는 점에서 독특하다. 항목별 비율과 점 이변성, 높은/낮은 부분군 비율, 항목 성능의 상세 그래픽 등을 계산한다. 또한 각 영역 및 전체 테스트에 대한 평균, 표준 편차, 신뢰성 및 측정의 표준 오차를 포함한 대표적인 기술 통계량을 계산한다. 그것은 평가 시스템 주식회사에서만 이용할 수 있다.

레르타프

Lertap5(Laboratory of Educational Research Test Analysis Program 5번째 버전)는 테스트 및 조사 분석을 위한 포괄적인 소프트웨어 패키지로, 마이크로소프트 엑셀과 함께 윈도우 및 매킨토시 컴퓨터에서 사용하기 위해 개발되었다. 여기에는 테스트, 항목 및 옵션 통계, 분류 일관성 및 마스터 테스트 분석, 부정행위 탐지 절차, 광범위한 그래픽(예: 항목 옵션에 대한 추적선, 조건부 표준 오차, 스크리 플롯, 그룹 차이의 상자 그림, 히스토그램, 산점도)이 포함된다. Lertap5는 특히 고전적인 시험 이론 방법(CTT)에 대한 광범위한 지원을 가지고 있지만, 이분법적인 시험 항목에 대한 Rasch 항목 분석 능력도 가지고 있다.

DIF, 차등 항목 기능 지원. Mantel-Haenszel 방법을 사용하며 경험적 DIF 그림을 포함한 결과 그래프가 제공된다. DIF 지원 모듈에는 R 및 R Studio와 함께 사용할 수 있는 스크립트가 포함되어 있다.

IRT 사용자, 항목 응답 이론은 4가지 특별 옵션을 사용할 수 있다: 하나는 Xcalibre에서 요구하는 데이터 및 항목 제어 파일을 생산하고, 다른 하나는 Bilog MG를 위한 ASCII 파일을 설정하며, 다른 하나는 SAS로 처리할 데이터를 준비하고, 다른 하나는 SAS IRT 모듈과 함께 사용하기 위한 적절한 SAS 코드 라인을 작성한다. Excel 버전과의 네 번째 인터페이스 사용자가 Excel을 떠나지 않고 항목을 보정할 수 있는 R 패키지의 "RIRT".

Lertap 및/또는 기타 항목 및 테스트 분석 프로그램과 함께 사용할 수 있는 몇 가지 샘플 데이터셋이 있다. 이러한 데이터셋은 인지 테스트와 감성적(또는 등급) 척도를 모두 포함한다. Lertap5의 적용과 관련된 기술 논문도 이용할 수 있다.

Lertap5는 Curtin 대학의 Larry Nelson에 의해 개발되었으며 Lertap5.com에서 이용할 수 있다.

탭

TAP(Test Analysis Program)는 Delphi Pascal에서 작성된 Windows 9x/NT/2000/XP/7 프로그램을 무료로 제공하며, 고전적인 테스트 이론을 바탕으로 테스트 분석과 항목 분석을 수행한다. TAP는 고전적인 시험 및 항목 분석 프로그램이다. 이 보고서는 수험생의 총 점수, 항목 통계(예: 항목 난이도, 항목 차별, 점수 비교), 옵션 분석 및 기타 유용한 정보에 대한 보고서를 제공한다. TAP는 또한 총점수와 항목 응답에 대한 개별 수험생 보고서를 제공한다.

비스타-시타

ViSta-CITA(Classical Item and Test Analysis)는 시각통계시스템(ViSta)에 포함된 모듈로, 심리학적 분석에 적용된 그래픽 중심의 방법을 중점적으로 다룬다. 루벤 레데스마, J. 가브리엘 몰리나, 페드로 M. 발레로-모라, 포레스트 W에 의해 개발되었다. 영. ViSta는 2014년 이후 업데이트되지 않았다.

정신의

R 패키지 성격, 정신분석학, 실험심리학을 위한 많은 일상. 다른 기능들은 기본적인 기술 통계량을 제공하지만, 주로 인자 분석, 군집 분석 및 신뢰성 분석을 이용한 규모 구축에 사용된다. 항목 반응 이론은 4차 및 다차 상관 계수 분석을 사용하여 수행된다. 특정 항목 및 시험 구조 시뮬레이션을 위한 기능이 포함되어 있다. 구조 방정식 모델링에 유용한 프런트엔드 역할을 하는 기능도 몇 가지 있다. 경로 다이어그램, 인자 분석 및 구조 방정식 모델의 그래픽 디스플레이는 기본 그래픽을 사용하여 생성된다. 그 기능들 중 일부는 성격 연구에서의 출판물뿐만 아니라 정신 측정학에 관한 책을 지원하기 위해 쓰여졌다. 자세한 내용은 personality-project.org/r 웹 페이지를 참조하십시오.

품목응답이론교정

항목 반응 이론(IRT)은 특정 반응의 확률을 기저 특성이나 특성의 직접적인 함수라고 가정하는 심리학적 접근법이다. 이러한 관계를 모델링하기 위해 다양한 기능이 제안되었으며, 다른 보정 패키지는 이를 반영한다. 동일시 등의 추가 분석을 위해 여러 소프트웨어 패키지가 개발되었다. 소프트웨어 패키지는 다음 절에 나열되어 있다.

부검을 하다

부검은 단차원 Rasch 분석을 수행하기 위한 오픈 소스 소프트웨어 프로그램이다. 이 앱은 마스터의 부분 신용 모델의 적용을 통해 이분법적 데이터와 다원적 데이터를 모두 처리할 수 있다. 이 앱은 한계 최대우도 추정을 채택하고 총 31개의 오픈 소스 R 패키지(TAM, 심리학, 니트러 등 포함)를 활용한다. 사용자는 항목-응답 매트릭스(.csv 파일)를 업로드하고, Rasch 분석을 위한 설정을 사용자 정의하며, 앱은 방법론과 결과를 위해 내레이션이 내장된 PDF를 자동으로 생성한다. Excel 파일에는 타당한 값을 포함하여 수행된 모든 분석에 대한 출력이 포함되어 있다. 사용자는 또한 항목 DIF 검사를 위한 기본적인 다요소 Rasch 분석, 이분법적 매트릭스 2개에 해당하는 고정 앵커, 그룹 효과의 조사를 위한 EAP 세타 추정치의 분산 분석(ANOVA), 검사자 일관성 검사를 위한 사용자 간 신뢰도 분석을 수행할 수 있다. 웹 앱에 대한 완전한 설명은 PLOS ONE SEACHY 저널에 제공된다. ^[2]

빌로그-MG

BILOG-MG는 적합 및 차등 항목 기능을 포함한 이분법(수정/잘못된) 데이터의 IRT 분석을 위한 소프트웨어 프로그램이다. 그것은 상업적이며, Scientific Software International에서만 이용할 수 있다.

손재주를 부리다

2017년 2월에 처음 출판된 덱스터는 책자로 정리된 시험 데이터를 관리하고 분석하기 위한 강력하고 상당히 종합적인 시스템으로 의도된 R 패키지다. 패키지는 시험 데이터의 수입 및 관리, 기본적인 시험 및 항목 분석을 통한 데이터 품질 평가 및 개선, IRT 모델 적합, 다양한 능력 추정치 계산 등의 시설을 포함한다. 다항성 항목에 대해 일반화된 Haberman(2007) 상호작용 모델, 그럴듯한 값이나 점수의 효율적인 생성, 탐색 및 확인 DIF 분석을 위한 새로운 방법, 표준 설정의 3DC 방법에 대한 지원 등 다른 곳에서는 찾아볼 수 없는 많은 심리학적 방법이 제공된다. 중앙 IRT 모델은 확장된 한계 Rasch 모델의 다단성 일반화다. 추정은 CML 또는 베이지안 기법에 의해 이루어진다. 덱스터기, 2018년 6월 처음 출간된 덱스터기, 덱스터에서 가장 널리 사용되는 기능에 손쉬운 그래픽 인터페이스 제공, 덱스터의 두 가지 동반 패키지가 있다.MST는 다단계 시험 설계의 데이터를 관리하고 분석하기 위해 2018년 7월에 처음 발간되었다. 모든 패키지는 프로페셔널과 마찬가지로 초보자를 위해 광범위하게 문서화된다(블로그 참조).

면

파셋은 논술 성적, 다이빙 대회, 만족도 조사, 삶의 질 데이터 등 래쉬(Rasch) 또는 심판 중간 데이터를 분석하기 위한 소프트웨어 프로그램이다. 다른 응용 프로그램에는 순위 데이터, 이항 시행 및 포아송 카운트가 포함된다.

플렉스미르트

flexMIRT IRT 소프트웨어는 아이템 분석, 아이템 보정, 테스트 채점 등을 위한 다단계 다중 그룹 소프트웨어 패키지다. flexMIRT IRT 소프트웨어 패키지는 다양한 일차원 및 다차원 항목 반응 이론 모델(항목 인자 분석 모델이라고도 함)을 임의의 그룹의 단일 수준 및 다단계 데이터에 적합시킨다.

얼토당토않은 말

irtoys는 2007년에 처음 출판된 R 패키지로, 책의 거의 모든 것을 지원하지만 이분법적인 항목의 책자 하나에만 한정되어 있다. 그것은 심리학자의 스위스 칼로서 그리고 다른 프로젝트의 돌을 쌓는 원천으로서 작은 프로젝트들을 가르치는 데 좋다. ICL과 BILOG-MG를 위한 간단한 구문 파일은 좀 더 복잡한 문제들을 다루도록 연구되고 수정될 수 있다.

ICL

ICL(IRT 명령어)은 1, 2, 3 매개변수 로지스틱 모델뿐만 아니라 부분 크레딧 모델과 일반화된 부분 크레딧 모델을 포함하여 IRT 교정을 수행한다. 반응 데이터도 생성할 수 있다. 이름에서 알 수 있듯이, 그것은 그래픽 사용자 인터페이스 없이 완전히 명령 코드를 기반으로 한다.

j메트리크

jMetrik은 포괄적인 정신측정학 분석을 수행하기 위한 무료 오픈소스 소프트웨어다. 그것은 버지니아 대학의 J. Patrick Meyer에 의해 개발되었다. 현재 방법으로는 고전적 항목 분석, 차등 항목 기능(DIF) 분석, 항목 반응 이론, IRT 등분, 비모수 항목 반응 이론 등이 있다. 항목 분석에는 모든 반응 옵션에 대한 비율, 점 이변량 및 이변량 통계량이 포함된다. 신뢰도 계수로는 크론바흐 알파, 구트만의 람다, 펠트-길머 계수, 펠트-브렌난 계수, 의사결정 일관성 지수, 측정의 조건부 표준 오차, 항목 삭제 시 신뢰성이 포함된다. DIF 분석은 비모수 품목 특성 곡선과 Mantel-Haenszel 절차를 기반으로 한다. DIF 효과 크기와 ETS DIF 분류는 출력에 포함된다. IRT 방법에는 JMLE를 통해 추정된 Rasch, 부분 신용 및 등급 척도 모델이 포함된다. jMetrik은 또한 MMLE를 통해 추정된 3PL, 4PL 및 일반화된 부분 신용 모델을 제공한다. 개인 점수 방법에는 MLE, MAP, EAP가 포함된다. IRT 동일 방법에는 평균/평균, 평균/시그마, 해바라 및 스타킹-로드 절차가 포함된다.

jMetrik은 또한 기본적인 기술 통계와 막대 차트, 파이 차트, 히스토그램, 커널 밀도 추정치 및 선 그림을 생성하는 그래픽 기능도 포함한다.

jMetrik은 순수 Java 애플리케이션으로 32비트 및 64비트 버전의 Windows, Mac, Linux 운영 체제에서 실행되며, jMetrik는 호스트 컴퓨터에 Java 1.6이 필요하다.

레르타프5

기본적으로 고전적인 테스트 이론 프로그램인 Lertap5는 SAS의 IRT 루틴인 Xcalibre, Bilog-MG, 그리고 "RT" 패키지와 동등한 엑셀인 "EIRT"의 사용자를 지원한다. Lertap5는 EIRT와 마찬가지로 Excel "app"를 실행한다. 이 두 프로그램을 결합한 결과 엑셀만으로 항목 교정이 매우 실현 가능하다.

멀티로그

Multilog는 다항성(복수) 반응을 갖는 데이터에 대한 BLOG의 확장이다. 그것은 상업적이며, Scientific Software International에서만 이용할 수 있다.

비머트

BMIRT는 다차원 다단계 항목 대응 이론(IRT) 모델 프레임워크에서 항목 보정 및 능력 추정을 수행하는 자바 무료 다목적 어플리케이션 프로그램으로, 혼합 모델과 함께 이분법 또는 다분법 모델에 적합할 수 있다. 그것은 탐색적 및 확인적 모델과 보상적 및 비보상적 MIRT 모델 모두를 지원한다.

파스케일

PARSCLE은 다단성 IRT 분석을 위해 특별히 설계된 프로그램이다. 그것은 상업적이며, Scientific Software International에서만 이용할 수 있다.

PARAM-3PL

PARAM-3PL은 3-모수 로지스틱 IRT 모델의 교정을 위한 무료 프로그램이다. 교육자원정보센터(ERIC)의 로렌스 러드너가 개발했다. 최신 버전은 2012년 8월 버전 0.93이었다.

테스트팩트

테스트 팩트 특성 - 한계 최대우도(MML) 탐색 인자 분석 및 2진수 데이터의 고전적 항목 분석 - 4차 상관 계수, 주 인자 솔루션, 고전적 항목 기술 통계량, 프랙탈 표 및 그림 계산 - 숫자 4차분석을 사용하여 최대 10개 요인 처리: 비적응성의 경우 최대 5개, 최대 10개 요인 처리 적응형 4차 분석 - 몬테카를로 통합 기법을 사용하여 최대 15개 요인 처리 - 인자 적재의 Varimax(직교) 및 PROMAX(불규칙) 회전 - "바이오텍터" 분석으로 알려진 확인 인자 분석의 중요한 형태 처리: 인자 패턴은 하나의 주요 인자와 그룹 인자로 구성된다 - 사용자 지정 매개변수에 기초한 항목에 대한 반응 시뮬레이션 - 추측 및 미보고 항목에 대한 수정 - 항목 매개변수 추정치에 대한 제약사항 부과 허용 - 누락 및 미표시 항목 - 상세 온라인 HELP 문서에는 구문과 주석이 포함된다.예를 들다

윈미라 2001

WINMIRA 2001은 이분법 및 다분법 순서형 반응에 대한 Rasch 모델과 잠재 등급 분석, 이분법 및 다분법 항목 반응에 대한 혼합물 분포 Rasch 모델과의 분석을 위한 프로그램이다.^[3]^[4] 소프트웨어는 항목 매개변수에 대한 조건부 최대우도(CML) 추정뿐만 아니라 사람 매개변수에 대한 MLE 및 WLE 추정치, 사람 및 항목 적합도 통계, 모델 선택을 위한 정보 기준(AIC, BIC, CAIC)을 제공한다. 소프트웨어는 또한 혼합물 성분의 수 선택을 위한 파라메트릭 부트스트랩 절차를 수행한다. 마티아스 폰 다비에의 홈페이지에서 무료 학생 버전을 이용할 수 있으며, 상업용 버전을 이용할 수 있다.

윈스텝

윈스텝(Winstep)은 Rasch 모델과 함께 분석을 위해 고안된 프로그램으로, 개인 표본의 각 개인은 항목 추정을 위해 매개변수가 지정되고, 성격상 서술적이고 표준 참조가 아닌 규범적이고 기준 참조가 된다는 점에서 1PL 모델과 다르다.^[5] 그것은 Winsteps, Inc.에서 상업적으로 구할 수 있다. 이전 DOS 기반 버전인 BIGSTEPS도 이용할 수 있다.

크칼리브르

Xcalibre는 이분법(1PL-Rasch, 2PL, 3PL)과 모든 주요 다단성 IRT 모델에 대해 한계 최대우도 추정을 수행하는 상용 프로그램이다. 인터페이스는 포인트 앤 클릭으로, 명령 코드가 필요하지 않다. 그 결과물에는 스프레드시트와 테이블과 그림이 포함된 상세한 내레이션 보고서 문서가 모두 포함되어 있으며, 인쇄하여 주제 전문가에게 전달하여 항목 검토를 할 수 있다. 그것은 평가 시스템 주식회사에서만 이용할 수 있다.

IATA

IATA는 정신측정학 및 교육평가 데이터를 분석하기 위한 소프트웨어 패키지다. 인터페이스는 포인트 앤 클릭이며, 모든 기능은 파일럿 테스트나 동일화와 같은 다른 워크플로우나 분석 목표에 기초한 마법사 방식의 인터페이스를 통해 전달된다. IATA는 CSV, Excel 및 SPSS 파일 형식을 읽고 쓰며, 모든 통계 분석을 위해 내보낼 수 있는 그래픽을 생산한다. 또한 각 분석에는 수치 결과에 대한 적절한 해석을 제시하는 휴리스틱스가 포함된다. IATA는 인자 분석, (1PL-Rasch, 2PL, 3PL) 스케일링 및 교정, 차등 항목 기능(DIF) 분석, (기본) 컴퓨터 보조 시험 개발, 등화, IRT 기반 표준 설정, 점수 조건화 및 그럴듯한 값 생성을 수행한다. 폴리메트리카 인터내셔널에서 무료로 이용할 수 있다.

미더덕을 부리다

R 패키지 항목응답이론 패러다임에 따른 일차원 및 다차원 잠재특성 모델을 이용한 이분법 및 다차원 반응 데이터 분석. 탐색 및 확인 모델은 4차(EM) 또는 확률적(MHRM) 방법으로 추정할 수 있다. 항목 시험장 모델링에 확인 2-요인 및 2-계층 분석을 이용할 수 있다. 또한 차등 항목 기능 및 모델링 항목 및 사람 공변량을 탐지하기 위해 다중 그룹 분석 및 혼합 효과 설계를 사용할 수 있다.

ltm

R 패키지 항목 반응 이론 접근법에 따른 잠재적 특성 모델을 이용한 다변량 이분법 및 다변량 데이터의 분석. Rasch, Two-Parameter Logistic, Birnbaum의 3-Parameter, Graded Response, Generalized Spart Credit Models를 포함한다.

TAM

R 패키지 패키지는 단일 및 다차원 항목 반응 모델(Rasch, 2PL, Generalized Spartment Credit, 등급 척도, Multi Facets), 적합 통계량, 표준 오차 추정뿐만 아니라 능력의 타당한 값 귀속 및 가중우도 추정도 포함한다.

ACER 콘퀘스트

ACER ConQuest는 일차원 및 다차원 항목 반응과 잠재 회귀 모델을 모두 적합시키기 위한 컴퓨터 프로그램이다. 종합적이고 유연한 항목 대응 모델(IRM)을 기반으로 데이터 분석을 실시, 성과 평가의 속성, 전통적 평가, 등급 척도 등을 검토할 수 있다. ACER ConQuest 4는 또한 다면 항목 반응 모델, 다차원 항목 반응 모델, 잠재 회귀 모델 및 타당한 값 그리기 등의 최신 심리측정 방법을 기반으로 한 광범위한 측정 및 연구 커뮤니티 분석 절차를 제공한다.

얼뜨기 놀이를 하다

R 패키지 일차원적 IRT와 관련된 유용한 기능을 제공할 뿐만 아니라, 이분법적 데이터와 다원적 데이터의 혼합에 일차원적 항목 반응 이론(IRT) 모델을 적합시키고, 온라인 항목 매개변수를 보정하고, 수험자의 잠재 능력을 추정하며, IRT 모델-데이터를 항목 수준에 맞는 다양한 방법으로 검사한다.

미르트

교육 시험 서비스에서 개발된 항목-응답 분석을 위한 일반 오픈 소스 프로그램.^[6] 이 프로그램은 독립 변수, 다차원 능력 매개변수, 불완전한 데이터 및 복잡한 샘플링을 처리할 수 있다. 능력 변수는 다변량 또는 다변량 정규 분포를 사용할 수 있으며, 항목은 이분법 또는 다변량 분포를 사용할 수 있다.

추가품목반응이론 소프트웨어

IRT의 복잡성 때문에 교정이 가능한 소프트웨어 패키지는 거의 없다. 그러나 많은 소프트웨어 프로그램은 등가 및 스케일링과 같은 특정 보조 IRT 분석을 위해 존재한다. 그러한 소프트웨어의 예는 다음과 같다.

링크MIRT

LinkMIRT는 다차원 IRT(MIRT) 프레임워크에서 두 세트의 항목 매개변수를 연결하는 무료 자바 애플리케이션 프로그램이다. 소프트웨어는 Stocking and Lord 방법, 평균/평균 방법 및 평균/시그마 방법을 구현할 수 있다. 코멘트-개인별 및 무작위 등가 그룹 설계에 의한 연계가 지원된다.

파커

PACER(Pychometric Analysis and Computing Environment for Researchs)는 해롤드 도런이 개발한 심리측정학자와 데이터 과학자를 위한 무료 웹 기반 애플리케이션이다. 소프트웨어는 MLE, MAP, EAP, TCC 및 바이팩터 모델을 이용한 IRT 기반 시험 채점, 공통항목 설계에 기초한 접근법, 고정효과 모델과 혼합효과 모델을 포함한 오차-변수 선형 회귀법, 항목 매핑 절차, 대화형 데이터 탐색 및 기초통계 분석, Cr을 이용한 신뢰성 계산 등을 6가지 시험으로 동일시한다.onbach의 알파, 층화 알파, Feldt-Raju와 함께 잭나이프 분산, 테스트 항목의 고전적 항목 분석, 항목 적합도를 포함한 IRT 기반 적합 통계, Yen의 Q1 및 Q3 통계, 분류 일관성 및 분류 정확도 방법, NEP 스타일 분석에 사용되는 직접 추정 절차.

시무미르트

SimuMIRT는 사용자가 지정한 매개변수 집합에서 고정 형태(즉, 종이와 연필) 테스트를 위해 다차원 데이터(검정 능력 및 항목 응답)를 시뮬레이션하는 프로그램이다. 래터 효과 모델이 지원된다.

시무MCAT

SimuMCAT는 다차원 컴퓨터 적응 시험(MCAT)을 시뮬레이션하는 무료 자바 응용 프로그램이다. 사용자는 5가지 MCAT 항목 선택 절차(Volume, Kullback-Leibler 정보, 선형 조합의 오차 분산 최소화, 최소 각도, 최적화된 가중치로 복합 점수의 오차 분산 최소화)^[7] 중에서 선택할 수 있다. 두 가지 노출 제어 접근방식이 가능하다: 전통적인 Simponson-Hetter 접근방식과 최대 노출 제어 접근방식이 그것이다. 우선지수 방식을 이용해 콘텐츠 제약도 구현할 수 있다. 고정 길이 시험과 가변 길이 시험으로 서로 다른 정지 규칙이 구현된다. 사용자는 진정한 수험자 능력, 항목 풀, 항목 선택 절차를 지정하며, 프로그램은 항목 응답 및 능력 추정치가 있는 선택된 항목을 출력한다. 베이지안 방법과 비베이지안 방법은 사용자가 지정할 수 있다. 사용자 지정 배포에 의해 프로그램을 통해 수험생의 능력과 아이템 풀도 만들어질 수 있다.

IRTEQ

IRTEQ는 한경(Chris) T. Han이 개발한 IRT 스케일링과 등산을 구현하는 프리웨어 윈도 GUI 애플리케이션이다. "비등분 그룹 앵커 테스트" 설계에 널리 사용되는 IRT 스케일링/등분 방법을 구현한다. 평균/평균, 평균/시그마, 강력한 평균/시그마 및 TCC 방법.^[8]^[9]^[10]^[11]^[12] TCC 방법의 경우 IRTEQ는 사용자에게 손실 함수에 통합하기 위해 다양한 점수 분포를 선택할 수 있는 옵션을 제공한다. IRTEQ는 다양한 인기 있는 일차원 IRT 모델: 이분법 반응에 대한 로지스틱 모델(1, 2 또는 3 매개변수 포함)과 일반화 부분 신용 모델(GPCM의 특수 사례인 부분 신용 모델 포함)과 다면 반응에 대한 GRM(그레이드 응답 모델)을 지원한다. 또한 IRTEQ는 시험 척도의 시험 점수를 IRT 참 점수와 동일시하여 다른 시험의 척도와 동일시할 수 있다.^[13]

잔류플롯-2

LegentPlots-2는 IRT 그래픽 잔차 분석을 위한 무료 프로그램이다. Tie Rang, Kyung (Chris) T에 의해 개발되었다. 한, 그리고 로널드 K. 매사추세츠 대학교의 햄블턴.

윈젠

윈젠은 IRT 매개변수와 항목 응답을 생성하는 윈도 기반의 무료 프로그램이다. 경 (크리스) T. 한 교수는 매사추세츠 대학교 암허스트에 재학 중이다.^[14]

세인트

ST는 이분법적으로 점수가 매겨진 시험에 대해 IRT 척도 변환을 실시한다.

폴리스트

Polyst는 이분법적으로, 다원적으로 점수가 매겨진 테스트에 대해 IRT 척도 변환을 실시한다.

스튜어트

STUIRT는 혼합형 테스트(일부 객관식 항목과 일부 다항성 항목을 포함하는 테스트)를 위해 IRT 척도 변환을 실시한다.

터벅터벅 걷다

R 패키지 이 패키지는 항목 응답 이론 방법을 사용하여 연결 상수를 계산하고 공통 항목 설계에 따라 여러 그룹에 대해 일차원 또는 다차원 테스트의 체인 연결을 실시한다. 일차원적 방법으로는 이분법(1PL, 2PL, 3PL) 및/또는 다원적(1단계 응답, 부분신용/일반화 부분신용, 명목 및 다중선택 모델)의 평균/평균/시그마, 해바라 및 스타킹-로드 방법이 있다. 다차원 방법에는 모든 일차원 이분법 및 다원성 항목 반응 모델의 다차원 확장에 대해 단일 또는 다중 확장 매개변수를 사용하는 해바라 및 스타킹-로드 방법의 최소 제곱법과 확장법이 포함된다. 또한 이 패키지에는 공통 IRT 소프트웨어에서 항목 및/또는 능력 매개변수를 가져오기 위한 기능, IRT 참 점수 및 관측 점수와 동등한 IRT 실제 점수 및 관측 점수 수행, 매개변수 표류를 검사하기 위한 항목 반응 곡선/서페이스, 벡터 그림 및 비교 그림을 표시하는 기능이 포함되어 있다.

의사 결정 일관성

의사결정 일관성 방법은 면허 시험과 학업 숙달 시험과 같은 기준 참조 시험에 적용할 수 있다.

항목

Iteman은 의사결정 일관성 지수뿐만 아니라 컷스코어 측정의 조건부 표준 오차에 대한 일반적인 추정치를 제공한다. 컷스코어는 종종 시험 프로그램의 인증을 요청 받는다.

j메트리크

jMetrik은 포괄적인 정신측정학 분석을 수행하기 위한 무료 오픈소스 소프트웨어다. 자세한 정보는 위에 나열되어 있다. jMetrik은 항목 분석에서 컷포인트가 제공될 경우 Huynh의 의사결정 일관성 추정치를 포함한다.

레르타프

Lertap은 후인의 방법의 펑-섭코비악 적응을 이용하여 도출한 리빙스턴의 계수, 브레넌-케인의 신뢰도 지수, 카파, 비율로서의 정확한 분류 수 p(0)의 추정치 등 결정 및 분류 일관성과 관련된 몇 가지 통계를 계산한다. Lertap에 관한 보다 자세한 정보는 '클래식 테스트 이론'에 의거하여 위에 제공된다.

기타 분석

대부분의 사이코메트릭 소프트웨어는 응답 데이터를 분석하여 항목을 평가하고 성능을 시험하도록 설계되었다. 위의 소프트웨어 대부분은 이에 초점을 맞추고 있다. 일부 소프트웨어는 다른 정신측정학 분석을 위한 것이다.

시프트

SIFT는 데이터 포렌식, 즉 시험의 타당성과 무결성을 위협하는 부정행위나 기타 행동의 증거를 찾기 위해 설계되었다. 포인트 앤 클릭 사용자 인터페이스와 마이크로소프트 엑셀 출력을 갖춘 윈도 프로그램이다.

탐지 복사

CopyDetect는 데이터 포렌식, 즉 부정행위나 시험의 타당성과 무결성을 위협하는 다른 행동의 증거를 찾기 위해 고안된 R 패키지다.

테스트어셈블러

TestAssembly는 자동화된 테스트 어셈블리를 수행하는 Windows 프로그램이다.

ATA

ATA는 자동 시험 조립을 위한 R 패키지다.

일반통계분석 소프트웨어

일반적인 통계 분석을 위해 설계된 소프트웨어는 종종 특정 유형의 정신측정학 분석에 사용될 수 있다. 또한, 보다 발전된 유형의 정신측정학 분석에 대한 코드를 사용할 수 있는 경우가 많다.

R

R은 통계 컴퓨팅과 그래픽 생산을 위해 설계된 프로그래밍 환경이다. 기고된 '패키지'를 설치하여 기본 R 기능을 확장할 수 있으며, CRAN 웹사이트에 사이코메트리 관련 패키지 목록이 유지된다.^[15]

SAS

SAS는 통계 분석과 데이터 조작을 위해 상용화된 패키지다. 명령어 기반이기도 하다.

SPSS

SPSS는 원래 사회과학을 위한 통계패키지(Statistical Package for the Social Science)로 불리는 상업용 일반통계분석 프로그램으로, 데이터가 스프레드시트 레이아웃으로 제시되고 공통분석은 메뉴 중심이다.

S-Plus

S-Plus는 프로그래밍 언어 S를 기반으로 한 상업적 분석 패키지다.

스타타

스타타는 상업용 소포다. Stata의 IRT 실행은 1, 2, 3 매개변수 로지스틱 모델, 등급화된 반응 모델, 부분 신용 및 일반화된 부분 신용 모델, 등급 척도 모델, 그리고 순서가 정하지 않은 범주형 반응에 대한 명목 반응 모델을 포함한다. 사용자가 모델을 지정하고, 숫자 및 그래픽으로 적합성을 검사하고, 단일 인터페이스에서 기능하는 차등 품목을 조사할 수 있는 제어판에 의해 구동된다.^[16]

참고 항목

참조

^ [1] 코트니, M. G. R., 창, K, 메이, E, 메이셀, K, 로위, L, & 이스사예바, L. (2021년) 부검: 재현 가능한 Rasch 분석, 차등 항목 기능, 등화 및 그룹 효과 검사를 위한 R 광택 도구. PLOS 1. doi:10.1371/journal.pone.0257682
^ [2] 코트니, M. G. R., 창, K, 메이, E, 메이셀, K, 로위, L, & 이스사예바, L. (2021년) 부검: 재현 가능한 Rasch 분석, 차등 항목 기능, 등화 및 그룹 효과 검사를 위한 R 광택 도구. PLOS 1. doi:10.1371/journal.pone.0257682
^ 로스트, J. (1990). 잠재적 클래스의 Rasch 모델: 항목 분석에 대한 두 가지 접근법의 통합. 응용 심리 측정, 14, 271-282.
^ 폰 다비에, M, & 로스트, J. (1995) 폴리토머스 혼방 라쉬 모델. G. H. Fischer & I. W. Molenaar (Eds.)에서는 Rasch 모델, 기초, 최근 개발 및 응용 프로그램(pp. 371-382)을 사용한다. 뉴욕: 스프링거.
^ 래쉬 이분법적 모델 vs. 1-모수 로지스틱 모형[3] Rasch Measurement Transactions [4], 2005, 19:3 페이지 1032
^ "MIRT". GitHub. 23 April 2021.
^ Yao, Lihua (2012-05-17). "Multidimensional CAT Item Selection Methods for Domain Scores and Composite Scores: Theory and Applications". Psychometrika. 77 (3): 495–523. doi:10.1007/s11336-012-9265-5. ISSN 0033-3123. PMID 27519778. S2CID 14868583.
^ 로이드 & 후버, 1980년
^ 1977년 마르코
^ 린, 레빈, 헤이스팅스 & 워드롭, 1981년
^ 해바라, T. (1980) 가중 최소 제곱법을 사용하여 로지스틱 능력을 척도화한다. 일본 심리학 연구, 22, 144 – 1449.
^ 스타킹, 엠엘 & 로드, 에프엠(1983) 항목 응답 이론의 공통 메트릭스 개발. 응용 심리 측정 7, 201-210
^ 주님, F.M. (1980년) 실제 시험 문제에 대한 항목 응답 이론의 적용. 마화, NJ: 로렌스 엘바움 어소시에이츠, 주식회사.
^ 한, K. T. (2007) WinGen: IRT 매개 변수 및 항목 응답을 생성하는 Windows 소프트웨어. 응용 심리 측정, 31, 457-459.
^ [5] CRAN 태스크 보기: 사이코메트릭 모델 및 방법
^ [6] Stata의 IRT 설명서 온라인

[1] [1] 코트니, M. G. R., 창, K, 메이, E, 메이셀, K, 로위, L, & 이스사예바, L. (2021년) 부검: 재현 가능한 Rasch 분석, 차등 항목 기능, 등화 및 그룹 효과 검사를 위한 R 광택 도구. PLOS 1. doi:10.1371/journal.pone.0257682

[2] [2] 코트니, M. G. R., 창, K, 메이, E, 메이셀, K, 로위, L, & 이스사예바, L. (2021년) 부검: 재현 가능한 Rasch 분석, 차등 항목 기능, 등화 및 그룹 효과 검사를 위한 R 광택 도구. PLOS 1. doi:10.1371/journal.pone.0257682

[3] 로스트, J. (1990). 잠재적 클래스의 Rasch 모델: 항목 분석에 대한 두 가지 접근법의 통합. 응용 심리 측정, 14, 271-282.

[4] 폰 다비에, M, & 로스트, J. (1995) 폴리토머스 혼방 라쉬 모델. G. H. Fischer & I. W. Molenaar (Eds.)에서는 Rasch 모델, 기초, 최근 개발 및 응용 프로그램(pp. 371-382)을 사용한다. 뉴욕: 스프링거.

[5] 래쉬 이분법적 모델 vs. 1-모수 로지스틱 모형[3] Rasch Measurement Transactions [4], 2005, 19:3 페이지 1032

[6] "MIRT". GitHub. 23 April 2021.

[7] Yao, Lihua (2012-05-17). "Multidimensional CAT Item Selection Methods for Domain Scores and Composite Scores: Theory and Applications". Psychometrika. 77 (3): 495–523. doi:10.1007/s11336-012-9265-5. ISSN 0033-3123. PMID 27519778. S2CID 14868583.

[8] 로이드 & 후버, 1980년

[9] 1977년 마르코

[10] 린, 레빈, 헤이스팅스 & 워드롭, 1981년

[11] 해바라, T. (1980) 가중 최소 제곱법을 사용하여 로지스틱 능력을 척도화한다. 일본 심리학 연구, 22, 144 – 1449.

[12] 스타킹, 엠엘 & 로드, 에프엠(1983) 항목 응답 이론의 공통 메트릭스 개발. 응용 심리 측정 7, 201-210

[13] 주님, F.M. (1980년) 실제 시험 문제에 대한 항목 응답 이론의 적용. 마화, NJ: 로렌스 엘바움 어소시에이츠, 주식회사.

[14] 한, K. T. (2007) WinGen: IRT 매개 변수 및 항목 응답을 생성하는 Windows 소프트웨어. 응용 심리 측정, 31, 457-459.

[15] [5] CRAN 태스크 보기: 사이코메트릭 모델 및 방법

[16] [6] Stata의 IRT 설명서 온라인

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

Search

사이코메트리 소프트웨어

원천

고전 시험 이론

부검을 하다

씨타스

j메트리크

항목

레르타프

탭

비스타-시타

정신의

품목응답이론교정

부검을 하다

빌로그-MG

손재주를 부리다

면

플렉스미르트

얼토당토않은 말

ICL

j메트리크

레르타프5

멀티로그

비머트

파스케일

PARAM-3PL

테스트팩트

윈미라 2001

윈스텝

크칼리브르

IATA

미더덕을 부리다

ltm

TAM

ACER 콘퀘스트

얼뜨기 놀이를 하다

미르트

추가품목반응이론 소프트웨어

링크MIRT

파커

시무미르트

시무MCAT

IRTEQ

잔류플롯-2

윈젠

세인트

폴리스트

스튜어트

터벅터벅 걷다

의사 결정 일관성

항목

j메트리크

레르타프

기타 분석

시프트

탐지 복사

테스트어셈블러

ATA

일반통계분석 소프트웨어

R

SAS

SPSS

S-Plus

스타타

참고 항목

참조