래쉬 모델

Rasch model

Georg Rasch의 이름을 딴 Rasch 모델은 (a) 응답자의 능력, 태도 또는 성격 특징과 (b) 항목 난이도 사이의 절충 함수로서 읽기 평가 또는 설문지 응답에 관한 질문에 대한 답변과 같은 범주형 데이터를 분석하기 위한 심리학 모델이다.[1] 예를 들어, 그것들은 설문지의 응답으로부터 사형에 대한 학생의 읽기 능력이나 사람의 태도의 극단성을 추정하는데 사용될 수 있다. 심리측정학 및 교육연구 외에도 라쉬 모델과 그 확장자는 일반적인 적용가능성 때문에 보건업,[2] 농업,[3] 시장조사[4] 등 다른 분야에서 사용되고 있다.[5]

Rasch 모델의 기초가 되는 수학 이론은 항목 반응 이론의 특별한 경우고, 더 일반적으로는 일반화된 선형 모델의 특별한 경우다. 그러나 모델 매개변수의 해석과 Rasch 모델의 지지자를 아이템 응답 모델링 전통과 분리하는 철학적 함의에[6] 있어 중요한 차이가 있다. 이 분할의 중심적인 측면은 성공적인 측정에 대한 요건으로서 Georg Rasch 모델에 따른 Rasch 모델의 정의 [7]속성인 특정 객관성의 역할과 관련이 있다.

개요

측정용 Rasch 모델

Rasch 모델에서 지정된 반응(예: 오른쪽/틀린 답)의 확률은 사람과 항목 매개변수의 함수로 모델링된다. 구체적으로는, 원래의 Rasch 모델에서는, 정확한 반응의 확률을, 사람과 항목 매개변수의 차이에 대한 로지스틱 함수로 모델화한다. 모델의 수학적 형태는 이 글의 뒷부분에서 제공된다. 대부분의 맥락에서, 모델의 매개변수는 응답자들의 숙련도와 항목의 난이도를 연속적인 잠재적 변수의 위치로서 특징짓는다. 예를 들어, 교육 시험에서 항목 매개변수는 항목의 난이도를 나타내는 반면, 개인 매개변수는 평가 대상자의 능력 또는 달성 수준을 나타낸다. 항목의 난이도에 대한 개인의 능력이 높을수록 해당 항목에 대한 정확한 응답 확률이 높아진다. 잠재 형질에 대한 사람의 위치가 항목의 난이도와 동일할 때, 라쉬 모델에는 정의상 올바른 반응의 0.5 확률이 있다.

Rasch 모델은 데이터로부터 측정을 얻기 위해 데이터가 표시되어야 하는 구조를 나타낸다는 점에서, 즉, 성공적인 측정을 위한 기준을 제공한다는 점에서 하나의 의미에서 모델이다. 데이터를 넘어, 우리가 실제 세계에서 얻을 것으로 기대하는 Rasch의 방정식들은 모델 관계를 보여준다. 예를 들어, 교육은 교과서나 시험에만 나오는 것이 아니라, 아이들이 인생에서 직면하게 될 모든 범위의 도전에 대비하기 위한 것이다. Rasch 모델은 동일한 것을 측정하는 여러 시험에서 동일한 (불변수) 상태를 유지하도록 조치를 요구함으로써, 커리큘럼과 시험에서 발생하는 특정 난제가 해당 영역에서 가능한 모든 난제의 무한 집단을 일관성 있게 나타낸다는 가설을 시험할 수 있게 한다. 그러므로 라스치 모델은 실제로 결코 실제로 관찰되지 않을 때에도 유용한 조직원리로서의 역할을 하는 휴리스틱 픽션을 제공하는 이상적 또는 표준의 의미에서 모델이다.

Rasch 모델을 뒷받침하는 관점이나 패러다임은 통계적 모델링을 뒷받침하는 관점과는 구별된다. 모델은 데이터 집합을 설명할 목적으로 가장 자주 사용된다. 매개변수는 데이터 적합도에 따라 수정, 승인 또는 거부된다. 이와는 대조적으로, Rasch 모델을 채용할 때, 목적은 모델에 적합한 데이터를 얻는 것이다(Andrich, 2004; Wright, 1984, 1999). 이러한 관점의 근거는 Rasch 모델이 측정을 얻기 위해 충족되어야 하는 요건을 구체화한다는 데 있는데, 이는 측정이 물리과학에서 일반적으로 이해된다는 것이다.

이 근거를 이해하는 데 유용한 비유는 체중계로 측정한 물체를 고려하는 것이다. 물체 A의 무게가 한 번에 물체 B의 무게보다 실질적으로 더 큰 것으로 측정되었다면, 그 직후에 물체 B의 무게가 물체 A의 무게보다 실질적으로 더 큰 것으로 측정된다고 가정하자. 우리가 측정에 필요한 특성은 물체들 간의 결과 비교가 다른 요인과 관계없이 동일하거나 불변해야 한다는 것이다. 이 핵심 요건은 Rasch 모델의 공식 구조 내에 구체화된다. 따라서 Rasch 모델은 데이터에 맞게 변경되지 않는다. 대신, 평가 방법을 변경하여 이 요건을 충족해야 하며, 측정 눈금이 물체의 별도 측정 시 물체 간에 서로 다른 비교를 제공할 경우 이를 수정해야 한다.

모델을 사용하여 분석된 데이터는 보통 정답/오답이 있는 교육용 시험과 같은 시험의 전통적인 항목에 대한 응답이다. 단, 모델은 일반적이며, 양적 속성이나 특성을 측정할 목적으로 이산 데이터를 입수하는 곳이라면 어디든 적용할 수 있다.

스케일링

그림 1: 시험의 총 점수와 사람 위치 추정치 사이의 관계를 보여주는 시험 특성 곡선

모든 수험생이 한 번의 시험으로 모든 항목을 시험해 볼 수 있는 기회가 있을 때, 시험 지도상의 각 총점은 고유한 능력 추정치로, 총점이 클수록 능력 추정치는 더 커진다. 총점은 능력 추정치와 선형 관계를 가지지 않는다. 오히려 그 관계는 그림 1과 같이 비선형적이다. 총점은 수직축에 표시되며, 해당 인물 위치 추정치는 수평축에 표시된다. 그림 1에 나타낸 시험 특성 곡선(TCC)이 기초하는 특정 시험의 경우, 약 13점에서 31점까지의 총점 범위에 걸쳐 관계가 대략적으로 선형이다. TCC의 모양은 일반적으로 이 예에서와 같이 S자형이다. 그러나 총점수와 사람 위치 추정치 사이의 정확한 관계는 시험 항목의 분포에 따라 달라진다. TCC는 그림 1과 2의 0의 양쪽에 있는 범위처럼 더 많은 항목이 있는 연속체에서 범위가 더 가파르다.

Rasch 모델을 적용할 때, 아이템 위치는 아래 설명된 방법에 따라 먼저 스케일링되는 경우가 많다. 스케일링 프로세스의 이 부분을 흔히 항목 보정이라고 한다. 교육용 시험에서는 정답 비율이 작을수록 난이도가 높아져 항목의 스케일 위치가 높아진다. 품목의 위치가 조정되면, 사용자 위치는 척도로 측정된다. 그 결과 개인 및 품목 위치는 그림 2와 같이 단일 척도로 추정한다.

축척 위치 해석

그림 2: 사람 분포(위) 및 항목 분포(아래)의 히스토그램을 척도로 나타낸 그래프

옳고 그른 답변과 같은 이분법적 데이터의 경우, 정의상 척도 상의 항목의 위치는 질문에 대한 정확한 답변의 확률이 0.5인 사람 위치와 일치한다. 일반적으로 그 사람의 위치보다 낮은 난이도의 질문에 정확하게 응답할 확률은 0.5보다 큰 반면, 그 사람의 위치보다 큰 난이도의 질문에 정확하게 응답할 확률은 0.5보다 적다. 항목 특성 곡선(ICC) 또는 항목 응답 함수(IRF)는 개인의 능력 함수로써 정확한 응답 확률을 나타낸다. 단일 ICC가 이 글의 그림 4와 관련하여 보다 상세하게 표시되고 설명된다(항목 응답 기능도 참조). 그림 3에서 가장 왼쪽 ICC가 가장 쉬운 항목이고, 같은 그림에서 가장 오른쪽 ICC가 가장 어려운 항목이다.

사람의 반응을 항목 난이도에 따라 최하위부터 최고위까지 분류할 때 가장 가능성이 높은 패턴은 구트만 패턴이나 벡터(예: {1,1,1,..., 1,0,0,0,0})이다. 그러나 이 패턴은 Rasch 모델의 구조를 고려할 때 가장 가능성이 높지만, 모델에는 확률론적 Guttman 반응 패턴, 즉 Guttman 패턴 쪽으로 경향이 있는 패턴만 필요하다. 가능한 패턴이 많아 반응이 패턴에 엄격히 부합하는 것은 이례적이다. 데이터가 Rasch 모델에 적합하기 위해서는 반응이 패턴을 엄격히 준수하는 것이 불필요하다.

그림 3: 여러 항목에 대한 ICC ICC는 수직선에서 능력 위치를 가진 사람에 대한 성공적인 응답의 확률의 변화를 강조하기 위해 색상으로 되어 있다. 가장 손쉬운 항목(왼쪽 및 높은 커브에 위치)에 대해 정확하게 응답할 가능성이 높으며 어려운 항목(오른쪽 및 아래쪽 커브에 위치)에 대해서는 정확하게 응답할 가능성이 낮다.

각 능력 추정치에는 능력 추정치와 관련된 불확실성의 정도를 계량화하는 관련 표준 측정 오차가 있다. 항목 추정치에도 표준오차가 있다. 일반적으로 항목 추정치의 표준 오차는 한 항목에 대한 응답 데이터가 한 개인에 대한 응답 데이터보다 많으므로 개인 추정치의 표준 오차보다 상당히 작다. 즉, 주어진 항목을 시도하는 사람의 수는 일반적으로 주어진 사람이 시도하는 항목의 수보다 많다. 사람 추정치의 표준 오차는 ICC의 경사가 더 가파른 경우 더 작으며, 일반적으로 시험에서 중간 범위의 점수를 통과한다. 따라서 경사가 경사가 클수록 선상의 두 점 사이의 구분이 커지기 때문에 이 범위에는 더 큰 정밀도가 있다.

통계적 및 그래픽 테스트는 모델과의 데이터 관련성을 평가하는 데 사용된다. 특정 테스트는 글로벌한 반면 다른 테스트는 특정 항목이나 사람에 초점을 맞춘다. 특정 적합성 시험은 불량품의 문제를 생략하거나 수정하여 시험의 신뢰성을 높이는 데 사용할 수 있는 항목에 대한 정보를 제공한다. Rasch Measurement에서는 신뢰도 지수 대신 개인 분리 지수를 사용한다. 다만 사람분리지수는 신뢰지수와 유사하다. 분리지수는 측정오차를 포함한 분리의 비율로 실제 분리를 요약한 것이다. 앞에서 언급한 바와 같이 측정오차의 수준은 시험범위에 걸쳐 균일하지 않지만, 일반적으로 더 많은 극한점수(낮고 높음)의 경우 더 크다.

라쉬 모델의 특징

모델 등급은 덴마크 수학자 겸 통계학자인 게오르그 라쉬가 물리학의 핵심 측정 요건, 즉 불변 비교 요건과 일치하여 모델에 대한 인식론적 사례를 발전시킨 이름에서 따온 것이다.[1] 이는 다음 절에서 자세히 설명한 바와 같이 모델 등급의 결정적인 특징이다. 이분법적 데이터에 대한 Rasch 모델은 L. L. Thurstone이 광범위하게 공식화하고 사용하는 모델인 비교 판단법(LCJ)과 개념적 관계가 밀접하며,[8][9] 따라서 Thurstone 척도와도 밀접한 관계가 있다.[10]

래쉬는 자신이 가장 잘 알려진 측정 모델을 소개하기 전에 포아송 분포를 측정 모델로서 판독 데이터에 적용했는데, 관련 경험적 맥락에서 주어진 개인이 범한 오류의 수가 개인의 읽기 능력에 대한 텍스트 난이도의 비율에 의해 좌우된다는 가설을 세웠다. Rasch는 이 모형을 승법 포아송 모형이라고 불렀다. Rasch의 이분법적 데이터 모델(즉, 반응을 두 범주로 분류할 수 있는 모델)은 Rasch가 가장 널리 알려지고 사용되는 모델이며, 여기서 주안점을 두고 있다. 이 모델은 단순한 로지스틱 함수의 형태를 가지고 있다.

위의 간략한 개요는 사회적 측정에 대한 라스치의 관점이 갖는 어떤 독특하고 상호 관련되는 특징을 강조하는데, 이는 다음과 같다.

  1. 그는 주로 인구 사이의 분포보다는 개인의 측정에 관심이 있었다.
  2. 그는 물리학에서 추론된 측정에 대한 선행 조건의 충족에 대한 근거를 마련하는 데 관심이 있었고, 결과적으로 모집단 내 특성 수준 분포에 대한 가정을 하지 않았다.
  3. 라쉬의 접근방식은 특정 실험적인 맥락에서 작동되는 것처럼 주어진 특성이 양적이면서도 측정 가능한 것이라는 과학적 가설임을 명시적으로 인정하고 있다.

그러므로 토마스 쿤이 1961년 논문에서 제시한 관점에 부합하는 현대 물리 과학에서의 측정 기능, 측정은 이론적으로 기초된 것으로 간주되었고, 더 넓은 이론적 틀과 관련된 가설과 일치하지 않는 정량적 이상을 탐지하는 데 도움이 되는 것으로 간주되었다.[11] 이러한 관점은 사회과학계에서 일반적으로 지배적인 것과는 대조적으로, 측정의 이론적 근거를 요구하지 않고 시험점수와 같은 데이터를 측정으로 직접 취급한다. 비록 이러한 대비가 존재하지만, Rasch 모델을 적용하는 목적은 그러한 측정을 얻기 위한 것이기 때문에 Rasch의 관점은 실제로 구간 수준 측정을 요구하는 통계 분석 또는 모델링의 사용을 보완한다. 라쉬 모델의 적용은 알라구말라이, 커티스 & 헝기(2005년), 베즈루츠코(2005년), 본드 & 폭스(2007년), 버로(2016년), 피셔 & 라이트(1994년), 마스터스 & 키브스(1999년), 응용 측정 저널 등 매우 다양한 출처에 설명되어 있다.

불변 비교 및 충분성

이분법 데이터에 대한 Rasch 모델은 종종 하나의 항목 매개변수를 가진 항목 반응 이론(IRT) 모델로 간주된다. 그러나, 특정 IRT 모델이 되기 보다는, 모델의[12] 지지자들은 그것을 다른 IRT 모델과 구별되는 특성을 가진 모델로 간주한다. 구체적으로 라쉬 모델의 정의 속성은 불변비교 원리의 형식적 또는 수학적 구현이다. Rasch는 불변 비교의 원리를 다음과 같이 요약하였다.

두 자극 간의 비교는 어떤 특정 개인이 비교에 중요한지 독립적이어야 하며, 또한 고려된 등급 내의 다른 자극이 비교되었거나 비교되었을지도 모르는 독립적이어야 한다.
대칭적으로, 두 개인 간의 비교는 어떤 계층 내의 특정 자극이 비교에 중요한지 독립적이어야 하며, 또한 같은 경우 또는 다른 경우에 비교되는 다른 개인과 독립적이어야 한다.[13]

Rasch 모델은 항목 매개변수의 통계적 추정 과정에서 개인 매개변수가 제거될 수 있다는 점에서, 형식 구조가 개인과 항목 매개변수의 대수적 분리를 허용하기 때문에 이 원칙을 구현한다. 이 결과는 응답 공간이 개인 총 점수에 따라 분할되는 조건부 최대우도 추정의 사용을 통해 달성된다. 결과적으로 항목 또는 개인의 원시 점수는 항목 또는 개인 매개변수에 대한 충분한 통계량이다. 즉, 개인 총점은 개인에 대해 지정된 맥락 안에서 이용할 수 있는 모든 정보를 포함하고, 항목 총점은 관련 잠재적 특성과 관련된 항목과 관련된 모든 정보를 포함한다. Rasch 모델은 반응 데이터의 특정 구조, 즉 확률론적 Guttman 구조를 요구한다.

다소 친숙한 용어로, Rasch 모델은 평가의 총 점수로부터 연속적으로 사람 위치를 얻을 수 있는 근거와 정당성을 제공한다. 총 점수를 측정값으로 직접 다루는 경우가 드물지 않지만, 실제로는 측정값보다는 이산 관측치의 계수다. 각 관찰은 사람과 항목을 비교했을 때 관찰할 수 있는 결과를 나타낸다. 그러한 결과는 한 방향 또는 다른 방향에서 균형 척도의 회전을 관측하는 것과 직접적으로 유사하다. 이 관측치는 한 물체 또는 다른 물체의 질량이 더 크다는 것을 나타낼 수 있지만, 그러한 관측치의 계수는 측정으로 직접 처리할 수 없다.

래쉬는 불변 비교의 원리는 각 계측기가 가속을 생산하기 위해 고체 신체에 기계적 을 발휘하는 양방향 실험 기준 프레임을 이용한 물리학 측정의 특성이라고 지적했다. 래쉬는[1]: 112–3 이러한 맥락에 대해 "일반적으로 두 물체에 대해 한 계측기에서 발생하는 가속도의 특정 비율을 발견한다면 다른 계측기에서도 동일한 비율을 발견할 수 있을 것"이라고 말했다. 뉴턴의 두 번째 법칙은 그러한 비율이 신체의 질량의 비율에 반비례한다는 것을 수반한다는 것을 쉽게 알 수 있다.

이분법 데이터를 위한 Rasch 모델의 수학적 형태

= { 은(는) 이분법 랜덤 변수로, 예를 들어 = x}은는) 지정된 평가 항목에 대한 올바른 응답을 나타내고 = x은 잘못된 반응을 나타낸다. 이분법 데이터에 대한 Rasch 모델에서 X = 의 확률은 다음과 같다.

여기서 사람 의 능력이고 i}는 항목 i의 난이도 입니다 따라서 이분법적 달성 항목의 경우 { = } 은(는) 관련자와 평가 항목 간의 상호 작용 시 성공 확률이다. 모델에 근거한 어떤 항목에 대한 사람에 의한 정확한 응답의 로그 오즈 또는 로짓n - i{\\ 다른 능력 파라미터를 가진 두 수험생에게 주어진다면 쉽게 알 수 난이도가 ary은 ( - Δ )-( -Δ ){\ 이 차이는 - }}이 된다 반대로 동일인이 한 항목에 대해 올바른 응답에 대한 로그 오차는 두 항목 중 하나에 대한 정확한 응답을 조건으로 하여 항목 위치 간의 차이와 동일하다는 것을 알 수 있다. 예를 들어,

여기서 는 두 항목에 대한 사람 n의 총점이며, 이는 한 항목 또는 다른 항목에 대한 올바른 응답을 의미한다.[1][14][15] 따라서 조건부 로그 오즈는 개인 매개변수 }을포함하지 않으며, 따라서 총 점수 = 1 }에 따라 응답을 분할하고 올바른 응답의 로그 오즈를 계산하여 e를 제거할 수 있다 - {11}는 {\n}}의 개입 없이 얻는다 보다 일반적으로 조건부 최대우도 추정과 같은 과정을 적용하여 여러 항목 매개변수를 반복적으로 추정할 수 있다(Rasch 모델 추정 참조). 이러한 추정에는 더 많은 관련성이 있지만, 동일한 기본 원칙이 적용된다.

그림 4: 5가지 등급 간격에 대해 정확한 관측 비율과 예상 비율의 비교를 보여주는 Rasch 모델의 ICC

이분법적 데이터에 대한 Rasch 모델의 ICC는 그림 4와 같다. 회색 선은 잠재 연속체에서 서로 다른 위치(즉, 능력 수준)를 가진 사람에 대한 이산 결과 X = 1 즉, 질문에 정확하게 대답)의 확률을 매핑한다. 항목의 위치는 정의상 = 1 의 확률이 0.5인 위치다. 그림 4에서 검은색 원은 결과가 관찰된 등급 간격 내에 있는 실제 또는 관측된 사람의 비율을 나타낸다. 예를 들어, 교육심리학의 맥락에서 사용되는 평가항목의 경우, 이러한 평가항목은 해당 항목에 정확하게 답한 사람의 비율을 나타낼 수 있다. 개인은 잠재 연속체 상의 위치 추정에 의해 순서가 정해지고, 모형에 따른 관측에 따라 그래픽으로 검사하기 위해 이 기준에 따라 등급 간격으로 분류된다. 그 모델과 데이터의 밀접한 일치성이 있다. 데이터의 그래픽 검사 외에도, 적합성의 통계적 테스트 범위를 사용하여 필요에 따라 모델로부터의 관측치 이탈이 무작위 효과만으로 귀속될 수 있는지 또는 모델로부터 체계적인 이탈이 있는지 여부를 평가한다.

Rasch 모델의 다면 확장

Rasch 모델에는 다중 다항성 확장자가 있는데, 이는 이분법 모델을 일반화하여 연속 정수 점수가 증가하는 능력, 운동 기능, 진술의 보증 등과 같이 잠재 형질의 증가 수준 또는 크기 범주를 나타내는 맥락에서 적용될 수 있다. 예를 들어, 이러한 다단성 확장은 리커트 척도 사용, 교육 평가에서 점수 매기기, 심사위원의 성과 채점 등에 적용할 수 있다.

기타 고려사항

Rasch 모델에 대한 비판은 모든 항목이 동일한 차별을 가지고 있는 반면, 실제로 항목 차별은 다양하기 때문에 데이터 집합이 완벽한 데이터 모델 적합을 보여주지 못할 것이기 때문에 지나치게 제한적이거나 규범적이라는 것이다. 잦은 오해는 라쉬 모델이 각 품목이 다른 차별을 가지는 것을 허용하지 않지만, 동등한 차별은 불변측정 가정이므로 서로 다른 품목 차별은 금지되지 않고 오히려 측정 품질이 이론적 이상과 같지 않음을 나타내는 것이다. 물리적 측정에서와 마찬가지로, 실제 데이터 집합은 이론적 모델과 완벽히 일치하지는 않을 것이기 때문에, 관련 질문은 특정 데이터 집합이 도달할 수 없는 완벽성의 표준과 완벽하게 일치하는지 아닌, 당면한 목적에 맞는 충분한 측정 품질을 제공하는지에 대한 것이다.

객관식 항목의 반응 데이터가 있는 Rasch 모델의 사용에 특유한 비판은 왼쪽 점증상이 항상 Rasch 모델에서 0 확률에 근접하기 때문에 모델에는 추측에 대한 규정이 없다는 것이다. 이는 능력이 낮은 사람이 항상 아이템을 틀리게 된다는 것을 암시한다. 그러나 객관식 시험을 완료하는 저능력의 개인은 우연만으로 정답을 선택할 확률은 상당히 높다(k-option 항목의 경우 가능성은 약 1/k이다).

3-모수 로지스틱 모형은 이러한 가정을 완화하고 2-모수 로지스틱 모형은 다양한 기울기를 허용한다.[16] 단, 단순하고 무가중치 원시점수의 충분함을 유지하기 위해서는 균일차별과 무좌익증상(Zero left ptote)의 명세가 모델의 필수 속성이다. 실제로, 객관식 데이터 집합에서 발견된 0이 아닌 낮은 점증률은 일반적으로 가정된 것보다 측정의 위협이 덜하며, 잘 개발된 시험 항목을 감각적으로 사용할 때 일반적으로 측정에서 실질적인 오류를 일으키지 않는다.

Verhelst & Glas(1995)는 원 매개변수 로지스틱 모델(OPLM)으로 지칭하는 모델에 대한 조건부 최대우도(CML) 방정식을 도출한다. 대수적 형태에서는 2PL 모델과 동일한 것으로 보이지만, OPLM은 2PL의 추정 차별 매개변수보다는 사전 설정된 차별 지수를 포함하고 있다. 그러나 이 저자들이 지적한 바와 같이 추정된 차별 매개변수로 추정할 때 직면하는 문제는 차별을 알 수 없다는 것이다. 즉 가중 원시 점수는 "단순한 통계치가 아니며 따라서 추정 방법으로 CML을 사용할 수 없다"(Verhelst & Glas, 1995, 페이지 217). 즉, 2PL에서 가중치가 부여된 "점수"의 충분성은 충분한 통계가 정의되는 방식에 따라 사용될 수 없다. OPLM에서와 같이 가중치를 추정하는 대신 귀속시키는 경우 조건부 추정이 가능하며 Rasch 모델의 특성 중 일부가 유지된다(Verhelst, Glas & Verstralen, 1995; Verhelst & Glas, 1995). OPLM에서 차별지수의 값은 1에서 15 사이로 제한된다. 이 접근법의 한계는 실제로 차별 지수의 값이 출발점으로 사전 설정되어야 한다는 것이다. 이것은 차별을 피하기 위한 목적이 있을 때 차별에 대한 어떤 종류의 추정이 개입된다는 것을 의미한다.

이분법적 데이터에 대한 Rasch 모델은 본질적으로 단일 차별 매개변수를 포함하며,[1]: 121 Rasch에서 언급한 바와 같이 잠재 형질의 크기를 표현하거나 추정하는 측면에서 단위의 임의적 선택을 구성한다. 그러나 Rasch 모델에서는 지정된 기준 프레임 내에서 사람과 항목 사이의 상호작용(즉, 평가를 위한 조건이 주어진 평가 컨텍스트)에 걸쳐 차별이 균일해야 한다.

모델의 적용은 기준이 얼마나 잘 충족되는지 진단 정보를 제공한다. 모델의 적용은 또한 평가의 항목이나 질문이 능력이나 특성을 측정하는데 얼마나 잘 작용하는지에 대한 정보를 제공할 수 있다. 예를 들어, 주어진 행동에 관여하는 사람의 비율을 아는 Rasch 모델을 사용하여 행동의 어려움, 태도, 행동 사이의 관계를 도출할 수 있다.[18] 라쉬 모델의 저명한 지지자들로는 벤자민 드레이크 라이트, 데이비드 안드리치, 얼링 안데르센 등이 있다.

참고 항목

추가 읽기

  • 알라구말라이, S, 커티스, D.D. & Hungi, N. (2005) 응용 라스치 측정: 예시책. 스프링거-클루어
  • 앤드리히, D. (1978a) 순서형 반응 범주에 대한 등급 공식. 사이코메트리카, 43세, 357–74세
  • 앤드리히, D. (1988) 측정용 Rasch 모델. 베벌리 힐즈: 세이지 출판사.
  • 앤드리히, D. (2004) 논쟁과 라쉬 모델: 양립할 수 없는 패러다임의 특징? 의료, 42, 1–16.
  • 베이커, F. (2001) 항목 응답 이론의 기본 사항. ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD. Edres.org에서 IRT의 소프트웨어 포함 무료 이용 가능
  • 베즈루츠코, N. (에드). (2005). 보건 과학에서의 불량 측정. 메이플 그로브, 잼 프레스.
  • 본드, T.G. & Fox, C.M. (2007) Rasch 모델 적용: 인간 과학의 근본적 측정. 2번째 Edn (CD-ROM에 Rasch 소프트웨어 포함). 로렌스 얼바움.
  • 버로, R. (2016) 실험현상학에서 객관적이 되는 것: 정신물리학 응용. SpringerPlus, 5(1), 1720. doi:10.11886/s40064-016-3418-4
  • 피셔, G.H. & Molenaar, I.W. (1995년) Rasch 모델: 기초, 최근 개발애플리케이션. 뉴욕: 스프링거-베를라크.
  • Fisher, W. P. Jr. & Wright, B. D. (Eds.) (1994년) 확률론적 결합 측정의 적용. 국제학술지, 21(6), 557–664.
  • 골드스타인 H&블링크혼.S(1977년). 교육 기준 모니터링: 부적절한 모델. 황소.사이콜 씨Soc. 309–311
  • 골드스타인 H&블링크혼.S(1982년). Rasch 모델은 여전히 맞지 않는다. BERJ 82 167–170.
  • Hambleton RK, Jones RW. "클래식 테스트 이론과 항목 응답 비교", Educational Measurement: 문제 관행 1993; 12(3):38-47. 교육 국가 측정 협의회의 INTITES 시리즈에서 이용 가능
  • 해리스 D. 1-모수, 2-모수 및 3-모수 IRT 모델 비교 교육적 측정: 문제 및 실천; 1989; 8: 35–41 교육 측정 국가평의회의 INTEMENT 시리즈에서 이용 가능
  • 쿤, T.S. (1961년). 현대 물리 과학에서 측정의 기능. IS, 52, 161–193. JSTOR
  • Linacre, J. M. (1999). "Understanding Rasch measurement: Estimation methods for Rasch measures". Journal of Outcome Measurement. 3 (4): 382–405. PMID 10572388.
  • 마스터스, G. N. & Keyves, J. P. (Eds.) (1999년) 교육 연구평가에서 측정의 진보. 뉴욕: 퍼가몬.
  • N.D. 버헬스트와 C.A.W.(1995) 글라스. 단일 모수 로지스틱 모형. G.H. Fischer 및 I.W. Molenaar(에드)에서 Rasch 모델: 기초, 최근 개발 및 애플리케이션(pp. 215–238) 뉴욕: 스프링거 베라크.
  • N.D. 버헬스트, 글라스, C.A.W.와 H.H.F.M.(1995) 버스트랄렌. 하나의 파라미터 로지스틱 모델(OPLM). Arnhem: CITO.
  • 본 다비에르, M, & 카르스텐센, C. H. (2007) 다변량 분포 혼합물 분포 Rasch 모델: 확장응용 프로그램. 뉴욕: 스프링거. [1]
  • 폰 다비에, M. (2016) 래쉬 모델. Wim J. van der Linden (ed.): 항목 응답 이론 핸드북(Boca Raton: CRC Press), Routrege 핸드북.[2]
  • 라이트, B. D. (1984) 교육적 측정에 대한 절망과 희망. 현대 교육 리뷰, 3(1), 281-288 [3].
  • 라이트, B. D. (1999년) 심리학에 대한 근본적인 측정. S. E. E. E. E. E. L. Hershberger(에드스)에서 새로운 측정 규칙은 다음과 같다. 모든 교육자와 심리학자가 알아야 할 것 (pp. 65–104) 뉴저지 힐스데일: 로렌스 얼바움 어소시에이츠.
  • Wright, B.D. & Stone, M.H. (1979년) 최상의 테스트 설계. 시카고, 일리노이주: 메사 프레스.
  • Wu, M. & Adams, R. (2007) 정신-사회적 측정에 Rasch 모델을 적용하는 것: 실용적인 접근법. 오스트레일리아 멜버른: 교육적 측정 솔루션. 교육용 측정 솔루션 무료 제공

참조

  1. ^ a b c d e 래쉬, G. (1960/1980). 일부 인텔리전스 및 달성 테스트에 대한 확률론적 모델.(덴마크 교육 연구소 코펜하겐), B.D.에 의한 서문과 후기를 포함한 확장판(1980년). 장인 시카고: 시카고 대학 출판부.
  2. ^ 베즈루츠코(2005년) 보건 과학에서의 불량 측정. 메이플 그로브, MN: 잼 프레스.
  3. ^ 모럴, 에프제이, 앤 리볼로, 에프제이(2017). Rasch 모델을 이용한 토양 다산의 특성화. 토양 과학 및 식물 영양학 저널, 17(2), 486-498.
  4. ^ 벡텔, G. G. G. (1985) 소비자 등급 척도를 위한 Rasch 모델 일반화. 마케팅 사이언스, 4(1), 62-73.
  5. ^ 라이트, B. D. (1977년) Rasch 모델로 측정 문제 해결. 교육 측정 저널, 14(2), 97-116.
  6. ^ 리나크레 J.M. (2005년) 래쉬 이분법적 모델 vs. 단일 변수 로지스틱 모형. Rasch 측정 트랜잭션, 19:3, 1032
  7. ^ 래쉬, G. (1977년) 특정 객관성에 대해: 과학적 진술의 일반성과 타당성에 대한 요청을 공식화하려는 시도. 덴마크 철학 연감, 14, 58-93.
  8. ^ 서스톤, L. L. (1927년) 비교 판단의 법칙. 심리학 리뷰, 34(4), 273.
  9. ^ Thurstone 및 감각 스케일링: 그때나 지금이나. (1994년) Thurstone 및 감각 스케일링: 그때와 지금. 심리학적 검토, 101(2), 271–277. doi:10.1037/0033-295X.101.271
  10. ^ 앤드리히, D. (1978b) Thurstone과 Rasch의 관계는 아이템 확장에 접근한다. 응용 심리 측정, 2, 449–460.
  11. ^ 쿤, 토마스 S. "현대 물리 과학에서 측정의 기능" 이시스(1961년): 161-193.
  12. ^ *본드, T.G. & Fox, C.M. (2007) Rasch 모델 적용: 인간 과학의 근본적 측정. 2번째 Edn (CD-ROM에 Rasch 소프트웨어 포함). 로렌스 얼바움. 265페이지
  13. ^ 래쉬, G. (1961년). 일반법칙과 심리학에서의 측정의 의미에 관하여, 제4회 수학통계확률 심포지엄의 321-334페이지. IV. 캘리포니아 버클리: 캘리포니아 대학교 출판부. 프로젝트 유클리드로부터 무료로 이용 가능
  14. ^ 안데르센, E.B. (1977년) 충분한 통계와 잠재 특성 모델, 사이코메트리카 42, 69–81.
  15. ^ 안드리치, D. (2010) 다항성 Rasch 모델에서 사람 매개변수의 충분성 및 조건부 추정. 사이코메트리카 75(2), 292-308
  16. ^ 버른바움, A. (1968년) 일부 잠재적 특성 모델과 시험 응시자의 능력을 추론하는 데 사용되는 모델. 로드, F.M.&Novick, M.R(Eds)에서는 정신 테스트 점수에 대한 통계 이론. MA: 애디슨-웨슬리.
  17. ^ Holster, Trevor A.; Lake, J. W. (2016). "Guessing and the Rasch model". Language Assessment Quarterly. 13 (2): 124–141. doi:10.1080/15434303.2016.1160096. S2CID 148393334.
  18. ^ Byrka, Katarzyna; Jȩdrzejewski, Arkadiusz; Sznajd-Weron, Katarzyna; Weron, Rafał (2016-09-01). "Difficulty is critical: The importance of social factors in modeling diffusion of green products and practices". Renewable and Sustainable Energy Reviews. 62: 723–735. doi:10.1016/j.rser.2016.04.063.

외부 링크