평가 척도
Rating scale- 교육 점수 체계로서의 평가 척도에 대해서는, 다른 나라의 교육에 관한 기사(예를 들면, 우크라이나의 교육 등)를 참조해 주세요.
- 의료 업무에 사용되는 평가 척도에 대해서는 주요 우울증 장애와 같은 진단 관련 기사를 참조하십시오.
평가 척도는 정량적 또는 질적 속성에 대한 정보를 도출하기 위해 설계된 범주 집합이다.사회과학, 특히 심리학에서 일반적인 예로는 리커트 응답 척도 및 1~10 평가 척도가 있으며, 이 척도는 제품의 인지된 품질을 반영하는 것으로 간주되는 숫자를 선택한다.
배경
평가 척도는 평가자가 일부 평가 속성의 척도로 평가 객체에 값(때로는 숫자)을 할당해야 하는 방법입니다.
등급 척도 유형
모든 등급 척도는 다음 유형 중 하나로 분류할 수 있습니다.
- 수치평가척도(NRS)
- 구두평가척도(VRS)
- 비주얼 아날로그 스케일(VAS)
- 리커트
- 그래픽 평가 척도
- 설명적인 그래픽 평가 척도
일부 데이터는 순서형 수준에서 측정됩니다.숫자는 항목의 상대적 위치를 나타내지만 차이의 크기는 나타내지 않습니다.자세 및 의견 척도는 일반적으로 순서형입니다. 한 가지 예로 Likert 반응 척도가 있습니다.
- 진술
- 예: "컴퓨터 없이는 살 수 없습니다."
- 응답 옵션
-
- 강하게 반대하다
- 동의하지 않다
- 중립
- 동의하다
- 강력히 동의하다
일부 데이터는 간격 수준에서 측정됩니다.숫자는 항목 간 차이의 크기를 나타내지만 절대 영점은 없습니다.좋은 예로는 화씨/섭씨 온도 척도를 들 수 있습니다. 화씨/섭씨 온도 척도는 수치 간의 차이는 중요하지만 0의 위치는 중요하지 않습니다.
일부 데이터는 비율 수준에서 측정됩니다.숫자는 차이의 크기를 나타내며 고정된 영점이 있습니다.비율을 계산할 수 있습니다.예를 들어 연령, 수입, 가격, 비용, 판매 수익, 판매량 및 시장 점유율을 들 수 있습니다.
순서 [1]범주의 폴리토머스 래쉬 모델의 범주 간 통계적 비교 요건으로 인해 태도 또는 인식을 측정하기 위해 둘 이상의 등급 척도 질문이 필요하다.고전적 테스트 이론의 관점에서, 등급 척도 및 보다 일반적으로 심리 측정 기구의 효과 평가를 위한 기본 기준인 크론바흐 [2]알파와 같은 내부 신뢰성의 지수를 얻기 위해 둘 이상의 질문이 필요하다.
온라인으로 사용되는 평가 척도
이 섹션은 어떠한 출처도 인용하지 않습니다.(2016년 11월 (이 및 ) |
평가 척도는 제품에 대한 소비자의 의견을 표시하기 위해 온라인에서 널리 사용됩니다.평가 척도를 사용하는 사이트의 예로는 IMDb, Epinions.com, Yahoo! 등이 있습니다. 영화, Amazon.com, Board Game Geek 및 TV.com는 "개인화된 영화 권장 사항"을 얻기 위해 0 ~ 100의 등급을 사용합니다.
거의 모든 경우에 온라인 평가 척도는 제품당 사용자당 하나의 등급만을 허용하지만, 사용자가 여러 품질에 대해 제품을 평가할 수 있는 Ratings.net 등의 예외가 있습니다.또한 대부분의 온라인 등급 시설에서는 등급 카테고리에 대한 질적 설명을 거의 제공하지 않지만, 야후와 같은 예외도 있습니다. F와 A+ 사이의 각 카테고리에 라벨을 붙이는 무비 및 1~10의 각 카테고리에 대한 명확한 설명을 제공하는 보드게임기크.IMDb의 온라인 등급 시설과 같이 상단과 하단의 범주만 설명되는 경우가 많습니다.
유효성
유효성은 측정하려는 도구를 얼마나 잘 측정하는지 나타냅니다.예를 들어 1부터 10까지의 카테고리에서 각 사용자가 제품을 한 번만 평가하면 Cronbach의 알파와 같은 인덱스를 사용하여 내부 신뢰성을 평가할 수 있는 수단이 없습니다.따라서 시청자의 인식의 척도로 시청률의 타당성을 평가하는 것은 불가능하다.유효성을 확립하려면 신뢰성과 정확성을 모두 확립해야 한다(즉, 등급이 나타내는 것을 나타내는 것).계측기의 유효도는 논리/통계절차를 적용하여 결정한다."측정 절차는 측정하고자 하는 것을 측정할 수 있는 범위 내에서 유효합니다."
또 다른 근본적인 문제는 온라인 시청률이 보통 텔레비전 여론조사처럼 편의성 샘플링을 수반한다는 것이다. 즉, 시청률을 제출하려는 경향이 있는 사람들의 의견만을 대변한다.
유효성은 측정 과정의 다양한 측면과 관련이 있습니다.이들 유형 각각은 논리, 통계적 검증 또는 둘 다 사용하여 유효성을 판단하고 특정 조건 하에서 특별한 가치를 갖는다.유효성 유형에는 내용 유효성, 예측 유효성 및 구성 유효성 등이 있습니다.
샘플링
표본 오차는 특정 편향을 가지거나 특정 부분군과만 관련이 있는 결과를 초래할 수 있습니다.이 예를 들어, 영화가 전문가 관객에게만 어필한다고 가정해 봅시다.이들 중 90%는 이 장르의 애호가이며, 10%만이 영화에 대한 일반적인 관심을 가지고 있는 사람들입니다.영화를 보는 관객들 사이에서 매우 인기가 있고, 영화에 대해 가장 강하게 느끼는 사람들만이 온라인으로 영화를 평가하는 경향이 있다고 가정해 보자. 따라서 평가자들은 모두 헌신적인 사람들로부터 끌어낸 것이다.이 조합은 영화의 매우 높은 시청률로 이어질 수 있으며, 이는 실제로 영화를 보는 사람들(또는 실제로 영화를 평가하는 사람들)을 넘어서는 일반적이지 않을 수 있습니다.
질적 설명
범주의 정성적 설명은 등급 척도의 유용성을 향상시킨다.예를 들어, 설명 없이 1-10점만 주어진 경우, 10점을 거의 선택하지 않는 사람이 있는가 하면 범주를 자주 선택하는 사람도 있습니다.그 대신 "10"이 "결함에 가까운" 것으로 표현될 경우, 범주는 다른 사람에게 동일한 의미를 가질 가능성이 높습니다.이는 극단점뿐만 아니라 모든 범주에 적용됩니다.
제품의 목록 및 랭킹에 평균과 같은 집계된 통계를 사용할 경우 위의 문제는 더욱 복잡해집니다.사용자 등급은 기껏해야 서수 분류입니다.이러한 데이터에 대한 평균이나 평균을 계산하는 것은 드문 일이 아니지만, 평균을 계산할 때 인식 품질 수준 간의 동일한 차이를 나타내기 위해 동일한 구간이 필요하기 때문에 그렇게 하는 것은 정당화될 수 없습니다.온라인에서 일반적으로 사용되는 평가 척도의 종류에 따른 집계 데이터의 주요 문제는 다음과 같습니다.
- 수집된 종류의 데이터에 대해서는 평균을 계산해서는 안 됩니다.
- 일반적으로 사용자 등급의 신뢰성 또는 유효성을 평가하는 것은 불가능합니다.
- 제품은 일반적인 기준은 말할 것도[clarification needed] 없고 명시적인 기준과도 비교되지 않습니다.
- 제품에 대한 평가를 제출하고자 하는 사용자만 그렇게 합니다.
- 데이터는 일반적으로 제품 등급을 평가할 수 있는 형식으로 공개되지 않습니다.
보다 발전된 방법론에는 선택 모델링 또는 최대 차이 방법이 있으며, 후자는 서스톤의 비교[clarification needed] 판단 법칙과 래쉬 모델 사이의 연관성으로 인해 래쉬 모델과 관련이 있다.
등급 축척 축소
국제적인 공동 연구[3] 활동은 등급 축소를 위한 데이터 중심 알고리즘을 도입했습니다.수신기의 동작 특성에 근거하고 있습니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Andrich, David (December 1978). "A rating formulation for ordered response categories". Psychometrika. 43 (4): 561–573. doi:10.1007/BF02293814. S2CID 120687848.
- ^ Cronbach, Lee J. (September 1951). "Coefficient alpha and the internal structure of tests". Psychometrika. 16 (3): 297–334. CiteSeerX 10.1.1.452.6417. doi:10.1007/BF02310555. S2CID 13820448.
- ^ Koczkodaj, Waldemar W; Kakiashvili, T.; Szymańska, A.; Montero-Marin, J.; Araya, R.; Garcia-Campayo, J.; Rutkowski, K.; Strzałka, D. (2017). "How to reduce the number of rating scale items without predictability loss?". Scientometrics. 111 (2): 581–593(2017). doi:10.1007/s11192-017-2283-4. PMC 5400800. PMID 28490822.