사분위간 평균

Interquartile mean

사분위간 평균(IQM) 또는 중간값(midmean)은 사분위간 범위의 잘린 평균에 기초한 중심 경향통계적 척도다. IQM은 심사위원단이 평가하는 스포츠에서 사용하는 채점 방법과 매우 유사하다: 최저점과 최고점을 버리고, 남은 점수의 평균값을 계산한다.

계산

IQM 계산에서는 제1 사분위수와 제3 사분위수 사이의 데이터만 사용되며, 데이터의 최하위 25%와 최고 25%는 폐기된다.

값이 정렬되었다고 가정할 때

데이터 집합 크기는 4로 나눌 수 있음

그 방법은 예를 들어 가장 잘 설명된다. 다음 데이터 집합을 고려하십시오.

5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6

먼저 가장 낮은 항목에서 가장 높은 항목으로 목록을 정렬하십시오.

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

데이터 집합에는 12개의 관측치(데이터포인트)가 있으므로, 3개의 숫자로 된 사분위수가 4개 있다. 가장 낮은 값과 가장 높은 값 3개를 삭제하십시오.

1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38

이제 12개의 관측치 중 6개가 남아 있다. 다음으로 이 숫자의 산술 평균을 계산한다.

xIQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6.5

이것은 사분위간 평균이다.

비교를 위해 원본 데이터 집합의 산술 평균은

(5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8.5

특출한 38세의 강력한 영향 때문에.

데이터 집합 크기가 4로 분할되지 않음

위의 예는 데이터 집합에서 12개의 관측치로 구성되었고, 이는 사분위수를 매우 쉽게 결정할 수 있게 했다. 물론 모든 데이터 집합이 4로 나눌 수 있는 다수의 관측치를 가지고 있는 것은 아니다. 우리는 이것을 수용하기 위해 IQM을 계산하는 방법을 조정할 수 있다. 따라서 이상적으로는 IQM이 대칭 분포의 평균과 같기를 원한다. 예를 들어,

1, 2, 3, 4, 5

평균값 xmean = 3을 가지며, 대칭 분포이므로 x = 3IQM 필요할 것이다.

사분위수 및 사분위간 데이터 집합의 가중 평균을 사용하여 이 문제를 해결할 수 있다.

다음 9개의 관측치 데이터 집합을 고려하십시오.

1, 3, 5, 7, 9, 11, 13, 15, 17

각 사분위수에는 9/4 = 2.25 관측치가 있고 사분위간 범위에는 4.5 관측치가 있다. 분수 사분위수 크기를 잘라내고 이 숫자를 1 사분위수와 4 사분위수에서 제거한다(각 사분위수에서 2.25 관측치를 제거하므로 가장 낮은 2와 가장 높은 2가 제거됨).

1, 3, (5), 7, 9, 11, (13), 15, 17

따라서 사분위간 범위에는 3개의 전체 관측치와 2개의 부분 관측치가 있다. 사분위간 범위에서 총 4.5개의 관측치를 가지므로, 두 개의 부분 관측치는 각각 0.75(따라서 3×1 + 2×0.75 = 4.5 관측치)를 카운트한다.

IQM은 이제 다음과 같이 계산된다.

xIQM = {(7 + 9 + 11) + 0.75 × (5 + 13)} / 4.5 = 9

위의 예제에서 평균은mean x = 9 값을 갖는다. 예상대로 IQM과 동일하다. IQM을 계산하는 방법은 유사하다. IQM에 대한 부분 기여도는 0, 0.25, 0.50 또는 0.75일 수 있다.

평균 및 중위수와의 비교

사분위간 평균은 평균중위수의 일부 속성을 공유한다.

  • 중위수와 마찬가지로 IQM은 특이치에 둔감하다. 주어진 예에서 가장 높은 값(38)은 데이터 집합의 명백한 특이치였지만 IQM의 계산에는 사용되지 않는다. 반면, 공통 평균(산술 평균)은 이러한mean 특이치인 x = 8.5에 민감하다.
  • 평균과 마찬가지로 IQM은 데이터 집합에서 많은 수의 관측치를 기반으로 하는 구별되는 매개변수다. 중위수는 항상 데이터 집합의 관측치 중 하나와 동일하다(홀수 수의 관측치를 가정함). 평균은 다른 모든 관측치의 값에 따라 가장 낮은 관측치와 가장 높은 관측치 사이의 과 같을 수 있다. IQM은 사분위간 범위의 모든 관측치에 따라 첫 번째 사분위수와 세 번째 사분위수 사이의 모든 값과 같을 수 있다.

참고 항목

관련통계

적용들

  • 런던 인터뱅크 제공 금리는 여러 은행이 제시한 금리의 사분위간 평균으로 기준 금리를 추정했다(London Interbank Proved Rate). (Libor의 주요 미국 대체품인 SOFR부피가중 평균 가격을 사용하며, 이 가격은 견고하지 않다.)
  • Everything2는 사용자가 작성한 평판의 사분위간 평균을 사용하여 사용자의 기여도를 결정한다.[1]