잘린 평균
Truncated mean이 글은 검증을 위해 인용구가 추가로 필요하다. – · · · JSTOR (2010년 7월 (이 |
잘린 평균 또는 잘린 평균은 평균 및 중위수와 거의 유사한 중심 경향의 통계적 척도다. 확률 분포의 주어진 부분이나 표본을 상한과 하한에서 폐기하고 일반적으로 둘 다 같은 양을 폐기한 후 평균을 계산하는 것이 포함된다. 폐기될 포인트의 이 수는 보통 포인트 총수의 백분율로 주어지지만, 정해진 포인트 수로 주어질 수도 있다.
대부분의 통계적 적용의 경우, 종말의 5~25%가 폐기된다. 예를 들어, 8개의 점 집합이 주어진 경우, 12.5%를 트리밍하면 표본의 최소값과 최대값, 즉 가장 작은 값과 가장 큰 값을 버리고 나머지 6개의 점의 평균을 계산하게 된다. 25% 절삭 평균(최하위 25%와 최고 25%를 폐기한 경우)은 사분위간 평균으로 알려져 있다.
중위수는 완전히 잘린 평균으로 간주할 수 있으며 가장 견고하다. 다른 절삭 추정기와 마찬가지로 절삭 평균의 주요 장점은 혼합 분포와 무거운 꼬리 분포(Cauchy 분포와 같이)에 대한 강건성과 높은 효율성이며, 다른 덜 꼬인 분포(정상 분포 등)에 대한 낮은 효율성의 비용이다. 중간 분포의 경우 평균과 중위수의 효율 차이는 그리 크지 않다. 예를 들어 자유도가 2인 학생-t 분포의 경우 평균과 중위수의 분산이 거의 동일하다.
용어.
중앙 유럽의 일부 지역에서는 윈저 평균이라고도 알려져 있지만,[표창 필요한]이 이름은 윈저 평균과 혼동해서는 안 된다.후자에서는 잘라낸 평균이 대신 폐기될 것이라는 관측치가 나머지 값 중 가장 크거나 작은 값으로 대체된다.
특히 관리 통계에서 최대값과 최소값만 폐기하는 것을 수정된 평균이라고 한다.[1] 이것은 피겨 스케이팅의 ISU 심판 시스템과 같은 올림픽 경기에서 단일 특출한 심판에게 점수를 강하게 하기 위해 사용되기 때문에 올림픽 평균(예: 미국 농업에서는 평균 농작물 수익 선거와 같은)으로도 알려져 있다.[2]
보간법
폐기할 점의 백분율이 정수를 산출하지 않는 경우, 절삭 평균은 가장 가까운 정수 사이의 보간(일반적으로 선형 보간)으로 정의할 수 있다. 예를 들어, 10개의 항목이 포함된 표본의 15% 절삭 평균을 계산해야 하는 경우, 엄격히 말하면 각 끝에서 1개의 점(10% 절삭 평균과 동일)을 폐기하는 것을 의미한다. 보간법을 사용할 경우, 10% 절삭 평균(각 끝에서 1포인트 삭제)과 20% 절삭 평균(각 끝에서 2포인트 삭제)을 계산한 다음 이 두 값의 평균을 보간한다. 마찬가지로, 12% 절삭 평균을 보간할 경우 가중 평균을 취하게 된다. 가중 평균: 10% 절삭 평균은 0.8이고 20% 절삭 평균은 0.2이다.
이점
잘린 평균은 평균보다 특이치에 덜 민감하지만 여전히 많은 통계적 모형의 중심 경향이나 평균에 대한 합리적인 추정치를 제공하기 때문에 유용한 추정치가 된다. 이 점에서 그것은 견실한 추정기라고 불린다. 예를 들어, 올림픽 심판에 사용할 때, 최고점과 최저점을 잘라내는 것은 심판 한 명이 예외적으로 높은 점수를 주거나 낮은 점수를 주어서 전체 점수를 올리거나 내리는 것을 막는다.
잘린 평균을 사용하는 것이 유리할 수 있는 한 가지 상황은 정규 분포보다 더 뚱뚱한 꼬리를 가진 종 모양의 확률 분포인 Cauchy 분포의 위치 모수를 추정할 때 이다. 중간 24% 표본 순서 통계량의 잘린 평균(즉, 각 끝에서 표본을 38% 잘라냄)이 표본 중위수 또는 전체 표본 평균을 사용하는 것보다 더 효율적인 모집단 위치 모수에 대한 추정치를 산출한다는 것을 알 수 있다.[3][4] 그러나 Cauchy 분포의 두꺼운 꼬리로 인해 견적에 더 많은 표본을 사용할수록 추정기의 효율은 감소한다.[3][4] Cauchy 분포의 경우, 잘린 평균, 전체 표본 평균 또는 표본 중위수가 최대우도 추정기를 나타내지 않으며 최대우도 추정기만큼 점증적으로 효율적이지도 않지만, 최대우도 추정치는 계산하기가 더 어려워 잘린 평균을 유용한 대안으로 남겨둔다는 점에 유의하십시오.[4][5]
단점
잘린 평균은 중위수보다 분포 또는 표본의 정보를 더 많이 사용하지만, 기본 분포가 대칭이 아닌 한 표본의 잘린 평균은 평균 또는 중위수에 대해 편향되지 않은 추정자를 생성할 가능성이 낮다.
통계적 시험
잘린 평균을 바탕으로 학생 t-테스트를 수행할 수 있는데, 이를 Yuen의 t-테스트를 T-테스트로 부르며,[6][7] R에도 여러 가지 구현이 있다.[8][9]
예
심사위원단이 평가하는 많은 스포츠에서 사용하는 채점 방법은 가장 낮은 점수와 가장 높은 점수를 버리고 남은 점수의 평균값을 계산하는 잘린 평균이다.[10]
리보 기준금리는 절사 평균으로 계산되는데, 18개의 응답으로 볼 때 상위 4와 하위 4는 폐기되고 나머지 10개는 평균(수익률 4/18 22 22%)[11]이다.
다음과 같이 구성된 데이터 세트를 고려하십시오.
- {92, 19, 101, 58, 1053, 91, 26, 78, 10, 13, -40, 101, 86, 85, 15, 89, 28, -5, 41}(N = 20, 평균 = 101.5)
5번째 백분위수(-6.75)는 -40과 -5 사이에 있고, 95번째 백분위수(148.6)는 101과 1053 사이에 있다(볼드체로 표시된 값). 5% 절사 평균은 다음과 같은 결과를 가져올 수 있다.
- {92, 19, 101, 58, 91, 26, 78, 10, 13, 101, 86, 85, 15, 89, 28, -5, 41}(N = 18, 평균 = 56.5)
이 예는 윈저라이징 절차를 사용하는 예와 비교할 수 있다.
참고 항목
참조
- ^ Aulmozhi, G.; Statistics For Management, 제2판, Tata McGraw-Hill Education, 2009, 페이지 458
- ^ Paul E. Peterson (August 3, 2012). "Lessons from LIBOR".
Once the quotes are compiled, LIBOR uses a trimmed mean process, in which the highest and lowest values are thrown out and the remaining values are averaged. This is sometimes called an "Olympic average" from its use in the Olympics to eliminate the impact of a biased judge on an athlete's final score.
- ^ a b Rothenberg, Thomas J.; Fisher, Franklin, M.; Tilanus, C.B. (1964). "A note on estimation from a cauchy sample". Journal of the American Statistical Association. 59 (306): 460–463. doi:10.1080/01621459.1964.10482170.
- ^ a b c Bloch, Daniel (1966). "A note on the estimation of the location parameters of the Cauchy distribution". Journal of the American Statistical Association. 61 (316): 852–855. doi:10.1080/01621459.1966.10480912. JSTOR 2282794.
- ^ Ferguson, Thomas S. (1978). "Maximum Likelihood Estimates of the Parameters of the Cauchy Distribution for Samples of Size 3 and 4". Journal of the American Statistical Association. 73 (361): 211–213. doi:10.1080/01621459.1978.10480031. JSTOR 2286549.
- ^ Yuen, K.K. (1974) 2-표본은 불평등한 모집단 분산을 위해 t를 잘랐다. 바이오메트리카, 61, 165-170
- ^ 윌콕스, R.R. (2005) 견실한 추정 및 가설 검사에 대한 소개. 학술 출판사.
- ^ "WRS2: A Collection of Robust Statistical Methods". 20 July 2021.
- ^ "DescTools: Tools for Descriptive Statistics". 9 September 2021.
- ^ Bialik, Carl (27 July 2012). "Removing Judges' Bias Is Olympic-Size Challenge". The Wall Street Journal. Retrieved 7 September 2014.
- ^ "bbalibor: The Basics". The British Bankers' Association.