평균 절대 오차

Mean absolute error

통계에서 평균 절대 오차(MAE)는 같은 현상을 나타내는 쌍체 관측치 사이의 오차를 측정한 것이다. YX의 예로는 예측 대 관측, 후속 시간 대 초기 시간 및 측정 기법 대 대체 기법의 비교가 있다. MAE는 다음과 같이 계산된다.[1]

따라서 절대 오차 = - i = 의 산술 평균이며 이고 x 대체 공식에는 체중 계수로 상대 빈도가 포함될 수 있다는 점에 유의하십시오. 평균 절대 오차는 측정되는 데이터와 동일한 척도를 사용한다. 이것은 척도 의존적 정확도 측정이라고 알려져 있으므로 서로 다른 척도를 사용하는 시계열 간의 비교에는 사용할 수 없다.[2] 평균 절대 오차는 시계열 분석에서 예측 오차의 일반적인 척도로,[3] 때로는 평균 절대 편차의 보다 표준적인 정의와 혼동하여 사용된다. 같은 혼란이 더 일반적으로 존재한다.

수량 불일치 및 할당 불일치

MAE와 RMSE에서 수량 불일치가 0이고 할당 불일치가 2인 데이터 포인트

MAE를 수량 불일치와 할당 불일치라는 두 가지 구성요소의 합으로 표현할 수 있다. 수량 불일치는 평균 오차의 절대값이다.[4]

할당량 불일치는 MAE에서 수량 불일치 입니다.

또한(, 그림을 보고 차이 유형을 식별할 수도 있다. 수량 차이는 X 값의 평균이 Y 값의 평균과 같지 않을 때 존재한다. 점들이 ID 라인의 양쪽에 위치하는 경우에만 할당 차이가 존재한다.[4][5]

관련조치

평균 절대 오차는 예측과 최종 결과를 비교하는 여러 가지 방법 중 하나이다. 잘 확립된 대안으로는 평균 절대 스케일 오차(MASE)와 평균 제곱 오차가 있다. 이것들은 모두 과대 또는 과소 예측의 방향을 무시하는 방식으로 성과를 요약한다; 이것을 강조하는 척도는 평균 서명 차이다.

선택한 성능 측정을 사용하여 예측 모형을 적합할 경우, 최소 제곱 접근법이 평균 제곱 오차와 관련이 있다는 점에서 평균 절대 오차의 등가는 최소 절대 편차다.

MAE는 일부 연구자들이 보고하고 그렇게 해석하지만, RMSE(Root-Mean Square Error)와 같지 않다. MAE는 RMSE보다 개념적으로 단순하고 해석하기도 쉽다: 단순히 산점도의 각 점과 Y=X선 사이의 평균 절대 수직 또는 수평 거리일 뿐이다. 즉, MAE는 X와 Y의 평균 절대차이다. 또한 각 오차는 오차의 절대값에 비례하여 MAE에 기여한다. 이는 차이를 제곱하는 RMSE와 대조적인 것으로, 몇 가지 큰 차이가 RMSE를 MAE보다 더 큰 수준으로 증가시킬 것이다.[4] 이러한 차이점의 예는 위의 예제를 참조하십시오.

최적성 속성

랜덤 변수 X에 대한 실제 변수 c평균 절대 오차는 다음과 같다.

X의 확률 분포가 위의 예상과 같다면 mX에 대한 평균 절대 오차의 최소값인 경우에만 X의 중위수가 된다.[6] 특히 m은 절대편차의 산술평균을 최소화하는 경우에만 표본 중위수가 된다.[7]

일반적으로 중위수는 최소값으로 정의된다.

다변량 중위수(특히 공간 중위수)에서 논한 바와 같다.

중위수에 대한 이러한 최적화 기반 정의는 예를 들어 k-중간 군집화와 같은 통계 데이터 분석에 유용하다.

최적성 증명

문: - (를) 최소화하는 분류기는 x)= { X 입니다.

증명:

분류에 대한 손실 함수는

경품을 기준으로 차별화

이 말은

그러므로

참고 항목

참조

  1. ^ Willmott, Cort J.; Matsuura, Kenji (December 19, 2005). "Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance". Climate Research. 30: 79–82. doi:10.3354/cr030079.
  2. ^ "2.5 Evaluating forecast accuracy OTexts". www.otexts.org. Retrieved 2016-05-18.
  3. ^ Hyndman, R. 및 Koehler A.(2005). "예측 정확도 측정에 대한 다른 검토" [1]
  4. ^ a b c Pontius Jr., Robert Gilmore; Thontteh, Olufunmilayo; Chen, Hao (2008). "Components of information for multiple resolution comparison between maps that share a real variable". Environmental and Ecological Statistics. 15 (2): 111–142. doi:10.1007/s10651-007-0043-y.
  5. ^ Willmott, C. J.; Matsuura, K. (January 2006). "On the use of dimensioned measures of error to evaluate the performance of spatial interpolators". International Journal of Geographical Information Science. 20: 89–102. doi:10.1080/13658810500286976.
  6. ^ Stroock, Daniel (2011). Probability Theory. Cambridge University Press. pp. 43. ISBN 978-0-521-13250-3.
  7. ^ Nicolas, André (2012-02-25). "The Median Minimizes the Sum of Absolute Deviations (The $ {L}_{1} $ Norm)". StackExchange.