평균 제곱근 편차

Root-mean-square deviation

RMSD(Root-Mean-Square Deviation) 또는 RMSE(Root-Mean-Square Error)는 모형이나 추정기에서 예측한 값(표본 또는 모집단 값)과 관측된 값 사이의 차이를 측정하는 데 자주 사용되는 측도다. RMSD는 예측값과 관측값 사이의 차이에 대한 두 번째 표본 모멘트의 제곱근 또는 이러한 차이의 2차 평균을 나타낸다. 이러한 편차는 추정에 사용된 데이터 표본에 대해 계산이 수행될 때 잔차라고 하며, 표본 외 계산 시 오차(또는 예측 오차)라고 한다. RMSD는 다양한 데이터 포인트에 대한 예측에서 오류의 크기를 예측력의 단일 척도로 집계하는 역할을 한다. RMSD는 규모에 따라 달라지므로 데이터 집합 간이 아니라 특정 데이터 집합에 대해 서로 다른 모델의 예측 오류를 비교하는 정확도 측도다.[1]

RMSD는 항상 음성이 아니며 값이 0(실제로는 거의 달성되지 않음)이면 데이터에 완벽하게 적합함을 나타낼 수 있다. 일반적으로 RMSD가 높은 것보다 낮은 것이 낫다. 그러나 다른 유형의 데이터에 대한 비교는 측도가 사용된 숫자의 척도에 따라 달라지기 때문에 무효가 될 수 있다.

RMSD는 평균 오차 제곱의 제곱근이다. RMSD에 대한 각 오류의 영향은 제곱 오차 크기에 비례한다. 따라서 더 큰 오류는 RMSD에 불균형적으로 큰 영향을 미친다. 따라서 RMSD는 특이치에 민감하다.[2][3]

공식

변수 \에 대한 추정치 }}의 RMSD는 평균 제곱 오차의 제곱근으로 정의된다.

편향되지 않은 추정기의 경우 RMSD는 분산의 제곱근이며 표준 편차로 알려져 있다.

T 시간에 걸쳐 관측된 변수를 갖는 회귀의 종속 변수 y 의 시간 t에 대한 예측 값 t {의 RMSD는 다음과 같은 편차 제곱 평균의 제곱근으로 T에 대해 계산된다.

(단면 데이터에 대한 회귀 분석의 경우 첨자 ti로, Tn으로 대체)

일부 분야에서는 RMSD를 사용하여 달라질 수 있는 두 가지 사항 간의 차이를 비교하는데, 두 가지 모두 "표준"으로 받아들여지지 않는다. 예를 들어, 두 , t , 사이의 평균 차이를 측정할 때 공식은 다음과 같이 된다

정규화

RMSD를 정상화하면 서로 다른 스케일의 데이터셋 또는 모델 간 비교가 용이하다. 문헌에 일관적인 정규화 수단은 없지만 공통적인 선택은 측정 데이터의 평균 또는 범위(최대값에서 최소값을 뺀 값으로 정의됨)[4]이다.

or .

이 값은 일반적으로 정규화된 루트 평균 제곱 편차 또는 오차(NRMSD 또는 NRMSE)라고 하며, 낮은 값이 잔차 분산을 적게 나타내는 백분율로 표시되기도 한다. 많은 경우, 특히 작은 표본의 경우 표본 범위는 표본의 크기에 영향을 받아 비교에 방해가 될 수 있다.

RMSD를 보다 유용한 비교 척도로 만드는 또 다른 가능한 방법은 RMSD를 사분위간 범위로 나누는 것이다. RMSD를 IQR로 나눌 때 정규화된 값은 목표 변수의 극단값의 민감도가 낮아진다.

where

포함( = - 1( 0.) )및 Q = - (75 , 여기서 CDF는−1 계량함수다.

측정값의 평균값으로 정규화할 때 모호성을 피하기 위해 RMSD, CV(RMSD)의 변동 계수 항을 사용할 수 있다.[5] 이는 RMSD가 표준 편차를 대신할 때의 변동 계수와 유사하다.

평균 절대 오차

일부 연구자들은 평균 제곱 편차 대신 평균 절대 오차(MAE)를 사용할 것을 권고했다. MAE는 RMSD에 비해 해석성에 장점이 있다. MAE는 오차의 절대값의 평균이다. MAE는 기본적으로 평균 오차 제곱의 제곱근보다 이해하기 쉽다. 또한 각 오류는 오류의 절대값과 정비례하여 MAE에 영향을 미치는데, 이는 RMSD의 경우가 아니다.[2]

적용들

  • 기상학에서, 수학적 모델이 대기의 행동을 얼마나 효과적으로 예측하는지 보기 위해서입니다.
  • 생물정보학에서 원자 위치의 뿌리-평균 제곱 편차는 중첩단백질 원자들 사이의 평균 거리를 측정한 것이다.
  • 구조 기반 약물 설계에서 RMSD는 리간드 순응의 결정 순응과 도킹 예측 사이의 차이를 측정한 것이다.
  • 경제학에서 RMSD는 경제 모형이 경제 지표를 적합시키는지를 결정하는 데 사용된다. 일부 전문가들은 RMSD가 상대적 절대 오차보다 신뢰성이 떨어진다고 주장해왔다.[6]
  • 실험 심리학에서 RMSD는 행동의 수학적 또는 계산적 모델이 경험적으로 관찰된 행동을 얼마나 잘 설명하는지 평가하는 데 사용된다.
  • GIS에서 RMSD는 공간 분석과 원격 감지의 정확성을 평가하는 데 사용되는 하나의 척도다.
  • 수력 지질학에서 RMSD와 NRMSD는 지하수 모델의 교정을 평가하는 데 사용된다.[7]
  • 영상 과학에서 RMSD는 피크 신호 대 잡음 비(Peak Signal-to-Noise Ratio)의 일부로서, 영상을 재구성하는 방법이 원본 영상에 비해 얼마나 잘 수행되는지 평가하는 데 사용되는 측정이다.
  • 계산 신경 과학에서 RMSD는 시스템이 주어진 모델을 얼마나 잘 학습하는지 평가하는 데 사용된다.[8]
  • 단백질 핵자기공명 분광학에서 RMSD는 획득한 구조물 다발의 품질을 추정하는 척도로 사용된다.
  • 넷플릭스 상 제출은 테스트 데이터 세트의 공개되지 않은 "참" 값에서 RMSD를 사용하여 평가되었다.
  • 건물의 에너지 소비량 시뮬레이션에서는 RMSE와 CV(RMSE)를 사용하여 측정된 건물 성능에 맞게 모델을 보정한다.[9]
  • X선 결정학에서는 RMSD(및 RMSZ)를 사용하여 구속 라이브러리 값에서 벗어난 분자 내부 좌표의 편차를 측정한다.

참고 항목

참조

  1. ^ Hyndman, Rob J.; Koehler, Anne B. (2006). "Another look at measures of forecast accuracy". International Journal of Forecasting. 22 (4): 679–688. CiteSeerX 10.1.1.154.9771. doi:10.1016/j.ijforecast.2006.03.001.
  2. ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Components of information for multiple resolution comparison between maps that share a real variable". Environmental Ecological Statistics. 15 (2): 111–142. doi:10.1007/s10651-007-0043-y.
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). "On the use of dimensioned measures of error to evaluate the performance of spatial interpolators". International Journal of Geographical Information Science. 20: 89–102. doi:10.1080/13658810500286976.
  4. ^ "Coastal Inlets Research Program (CIRP) Wiki - Statistics". Retrieved 4 February 2015.
  5. ^ "FAQ: What is the coefficient of variation?". Retrieved 19 February 2019.
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). "Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons" (PDF). International Journal of Forecasting. 8 (1): 69–80. CiteSeerX 10.1.1.423.508. doi:10.1016/0169-2070(92)90008-w.
  7. ^ Anderson, M.P.; Woessner, W.W. (1992). Applied Groundwater Modeling: Simulation of Flow and Advective Transport (2nd ed.). Academic Press.
  8. ^ 앙상블 신경망 모델
  9. ^ ANSI/BPI-2400-S-2012: 에너지 사용 이력 보정에 의한 주택 전체의 에너지 절약량 예측 표준화를 위한 표준화된 자격인정 관행