평균 제곱 예측 오차

Mean squared prediction error

통계에서 평활화 또는 곡선 적합 절차의 예측대한 평균 제곱 예측 오차 또는 평균 제곱 오차는 예측 g^{\{\ 내포한 적합치와 (관찰할 수 없는) 함수 g의 값 사이의 제곱 차이 예상 값이다. , {\의 설명력을 역측정하는 것으로 추정된 모델의 교차검증 과정에 사용할 수 있다.

스무딩 또는 피팅 절차에서 관찰된 값 벡터 을(를) y^{\ y = {\에 매핑하는 투영 행렬(예: hat 행렬)이 있는 경우

MSPH는 적합치의 편향 제곱 평균과 적합치의 분산 평균의 두 가지 용어로 분해할 수 있다.

MSPE를 정확하게 계산하기 위해서는 g에 대한 지식이 필요하다. 그렇지 않으면 추정할 수 있다.

비표본 데이터에 대한 MSE 연산

평균 제곱 예측 오차는 두 가지 맥락에서 정확하게 계산할 수 있다. 첫째, 길이가 n데이터 샘플로 데이터 분석가데이터 포인트의 q에만 대해 회귀 분석을 실행할 수 있으며(q < n으로), 이를 사용하여 추정된 모델의 MSPE를 표본에서 계산하는 특정 목적을 가진 다른 n – q 데이터 포인트는 억제할 수 있다(즉, 모델 추정 프로세스에 사용된 데이터는 사용하지 않음). 회귀 분석 프로세스는 q-표본 내 점들에 맞춤화되므로, 일반적으로 표본 내 MSPE는 n - q 보류 점들에 대해 계산된 표본 외 점보다 작을 것이다. 표본에서 추출한 MSPH의 증가가 비교적 미미할 경우 모델을 유리하게 볼 수 있다. 그리고 두 모델을 비교하는 경우, 모델들의 상대적인 샘플 내 성능에 관계없이, n – q 샘플 외 데이터 포인트에 대해 낮은 MSPH를 가진 모델을 보다 유리하게 볼 수 있다. 이 맥락에서 표본을 벗어난 MSPH는 계산된 표본을 벗어난 데이터 점에 대해 정확하지만, 데이터가 그려진 대부분 관측되지 않은 모집단에 대한 모형의 MSPE 추정치에 불과하다.

둘째, 시간이 흐를수록 데이터 분석가가 더 많은 데이터를 이용할 수 있게 될 수 있으며, MSPE는 이러한 새로운 데이터에 대해 계산될 수 있다.

모집단에 대한 MSE 추정

모델을 보류하지 않고 사용 가능한 모든 데이터에 대해 추정했을 때, 대부분 관측되지 않은 데이터의 전체 모집단에 대한 모델의 MSPH는 다음과 같이 추정할 수 있다.

i = ( ) + i{\g_{{sigma_{1}에 쓸 수 있다.

표본 내 데이터 값을 사용하면 오른쪽의 첫 번째 항은

그러므로,

}}:^ 2 {\}}:by ^에 의해 잘 알려져 있거나 잘 추정된 경우, mSPE에 의한 추정이 가능해진다.

Colin Mallows는 추정 MSPE의 정규화p 버전인 그의 모델 선택 통계량 C의 구축에서 이 방법을 주창했다.

여기서 p 파라미터 p와 ^^ {\{\개는 가능한 모든 역류기를 포함하는 모델의 버전에서 계산된다. 이것으로 이 증거는 끝났다.

참고 항목

추가 읽기

  • Pindyck, Robert S.; Rubinfeld, Daniel L. (1991). "Forecasting with Time-Series Models". Econometric Models & Economic Forecasts (3rd ed.). New York: McGraw-Hill. pp. 516–535. ISBN 0-07-050098-3.