설명할 수 없는 분산 비율

Fraction of variance unexplained

통계에서, 회귀 과제의 맥락에서 설명되지 않는 분산 비율(FVU)은 설명 변수 X에 의해 설명될 수 없는 회귀 분석(의존 변수) Y의 분산 비율이다.

형식 정의

대해 산출되는 ff(가 주어진다고 가정합시다. x {\는 모든 설명 변수에 대한th i 관측치의 벡터입니다.[1]: 181 우리는 설명되지 않은 (FVU)의 분산을 다음과 같이 정의한다.

여기서 R2 결정 계수, VARerr VARtot 잔차의 분산과 종속 변수의 표본 분산이다. 제곱합err(예측 오차 제곱합, 균등하게 잔차 제곱합), 제곱합tot(총 제곱합), 제곱합reg(회귀 제곱합, 설명 제곱합)은 다음과 같다.

또는 설명할 수 없는 분산의 분율은 다음과 같이 정의할 수 있다.

여기서 MSE(f)는 회귀 함수 ƒ평균 제곱 오차이다.

설명

It is useful to consider the second definition to understand FVU. When trying to predict Y, the most naïve regression function that we can think of is the constant function predicting the mean of Y, i.e., . It follows that the MSE of this function equals the variance of Y; that is, SSerr = SStot, SSreg = 0. 이 경우 Y의 변동을 설명할 수 없으며 FVU의 최대값은 1이다.

보다 일반적으로 설명 변수 X가 Y의 예측 값이 Y동일하지 않다는 에서 Y에 대해 아무 것도 알려주지 않는다면 FVU는 1이 될 것이다. 그러나 예측이 좋아지고 MSE를 줄일 수 있게 되면서 FVU는 내려간다. 모든 i에 y i= {\}=y_{i}=y_가 완벽하게 예측되는 경우 MSE는 0, SS = 0err, SSreg = SStot, FVU는 0이다.

참고 항목

참조

  1. ^ Achen, C. H. (1990). "'What Does "Explained Variance" Explain?: Reply". Political Analysis. 2 (1): 173–184. doi:10.1093/pan/2.1.173.