평균 및 예측 반응

Mean and predicted response

선형 회귀 분석에서 평균 반응예측 반응은 회귀 모수로부터 계산된 종속 변수의 값과 독립 변수의 주어진 값이다. 이 두 반응의 값은 같지만 계산된 분산은 다르다.

배경

직선 피팅에서 모델은

여기서 반응 변수, i 설명 변수, \ \}은는) 매개 변수다. 주어진 설명 값 xd 대한 평균 및 예측 반응 값은

실제 반응은 다음과 같을 것이다.

의 값과 분산에 대한 식은 선형 회귀 분석에서 제공된다.

평균 반응

Since the data in this context is defined to be (x, y) pairs for every observation, the mean response at a given value of x, say xd, is an estimate of the mean of the y values in the population at the x value of xd, that is . 평균 반응의 분산은 다음과 같다.

이 표현은 다음과 같이 단순화할 수 있다.

여기서 m은 데이터 점의 수입니다.

이러한 단순화를 증명하기 위해, 우리는 그 정체성을 이용할 수 있다.

예측 반응

예측 반응 분포는 주어진 점 x에서d 잔차의 예측 분포입니다. 따라서 분산은

The second line follows from the fact that is zero because the new prediction point is independent of the data used to fit the model. 또한 평균 에 대해 ^+ x d ) {\ {\좌측 {\이라는 용어가 앞서 계산되었다.

( )= 추정할 수 있지만 알 수 없는 고정 파라미터))이므로 예측 반응의 분산이 다음과 같이 주어진다.

신뢰구간

The confidence intervals are computed as . Thus, the confidence interval for predicted response is wider than the interval for mean response. 이는 직관적으로 예상됨 – 무작위 변수 εi 감소하지 않지만, {\displaystyle {\\}의 분산은 샘플링이 증가함에 따라 감소하기 때문에 표본에서y{\ 값의 모집단의 분산은 감소하지 않는다. (가) 감소하므로 평균 반응(vmx response value)은 + x 에 가까워진다

이는 모집단의 분산과 모집단의 표본 평균의 분산 간의 차이와 유사하다. 모집단의 분산은 모수로서 변하지 않지만 표본 평균의 분산은 표본이 증가하면 감소한다.

일반 선형 회귀 분석

일반 선형 모델은 다음과 같이 쓸 수 있다.

따라서 = j= j =1} 평균 반응의 분산에 대한 일반적인 표현은 다음과 같다.

여기서 S는 모수의 공분산 행렬로, 다음과 같이 주어진다.

참조

  • Draper, N. R.; Smith, H. (1998). Applied Regression Analysis (3rd ed.). John Wiley. ISBN 0-471-17082-8.