다중 상관 계수
Coefficient of multiple correlation통계에서 다중 상관 계수는 다른 변수 집합의 선형 함수를 사용하여 주어진 변수를 얼마나 잘 예측할 수 있는지를 나타내는 척도다.예측 변수에서 선형적으로 계산할 수 있는 것은 변수의 값과 최선의 예측 사이의 상관관계다.[1]
다중 상관 계수는 0과 1 사이의 값을 취한다.값이 높을수록 독립 변수에서 종속 변수의 예측 가능성이 높음을 나타내며, 값이 1이면 예측이 정확하게 맞으며 값이 0이면 독립 변수의 선형 결합이 종속 변수의 고정 평균보다 더 나은 예측 변수가 되지 않음을 나타낸다.[2]
다중 상관 계수는 결정 계수의 제곱근으로 알려져 있지만, 절편이 포함되고 가능한 최선의 선형 예측 변수가 사용된다는 특정한 가정 하에서 결정 계수는 비선형 예측과 tho를 포함한 더 일반적인 경우에 대해 정의된다.예측 값이 모형 적합 절차에서 도출되지 않은 경우.
정의
R로 표시된 다중 상관 계수는 절편을 포함하는 선형 회귀 모형에서 종속 변수의 예측 값과 실제 값 사이의 Pearson 상관 계수로 정의되는 스칼라이다.
연산
The square of the coefficient of multiple correlation can be computed using the vector of correlations between the predictor variables 독립 변수) 및 대상 변수 종속 변수) 및 예측 변수 간의 상관 행렬 x 그것은 에 의해 주어진다.
여기서 {은(는) {\의 전치물이고 x - 는 행렬의 역치물이다.
모든 예측 변수가 상관 관계가 없는 경우 행렬 x 은(는) ID 행렬이고 2 R은(는) 단순히 와 같다예측 변수가 서로 상관되어 있는 경우 상관 행렬 x 의 역행렬이 이를 설명한다.
다중 상관 계수의 제곱 계수는 독립 변수로 설명되는 종속 변수의 분산 비율로 계산될 수 있으며, 이는 결국 1에서 설명되지 않은 분수를 뺀 값이다.설명할 수 없는 분수는 잔차의 제곱합, 즉 예측 오차의 제곱합으로 계산할 수 있으며, 기대값에서 종속 변수 값의 편차의 제곱합으로 나눌 수 있다.
특성.
세 개 이상의 변수가 서로 연관되어 있는 경우, 다중 상관 계수의 값은 변수의 선택에 따라 달라진다: x z{\의 회귀 은 일반적으로 {\displaystyle 과(와)의 회귀분석과는 다른 R {\ R}을 갖는다.를 들어 및 의 z 변수가 y 과와) 모두 상관 관계가 없는 반면 및 y은 선형 r이라고 가정해 보십시오서로 의기양양하여그러면 x x에서 z을(를) 회귀 분석하면 이(가) 0이 되는 , x{\} 및}에서 R이(가 엄격히 다음과 같다. 및 에 기반한 최고의 예측 변수와 y 의 상관관계는 모든 경우에 최소한 에만 기반한 최고의 예측 변수와 pr에 기반한 상관관계만큼 크므로 이 경우설명력을 배제하면 정확히 그만큼 클 것이다.
참조
추가 읽기
- 앨리슨, 폴 D. (1998년).다중 회귀 분석: 프라이머.런던: 세이지 출판사. ISBN9780761985334
- 코헨, 제이콥 등(2002).적용 다중 회귀 분석: 행동 과학에 대한 상관 분석.ISBN 0805822232
- 크라운, 윌리엄 H. (1998년).사회 및 행동 과학을 위한 통계 모델: 다중 회귀 분석 및 제한된 종속 변수 모형.ISBN 0275953165
- 에드워즈, 앨런 루이스(1985)다중 회귀 분석 및 분산 및 공분산 분석.ISBN 0716710811
- 키스, 티모시(2006)다중 회귀 분석 및 이상.보스턴: 피어슨 교육.
- 프레드 N. 케를링거, 엘라자르 J. 페다수르(1973년).행동 연구의 다중 회귀.뉴욕: 홀트 리네하트 윈스턴.ISBN 9780030862113
- 스탠튼, 제프리 M.(2001)통계교육저널 9 (3) "Galton, Pearson and the Feeds: 통계강사를 위한 선형 회귀의 간략한 역사"