제곱합 분할은 많은 추리통계량과 기술 통계량에 스며드는 개념이다.보다 적절하게는 편차 또는 오차의 제곱합을 분할하는 것입니다.수학적으로 편차의 제곱합은 비확장 또는 수정되지 않은 분산 측정값(변동성이라고도 함)입니다.자유도에 따라 크기를 조정하면 평균 값에 대한 관측치의 분산 또는 산포를 추정합니다.편차의 제곱합을 다양한 구성요소로 분할하면 데이터 집합의 전체 변동성을 다양한 유형 또는 변동의 원천에 기인하며, 각 요소의 상대적 중요성은 전체 제곱합에 대한 각 구성요소의 크기에 의해 정량화된다.
데이터 집합의 모든 점에서 데이터 평균까지의 거리는 편차입니다.은 y - { { } - { \ }( y} ) 서 는 ith 데이터 이고 y는 의 추정치입니다.§ i ( - ) \ _2에서와 같이 이러한 편차를 제곱하여 합하면, 이러한 데이터에 대한 "제곱합"을 얻을 수 있다.
수집에 데이터가 더 많이 추가되면 새 데이터가 평균과 같은 드문 경우를 제외하고 제곱합이 증가합니다.따라서 일반적으로 제곱합은 데이터 수집의 크기에 따라 커집니다.그것은 봉인되지 않은 사실의 증거이다.
대부분의 경우 자유도는 단순히 수집에 포함된 데이터 수에서 1을 뺀 값입니다.이것을 n - 1로 씁니다.여기서 n은 데이터 수입니다.
척도 조정(정규화라고도 함)은 데이터 수집의 크기가 커짐에 따라 제곱합이 커지지 않도록 조정하는 것을 의미합니다.이것은 100명의 표본과 20명의 표본과 같이 크기가 다른 표본을 비교하려는 경우 중요합니다.제곱합이 정규화되지 않으면 100명의 표본이 20명의 표본보다 항상 값이 더 커집니다.제곱합을 스케일링하기 위해 자유도, 즉 자유도당 제곱합 또는 분산으로 나눕니다.표준 편차는 분산의 제곱근입니다.
위는 기술 통계학에서 제곱합이 어떻게 사용되는지를 설명하고 있다.추리 통계학에 대한 이 넓은 원칙의 적용에 대해서는 총 제곱합에 관한 기사를 참조한다.
선형 회귀 분석에서 제곱합 분할
정리.회귀 0+ x + p i + p p + β i p + { + \ \ _ { } { } + \ _ i } 0 _ _ 0 } 。의 관측치를 포함하는 \displaystyleipi=1,\ldots,총 i 1 ( - ) { {= \ips(RSS):
여기서 이 방정식은 다음 각 형태와 같다.
서 y^ \{ { i }、^ {{ } _ {, ... , ^ { { b } _ { b } } [1]、 b ^ p { displaystyle_ { } _ { p } b b having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having having
증명
모델에 상수 또는 동등한 설계 매트릭스에 1개의 열이 포함되어 있어야 하기 때문에 i n^ { _ { i=}^{}=^ 0 {\hats 으)가 보장됩니다.
증명은 다음과 같이 벡터 형식으로도 표현할 수 있습니다.
마지막 줄에서 용어를 삭제한 경우
추가 파티셔닝
잔차 제곱합은 적합치 결여 제곱합과 순수 오차로 인한 제곱합으로 더 세분화할 수 있습니다.