수학 및 다변량 통계에서 중심행렬은[1] 대칭 및 공전위 행렬이며, 벡터로 곱하면 그 벡터의 모든 성분에서 벡터 성분의 평균을 빼는 것과 같은 효과가 있다.
정의
n 크기의 중심 행렬은 n-by-n 행렬로 정의된다.
서 은(는) n 크기의 ID 매트릭스, {\n}}은(는) 1의 모든 매트릭스인 n-by-n 매트릭스다.
예를 들어,
- =[
- C 2)[1001]− 12[1111])[12− 12− 1212]{\displaystyle C_{2}[{\begin{배열}{}rrr 1&, 0\\0&, 1\end{배열}}\right]-{\frac{1}{2}}\left[{\begin{배열}{}rrr 1&, 1\\1&, 1\end{배열}}\right]=\left는 경우에는{\begin{배열}{rrr}{\frac{1}{2}}&-{\frac. {1}{2}}\\-{\fra}{21}:{
특성.
, v\mathbf {v} 크기 n을 지정하면 C 의 중심 속성은 다음과 같이 표현할 수 있다
여기서 , 은(는) 1의 열 벡터 및 v {T}{{은(는) {v의 성분 평균이다.
은(는) 대칭 양의 반확정이다.
은(는) idempotent이므로 = 1,,… 에 C k = = C = {\displaysty 평균이 제거되면 다시 0이 되고 제거되는 것은 아무런 효과도 없다
은(는) 단수형이다. 변환 을(를) 적용하는 효과는 되돌릴 수 없다.
에는 다중성 n - 1의 고유값 1과 다중성 1의 고유값 0이 있다.
은(는) 벡터 , 1 을 따라 치수 1의 nullspace를 가진다
은(는) 직교 투영 행렬이다. That is, is a projection of onto the (n − 1)-dimensional subspace that is orthogonal to the nullspace . (This is the subspace of all n-vectors whose components sum to zero.)
의 추적은 (- 1)/ = - n 입니다
적용
중심행렬에 의한 곱셈은 벡터에서 평균을 제거하는 계산적으로 효율적인 방법은 아니지만, 편리한 분석 도구다. 단일 벡터의 평균뿐만 아니라 m-by-n 매트릭스 의 행이나 열에 저장된 여러 벡터의 평균을 제거하는 데 사용할 수 있다
곱하기 C {\ C_는 각 n열에서 해당 평균값을 빼서 제품 의 각 열에 0 평균이 표시되도록 한다. 마찬가지로 오른쪽의 에 의한 곱셈은 각 m 행에서 해당 평균값을 빼며, X {\ X의 각 행은 평균이 0이다. 양쪽의 곱셈은 행과 열 평균이 0인 이중 중심 행렬 X n 을 만든다
The centering matrix provides in particular a succinct way to express the scatter matrix, of a data sample , where 는 표본 평균이다. 중심 매트릭스는 산점 매트릭스를 보다 콤팩트하게 표현할 수 있게 해준다.
is the covariance matrix of the multinomial distribution, in the special case where the parameters of that distribution are , and .
참조