통계학에서는 윌리엄 G가 고안한 코크란의 정리. Cochran은 분산 분석에 사용되는 통계량의 확률 분포와 관련된 결과를 정당화하기 위해 사용되는 정리다.[1][2]
성명서
Suppose U1, ..., UN are i.i.d. standard normally distributed random variables, and
are positive semidefinite matrices with
더 나아가 1+ + = N
여기서 r은i (
라고 가정하면 다음과 같다.

그래서 Q는i 2차 형태라고 코크란의 정리에서는 Q는i 독립적이며, 각 Q는i 자유도가 r인i 카이-제곱 분포를 가진다.[1]
덜 공식적으로, 이 선형 결합이 선형적으로 독립적이면 Q를i 정의하는 제곱합에 포함된 선형 결합의 수입니다.
증명
먼저 행렬(i) B가 동시에 대각선이 될 수 있고 0이 아닌 고유값이 모두 +1과 같다는 것을 보여준다.그리고 나서 우리는 그것들을 대각선으로 배열하는 벡터 베이스를 사용하여 그들의 특성 함수를 단순화하고 그들의 독립성과 분포를 보여준다.[3]
각 행렬 B는(i) 순위 r을i 가지며 따라서 ri 비 0 고유값을 가진다.For each i, the sum
has at most rank
. Since N
C의(i) 순위는i N - r이다.
따라서 B와(i) C는(i) 동시에 대각선화 될 수 있다.이것은 B를(i) 먼저 대각선으로 표시하면 알 수 있다.이 기준에서, 그것은 다음과 같은 형식이다.

따라서 하위- ) 행은
0이 된다.Since
, it follows that these rows in C(i) in this basis contain a right block which is a
unit matrix, with zeros in the rest of these rows.그러나 C가(i) N - ri 등급을 가지고 있기 때문에 다른 곳에서는 0이 되어야 한다.따라서 이 기준에서도 대각선이다.따라서(i) B와(i) C의 모든 0이 아닌 고유값은 +1이다.게다가, 위의 분석 C(1))에게 B를은 대각선 기준에(2)+;2B(j){\displaystyle C^{(1)}=B^{(2)}+\sum _{j>2}B^{(j)}}. 이러한 기준에 한(N− r1)×(N− r1){\displaystyle(N-r_{1})\times(N-r_{1})}의 C({\displaystyle C^{(1)}}은 정체성∑ j를 반복할 수 있다.순진ctor space, 따라서 B와(2) > ( {j 둘 다 이 벡터 공간(따라서 B와(1) 함께)에서 동시에 대각선이 가능하다
.반복에 의해 모든 B-s는 동시에 대각선이 가능하다.
따라서 모든 에 대해직교 행렬 S {\
, B( i) B( ) 과 같은
직교 행렬 S S이 한다.S\equiv B^{(나는)\prime}}, 어디서 입력 B), 지수와 y(나는)′{\displaystyle B_{x, y}^{(나는)\prime}})대각선이 = y{\displaystyle x=y},∑ j=1나는 − 1rj<>x)y≤ ∑ j=1나는이었고 넌 결코 모르네 j{\displaystyle \sum_{j=1}^{i-1}r_{j}<, x=y\leq \sum _{j=1}^{나는}r_{j}},와 1, 어떠한 입국과 함께.다른.지수는 0과 같다.
Let
denote some specific linear combination of all
after transformation by
. Note that 직교 행렬 S의 길이 보존 때문에
, 선형 변환의 Jacobian은 선형 변환 그 자체와 관련된 행렬이며, 직교 행렬의 결정 인자는 계량 1을 가지고 있다.
Q의i 특징은 다음과 같다.

이것은 자유도가 r인i 카이-제곱 분포의 푸리에 변환이다.따라서 이것은 Q의i 분포다.
더욱이 모든 Qs의i 공동분포의 특징적인 기능은 다음과 같다.

이로부터 모든 Qs가i 독립적이라는 것이 뒤따른다.
예
표본 평균 및 표본 분산
X1, ..., X가n 평균 μ와 표준 편차 σ을 갖는 독립 정규 분포 랜덤 변수라면

각 i에 대해 표준 정상이다.총 Q는 다음과 같이 우리를 제곱한 합과 같다는 점에 유의하십시오.

B + …= 라는 원래 가설에서 비롯된다
그래서 대신 우리는 이 수량을 계산하고 나중에i Q로 분리할 것이다.쓸 수 있다.

(여기서 의이
(가) 샘플 평균임).이 ID를 보려면 번씩 곱한
후 주의하십시오.

그리고 확장하여 주다.

세 번째 항은 일정한 시간과 같기 때문에 0이다.

그리고 두 번째 학기는 단지 n개의 동일한 용어를 더했다.그러므로

그래서

이제 () = {\이
(가) 있고, {\이(가) 1위를 가진 행렬이
있다.In turn
given that
. This expression can be also obtained by expanding
in matrix notation.모든 행이 0과 같기 에
B B)의순위는 - 임을
알 수 있다.이리하여 코크란의 정리조건이 충족된다.
그런 다음 코크란의 정리에서는 Q와1 Q가2 독립적이며, 각각 n - 1과 1의 자유도를 갖는 카이-제곱 분포가 있다고 명시한다.이것은 표본 평균과 표본 분산이 독립적이라는 것을 보여준다.이는 바수의 정리에서도 알 수 있으며, 실제로 이 특성은 정규 분포를 특징으로 한다. 다른 분포는 표본 평균과 표본 분산이 독립적이지 않기 때문이다.[4]
분포
분포에 대한 결과는 다음과 같이 상징적으로 기록된다.


이 두 랜덤 변수는 모두 참이지만 알 수 없는 분산 σ에2 비례한다.따라서 그들의 비율은 통계적으로 독립적이기 때문에 σ에2 의존하지 않는다.비율의 분포는 다음과 같다.

여기서 F는1,n − 1 자유도가 1과 n - 1인 F-분포(학생 t-분포 참조)이다.여기서의 마지막 단계는 사실상 F-분포를 갖는 랜덤 변수의 정의다.
분산 추정
분산 σ을2 추정하기 위해, 때때로 사용되는 하나의 추정기는 정규 분포의 분산의 최대우도 추정기입니다.

코크란의 정리를 보면 다음과 같다.

카이-제곱 분포의 속성은

대체 제형
다음 버전은 선형 회귀 분석을 고려할 때 자주 나타난다.[5]~ ( 2 ) 라고 가정하자.
is a standard multivariate normal random vector (here
denotes the n-by-n identity matrix), and if
are all n-by-n symmetric matrices with
그러면 = 을 정의할 때 조건 중 라도 다른 두 가지를 암시한다

- }}
(, A 는
양수 세미데마인임) - 은(는) Y와(와) 독립적임
. 에 대한
참고 항목
참조