코크란의 정리

Cochran's theorem

통계학에서는 윌리엄 G가 고안한 코크란의 정리. Cochran분산 분석에 사용되는 통계량의 확률 분포와 관련된 결과를 정당화하기 위해 사용되는 정리다.[1][2]

성명서

Suppose U1, ..., UN are i.i.d. standard normally distributed random variables, and are positive semidefinite matrices with 더 나아가 1+ + = N 여기서 ri ( 라고 가정하면 다음과 같다.

그래서 Qi 2차 형태라고 코크란의 정리에서는 Qi 독립적이며, 각 Qi 자유도ri 카이-제곱 분포를 가진다.[1]

덜 공식적으로, 이 선형 결합이 선형적으로 독립적이면 Qi 정의하는 제곱합에 포함된 선형 결합의 수입니다.

증명

먼저 행렬(i) B가 동시에 대각선이 될 수 있고 0이 아닌 고유값이 모두 +1과 같다는 것을 보여준다.그리고 나서 우리는 그것들을 대각선으로 배열하는 벡터 베이스를 사용하여 그들의 특성 함수를 단순화하고 그들의 독립성과 분포를 보여준다.[3]

각 행렬 B(i) 순위 ri 가지며 따라서 ri 비 0 고유값을 가진다.For each i, the sum has at most rank . Since N C(i) 순위i N - r이다.

따라서 B(i) C(i) 동시에 대각선화 될 수 있다.이것은 B(i) 먼저 대각선으로 표시하면 알 수 있다.이 기준에서, 그것은 다음과 같은 형식이다.

따라서 하위- ) 행은 0이 된다.Since , it follows that these rows in C(i) in this basis contain a right block which is a unit matrix, with zeros in the rest of these rows.그러나 C(i) N - ri 등급을 가지고 있기 때문에 다른 곳에서는 0이 되어야 한다.따라서 이 기준에서도 대각선이다.따라서(i) B(i) C의 모든 0이 아닌 고유값은 +1이다.게다가, 위의 분석 C(1))에게 B를은 대각선 기준에(2)+;2B(j){\displaystyle C^{(1)}=B^{(2)}+\sum _{j>2}B^{(j)}}. 이러한 기준에 한(N− r1)×(N− r1){\displaystyle(N-r_{1})\times(N-r_{1})}의 C({\displaystyle C^{(1)}}은 정체성∑ j를 반복할 수 있다.순진ctor space, 따라서 B(2) > ( {j 둘 다 이 벡터 공간(따라서 B(1) 함께)에서 동시에 대각선이 가능하다.반복에 의해 모든 B-s는 동시에 대각선이 가능하다.

따라서 모든 에 대해직교 행렬 S {\, B( i) B( ) 과 같은 직교 행렬 S S한다.S\equiv B^{(나는)\prime}}, 어디서 입력 B), 지수와 y(나는)′{\displaystyle B_{x, y}^{(나는)\prime}})대각선이 = y{\displaystyle x=y},∑ j=1나는 − 1rj<>x)y≤ ∑ j=1나는이었고 넌 결코 모르네 j{\displaystyle \sum_{j=1}^{i-1}r_{j}<, x=y\leq \sum _{j=1}^{나는}r_{j}},와 1, 어떠한 입국과 함께.다른.지수는 0과 같다.

Let denote some specific linear combination of all after transformation by . Note that 직교 행렬 S의 길이 보존 때문에, 선형 변환의 Jacobian은 선형 변환 그 자체와 관련된 행렬이며, 직교 행렬의 결정 인자는 계량 1을 가지고 있다.

Qi 특징은 다음과 같다.

이것은 자유도가 ri 카이-제곱 분포푸리에 변환이다.따라서 이것은 Qi 분포다.

더욱이 모든 Qsi 공동분포의 특징적인 기능은 다음과 같다.

이로부터 모든 Qsi 독립적이라는 것이 뒤따른다.

표본 평균 및 표본 분산

X1, ..., Xn 평균 μ와 표준 편차 σ을 갖는 독립 정규 분포 랜덤 변수라면

i에 대해 표준 정상이다.Q는 다음과 같이 우리를 제곱한 합과 같다는 점에 유의하십시오.

B + = 라는 원래 가설에서 비롯된다 그래서 대신 우리는 이 수량을 계산하고 나중i Q로 분리할 것이다.쓸 수 있다.

(여기서 (가) 샘플 평균임).이 ID를 보려면 번씩 곱한 후 주의하십시오.

그리고 확장하여 주다.

세 번째 항은 일정한 시간과 같기 때문에 0이다.

그리고 두 번째 학기는 단지 n개의 동일한 용어를 더했다.그러므로

그래서

이제 () = {\(가) 있고, {\이(가) 1위를 가진 행렬 있다.In turn given that . This expression can be also obtained by expanding in matrix notation.모든 행이 0과 같기 B B)의순위는 - 임을 알 수 있다.이리하여 코크란의 정리조건이 충족된다.

그런 다음 코크란의 정리에서는 Q1 Q2 독립적이며, 각각 n - 1과 1의 자유도를 갖는 카이-제곱 분포가 있다고 명시한다.이것은 표본 평균과 표본 분산이 독립적이라는 것을 보여준다.이는 바수의 정리에서도 알 수 있으며, 실제로 이 특성은 정규 분포를 특징으로 한다. 다른 분포는 표본 평균과 표본 분산이 독립적이지 않기 때문이다.[4]

분포

분포에 대한 결과는 다음과 같이 상징적으로 기록된다.

이 두 랜덤 변수는 모두 참이지만 알 수 없는 분산 σ2 비례한다.따라서 그들의 비율은 통계적으로 독립적이기 때문에 σ2 의존하지 않는다.비율의 분포는 다음과 같다.

여기서 F1,n − 1 자유도가 1과 n - 1인 F-분포(학생 t-분포 참조)이다.여기서의 마지막 단계는 사실상 F-분포를 갖는 랜덤 변수의 정의다.

분산 추정

분산 σ2 추정하기 위해, 때때로 사용되는 하나의 추정기는 정규 분포의 분산의 최대우도 추정기입니다.

코크란의 정리를 보면 다음과 같다.

카이-제곱 분포의 속성은

대체 제형

다음 버전은 선형 회귀 분석을 고려할 때 자주 나타난다.[5]~ ( 2 ) 라고 가정하자. is a standard multivariate normal random vector (here denotes the n-by-n identity matrix), and if are all n-by-n symmetric matrices with 그러면 = 을 정의할 때 조건 중 라도 다른 두 가지를 암시한다

  • }}(, A 양수 세미데마인임)
  • 은(는) Y와(와) 독립적임 . 에 대한

참고 항목

참조

  1. ^ a b Cochran, W. G. (April 1934). "The distribution of quadratic forms in a normal system, with applications to the analysis of covariance". Mathematical Proceedings of the Cambridge Philosophical Society. 30 (2): 178–191. doi:10.1017/S0305004100016595.
  2. ^ Bapat, R. B. (2000). Linear Algebra and Linear Models (Second ed.). Springer. ISBN 978-0-387-98871-9.
  3. ^ 크레이그 A. T.(1938년) "특정 분산 추정치의 독립성에 대하여"수학통계연보. 9페이지 48-55
  4. ^ Geary, R.C. (1936). "The Distribution of "Student's" Ratio for Non-Normal Samples". Supplement to the Journal of the Royal Statistical Society. 3 (2): 178–184. doi:10.2307/2983669. JFM 63.1090.03. JSTOR 2983669.
  5. ^ "Cochran's Theorem (A quick tutorial)" (PDF).