공분산 다변량 분석

Multivariate analysis of covariance

공분산 다변량 분석(MANCOVA)은 둘 이상의 종속 변수가 있고 동반성 연속 독립 변수인 공변량의 통제가 필요한 경우를 다루기 위해 공분산(ANCOVA) 방법을 확장한 것이다. 단순 다변량 분산 분석보다 MANCOVA 설계의 가장 큰 장점은 공변량이 도입한 소음 또는 오류의 '인자 배출'이다.[1] 일반적으로 사용되는 다변량 분산 분석 F-통계학적 버전은 Wilks의 람다(AND)로, 오차 분산(또는 공분산)과 효과 분산(또는 공분산) 사이의 비율을 나타낸다.[1]

목표들

분산 분석 계열의 모든 테스트와 유사하게, MANCOVA의 주요 목적은 그룹 평균 간의 유의한 차이를 테스트하는 것이다.[1] 데이터 출처에서 공변량을 특성화하는 프로세스는 MANCOVA 설계에 MSerror 표현되는 오차항의 크기를 줄일 수 있다. 이후, 전체 Wilks의 Lambda는 더 커지고 유의한 특성을 가질 가능성이 더 높아질 것이다.[1] 이는 연구자에게 데이터 내의 차이를 탐지할 수 있는 더 많은 통계적 힘을 부여한다. MANCOVA의 다변량 측면은 공변량을 동시에 제어하면서 다중 종속 변수의 선형 조합에 관한 그룹 평균의 차이를 특성화할 수 있다.

MANCOVA가 적절한 상황의 예: 한 과학자가 우울증과 불안 점수에 미치는 영향에 대해 두 가지 신약 실험에 관심이 있다고 가정해보자. 또한 과학자가 각 환자의 약물에 대한 전반적인 반응도와 관련된 정보를 가지고 있다고 가정하자; 이 공변량을 회계처리하면 두 종속 변수에 대한 각 약물의 영향을 결정하는 데 있어 시험의 민감도가 높아질 것이다.

가정

MANCOVA를 적절히 사용하려면 다음과 같은 특정 가정을 충족해야 한다.

  1. 정규성: 각 그룹에 대해 각 종속 변수는 점수의 정규 분포를 나타내야 한다. 또한 종속 변수의 선형 조합은 정규 분포를 따라야 한다. 특이치를 변환하거나 제거하면 이러한 가정이 충족되는지 확인하는 데 도움이 될 수 있다.[2] 이 가정을 위반하면 제1종 오류율이 증가할 수 있다.[3]
  2. 관측치의 독립성: 각 관측치는 다른 모든 관측치와 독립적이어야 한다. 이러한 가정은 무작위 표본 추출 기법을 사용하여 충족할 수 있다. 이 가정을 위반하면 제1종 오류율이 증가할 수 있다.[3]
  3. 분산 동질성: 각 종속 변수는 각 독립 변수 간에 유사한 수준의 분산을 보여 주어야 한다. 이러한 가정을 위반하는 것은 분산과 종속 변수의 수단 사이에 존재하는 상관관계로 개념화할 수 있다. 이 위반은 흔히 '히테로스파스틱리티'[4]라고 불리며 레베네 검사의 사용 여부를 검사할 수 있다.[5]
  4. 공분류의 동질성: 종속 변수 간의 상관 행렬은 독립 변수의 모든 수준에서 동일해야 한다. 이 가정을 위반하면 통계적 힘의 감소뿐만 아니라 제1종 오류율의 증가로 이어질 수 있다.[3]

다변량 분산 분석 논리

Analogous to ANOVA, MANOVA is based on the product of model variance matrix, and inverse of the error variance matrix, , or . 는)모델 Σ 그 가설}}잔류{\displaystyle \Sigma_{{\text 모델}}=\Sigma _{\text{잔류}를 암시하 Σ은 A제품 100∼을 나는{\displaystyle A\sim 1세}.[6]Invariance 고려 사항에 수반되는 MANOVA 통계야 한 대책의 규모에 특이한 값 분해의 이 매트릭스 제품지만 거기에 있n.o 대립 가설의 다차원적 특성에 의한 독특한 선택

일반적인[7][8] 통계량은 A 행렬의 루트(또는 고유값) 에 기반한 요약이다.

람다(λ)로 배포됨

공변량

통계에서 공변량은 실험에서 제어되지 않은 변동의 근원을 나타내며 종속 변수에 영향을 미치는 것으로 간주된다.[9] ANCOVA와 같은 기법의 목적은 통계적 힘을 증가시키고 독립변수와 종속변수 사이의 진정한 관계에 대한 정확한 측정을 보장하기 위해 통제되지 않는 변동의 영향을 제거하는 것이다.[9]

우드워스(1987년)의 해수면 동향 분석에 의해 한 예가 제공된다. 여기서 종속 변수(및 가장 관심 있는 변수)는 일련의 연간 값을 사용할 수 있는 특정 위치의 연간 평균 해수면이었다. 1차 독립 변수는 "시간"이었다. 해수면에서의 연평균 대기압의 연간 값으로 구성된 "공변량"으로 사용하였다. 그 결과 공변량을 포함하면 공변량을 생략한 분석과 비교하여 얻어진 시간에 대한 추세를 더 잘 추정할 수 있었다.

참고 항목

참조

  1. ^ a b c d [1] Statsoft 교과서, 분산 분석/분산 분석.
  2. ^ [2] 프랑스어, A. 외, 2010. 다변량 분산 분석(MANOVA)
  3. ^ a b c [3] 데이비스, K, 2003. 다중 분산 분석(MANOVA) 또는 다중 공분산 분석(MANCOVA) 루이지애나 주립 대학교.
  4. ^ [4] 보르스, D. A. Scarborough에 있는 토론토 대학교.
  5. ^ [5] 맥러플린, M, 2009. 사우스캐롤라이나의 대학교.
  6. ^ Carey, Gregory. "Multivariate Analysis of Variance (MANOVA): I. Theory" (PDF). Retrieved 2011-03-22.
  7. ^ Garson, G. David. "Multivariate GLM, MANOVA, and MANCOVA". Retrieved 2011-03-22.
  8. ^ UCLA: Academic Technology Services, Statistical Consulting Group. "Stata Annotated Output – MANOVA". Retrieved 2011-03-22.
  9. ^ a b Kirk, Roger E. (1982). Experimental design (2nd ed.). Monterey, Calif.: Brooks/Cole Pub. Co. ISBN 0-8185-0286-X.