예이츠 분석
Yates analysis통계학에서 예이츠 분석은 요인 설계를 사용한 설계 실험에서 얻은 데이터를 분석하는 방법입니다.완전 및 부분 요인 설계는 엔지니어링 및 과학적 응용을 위해 설계된 실험에서 일반적으로 사용됩니다.이러한 설계에서는 각 요인에 두 가지 수준이 할당됩니다.이러한 레벨을 보통 로우 레벨과 하이 레벨이라고 부릅니다.계산을 위해 낮은 수준에는 -1의 값이 할당되고 높은 수준에는 +1의 값이 할당되도록 요인의 크기가 조정됩니다.이들은 일반적으로 "-" 및 "+"라고도 합니다.
완전 요인 설계에는 모든 요인에 대해 가능한 모든 낮은/높은 수준의 조합이 포함됩니다.부분 요인 설계에는 이러한 조합 중 신중하게 선택된 부분 집합이 포함됩니다.부분 집합을 선택하는 기준은 부분 요인 설계 문서에서 자세히 설명합니다.
Frank Yates에 의해 공식화된 Yates 분석은 이러한 설계의 특수 구조를 이용하여 모든 요인 및 모든 관련 교호작용에 대한 요인 효과에 대한 최소 제곱 추정치를 생성합니다.예이츠 분석을 사용하여 다음 질문에 답할 수 있습니다.
- 요인의 순위 목록은 무엇입니까?
- 여러 모형에 대한 적합도(잔차 표준 편차로 측정)는 얼마입니까?
예이츠 분석의 수학적 세부 사항은 박스, 헌터, 헌터(1978)의 10장에 나와 있다.
예이츠 분석은 일반적으로 덱스 평균도 및 덱스 등고선도("dex"는 "실험 설계")와 같은 여러 그래픽 기법으로 보완됩니다.
예이츠 주문
Yates 분석을 수행하기 전에 데이터를 "Yates 순서"로 정렬해야 합니다.즉, k개의 요인이 주어진 경우 k 열은th 2개의 마이너스 기호(즉, 요인의 낮은 수준)와 2개의 플러스 기호(즉, 요인의 높은 수준)로(k - 1) 구성됩니다(k - 1).예를 들어 요인이 세 개인 완전 요인 설계의 경우 설계 행렬은 다음과 같습니다.
부분 요인 설계의 예이츠 순서를 확인하려면 부분 요인 설계의 교란 구조에 대한 지식이 필요합니다.
산출량
예이츠 분석은 다음과 같은 출력을 생성합니다.
- 요인 식별자(예이츠 순서)입니다.특정 식별자는 Yates 분석을 생성하는 데 사용되는 프로그램에 따라 달라집니다.예를 들어, 데이터 슬롯은 3-요인 모형에 다음 항목을 사용합니다.
- 1 = 인자 1
- 2 = 인자 2
- 3 = 인자 3
- 12 = 요인 1과 요인 2의 교호작용
- 13 = 요인 1과 요인 3의 교호작용
- 23 = 요인 2와 요인 3의 교호작용
- 123 = 요인 1, 2, 3의 교호작용
- 중요 요인의 순위 리스트.즉, 가장 큰 크기(가장 유의한 크기)에서 가장 작은 크기(가장 유의하지 않은 크기)로 정렬된 최소 제곱 추정 요인 효과입니다.
- 개별 요인 효과 추정치에 대한 t-값입니다.t-값은 다음과 같이 계산됩니다.
여기서 e는 추정된 요인 효과이고e s는 추정된 요인 효과의 표준 편차입니다.
- 단일 항의 모형에서만 발생하는 잔차 표준 편차입니다.즉, 모형으로부터의 잔차 표준 편차입니다.
여기서i X는 i 요인th 또는 교호작용 효과의 추정치입니다.
- 현재 항에 해당 항 앞의 모든 항을 더한 모형을 사용한 누적 잔차 표준 편차입니다.그것은,
이 값은 단조롭게 감소하는 잔차 표준 편차 집합(모형의 항 수가 증가할수록 더 잘 적합됨을 나타냄)으로 구성됩니다.첫 번째 누적 잔차 표준 편차는 모형에 대한 것입니다.
여기서 상수는 반응 변수의 전체 평균입니다.마지막 누적 잔차 표준 편차는 모형에 대한 것입니다.
이 마지막 모형의 잔차 표준 편차는 0입니다.
항이 추가될 때의 모수 추정치
최소 제곱 적합치의 대부분의 경우 이전에 추가된 항의 모형 계수는 연속적으로 추가된 값에 따라 달라집니다.예를 들어 X 항이 모형에2 포함되었는지 여부에 따라 X 계수가1 변경될 수 있습니다.설계가 직교인 경우에는 완전 요인 설계 2개와3 마찬가지로 해당되지 않습니다.직교 설계의 경우 이전에 포함된 항에 대한 추정치는 항이 추가되어도 변경되지 않습니다.즉, 순차적으로 더 복잡한 모형에 대한 최소 제곱 계수 추정치 역할을 동시에 수행합니다.
모델 선택 및 검증
위의 예이츠 출력에서 예이츠 분석에서 잠재적 모형을 정의할 수 있습니다.예이츠 분석의 중요한 구성 요소는 사용 가능한 잠재적 모형에서 최적의 모형을 선택하는 것입니다.위의 단계에서는 모든 잠재적 모델을 나열합니다.이 리스트에서 가장 적합한 모델을 선택하고 싶습니다.이를 위해서는 다음 두 가지 목표의 균형을 맞춰야 합니다.
- 우리는 그 모형에 모든 중요한 요소들을 포함하기를 원한다.
- 우리는 그 모델이 인색하기를 바란다.즉, 모델은 가능한 한 단순해야 합니다.
즉, 모형에 모든 중요한 요인과 교호작용이 포함되고 중요하지 않은 요인과 교호작용은 생략됩니다.잔차 표준 편차만으로는 요인을 추가하면 항상 감소하므로 가장 적합한 모형을 결정하는 데 충분하지 않습니다.대신 7가지 기준을 사용하여 중요한 요소를 정의합니다.이 7가지 기준이 모두 동일하게 중요한 것은 아니며, 동일한 하위 집합을 산출하지 않으며, 이 경우 합의 부분 집합 또는 가중 합의 부분 집합을 추출해야 한다.실제로 이러한 기준 중 일부는 모든 상황에 적용되지 않을 수 있으며, 일부 분석가는 추가 기준을 가질 수 있다.이러한 기준은 유용한 지침으로 제공됩니다.대부분의 분석가는 가장 유용하다고 생각하는 기준에 초점을 맞출 것입니다.
처음 네 가지 기준은 세 가지 수치 기준과 하나의 그래픽 기준을 사용하여 효과 크기에 초점을 맞춘다.다섯 번째 기준은 평균에 초점을 맞춘다.마지막 두 가지 기준은 모형의 잔차 표준 편차에 초점을 맞춥니다.임시 모형을 선택한 후에는 오차항이 일변량 측정 공정에 대한 가정을 따라야 합니다.즉, 잔차를 분석하여 모형을 검증해야 합니다.
그래픽스 프레젠테이션
일부 분석가는 예이츠 결과를 좀 더 그래픽으로 표시하는 것을 선호할 수 있습니다.특히 다음 그림이 유용할 수 있습니다.
- 순서 데이터 그림
- 순서 절대 효과도
- 누적 잔차 표준 편차 그림
관련 기술
레퍼런스
Box, G. E. P.; Hunter, W. G.; Hunter, J. S. (1978). Statistics for Experimenters: An Introduction to Design, Data Analysis, and Model Building. John Wiley and Sons. ISBN 0-471-09315-7.
이 문서에는 미국 국립표준기술연구소 웹사이트 https://www.nist.gov의 퍼블릭 도메인 자료가 포함되어 있습니다.