예이츠 분석

Yates analysis

통계학에서 예이츠 분석은 요인 설계를 사용한 설계 실험에서 얻은 데이터를 분석하는 방법입니다.완전 및 부분 요인 설계는 엔지니어링 및 과학적 응용을 위해 설계된 실험에서 일반적으로 사용됩니다.이러한 설계에서는 각 요인에 두 가지 수준이 할당됩니다.이러한 레벨을 보통 로우 레벨과 하이 레벨이라고 부릅니다.계산을 위해 낮은 수준에는 -1의 값이 할당되고 높은 수준에는 +1의 값이 할당되도록 요인의 크기가 조정됩니다.이들은 일반적으로 "-" 및 "+"라고도 합니다.

완전 요인 설계에는 모든 요인에 대해 가능한 모든 낮은/높은 수준의 조합이 포함됩니다.부분 요인 설계에는 이러한 조합 중 신중하게 선택된 부분 집합이 포함됩니다.부분 집합을 선택하는 기준은 부분 요인 설계 문서에서 자세히 설명합니다.

Frank Yates에 의해 공식화된 Yates 분석은 이러한 설계의 특수 구조를 이용하여 모든 요인 및 모든 관련 교호작용에 대한 요인 효과에 대한 최소 제곱 추정치를 생성합니다.예이츠 분석을 사용하여 다음 질문에 답할 수 있습니다.

  1. 요인의 순위 목록은 무엇입니까?
  2. 여러 모형에 대한 적합도(잔차 표준 편차로 측정)는 얼마입니까?

예이츠 분석의 수학적 세부 사항은 박스, 헌터, 헌터(1978)의 10장에 나와 있다.

예이츠 분석은 일반적으로 덱스 평균도 및 덱스 등고선도("dex"는 "실험 설계")와 같은 여러 그래픽 기법으로 보완됩니다.

예이츠 주문

Yates 분석을 수행하기 전에 데이터를 "Yates 순서"로 정렬해야 합니다.즉, k개의 요인이 주어진 경우 k th 2개의 마이너스 기호(즉, 요인의 낮은 수준)와 2개의 플러스 기호(즉, 요인의 높은 수준)로(k - 1) 구성됩니다(k - 1).예를 들어 요인이 세 개인 완전 요인 설계의 경우 설계 행렬은 다음과 같습니다.

부분 요인 설계의 예이츠 순서를 확인하려면 부분 요인 설계의 교란 구조에 대한 지식이 필요합니다.

산출량

예이츠 분석은 다음과 같은 출력을 생성합니다.

  • 요인 식별자(예이츠 순서)입니다.특정 식별자는 Yates 분석을 생성하는 데 사용되는 프로그램에 따라 달라집니다.를 들어, 데이터 슬롯은 3-요인 모형에 다음 항목을 사용합니다.
1 = 인자 1
2 = 인자 2
3 = 인자 3
12 = 요인 1과 요인 2의 교호작용
13 = 요인 1과 요인 3의 교호작용
23 = 요인 2와 요인 3의 교호작용
123 = 요인 1, 2, 3의 교호작용
  • 중요 요인의 순위 리스트.즉, 가장 큰 크기(가장 유의한 크기)에서 가장 작은 크기(가장 유의하지 않은 크기)로 정렬된 최소 제곱 추정 요인 효과입니다.
  • 개별 요인 효과 추정치에 대한 t-값입니다.t-값은 다음과 같이 계산됩니다.

여기서 e는 추정된 요인 효과이고e s는 추정된 요인 효과의 표준 편차입니다.

  • 단일 항의 모형에서만 발생하는 잔차 표준 편차입니다.즉, 모형으로부터의 잔차 표준 편차입니다.

여기i X는 i 요인th 또는 교호작용 효과의 추정치입니다.

  • 현재 항에 해당 항 앞의 모든 항을 더한 모형을 사용한 누적 잔차 표준 편차입니다.그것은,

이 값은 단조롭게 감소하는 잔차 표준 편차 집합(모형의 항 수가 증가할수록 더 잘 적합됨을 나타냄)으로 구성됩니다.첫 번째 누적 잔차 표준 편차는 모형에 대한 것입니다.

여기서 상수는 반응 변수의 전체 평균입니다.마지막 누적 잔차 표준 편차는 모형에 대한 것입니다.

이 마지막 모형의 잔차 표준 편차는 0입니다.

항이 추가될 때의 모수 추정치

최소 제곱 적합치의 대부분의 경우 이전에 추가된 항의 모형 계수는 연속적으로 추가된 값에 따라 달라집니다.예를 들어 X 항이 모형2 포함되었는지 여부에 따라 X 계수1 변경될 수 있습니다.설계가 직교인 경우에는 완전 요인 설계 2개와3 마찬가지로 해당되지 않습니다.직교 설계의 경우 이전에 포함된 항에 대한 추정치는 항이 추가되어도 변경되지 않습니다.즉, 순차적으로 더 복잡한 모형에 대한 최소 제곱 계수 추정치 역할을 동시에 수행합니다.

모델 선택 및 검증

위의 예이츠 출력에서 예이츠 분석에서 잠재적 모형을 정의할 수 있습니다.예이츠 분석의 중요한 구성 요소는 사용 가능한 잠재적 모형에서 최적의 모형을 선택하는 것입니다.위의 단계에서는 모든 잠재적 모델을 나열합니다.이 리스트에서 가장 적합한 모델을 선택하고 싶습니다.이를 위해서는 다음 두 가지 목표의 균형을 맞춰야 합니다.

  1. 우리는 그 모형에 모든 중요한 요소들을 포함하기를 원한다.
  2. 우리는 그 모델이 인색하기를 바란다.즉, 모델은 가능한 한 단순해야 합니다.

즉, 모형에 모든 중요한 요인과 교호작용이 포함되고 중요하지 않은 요인과 교호작용은 생략됩니다.잔차 표준 편차만으로는 요인을 추가하면 항상 감소하므로 가장 적합한 모형을 결정하는 데 충분하지 않습니다.대신 7가지 기준을 사용하여 중요한 요소를 정의합니다.이 7가지 기준이 모두 동일하게 중요한 것은 아니며, 동일한 하위 집합을 산출하지 않으며, 이 경우 합의 부분 집합 또는 가중 합의 부분 집합을 추출해야 한다.실제로 이러한 기준 중 일부는 모든 상황에 적용되지 않을 수 있으며, 일부 분석가는 추가 기준을 가질 수 있다.이러한 기준은 유용한 지침으로 제공됩니다.대부분의 분석가는 가장 유용하다고 생각하는 기준에 초점을 맞출 것입니다.

  1. 효과의 실제적 의미
  2. 효과의 크기 순서
  3. 효과의 통계적 유의성
  4. 효과 확률도
  5. Youden 평균 그림
  6. 잔차 표준 편차의 실제적 유의성
  7. 잔류 표준 편차의 통계적 유의성

처음 네 가지 기준은 세 가지 수치 기준과 하나의 그래픽 기준을 사용하여 효과 크기에 초점을 맞춘다.다섯 번째 기준은 평균에 초점을 맞춘다.마지막 두 가지 기준은 모형의 잔차 표준 편차에 초점을 맞춥니다.임시 모형을 선택한 후에는 오차항이 일변량 측정 공정에 대한 가정을 따라야 합니다.즉, 잔차를 분석하여 모형을 검증해야 합니다.

그래픽스 프레젠테이션

일부 분석가는 예이츠 결과를 좀 더 그래픽으로 표시하는 것을 선호할 수 있습니다.특히 다음 그림이 유용할 수 있습니다.

  1. 순서 데이터 그림
  2. 순서 절대 효과도
  3. 누적 잔차 표준 편차 그림

관련 기술

레퍼런스

Box, G. E. P.; Hunter, W. G.; Hunter, J. S. (1978). Statistics for Experimenters: An Introduction to Design, Data Analysis, and Model Building. John Wiley and Sons. ISBN 0-471-09315-7.

Public Domain이 문서에는 미국 국립표준기술연구소 웹사이트 https://www.nist.gov의 퍼블릭 도메인 자료가 포함되어 있습니다.

외부 링크