제한된 무작위화
Restricted randomization통계에서 제한된 무작위화는 실험 설계에서, 특히 무작위화된 실험과 무작위화된 제어 시험의 맥락에서 발생한다. 제한된 무작위화는 무작위화의 이론적 이점을 유지하면서 직관적으로 실험 단위에 대한 낮은 치료법 배분을 피할 수 있게 한다.[1][2] 예를 들어, 대조군과 비교하여 새로 제안된 비만 치료의 임상 실험에서 실험자는 새로운 치료법이 가장 무거운 환자에게만 할당되었던 무작위화의 결과를 피하고자 할 것이다.
이 개념은 프랭크 예이츠([full citation needed]1948)와 윌리엄 유든([full citation needed]1972)에 의해 "설계된 실험에서 치료의 나쁜 공간적 패턴을 피하는 방법"으로 소개되었다.[3]
내포 데이터 예제
각 실행에서 7개의 모니터 웨이퍼를 사용하는 배치 프로세스를 고려하십시오. 이 계획은 또한 9개 지점의 각 웨이퍼에 대한 반응 변수를 측정하는 것을 요구한다. 샘플링 계획의 조직은 계층 구조 또는 내포 구조를 가지고 있다. 즉, 배치 실행은 최상위 레벨이고, 두 번째 레벨은 개별 웨이퍼, 세 번째 레벨은 웨이퍼의 현장이다.
일괄 실행당 생성되는 데이터의 총량은 7/9 = 63 관측치일 것이다. 이러한 데이터를 분석하는 한 가지 접근방식은 표준 편차뿐만 아니라 이러한 모든 점의 평균을 계산하여 각 런에 대한 반응으로 사용하는 것이다.
위에 제시된 데이터를 분석하는 것은 절대적으로 잘못된 것은 아니지만 그렇게 하는 것은 다른 사람이 얻을 수 있는 정보를 잃게 된다. 예를 들어 웨이퍼 1의 사이트 1은 웨이퍼 2 또는 다른 웨이퍼의 사이트 1과 물리적으로 다르다. 웨이퍼에 있는 사이트도 마찬가지다. 마찬가지로, 1번 주행의 웨이퍼 1은 2번 주행의 웨이퍼 1과 물리적으로 다르다. 이 상황을 설명하기 위해 사이트는 웨이퍼 내에 중첩되어 있는 반면 웨이퍼는 런 내에 중첩되어 있는 것으로 한다.
이 보금자리 결과, 실험에서 발생할 수 있는 무작위화에 대한 제약이 있다. 이러한 종류의 제한된 무작위화는 항상 내포된 변동원을 생성한다. 이 페이지에서 설명하는 내포된 변동 또는 제한된 무작위화의 예로는 분할구 및 스트립구 설계를 들 수 있다.
이러한 유형의 샘플링 계획에 대한 실험의 목적은 일반적으로 프로세스에서 실행(또는 배치) 내 웨이퍼 및 웨이퍼의 부지에 기인하는 변동성을 줄이는 것이다. 웨이퍼와 일괄 내 웨이퍼의 부위는 원치 않는 변동의 원천이 되고 조사자는 시스템을 그러한 원천에 대해 견고하게 만들려고 한다. 즉, 그러한 실험에서 웨이퍼와 부지를 소음 요인으로 취급할 수 있다.
웨이퍼와 부위는 원치 않는 변동원을 나타내며, 목표 중 하나가 이러한 변동원에 대한 공정 민감도를 줄이는 것이기 때문에, 데이터 분석에서 웨이퍼와 부지를 무작위 효과로 취급하는 것이 합리적인 접근법이다. 즉, 내포된 변동은 내포된 무작위 효과 또는 내포된 소음원을 말하는 또 다른 방법이다. 요인 "웨이퍼"와 "사이트"를 랜덤 효과로 취급하는 경우 분산 분석 기법을 통해 각 변동의 원천으로 인한 분산 성분을 추정할 수 있다. 일단 분산 성분의 추정치를 얻으면, 조사자는 실험 중인 공정에서 가장 큰 변동의 근원을 결정할 수 있으며, 또한 가장 큰 선원에 대한 다른 변동의 근원을 결정할 수 있다.
내포된 랜덤 효과
실험이나 공정이 내포된 변동을 갖는 경우, 실험이나 공정은 그 출력에 영향을 미치는 여러 가지 랜덤 오차원을 갖는다. 모형에 내포된 랜덤 효과를 갖는 것은 모형에 내포된 변동을 갖는 것과 동일하다.
분할구 설계
분할구 설계는 실험 중에 특정 유형의 제한된 무작위화가 발생한 경우 발생한다. 단순 요인 실험은 실험이 실제로 실행된 방법 때문에 분할구 형식의 설계로 이어질 수 있다.
많은 산업 실험에서 세 가지 상황이 종종 발생한다.
- 관심 요소 중 일부는 '변하기 어려운' 반면 나머지 요소들은 변하기 쉽다. 그 결과 실험에 대한 처리 조합이 실행되는 순서는 이러한 '이해하기 어려운' 요인의 순서에 따라 결정된다.
- 실험 단위는 특정 치료 조합에서 하나 이상의 요인에 대한 배치로서 함께 처리된다.
- 실험 단위는 동일한 치료 조합에 대해 해당 치료 조합에 대한 요인 설정을 재설정하지 않고 개별적으로 처리된다.
분할구 실험 예제
위의 세 가지 상황 중 하나에 따라 실험을 수행하면 대개 분할구 형식의 설계가 발생한다. 구리 스트립에 알루미늄(무수) 전기 도금을 검사하는 실험을 고려해 보십시오. 관심 요인은 전류(A), 용액 온도(T), 도금제(S)의 용액 농도 등 3가지다. 도금률은 측정된 반응이다. 이 실험에는 총 16개의 구리 스트립이 이용 가능하다. 실행할 처리 조합(정통적으로 스케일링됨)은 표준 순서(즉, 무작위화되지 않음)로 아래에 나열되어 있다.
현재 | 온도 | 집중력 |
---|---|---|
−1 | −1 | −1 |
−1 | −1 | +1 |
−1 | +1 | −1 |
−1 | +1 | +1 |
+1 | −1 | −1 |
+1 | −1 | +1 |
+1 | +1 | −1 |
+1 | +1 | +1 |
예제: 변경하기 어려운 일부 요인
도금제(S)의 인자용액 농도를 달리하기 어려운 상태에서 위에 나열된 첫 번째 조건에서 실험을 실행하는 것을 고려해 보십시오. 이 인자는 변하기 어렵기 때문에 실험자는 처리 조합을 랜덤화하여 용액 농도 인자의 변경 횟수를 최소화하고자 한다. 즉, 처리 런의 무작위화는 용액 농도계수 수준에 의해 어느 정도 제한된다.
따라서 한 농도 수준(-1)에 해당하는 처리 런이 먼저 실행되도록 처리 조합을 랜덤화할 수 있다. 각 구리 스트립은 개별적으로 도금되며, 이는 주어진 처리 조합을 위해 한 번에 하나의 스트립만 용액에 배치된다는 것을 의미한다. 낮은 수준의 용액 농도에서의 4회 주행이 완료되면 고농도(1)로 용액을 변경하고 실험의 나머지 4회 주행을 수행한다(다시 한 번 각 스트립은 개별적으로 도금한다).
실험의 완전한 복제가 완료되면, 주어진 용액 농도에 대해 처리된 네 개의 구리 스트립 세트를 사용하여 두 번째 반복실험을 수행한 후 농도를 변경하고 나머지 네 개의 스트립을 처리한다. 나머지 두 요인의 수준은 여전히 랜덤화할 수 있다는 점에 유의하십시오. 또한 복제 실행 시 가장 먼저 실행되는 농도 수준도 임의화할 수 있다.
이러한 방법으로 실험을 실행하면 분할구 설계가 된다. 용액 농도를 전체 플롯 인자로 알고 하위 플롯 인자는 전류와 용액 온도라고 한다.
분할구 설계에는 둘 이상의 크기의 실험 단위가 있다. 이 실험에서 한 가지 크기의 실험 단위는 개별 구리 스트립이다. 개별 스트립에 적용된 치료법이나 요인은 용액 온도와 전류(이 요인들은 용액에 새 스트립을 넣을 때마다 변경되었다)이다. 다른 또는 더 큰 크기의 실험 단위는 네 개의 구리 스트립으로 구성된 세트다. 4개의 스트립 세트에 적용된 처리 또는 인자는 용액 농도(이 인자는 4개의 스트립을 처리한 후 변경됨)이다. 더 작은 크기의 실험 단위를 하위구 실험 단위라고 하고, 더 큰 실험 단위를 전체 플롯 단위라고 한다.
이 실험에는 16개의 하위구 실험 단위가 있다. 솔루션 온도와 전류는 이 실험의 하위 플롯 요인이다. 이 실험에는 네 개의 전체 플롯 실험 단위가 있다. 용액 농도는 이 실험의 전체 플롯 요인이다. 실험 단위의 크기가 두 가지 크기 때문에 모형에는 두 개의 오차항이 있는데, 하나는 전구 오차 또는 전구 실험 단위에 해당하는 오차항과 다른 하나는 하위구 오차 또는 하위구 실험 단위에 해당하는 오차항이 있다.
이 실험의 분산 분석표는 부분적으로 다음과 같이 보일 것이다.
출처 | DF |
---|---|
복제 | 1 |
집중력 | 1 |
오차(홀 그림) = 대표 × 콩크 | 1 |
온도 | 1 |
Rep × Temp | 1 |
현재 | 1 |
담당자 × 전류 | 1 |
온도 × 콩크 | 1 |
Rep × Temp × Conc | 1 |
온도 × 전류 | 1 |
리프 × 온도 × 전류 | 1 |
전류 × 콩크 | 1 |
회원 × 전류 × 콩크 | 1 |
온도 × 전류 × 콩크 | 1 |
오류(하위 그림) = Rep × Temp × Current × Conc. | 1 |
처음 세 선원은 전체구 수준에서 나온 반면, 다음 12 선원은 하위구 부분에서 나온 것이다. 12개의 하위구 항 추정치의 정규 확률도를 사용하여 통계적으로 유의한 항을 찾을 수 있다.
예제: 배치 프로세스
위에 나열된 두 번째 조건(즉, 한 번에 네 개의 구리 스트립을 용액에 넣는 공정)에서 실험을 실행하는 것을 고려하십시오. 특정 수준의 전류를 용액 내의 개별 스트립에 적용할 수 있다. 첫 번째 시나리오에서 실행된 것과 동일한 16개의 처리 조합(복제된 2개의3 요인)이 실행된다. 그러나 실험의 수행 방식은 다를 것이다. 용액 온도와 용액 농도의 처리 조합은 (-1, -1, 1) (-1, -1) (1, 1)의 네 가지가 있다. 실험자는 이 네 가지 치료법 중 하나를 무작위로 선택하여 먼저 설정한다. 네 개의 구리 스트립을 용액에 넣는다. 4개의 스트립 중 2개는 무작위로 낮은 전류 레벨에 할당된다. 나머지 두 스트립은 높은 전류 레벨에 할당된다. 도금 작업을 수행하고 반응을 측정한다. 온도와 농도의 두 번째 치료 조합을 선택하고 동일한 절차를 따른다. 이 작업은 네 가지 온도/농도 조합 모두에 대해 수행된다.
이러한 방식으로 실험을 실행하면 전체 플롯 인자가 현재 솔루션 농도와 솔루션 온도가 되고 하위 플롯 인자가 전류인 분할구 설계도 생성된다.
이 실험에서, 한 가지 크기의 실험 단위는 다시 개별 구리 스트립이다. 개별 스트립에 적용된 처리 또는 인자는 전류가 된다(이 인자는 용액 내의 다른 스트립에 대해 매번 변경되었다). 다른 또는 더 큰 크기의 실험 단위는 다시 네 개의 구리 스트립으로 구성된 세트다. 4개의 스트립 세트에 적용된 치료법이나 요인은 용액 농도 및 용액 온도(이 요인들은 4개의 스트립을 처리한 후에 변경됨)이다.
더 작은 크기의 실험 단위를 다시 하위구 실험 단위라고 한다. 이 실험에는 16개의 하위구 실험 단위가 있다. 전류는 이 실험의 하위 플롯 요인이다.
더 큰 크기의 실험 단위는 전체 플롯 실험 단위다. 이 실험에는 4개의 전체 플롯 실험 단위가 있으며, 이 실험에서는 용액 농도 및 용액 온도가 전체 플롯 인자이다.
실험 단위에는 두 가지 크기가 있으며 모형에는 두 가지 오차항이 있는데, 하나는 전구 오차 또는 전구 실험 단위에 해당하는 오차항과 하위구 오차 또는 하위구 실험 단위에 해당하는 오차항이 있다.
이 실험의 분산 분석은 부분적으로 다음과 같이 보인다.
출처 | DF |
---|---|
집중력 | 1 |
온도 | 1 |
오차(홀 그림) = 콩크 × 온도 | 1 |
현재 | 1 |
콩크 × 전류 | 1 |
온도 × 전류 | 1 |
콩크 × 온도 × 전류 | 1 |
오류(하위 그림) | 8 |
처음 3개의 선원은 전체구 수준에서 나오고 다음 5개는 하위구 수준에서 나온다. 하위구 오차항에는 8도의 자유도가 있으므로 이 MSE를 사용하여 전류를 수반하는 각 효과를 시험할 수 있다.
예: 개별적으로 처리된 실험 단위
위에 나열된 세 번째 시나리오에서 실험을 실행하는 것을 고려해 보십시오. 용액에는 한 번에 하나의 구리 줄무늬만 있다. 단, 저전류에서 1개, 고전류에서 1개 등 2개의 스트립은 동일한 온도 및 농도 설정 하에서 각각 1개씩 처리한다. 두 스트립이 처리되면 농도가 변경되고 온도가 다른 조합으로 재설정된다. 이 온도 및 농도 설정 하에서 스트립 2개가 차례로 처리된다. 이 과정은 16개의 구리 스트립이 모두 처리될 때까지 계속된다.
이러한 방식으로 실험을 실행하면 전체 플롯 요인이 다시 솔루션 농도와 용액 온도이고 하위 플롯 인자가 전류인 분할구 설계도 생성된다. 이 실험에서 한 가지 크기의 실험 단위는 개별 구리 스트립이다. 개별 스트립에 적용된 처리 또는 인자는 전류가 된다(이 인자는 용액 내의 다른 스트립에 대해 매번 변경되었다). 다른 또는 더 큰 크기의 실험 단위는 두 개의 구리 스트립으로 구성된 세트다. 두 스트립의 한 쌍에 적용되는 치료법이나 요인은 용액 농도 및 용액 온도(이 요인들은 두 스트립을 처리한 후 변경됨)이다. 더 작은 크기의 실험 단위를 하위구 실험 단위라고 한다.
이 실험에는 16개의 하위구 실험 단위가 있다. 전류는 실험에서 하위 플롯 요인이다. 이 실험에는 8개의 전체 플롯 실험 단위가 있다. 용액 농도 및 용액 온도는 전체 플롯 요인이다. 모형에는 두 개의 오차항이 있는데, 하나는 전구 오차 또는 전구 실험 단위에 해당하는 것이고, 하나는 하위구 오차 또는 하위구 실험 단위에 해당하는 오차항이 있다.
이(3번째) 접근법에 대한 분산 분석은 부분적으로 다음과 같다.
출처 | DF |
---|---|
집중력 | 1 |
온도 | 1 |
콩크*템프 | 1 |
오류(전체 그림) | 4 |
현재 | 1 |
콩크 × 전류 | 1 |
온도 × 전류 | 1 |
콩크 × 온도 × 전류 | 1 |
오류(하위 그림) | 4 |
처음 네 항은 주구 분석에서 나왔고 다음 다섯 항은 하위구 분석에서 나왔다. 주구 및 하위구 효과에 대해 각각 자유도 4도에 기초한 별도의 오차항이 있다는 점에 유의하십시오.
이러한 세 가지 시나리오에서 볼 수 있듯이 분할구 설계 대 단순 요인 설계의 주요 차이 중 하나는 실험에서 서로 다른 크기의 실험 단위 수입니다. 분할구 설계에는 둘 이상의 크기 실험 단위, 즉 두 개 이상의 오차항이 있다. 이러한 설계는 서로 다른 크기의 실험 단위와 다른 분산을 포함하므로 다양한 평균 비교의 표준 오차는 하나 이상의 분산을 포함한다. 분할구 설계에 적합한 모형을 지정하려면 실험 단위의 각 크기를 식별할 수 있어야 한다. 실험 단위가 설계 구조(예: 완전 랜덤화 설계 대 랜덤화 완전 블럭 설계) 및 처리 구조(예: 완전 2 요인3, 분해능 V 반분율, 제어 그룹이 있는 이원 처리 구조 등)에 대해 정의되는 방법. 둘 이상의 크기 실험 단위를 가진 결과, 분할구 설계를 분석하는 데 사용되는 적절한 모형은 혼합 모형이다.
모형에 사용된 오차항 하나만 사용하여 실험 데이터를 분석하는 경우, 결과로부터 오해의 소지가 있고 잘못된 결론을 도출할 수 있다.
스트립 플롯 설계
분할구 설계와 유사하게 스트립구 설계는 실험 중에 제한된 무작위화의 어떤 유형이 발생했을 때 발생할 수 있다. 단순 요인 설계는 실험이 수행된 방법에 따라 스트립 플롯 설계를 유발할 수 있다. 스트립 플롯 설계는 종종 각 공정 단계가 배치 프로세스인 두 개 이상의 공정 단계에 걸쳐 수행되는 실험에서 비롯된다. 즉, 실험의 각 처리 조합을 완료하려면 각 공정 단계에서 함께 처리된 실험 단위와 두 개 이상의 처리 단계가 필요하다. 분할구 설계에서와 같이, 스트립구 설계는 실험의 무작위화가 어떤 식으로든 제한되었을 때 발생한다. 스트립 플롯 설계에서 발생하는 제한된 무작위화의 결과, 여러 가지 크기의 실험 단위가 있다. 따라서 설계에 관심 있는 요인을 검정하는 데 사용되는 오차항 또는 오차 분산이 서로 다르다. 전통적인 스트립 플롯 설계에는 세 가지 크기의 실험 단위가 있다.
스트립 플롯 예제: 2단계 및 3개 요인 변수
반도체 산업의 다음 예를 생각해 보자. 실험에는 임플란트 스텝과 안네알 스텝이 필요하다. 안네알과 임플란트 단계 모두에서 테스트해야 할 세 가지 요인이 있다. 임플란트 프로세스는 12개의 웨이퍼를 일괄적으로 수용하며, 특정 조건 하에서 웨이퍼 1개를 삽입하는 것은 실용적이지 않으며, 그렇게 하는 것은 임플란터의 경제적 사용을 의미하지도 않는다. 안네알로는 최대 100개의 웨이퍼를 처리할 수 있다.
삽입물 단계의 세 가지 요인에 대한 2-수준 요인 설계의 설정은 (A, B, C)로 표시되며, 안절 단계의 세 가지 요인에 대한 2-수준 요인 설계는 (D, E, F)로 표시된다. 또한 임플란트 인자와 안네알 인자의 상호작용 효과도 존재한다. 따라서 이 실험은 세 가지 크기의 실험 단위를 포함하며, 각 단위는 효과의 유의성을 추정하기 위한 고유한 오차항이 있다.
위의 예에서 각 실험 단위에 실제 물리적 의미를 부여하려면 삽입물 및 안네일 스텝의 각 조합을 개별 웨이퍼로 고려하십시오. 8개의 웨이퍼가 먼저 임플란트 단계를 거친다. A, B, C 인자의 치료 조합 3은 첫 번째 임플란트 치료 시행이다. 이 임플란트 치료는 8개 웨이퍼 모두에 한꺼번에 적용된다. 첫 번째 임플란트 치료가 끝나면 8개의 웨이퍼 세트에 A, B, C 요인의 5가지 치료 조합이 이식된다. 이는 마지막 8개 웨이퍼 배치에서 요인 A, B, C의 치료 조합 6을 이식할 때까지 계속된다. 임플란트 인자의 8가지 치료 조합이 모두 실행되면 안느러미 단계가 시작된다. 첫 번째로 실행될 안느러미 치료 조합은 요인 D, E, F의 치료 조합 5이다. 이 안네알 치료 조합은 8개의 웨이퍼 세트에 적용되며, 이들 8개의 웨이퍼 각각은 8개의 임플란트 치료 조합 중 하나에서 나온 것이다. 이 첫 번째 배치의 웨이퍼를 분쇄한 후, 두 번째 안네알 처리법은 두 번째 배치의 8개의 웨이퍼에 적용되며, 이 8개의 웨이퍼는 8개의 임플란트 처리 조합 각각 한 개씩에서 나온다. 이는 마지막 8개 웨이퍼 배치에서 D, E, F 요인의 특정 조합을 이식할 때까지 계속된다.
이러한 방식으로 실험을 실행하면 세 가지 크기의 실험 단위가 있는 스트립 플롯 설계가 된다. 함께 이식되는 8개의 웨이퍼 세트는 삽입 계수 A, B, C와 이들의 모든 상호작용에 대한 실험 단위다. 임플란트 인자에 대한 8개의 실험 단위가 있다. 다른 8개의 웨이퍼 세트가 함께 잘려져 있다. 이 서로 다른 8개 웨이퍼 세트는 두 번째 크기의 실험 단위로서 안네 요인 D, E 및 F와 이들의 모든 상호작용에 대한 실험 단위다. 세 번째 크기의 실험 유닛은 단일 웨이퍼다. 이것은 임플란트 인자와 안네알 인자의 모든 상호작용 효과에 대한 실험 단위다.
실제로, 위의 스트립 플롯 설계에 대한 설명은 이 실험의 한 블럭 또는 하나의 반복실험을 나타낸다. 실험에 복제가 없고 임플란트 모형에 주효과와 2-요인 상호작용만 포함된 경우, 3-요인 상호작용 용어 A*B*C(1도 자유도)는 임플란트 실험 단위 내 효과 추정에 대한 오차항을 제공한다. 안네 실험 단위에 대해 유사한 모델을 호출하면 안네 실험 단위 내 효과에 대한 오차항(1도 자유도)에 대한 3-요인 상호작용 항 D*E*F가 생성된다.
참고 항목
참조
- ^ Dodge, Y. (2006). The Oxford Dictionary of Statistical Terms. OUP. ISBN 978-0-19-920613-1.
- ^ Grundy, P.M.; Healy, M.J.R. "Restricted randomization and quasi-Latin squares". Journal of the Royal Statistical Society, Series B. 12: 286–291.
- ^ Bailey, R. A. (1987). "Restricted Randomization: A Practical Example". Journal of the American Statistical Association. 82 (399): 712–719. doi:10.1080/01621459.1987.10478487. JSTOR 2288775.
- "How can I account for nested variation (restricted randomization)?". (U.S.) National Institute of Standards and Technology: Information Technology Laboratory. Retrieved March 26, 2012.
추가 읽기
이러한 설계와 적절한 분석 절차에 대한 자세한 내용은 다음을 참조하십시오.
- Milliken, G. A.; Johnson, D. E. (1984). Analysis of Messy Data. Vol. 1. New York: Van Nostrand Reinhold.
- Miller, A. (1997). "Strip-Plot Configuration of Fractional Factorials". Technometrics. 39 (2): 153–161. doi:10.2307/1270903. JSTOR 1270903.
외부 링크
이 글은 국립표준기술원 웹사이트 https://www.nist.gov의 공공 도메인 자료를 통합한 것이다.