블로킹(통계정보)
Blocking (statistics)![]() |
실험 설계의 통계 이론에서 블럭화는 실험 단위를 서로 유사한 그룹(블록)으로 배열하는 것입니다.블로킹을 사용하여 의사 복제 문제를 해결할 수 있습니다.
사용하다
블럭화는 설명할 수 없는 변동성을 줄여줍니다.그 원리는 극복할 수 없는 변동성(예: 화학 물질 한 용기를 생산하기 위해 두 개의 원료 배치가 필요함)이 최종 생산물에 미치는 영향을 제거하기 위해 a(n)(고차/고차) 상호작용과 혼동되거나 별칭화된다는 사실에 있다.고차 상호작용은 일반적으로 가장 덜 중요하다(원료 배치 또는 원자로의 온도가 두 가지 조합보다 더 중요하다는 사실을 생각한다. 이는 특히 더 많은 (3, 4, ...) 요인이 존재할 때 해당된다). 따라서 이 변동성을 더 높은 상호작용과 혼동하는 것이 바람직하다.
예
- 남성 및 여성:실험은 환자에게 신약을 시험하기 위한 것이다.이중 블라인드 시험에서 남성과 여성 환자에게 투여되는 치료에는 약물 및 위약이라는 두 가지 수준이 있습니다.환자의 성별은 남성과 여성 사이의 치료 차이를 설명하는 차단 요인이다.이렇게 하면 변동의 원인이 줄어들기 때문에 정밀도가 높아집니다.
- 표고:특정 풀밭에 대한 새로운 살충제의 영향을 테스트하기 위한 실험이 고안되었습니다.잔디 영역은 큰 표고 변화를 포함하므로 '높은 표고'와 '낮은 표고'라는 두 개의 뚜렷한 영역으로 구성됩니다.처리군(신규 살충제)과 플라시보군은 풀의 고지대 및 저지대 양쪽에 적용된다.이 경우 연구자는 농약 도포의 변동성을 설명할 수 있는 상승 인자를 차단하고 있습니다.
- 개입:신발 밑창을 더 오래 지속할 수 있는 공정이 발명되어 현장 시험을 수행할 계획이 수립되었다고 가정합니다.n명의 지원자 그룹이 주어진 경우, 가능한 설계 중 하나는 n/2에게 새 밑창을, n/2는 일반 밑창을, n/2는 두 종류의 밑창을 무작위로 할당하는 것이다.이러한 유형의 실험은 완전히 랜덤화된 설계입니다.그리고 나서 두 그룹 모두 신발을 일정 기간 사용하고, 그 후 밑창의 마모 정도를 측정하도록 요구받습니다.이것은 실행 가능한 실험 설계이지만, 순수하게 통계적 정확성의 관점에서 (다른 요소를 무시한) 더 나은 설계는 각 지원자의 왼쪽과 오른쪽 신발에 두 가지 유형을 무작위로 할당하면서 각 사람에게 하나의 일반 밑창과 하나의 새로운 밑창을 주는 것이다.이러한 설계를 "랜덤화 완전 블록 설계"라고 합니다.이 설계는 각 개인이 자신의 대조군으로 작용하기 때문에 첫 번째 설계보다 더 민감할 것이다. 따라서 대조군은 치료 그룹 블록 설계와 더 밀접하게 일치하기 때문이다.
실험 설계의 통계 이론에서 블럭화는 실험 단위를 서로 유사한 그룹(블록)으로 배열하는 것입니다.일반적으로 블럭화 인자는 실험자가 주로 관심을 갖지 않는 변동성의 원천입니다.차단 인자의 예로는 환자의 성별이 있을 수 있습니다. 성별을 차단함으로써 이 변동의 원천이 제어되므로 정확도가 높아집니다.
확률론에서 블럭 방법은 블럭이 거의 독립적인 것으로 간주될 수 있도록 표본을 더 작은 하위 블럭으로 구분된 블럭(그룹)으로 분할하는 것으로 구성됩니다.블럭 방법은 종속 랜덤 변수의 경우 한계 정리를 증명하는 데 도움이 됩니다.
블록 방식은 S에 의해 도입되었습니다. 번스타인:[1]이 방법은 의존적 랜덤 변수의 합계 이론과 극단적 가치 [2][3][4]이론에서 성공적으로 적용되었다.
제어할 수 있는 방해 요인에 사용되는 블럭화
방해 요인을 제어할 수 있는 경우, 방해 요인에 의해 야기되는 실험 오류에 대한 기여도를 줄이거나 제거하기 위해 차단이라고 알려진 중요한 기술을 사용할 수 있습니다.기본 개념은 방해 요인이 일정하게 유지되고 관심 요소가 변동될 수 있는 균질 블록을 생성하는 것입니다.블럭 내에서 분석에서 설명하는 블럭 요인의 변화로 인한 변동에 대해 걱정할 필요 없이 관심 요인의 다양한 수준의 효과를 평가할 수 있습니다.
블럭화 요인의 정의
교란 요인은 1차 요인의 모든 수준이 교란 요인의 각 수준에서 동일한 횟수로 발생하는 경우 블럭화 인자로 사용됩니다.실험 분석은 실험의 각 블럭 내에서 주요 요인의 다양한 수준의 효과에 초점을 맞출 것입니다.
가장 중요한 방해 요인 중 몇 가지를 차단합니다.
일반적인 규칙은 다음과 같습니다.
- "할 수 있는 것은 차단하고, 할 수 없는 것은 랜덤화하십시오."
블럭화는 몇 가지 가장 중요한 방해 변수의 효과를 제거하는 데 사용됩니다.그런 다음 랜덤화를 사용하여 나머지 방해 변수의 오염 효과를 줄입니다.중요한 방해 변수의 경우 블럭화가 랜덤화보다 관심 변수에서 더 큰 유의성을 산출합니다.
테이블
랜덤화 블럭 실험을 살펴보는 한 가지 유용한 방법은 전체 실험의 블럭 중 하나 내에서 실행되는 완전한 랜덤화 실험의 집합으로 간주하는 것입니다.
의장명 | 요인 수 k | 실행 수 n |
---|---|---|
2 요소 RBD | 2 | L1 * L2 |
3 요소 RBD | 3 | L1 * L2 * L3 |
4 요소 RBD | 4 | L1 * L2 * L3 * L4 |
k계수 RBD | k | L1 * L2 * {style \ } * Lk |
와 함께
- L1 = 요인 1의 수준(표준) 수
- L2 = 요인 2의 수준(표준) 수
- L3 = 요인 3의 수준(표준) 수
- L4 = 요인 4의 수준(표준) 수
- Lk = 요인 k의 수준(표준) 수
예
반도체 제조 시설의 엔지니어가 용해로에서 확산 공정을 수행한 후 서로 다른 웨이퍼 임플란트 재료 선량이 저항률 측정에 유의한 영향을 미치는지 여부를 검정하려고 한다고 가정합니다.시험하고자 하는 4가지 용량과 각 용량에서 3개의 웨이퍼를 실행할 수 있는 충분한 양의 실험 웨이퍼가 있습니다.
각 용해로 실행이 마지막과 다르고 많은 공정 매개변수에 영향을 미치는 것으로 알려져 있기 때문에 이들이 우려하는 장애 요인은 "화로 실행"입니다.
이 실험을 실행하는 이상적인 방법은 모든 4x3=12 웨이퍼를 동일한 용해로에서 실행하는 것입니다.그러면 불필요한 용해로 요소를 완전히 제거할 수 있습니다.그러나 일반 생산 웨이퍼는 용해로 우선 순위를 가지며, 몇 개의 실험 웨이퍼만 동시에 모든 용해로에 사용할 수 있습니다.
이 실험을 실행하는 비블록화 방법은 12개의 실험 웨이퍼를 각각 용해로 실행당 하나씩 랜덤 순서로 실행하는 것입니다.이렇게 되면 런 투 런 용해로 변동성에 따른 각 저항률 측정의 실험 오차가 증가하고 다양한 용량에 대한 영향을 연구하기가 더욱 어려워집니다.제조회사에서 4개의 실험 웨이퍼를 용해로 런에 넣도록 설득할 수 있다고 가정할 때 이 실험을 실행하는 블록된 방법은 세 개의 용해로 런에 각각 서로 다른 선량으로 4개의 웨이퍼를 넣는 것입니다.유일한 랜덤화는 용량 1의 세 웨이퍼 중 어느 것이 용해로 1에 들어갈 것인지 선택하는 것이며 용량 2, 3, 4의 웨이퍼도 이와 유사합니다.
실험에 대한 설명
X를 용량 "수준"으로 하고2 X를 블럭화 인자 용해로 런으로 합니다1.그런 다음 실험을 다음과 같이 설명할 수 있습니다.
- k = 두 요인(주요인1 X 1개 및 블럭화 요인2 X 1개)
- L1 = 요인1 X의 4가지 수준
- L2 = 요인2 X의 3가지 수준
- n = 셀당 1회 복제
- N = L1 * L2 = 4 * 3 = 12 런
랜덤화 전에 설계 시행은 다음과 같습니다.
X1 | X2 |
---|---|
1 | 1 |
1 | 2 |
1 | 3 |
2 | 1 |
2 | 2 |
2 | 3 |
3 | 1 |
3 | 2 |
3 | 3 |
4 | 1 |
4 | 2 |
4 | 3 |
행렬 표현
설계 시행을 요약하는 다른 방법은 4행은 처리 X의1 수준이고 열은 블럭화 변수2 X의 3개 수준인 4x3 행렬을 사용하는 것입니다.행렬의 셀에는 위의 X1, X2 조합과 일치하는 인덱스가 있습니다.
치료 | 블록 1 | 블록 2 | 블록 3 |
---|---|---|---|
1 | 1 | 1 | 1 |
2 | 1 | 1 | 1 |
3 | 1 | 1 | 1 |
4 | 1 | 1 | 1 |
K-요인 랜덤화 블럭 설계에 대한 시행은 단순히 k차원 행렬의 셀 지수입니다.
모델
하나의 방해 변수가 있는 랜덤화 블럭 설계의 모형은 다음과 같습니다.
어디에
- Y는ij X = i 및 X2 = j에1 대한 관측치입니다.
- X가1 주요 요인입니다.
- X는2 차단 계수입니다.
- μ는 일반적인 위치 매개변수(즉, 평균)입니다.
- T는i 치료 i(인자1 X의)에 대한 효과입니다.
- B는j (인자2 X의) 블럭 j에 있는 효과입니다.
견적
- μ의 : { style { {} = 전체 데이터의 평균
- : iy - Y ( \ style } {\ - { \ { = X = i에1 대한 Y의 평균값.
- Bj : - - Y{\ {\ ( \ style { } - { \ j) 、 ( \ style { } { \ j} ) = X = j의2 전체 Y의 평균.
일반화
- 일반화 랜덤화 블럭 설계(GRBD)를 사용하면 블럭-처리 교호작용을 검정할 수 있으며 RCBD와 같이 블럭화 요인이 정확히 하나 있습니다.
- 라틴 제곱(및 기타 행-열 설계)에는 교호작용이 없는 것으로 간주되는 두 개의 블럭화 요인이 있습니다.
- 라틴 하이퍼큐브 샘플링
- 그라에코-라틴 광장
- 하이퍼-그래에코-라틴 사각형 디자인
이론적 근거
블로킹의 이론적 근거는 다음과 같은 수학적[citation needed] 결과입니다.주어진 랜덤 변수, X 및 Y
따라서 처리와 대조군 간의 차이는 X와 Y 사이의 공분산(또는 상관 관계)을 최대화함으로써 최소 분산(즉, 최대 정밀도)을 제공할 수 있다.
「 」를 참조해 주세요.
레퍼런스
- ^ Bernstein S.N.(1926년) Sur l'extension du théoréme limite du calculate des probabilité aux sommes de quantités dépendantes.수학, 애너런, 97절, 1-59절
- ^ 이브라기모프 I.A.와 린니크 Yu.V.(1971) 랜덤 변수의 독립적이고 정지된 시퀀스.울터스 누드호프, 그로닝엔
- ^ Leadbetter M.R., Lindgren G. 및 Rootzén H.(1983) 랜덤 시퀀스 및 프로세스의 극한 및 관련 특성.뉴욕: 스프링거 벨락.
- ^ Novak S.Y. (2011년) Applications to Finance를 통한 Extreme Value Methods.채프먼 & 홀 / CRC 프레스, 런던.
이 문서에는 미국 국립표준기술연구소 웹사이트 https://www.nist.gov의 퍼블릭 도메인 자료가 포함되어 있습니다.
참고 문헌
- Addelman, S. (1969). "The Generalized Randomized Block Design". The American Statistician. 23 (4): 35–36. doi:10.2307/2681737. JSTOR 2681737.
- Addelman, S. (1970). "Variability of Treatments and Experimental Units in the Design and Analysis of Experiments". Journal of the American Statistical Association. 65 (331): 1095–1108. doi:10.2307/2284277. JSTOR 2284277.
- Anscombe, F.J. (1948). "The Validity of Comparative Experiments". Journal of the Royal Statistical Society. A (General). 111 (3): 181–211. doi:10.2307/2984159. JSTOR 2984159. MR 0030181.
- Bailey, R. A (2008). Design of Comparative Experiments. Cambridge University Press. ISBN 978-0-521-68357-9. Archived from the original on 2018-03-22. 출판 전 장은 온라인으로 이용할 수 있습니다.
- Bapat, R. B. (2000). Linear Algebra and Linear Models (Second ed.). Springer. ISBN 978-0-387-98871-9.
- Caliński T.; Kageyama S. (2000). Block designs: A Randomization approach. Vol. I: Analysis. New York: Springer-Verlag. ISBN 0-387-98578-6.
- Caliński T.; Kageyama S. (2003). Block designs: A Randomization approach. Vol. II: Design. New York: Springer-Verlag. ISBN 0-387-95470-8. MR 1994124.
- Gates, C.E. (Nov 1995). "What Really Is Experimental Error in Block Designs?". The American Statistician. 49 (4): 362–363. doi:10.2307/2684574. JSTOR 2684574.
- Kempthorne, Oscar (1979). The Design and Analysis of Experiments (Corrected reprint of (1952) Wiley ed.). Robert E. Krieger. ISBN 0-88275-105-0.
- Hinkelmann, Klaus; Kempthorne, Oscar (2008). Design and Analysis of Experiments. Vol. I and II (Second ed.). Wiley. ISBN 978-0-470-38551-7.
- Hinkelmann, Klaus; Kempthorne, Oscar (2008). Design and Analysis of Experiments. Vol. I: Introduction to Experimental Design (Second ed.). Wiley. ISBN 978-0-471-72756-9.
- Hinkelmann, Klaus; Kempthorne, Oscar (2005). Design and Analysis of Experiments. Vol. 2: Advanced Experimental Design (First ed.). Wiley. ISBN 978-0-471-55177-5.
- Lentner, Marvin; Thomas Bishop (1993). "The Generalized RCB Design (Chapter 6.13)". Experimental design and analysis (Second ed.). Blacksburg, VA: Valley Book Company. pp. 225–226. ISBN 0-9616255-2-X.
- Raghavarao, Damaraju (1988). Constructions and Combinatorial Problems in Design of Experiments (corrected reprint of the 1971 Wiley ed.). New York: Dover. ISBN 0-486-65685-3.
- Raghavarao, Damaraju; Padgett, L.V. (2005). Block Designs: Analysis, Combinatorics and Applications. World Scientific. ISBN 981-256-360-1.
- Shah, Kirti R.; Sinha, Bikas K. (1989). Theory of Optimal Designs. Springer-Verlag. ISBN 0-387-96991-8.
- Street, Anne Penfold; Street, Deborah J. (1987). Combinatorics of Experimental Design. Oxford U. P. [Clarendon]. ISBN 0-19-853256-3.
- Wilk, M. B. (1955). "The Randomization Analysis of a Generalized Randomized Block Design". Biometrika. 42 (1–2): 70–79. doi:10.2307/2333423. JSTOR 2333423.
- Zyskind, George (1963). "Some Consequences of randomization in a Generalization of the Balanced Incomplete Block Design". The Annals of Mathematical Statistics. 34 (4): 1569–1581. doi:10.1214/aoms/1177703889. JSTOR 2238364.