통계적 가정
Statistical assumption통계는 모든 수학적 학문과 마찬가지로 무에서 유효한 결론을 추론하지 않는다. 실제 통계 모집단에 대한 흥미로운 결론을 추론하는 것은 거의 항상 몇 가지 배경 가정을 요구한다. 부정확한 가정은 매우 부정확한 결론을 초래할 수 있기 때문에 그러한 가정은 신중하게 이루어져야 한다.
여기 통계적 가정들의 몇 가지 예가 있다.
- 서로 간의 관측치 독립성(이 가정은 특히 일반적인 오류[1])
- 잠재적 교란 효과로부터 관측 오차의 독립성.
- 관측치(또는 오류)의 정확하거나 근사적인 정규성.
- 선형 회귀와 같은 양적 자극에 대한 등급이 지정된 반응의 선형성.
가정 유형
통계적 추론에 대한 두 가지 접근법이 있다: 모델 기반 추론과 설계 기반 추론이다.[2][3][4] 두 접근법 모두 데이터 생성 프로세스를 나타내기 위해 일부 통계적 모델에 의존한다. 모델 기반 접근법에서 모델은 초기에 알려지지 않은 것으로 간주되며, 그 목표 중 하나는 추론을 위해 적절한 모델을 선택하는 것이다. 설계 기반 접근법에서는 모델을 알 수 있도록 취하며, 목표 중 하나는 표본 데이터가 추론을 위해 무작위로 선택되도록 하는 것이다.
추론에 어떤 접근법을 사용하느냐에 따라 통계적 가정은 두 종류로 분류될 수 있다.
- 모델 기반 가정. 여기에는 다음 세 가지 유형이 포함된다.
- 분포 가정. 통계적 모형이 랜덤 오류와 관련된 항을 포함하는 경우, 이러한 오류의 확률 분포에 대해 가정할 수 있다.[5] 분포 가정은 관측치 자체와 관련이 있는 경우도 있다.
- 구조적 가정. 변수들 간의 통계적 관계는 종종 한 변수를 다른 변수(또는 다른 변수들)의 함수에 더하여 무작위 오차를 더하여 모델링된다. 모형에는 종종 선형 회귀와 같이 기능 관계의 형태에 대한 구조적 가정을 수반한다. 이는 관찰되지 않은 기본 잠재 변수 사이의 관계를 포함하는 모델에 일반화할 수 있다.
- 교차분산 가정. 이러한 가정은 관측치 자체의 공동 확률 분포 또는 모형의 랜덤 오차 중 하나를 포함한다. 단순 모형에는 관측치 또는 오차가 통계적으로 독립적이라는 가정이 포함될 수 있다.
- 설계 기반 가정. 이는 관측치가 수집된 방식과 관련되며, 표본 추출 중 랜덤화 가정을 수반하는 경우가 많다.[6][7]
모델 기반 접근법은 통계적 추론에 가장 일반적으로 사용된다. 설계 기반 접근법은 주로 조사 표본 추출에 사용된다. 모델 기반 접근방식으로 모든 가정은 모델에 효과적으로 암호화된다.
가정 확인
통계적 추론에서 도출된 결론의 타당성이 가정들의 타당성에 따라 결정된다는 점을 고려할 때, 그러한 가정들은 어느 단계에서 검토되어야 하는 것이 분명히 중요하다. 예를 들어, 데이터가 부족한 경우, 연구자가 가정이 타당한지 판단하도록 요구할 수 있다. 연구원들은 가정으로부터의 일탈이 어떤 영향을 끼칠지 고려하기 위해 이것을 어느 정도 확장할 수 있다. 더 광범위한 데이터를 사용할 수 있는 경우 통계적 모델 유효성 검사를 위한 다양한 절차(예: 회귀 모델 유효성 검사)를 사용할 수 있다.
참고 항목
메모들
![]() |
참조
- Cox D. R. (2006), 케임브리지 대학 출판부의 통계 추론의 원리.
- 드 그루이저 J, 브루스 D, 비에르켄스 M, 매듭터 M.(2006), 천연자원 모니터링을 위한 샘플링, 스프링거-베를랙.
- Kruskal, William (December 1988). "Miracles and statistics: the casual assumption of independence (ASA Presidential address)". Journal of the American Statistical Association. 83 (404): 929–940. doi:10.2307/2290117. JSTOR 2290117.
- McPherson, G. (1990), 과학 조사 통계: 그것의 기초, 적용 및 해석, Springer-Verlag. ISBN 0-387-97137-8