카이-제곱 자동 상호 작용 탐지

Chi-square automatic interaction detection

카이-제곱 자동 상호작용 탐지(CHAID)[1][2][3]는 수정된 유의성 검정(Bonferroni 보정, Holm-Bonferroni 검정)을 기반으로 하는 결정 트리 기법입니다.이 기술은 남아프리카에서 개발되었고 1980년에 이 주제에 대한 박사 논문을 완성한 Gordon V. Kass에 의해 출판되었습니다.CHAID는 예측(회귀 분석과 유사한 방식으로 이 버전의 CHAID는 원래 XAID로 알려져 있음)과 분류 및 변수 간의 상호작용 검출에 사용할 수 있습니다.CHAID는 1960년대와 1970년대의 [7]AID(Automatic Interaction Detection)[4] 및 THAID(THETA Automatic Interaction Detection)[5][6] 절차의 공식적인 확장을 기반으로 하며, 이는 1950년대 영국의 벨슨에 의해 수행된 것을 포함한 이전 연구의 연장이었다.Gilbert는 [3]이전의 감독 트리 방법의 이력, 원래의 CHAID 알고리즘의 상세 설명 및 Biggs, De Ville [2]및 Suen에 의한 완전한 CHAID 확장에 대해 설명합니다.

실제로, CHAID는 직접 마케팅의 맥락에서 일부 변수에 대한 소비자의 반응이 다른 변수에 어떻게 영향을 미치는지 예측하기 위해 종종 사용된다. 그러나 다른 초기 적용 분야는 의료 및 정신 연구 분야였다.

다른 의사결정 트리와 마찬가지로 CHAID의 장점은 출력이 매우 시각적이고 해석하기 쉽다는 것입니다.기본적으로 다중 방향 분할을 사용하기 때문에 표본 크기가 작으면 응답자 그룹이 빠르게 작아져 신뢰할 수 있는 분석을 할 수 없기 때문에 효과적으로 작동하려면 큰 표본 크기가 필요합니다.

다중 회귀 분석과 같은 대안보다 CHAID의 한 가지 중요한 장점은 비모수적이라는 것입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Kass, G. V. (1980). "An Exploratory Technique for Investigating Large Quantities of Categorical Data". Applied Statistics. 29 (2): 119–127. doi:10.2307/2986296. JSTOR 2986296.
  2. ^ a b Biggs, David; De Ville, Barry; Suen, Ed (1991). "A method of choosing multiway partitions for classification and decision trees". Journal of Applied Statistics. 18 (1): 49–62. doi:10.1080/02664769100000005. ISSN 0266-4763.
  3. ^ a b Ritschard, Gilbert (2013). "CHAID and Earlier Supervised Tree Methods". Contemporary Issues in Exploratory Data Mining in the Behavioral Sciences, McArdle, J.J. And G. Ritschard (Eds). New York: Routledge: 48–74.
  4. ^ Morgan, James N.; Sonquist, John A. (1963). "Problems in the Analysis of Survey Data, and a Proposal". Journal of the American Statistical Association. 58 (302): 415–434. doi:10.1080/01621459.1963.10500855. ISSN 0162-1459.
  5. ^ Messenger, Robert; Mandell, Lewis (1972). "A Modal Search Technique for Predictive Nominal Scale Multivariate Analysis". Journal of the American Statistical Association. 67 (340): 768–772. doi:10.1080/01621459.1972.10481290. ISSN 0162-1459.
  6. ^ Morgan, James N. (1973). THAID, a sequential analysis program for the analysis of nominal scale dependent variables. Robert C. Messenger. Ann Arbor, Mich. ISBN 0-87944-137-2. OCLC 666930.
  7. ^ Belson, William A. (1959). "Matching and Prediction on the Principle of Biological Classification". Applied Statistics. 8 (2): 65–75. doi:10.2307/2985543. JSTOR 2985543.

추가 정보

  • 프레스, 로렌스 I.; 로저스, 마일즈 S.; & 슈어, 제럴드 H.;다변량 데이터 분석을 위한 대화형 기법, Vol. 14(1969), 페이지 364–370
  • Hawkins, Douglas M.; 및 Kass, Gordon V.;자동 상호작용 검출, Hawkins, Douglas M. (ed), Applied Multivaly Analysis, Cambridge University Press, Cambridge, 1982, 페이지 269-302
  • 후튼, 토마스 M., 헤일리, 로버트 W., 컬버, 데이비드 H.화이트, 존 W.; 모건, W. 미드; & 캐롤, 레이먼드 J.;병원내 감염 발생에 따른 다중 위험 인자의 공동 연관성, 미국 의학 저널, Vol. 70, (1981), 페이지 960–970
  • Brink, Susanne; & Van Schalkwyk, Dirk J.; 골수 철 저장소의 예측 변수로서의 혈청 페리틴평균 입자 볼륨, South African Medical Journal, Vol. 61, (1982) 페이지 432–434
  • McKenzie, Dean P.; McGorry, Patrick D.; Wallace, Chris S.; Low, Lee H.; Copolov, David L.; & Singh, Bruce S.; 최소 진단 의사결정 트리 구성, 의학 정보의 방법, Vol16.193)
  • Magidson, Jay; 분할 모델링에 대한 CHAID 접근법: Bagozzi, Richard P. (ed), Advanced Methods of Marketing Research, Blackwell, Oxford, 1994, 페이지 118–159
  • Hawkins, Douglas M.; Young, S. & Rosinko, A.; 재귀 분할, 정량적 구조-활동 관계, Vol. 16, (1997), 페이지 296-302를 이용한 대규모 구조-활동 데이터 집합 분석

소프트웨어

  • Luchman, J.N.; CHAID: 카이-제곱 자동 상호작용 검출을 실행하는 Stata 모듈, 무료 다운로드 가능 또는 Stata: ssc install chaid에 입력합니다.
  • Luchman, J.N.; CHAIDFOREST: Stata 모듈은 기본 학습자, 무료 다운로드 가능 또는 Stata: sc install chaidforest에 입력함으로써 카이-제곱 자동 상호작용 검출(CHAID)에 기반한 랜덤 포레스트 앙상블 분류를 수행합니다.
  • IBM SPSS Decision Tree는 CART와 같은 몇 가지 다른 유형의 트리뿐만 아니라 완전한 CHAID 트리를 성장시킵니다.
  • R 패키지 CHAID는 R-Forge에서 사용할 수 있습니다.