일반화 선형 혼합 모형

Generalized linear mixed model

통계에서 일반화된 선형 혼합 모형(GLMM)일반화된 선형 모형(GLM)에 대한 확장으로, 선형 예측 변수가 일반적인 고정 효과 외에 랜덤 효과를 포함하고 있다.[1][2][3]그들은 또한 GLMs로부터 선형 혼합 모델비정규 데이터로 확장하는 아이디어를 계승한다.

GLMM은 그룹 간의 차이를 랜덤 효과로 모델링할 수 있기 때문에 그룹화된 데이터의 분석을 위한 광범위한 모델을 제공한다.이러한 모델은 종적 데이터를 포함한 많은 종류의 데이터를 분석하는데 유용하다.[4]

모델

GLMM은 일반적으로 무작위 효과 를) 조건으로 함수 을(를) 통해 선형 예측 변수 + Z X과(와) 관련되는 기대치를 지수 계열에 따라 분포하도록 정의된다

.

여기서 (는) 고정 효과 설계 매트릭스와 효과 Z {\textstyle {\u}은(는) 랜덤 효과 설계 매트릭스와 랜덤 효과다.이 매우 간단한 정의를 이해하기 위해서는 먼저 일반화된 선형 모형과 혼합 모형의 정의를 이해할 필요가 있을 것이다.

일반화된 선형 혼합 모형은 랜덤 효과가 정규 분포를 따르는 계층적 일반화된 선형 모형의 특별한 경우다.

완전우도[5]

일반적인 폐쇄형태를 가지고 있지 않으며, 무작위 효과에 대한 통합은 대개 매우 계산적으로 집약적이다.숫자로 이 적분(예: Gauss-Hermite 4중분법을 통한)에 근접한 것 외에, 라플라스 근사치에 의해 동기화된 방법이 제안되었다.[6]예를 들어, 가중 정규 혼합 모델을 작업 변수에 반복적으로 적합(즉, 이중 반복)하는 벌칙 준우도 방법은 다양한 상업 및 오픈 소스 통계 프로그램에 의해 구현된다.[7]

모형 적합

최대우도(AIC를 통해)를 통해 GLM을 적합시키는 것은 무작위 효과에 대한 통합을 포함한다.일반적으로 그러한 통합은 분석적 형태로 표현할 수 없다.다양한 근사 방법이 개발되었지만, 가능한 모든 모델과 데이터 세트에 대해 좋은 속성을 가진 것은 없다(예: 그룹화되지 않은 이진 데이터는 특히 문제가 있다).이 때문에 계산력의 증가와 방법의 발전으로 실용성이 높아짐에 따라 수치 사분법이나 마르코프 사슬인 몬테 카를로(Monte Carlo)와 관련된 방법들이 사용량이 많아졌다.

Akaike 정보 기준(AIC)은 모델 선택의 공통 기준이다.특정 지수 분포에 기초한 GLMM의 AIC 추정치가 최근에 입수되었다.[8]

소프트웨어

  • R의 여러 기여 패키지는 GLMM 기능을[9][10] 제공한다.
  • SASSPSS[11] 사용하여 GLMM 장착 가능
  • Matlab은 또한 GLMM 모델에 적합한 "fitglme"라는 기능을 제공한다.
  • Python 패키지 Statsmodels는 이항 및 포아송 구현 지원
  • Julia 패키지 MixedModels.jl은 GLMM에 맞는 GeneralLinear MixedModel이라는 기능을 제공하여 데이터를 제공한다.[13]

참고 항목

참조

  1. ^ Breslow, N. E.; Clayton, D. G. (1993), "Approximate Inference in Generalized Linear Mixed Models", Journal of the American Statistical Association, 88 (421): 9–25, doi:10.2307/2290687, JSTOR 2290687
  2. ^ Stroup, W.W. (2012), Generalized Linear Mixed Models, CRC Press
  3. ^ Jiang, J. (2007), Linear and Generalized Linear Mixed Models and Their Applications, Springer
  4. ^ Fitzmaurice, G. M.; Laird, N. M.; Ware, J.. (2011), Applied Longitudinal Analysis (2nd ed.), John Wiley & Sons, ISBN 978-0-471-21487-8
  5. ^ Pawitan, Yudi. In All Likelihood: Statistical Modelling and Inference Using Likelihood (Paperbackition ed.). OUP Oxford. p. 459. ISBN 978-0199671229.
  6. ^ Breslow, N. E.; Clayton, D. G. (20 December 2012). "Approximate Inference in Generalized Linear Mixed Models". Journal of the American Statistical Association. 88 (421): 9–25. doi:10.1080/01621459.1993.10594284.
  7. ^ Wolfinger, Russ; O'connell, Michael (December 1993). "Generalized linear mixed models a pseudo-likelihood approach". Journal of Statistical Computation and Simulation. 48 (3–4): 233–243. doi:10.1080/00949659308811554.
  8. ^ Saefken, B.; Kneib, T.; van Waveren, C.-S.; Greven, S. (2014), "A unifying approach to the estimation of the conditional Akaike information in generalized linear mixed models" (PDF), Electronic Journal of Statistics, 8: 201–225, doi:10.1214/14-EJS881
  9. ^ Pinheiro, J. C.; Bates, D. M. (2000), Mixed-effects models in S and S-PLUS, Springer, New York
  10. ^ Berridge, D. M.; Crouchley, R. (2011), Multivariate Generalized Linear Mixed Models Using R, CRC Press
  11. ^ "IBM Knowledge Center". www.ibm.com. Retrieved 6 December 2017.
  12. ^ "Statsmodels Documentation". www.statsmodels.org. Retrieved 17 March 2021.
  13. ^ "Details of the parameter estimation · MixedModels". juliastats.org. Retrieved 16 June 2021.