비선형 혼합효과 모형

Nonlinear mixed-effects model

비선형 혼합 효과 모델선형 혼합 효과 모델을 일반화하는 통계적 모델의 한 부류를 구성한다. 선형 혼합 효과 모델과 마찬가지로, 동일한 통계 단위 내에 복수의 측정치가 있거나 관련 통계 단위의 측정치 사이에 의존성이 있는 설정에서 특히 유용하다. 비선형 혼합효과 모델은 의학, 공중보건, 약리학, 생태학 등 여러 분야에 적용되고 있다.[1][2]

정의

고정 효과랜덤 효과를 모두 포함하는 통계적 모형이 비선형 혼합 효과 모형의 예인 반면, 가장 일반적으로 사용되는 모형은 반복[1] 측정을 위한 비선형 혼합 효과 모형의 부류다.

어디에

  • (는) 그룹/대상 수입니다.
  • (는) 그룹의 관측치 수입니다.
  • 은(는) 그룹별 파라미터 벡터 공변량 v {\의 실제 값 차별화 함수다.
  • is modeled as a linear mixed-effects model where is a vector of fixed effects and }_은(는)그룹 i {\ i와) 연관된 임의 효과의 벡터다.
  • 는 첨가 노이즈를 설명하는 랜덤 변수다.

추정

모형이 고정 효과에서만 비선형적이고 랜덤 효과가 가우스인 경우, 추정기와 시험 통계량점증적 특성이 기존일반 선형 모형과 다를 수 있지만 비선형 최소 제곱법을 사용하여 최대 우도 추정을 수행할 수 있다. 보다 일반적인 설정에서는 비선형 혼합 효과 모델의 특정 등급에서 최대 우도 추정 또는 최대 후사 추정을 수행하는 몇 가지 방법이 있으며, 이는 일반적으로 정규 분포 랜덤 변수를 가정하는 것이다. 일반적인 접근방식은 비선형 문제를 반복적으로 최적화하고, 이 최적점을 중심으로 모델을 국소적으로 선형화한 다음, 최대우도 추정을 위해 선형 혼합 효과 모델에서 일반적인 방법을 채택하는 Lindstrom-Bates 알고리즘이다[3]. 기대 최대화 알고리즘의 확률적 근사치는 최대 우도 추정을 위한 대체 접근방식을 제공한다.[4]

적용들

예: 질병 진행 모델링

비선형 혼합 효과 모델은 질병의 진행을 모델링하는 데 사용되어 왔다.[5] 진행성 질환에서 결과 변수에 대한 시간적 진행 패턴은 환자 간에 유사한 비선형 시간적 형태를 따를 수 있다. 그러나 개인의 질병 단계는 알 수 없거나 측정할 수 있는 것으로 부분적으로만 알 수 있다. 따라서 개별 질병 단계(즉, 환자가 비선형 평균 곡선을 따라 있는 위치)를 설명하는 잠재적 시간 변수를 모형에 포함할 수 있다.

예: 알츠하이머병의 인지력 저하 모델링

Progmod R 패키지를 사용한 세로 ADAS-Cog 점수의 질병 진행 모델링 예.[5]

알츠하이머병은 진행성 인지 기능 저하로 특징지어진다. 그러나 환자들은 인지 능력과 예비성이 크게 다를 수 있기 때문에, 한 시점에 인지 테스트를 하는 것은 종종 질병의 다른 단계에 있는 개인을 거칠게 그룹화하는 데만 사용될 수 있다. Now suppose we have a set of longitudinal cognitive data from individuals that are each categorized as having either normal cognition (CN), mild cognitive impairment (MCI) or dementia (DEM) at the baseline vi시트( t = 0 1{\에 해당하는 경우. 이러한 종방향 궤적은 기준선 분류에 기초한 질병 상태의 차이를 허용하는 비선형 혼합 효과 모델을 사용하여 모델링할 수 있다.

어디에

  • ~ 은(는) 매개 변수 ~ }에 의해 모양이 결정되는 인지 감소의 평균 시간 프로파일을 모형화하는 함수다
  • i 는 관찰 시간(예: 연구에서 기준 이후 시간)을 나타낸다.
  • M I E 은 개별 i i이(가) 기준선에 MCI 또는 치매에 걸린 경우 1인 더미 변수다.
  • D 인식 정상과 비교한 MCI 및 치매 그룹의 질병 진행의 차이를 모델링하는 파라미터다.
  • 은(는) 기준 범주에 상대적인 개별 의 질환 단계 차이 및
  • 는 첨가 노이즈를 설명하는 랜덤 변수다.

상자에 표시된 알츠하이머 질병 평가 척도-인지적 하위 척도(ADAS-Cog)의 세로방향 측정에 지수 평균 함수를 갖춘 모델의 예. 그림과 같이 기준선 분류의 고정 효과(정상 인지 대비 MCI 또는 치매)와 개별 연속 질환 단계 b 의 무작위 효과의 포함은 인지력 저하 궤적을 정렬하여 공통적인 인지 감소 패턴을 보여준다.

예제: 성장 분석

뒤틀림이 있거나 없는 버클리 성장 연구의 남자아이의 평균 높이 곡선 추정. 뒤틀림 모델은 파브팝 R 패키지를 이용한 비선형 혼합 효과 모델로 적합하다.[6]

성장 현상은 종종 비선형 패터(예: 로지스틱 성장, 지수 성장, 쌍곡성 성장)를 따른다. 영양소 결핍과 같은 요인은 측정된 결과(예: 영양소가 부족한 유기체)에 직접적인 영향을 미칠 수 있지만 타이밍(예: 영양소가 부족한 유기체는 느린 속도로 성장한다)에도 영향을 미칠 수 있다. 모형이 타이밍의 차이를 설명하지 못할 경우, 유기체 간의 동기화 부족으로 인해 추정된 모집단 수준 곡선이 더 미세하게 다듬어질 수 있다. 비선형 혼합 효과 모델은 성장 결과 및 타이밍의 개별 차이를 동시에 모델링할 수 있다.

예: 사람 키 모델링

연령 함수로서 인간의 키와 몸무게의 평균 곡선을 추정하기 위한 모델과 평균 주위의 자연적 변동을 성장 차트를 만드는 데 사용된다. 그러나 아이들의 성장은 유전적, 환경적 요인 둘 다로 인해 비동기화될 수 있다. 예를 들어, 사춘기가 시작될 때 나이와 관련된 키 스퍼트는 청소년들 사이에 몇 년씩 다를 수 있다. 따라서, 단면 연구는 나이가 생물학적 발달과 일치하지 않기 때문에 부버탈 높이 스퍼트의 크기를 과소평가할 수 있다. 생물학적 발달의 차이는 소위 뒤틀림 함수 w 를 사용하여 잠재 생물학적 연대에 관측된 나이를 매핑하는 것을 기술하는 의 랜덤 효과를 사용하여 모델링할 수 있다 간단한 비선형 혼합 효과 mod.이 구조를 가지고 있는 것은 에 의해 주어진다.

어디에

  • 은 연령의 함수로서 일반적인 아동의 신장 발달을 나타내는 함수다. 그것의 모양은 파라미터 에 의해 결정된다
  • (는) 높이 측정 에 해당하는 i 의 연령이다
  • (, w ) v는 연령을 생물학적 발달로 매핑하여 동기화하는 워핑 기능이다. 그것의 모양은 의 임의 효과에 의해 결정된다
  • 는 첨가 변동을 설명하는 랜덤 변수(예: 어린이와 측정 노이즈의 일관된 높이 차이)이다.

그러한 모델을 장착하기 위한 몇 가지 방법과 소프트웨어 패키지가 있다. 소위 SITAR 모델은[7] 시간의 결합적 변환(즉, 생물학적 연령의 적층 이동과 성숙율의 차이)인 뒤틀림 기능을 사용하여 그러한 모델을 적합시킬 수 있는 반면, 소위 파브팝 모델은[6] 부드럽게 휘어지는 뒤틀림 기능을 가진 모델을 적합시킬 수 있다. 후자의 예가 상자에 나와 있다.

예제: 모집단 약동학/약물역학 모델링

섭취된 물질의 운명에 영향을 미치는 기본적인 약동학 과정. 비선형 혼합 효과 모델링은 이러한 공정의 모집단 수준 효과를 추정하는 동시에 피험자 간의 개별 변동을 모델링하는 데 사용될 수 있다.

Emax 모델과 같은 노출-반응 관계를 설명하기 위한 PK/PD 모델은 비선형 혼합 효과 모델로 공식화될 수 있다.[8] 혼합 모델 접근방식은 관측된 결과에 비선형적인 영향을 미치는 영향의 인구 수준과 개인 차이의 모델링을 허용한다. 예를 들어, 화합물이 체내에서 대사되거나 분포되는 속도.

예: COVID-19 역학 모델링

COVID-19 및 5월 14일까지 총(인구) 평균으로 심각한 영향을 받은 40개국의 감염 궤적 외삽

비선형 혼합 효과 모델의 플랫폼을 사용하여 피험자의 감염 궤적을 설명하고 피험자 간에 공유되는 몇 가지 공통 특성을 이해할 수 있다. 역학 문제에서 대상자는 국가, 주 또는 카운티 등이 될 수 있다. 이것은 특히 질병에 관한 거의 알려진 정보가 없는 초기 단계의 유행병 추세를 추정하는데 유용할 수 있다.[9]

예: 잠재적 크리깅이 있는 새로운 위치에서 셰일오일 유정 생산곡선 예측

남텍사스 이글 포드 셰일 저장고(왼쪽 위)의 잠재된 크리그링 324개 훈련용 우물과 2개의 시험용 우물을 통해 얻은 석유 생산률 감소 곡선 예측 유압식으로 파열된 수평 유정의 개략적인 예(왼쪽 아래), 잠재된 크라이깅 방법을 통한 시험 유정에서의 예측 곡선(오른쪽)

석유 개발 프로젝트의 궁극적인 성공은 많은 양의 우물 건설 비용에 의존한다. 기존의 저수지와는 매우 낮은 투과성과 매우 다른 흐름 메커니즘 때문에, 유정 건설 비용 추정치는 종종 높은 수준의 불확실성을 포함하고 있으며, 석유 회사들은 유정의 시추와 완성 단계에 많은 투자를 할 필요가 있다. 최근 미국 수평우물의 전체 상업적 성공률은 65%로 알려져 있어 뚫은 우물은 3개 중 2개만 상업적으로 성공할 것으로 보인다. 이러한 이유로 석유 기술자의 중요한 업무 중 하나는 셰일 저장고의 석유 또는 가스 생산과 관련된 불확실성을 정량화하는 것이며, 나아가 실제 시추 작업이 이루어지기 전에 구체적인 준공 데이터를 주어진 새로운 장소에서 새로운 유정의 대략적인 생산 행태를 예측하여 다량의 유정을 절약하는 것이다.공사비

비선형 혼합효과 모델의 플랫폼은 다음과 같이 모델의 2단계에서 가우스 프로세스와 같은 정지지상적 과정을 통합하여 공간적 연관성을 고려하도록 확장할 수 있다.[10]

어디에

  • is a function that models the mean time-profile of log-scaled oil production rate whose shape is determined by the parameters . 함수는 로그에서 감소곡선 분석에 사용된 속도 감소곡선으로 얻는다.
  • =( i , x ) i{\i} -th 웰에 대한 유압 프랙팅 및 수평 방향 드릴링 완료 과정에서 얻은 공변량을 나타낸다.
  • =( 1, 2 ) {\i} -th well,
  • ( ) 은 오류 분산이 있는 가우스 백색 노이즈를 나타낸다. {\ 효과라고도 함).
  • ( ) 은 가우스 공분산 K l ( ,) ,\ ,, 가우스 프로세스를 나타낸다.
  • 은(는) 말발굽 수축 이전의 모습을 나타낸다.

The Gaussian process regressions used on the latent level (the second stage) eventually produce kriging predictors for the curve parameters that dictate the shape of the mean curve ){\ 날짜 수준(첫 번째 수준) 크리깅 기법이 잠재된 수준에 채용되어 왔기 때문에 이 기법을 잠적 크리깅이라고 한다. 오른쪽 패널은 사우스텍사스주 이글 포드 셰일 저수지에 있는 두 개의 시험용 웰에 적용된 잠복 크라이깅 방식의 예측 결과를 보여준다.

참고 항목


참조

  1. ^ a b Pinheiro, J; Bates, DM (2006). Mixed-effects models in S and S-PLUS. Statistics and Computing. New York: Springer Science & Business Media. doi:10.1007/b98882. ISBN 0-387-98957-9.
  2. ^ Bolker, BM (2008). Ecological models and data in R. McMaster University: Mathematics & Statistics. Princeton University Press.
  3. ^ Lindstrom, MJ; Bates, DM (1990). "Nonlinear mixed effects models for repeated measures data". Biometrics. 46 (3): 673–687. doi:10.2307/2532087. JSTOR 2532087. PMID 2242409.
  4. ^ Kuhn, E; Lavielle, M (2005). "Maximum likelihood estimation in nonlinear mixed effects models". Computational Statistics & Data Analysis. 49 (4): 1020–1038. doi:10.1016/j.csda.2004.07.002.
  5. ^ a b Raket, LL (2020). "Statistical disease progression modeling in Alzheimer's disease". Frontiers in Big Data. 3. doi:10.3389/fdata.2020.00024. S2CID 221105601.
  6. ^ a b Raket LL, Sommer S, Markussen B (2014). "A nonlinear mixed-effects model for simultaneous smoothing and registration of functional data". Pattern Recognition Letters. 38: 1–7. doi:10.1016/j.patrec.2013.10.018.
  7. ^ Cole TJ, Donaldson MD, Ben-Shlomo Y (2010). "SITAR—a useful instrument for growth curve analysis". International Journal of Epidemiology. 39 (6): 1558–66. doi:10.1093/ije/dyq115. PMC 2992626. PMID 20647267. S2CID 17816715.
  8. ^ Jonsson, EN; Karlsson, MO; Wade, JR (2000). "Nonlinearity detection: advantages of nonlinear mixed-effects modeling". AAPS PharmSci. 2 (3): E32. doi:10.1208/ps020332. PMC 2761142. PMID 11741248.
  9. ^ Lee, Se Yoon; Lei, Bowen; Mallick, Bani (2020). "Estimation of COVID-19 spread curves integrating global data and borrowing information". PLOS ONE. arXiv:2005.00662. doi:10.1371/journal.pone.0236860. PMC 7390340.
  10. ^ Lee, Se Yoon; Mallick, Bani (2021). "Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas". Sankhya B. doi:10.1007/s13571-020-00245-8.