베이지안 계층 모델링

Bayesian hierarchical modeling

베이지안 계층적 모델링베이지안 [1]방법을 사용하여 사후 분포의 매개변수를 추정하는 다단계(계층적 형식)로 작성된 통계 모델이다.하위 모델은 결합되어 계층적 모델을 형성하며, Bayes의 정리는 그것들을 관측된 데이터와 통합하고 존재하는 모든 불확실성을 설명하기 위해 사용된다.이러한 통합의 결과는 사전 분포에 대한 추가 증거를 획득하기 때문에 업데이트된 확률 추정치라고도 하는 사후 분포이다.

빈도주의 통계는 매개변수를 랜덤 변수로 베이지안 처리 및 이러한 [2]매개변수에 대한 가정을 확립할 때 주관적 정보의 사용으로 인해 베이지안 통계에서 제공하는 것과 겉으로 보기에 양립할 수 없는 결론을 도출할 수 있다.두 접근 방식이 서로 다른 질문에 답하기 때문에 공식적인 결과는 기술적으로 모순되지 않지만, 두 접근 방식은 어떤 답이 특정 애플리케이션과 관련이 있는지에 대해 서로 일치하지 않습니다.베이시안들은 의사결정과 갱신 신념에 관한 관련 정보를 무시할 수 없으며, 계층적 모델링은 응답자가 여러 관찰 데이터를 제공하는 애플리케이션에서 고전적인 방법을 무시할 수 있는 잠재력을 가지고 있다고 주장한다.더욱이, 모델은 더 유연한 계층적 전제에 덜 민감하게 사후 분포를 가지고 있는 으로 입증되었다.

계층적 모형화는 여러 가지 다른 수준의 관측 단위에서 정보를 사용할 수 있는 경우에 사용됩니다.예를 들어, 여러 국가의 감염 궤적을 설명하는 역학 모델링에서 관측 단위는 국가이며, 각 국가는 일일 감염 사례에 [3]대한 자체 시간 프로파일을 가지고 있다.여러 유정에 대한 석유 또는 가스 생산 감소 곡선을 설명하기 위한 감소 곡선 분석에서 관측 단위는 저장 영역의 유정 또는 가스정이며, 각 유정은 석유 또는 가스 생산률의 시간적 프로파일(보통 월 [4]배럴)을 가지고 있습니다.계층 모델링을 위한 데이터 구조는 중첩된 데이터 구조를 유지합니다.분석과 구성의 계층적 형태는 다중 파라미터 문제를 이해하는 데 도움이 되며 계산 [5]전략을 개발하는 데 중요한 역할을 합니다.

철학

통계적 방법과 모형은 일반적으로 이러한 매개변수에 [6]대한 공동 확률 모델의 의존성을 의미하도록 관련되거나 연결된 것으로 간주될 수 있는 여러 매개변수를 포함한다.확률의 형태로 표현되는 개인의 믿음의 정도는 [7]불확실성과 함께 온다.이 가운데에 시간이 지남에 따라 신념의 정도가 변화하고 있다.호세 M. 베르나르도 교수아드리안 F 교수가 진술한 바와 같이. 스미스, "학습 과정의 실제는 현실에 대한 개인적이고 주관적인 믿음의 진화에 있다."이러한 주관적 확률은 물리적 [7]확률보다는 마음에 더 직접적으로 관여합니다.따라서, 베이시안들은 [8]특정 사건의 이전 발생을 고려하는 대체 통계 모델을 공식화하였다.

베이즈 정리

실제 이벤트가 발생한다고 가정하면 일반적으로 특정 옵션 간의 선호도가 변경됩니다.이는 [9]개인이 옵션을 정의하는 사건에 부가된 믿음의 정도를 수정함으로써 이루어집니다.

예를 들어, 심장 치료의 효과에 대한 연구에서 병원 j의 환자가 생존확률 j \j을 갖는 경우 생존확률은 일부에서 믿듯이 심장 파티에서의 생존을 증가시키는 논란이 있는 혈청이 생성되는 경우 y의 발생에 따라 업데이트된다고 가정합니다.nts를 클릭합니다.

이벤트 y의 발생에 j \j에 대한 최신 확률 스테이트먼트를 하려면 \ _j} y에 대한 공동 확률 분포를 제공하는 모델부터 시작해야 합니다.이는 이전 P P 샘플링 P )(\ \theta 곱이라고 할 수 있습니다.

조건부 확률의 기본 특성을 사용하여 사후 분포는 다음과 같이 산출됩니다.

조건부 확률과 개별 사건 사이의 관계를 보여주는 이 방정식은 베이즈 정리라고 알려져 있다.이 간단한 표현은 최신 인 P( y P ( y 적절하고 해결 가능한 [9]방법으로 통합하는 것을 목표로 하는 베이지안 추론의 기술적 핵심을 캡슐화한다.

교환성

통계 분석의 일반적인 시작점은 n개 1, 2, n 교환 가능하다고 가정하는 것입니다. y 이외에는 § j _s를 구별할 수 있는 정보가 없고 파라미터의 순서나 그룹화를 할 수 없는 경우 이전 [10]분포에서 파라미터 간의 대칭성을 가정해야 합니다.이 대칭은 확률적으로 교환성으로 표현됩니다.Generally, it is useful and appropriate to model data from an exchangeable distribution as independently and identically distributed, given some unknown parameter vector , with distribution .

유한 교환성

고정수 n의 경우 조인트 P,,}, \순열치열에서 불변하는 경우 y , …, 교환가능하다. (1, 2, …, n ,,…, ) (, , …, y의 모든 에 대해 ( 1 1,2, …, 1,2 2, …, πn )(\(\},\ _= Y( 1 1, …,)입니다.[11]

다음은 교환 가능하지만 독립적이지 않고 동일한(iid) 예를 제시하겠습니다.안에 빨간색 공과 파란색 공이 들어 있는 항아리를 생각해 보십시오. 둘 중 하나를 그릴 입니다.공은 교체 없이 추첨된다. 즉, n개의 공에서 1개의 공을 뽑은 후, 다음 추첨을 위해 1개의 남은 공이 남는다.

첫 번째 추첨에서 빨간색 공을 선택하고 두 번째 추첨에서 파란색 공을 선택할 확률은 첫 번째 추첨에서 파란색 공을 선택하고 두 번째 추첨에서 빨간색 공을 선택할 확률과 같으므로, 두 모두 1/2(예 P( 1 , 0 ) ( 0 , 2 ) 1 )입니다.)=}=}=1)= })과y2({y_}})는 교환 가능합니다.

그러나 첫 번째 추첨에서 이미 빨간색 공이 선택되었을 때 두 번째 추첨에서 빨간색 공을 선택할 확률은 0이며, 두 번째 추첨에서 빨간색 공이 선택될 확률은 1/2입니다(예 [ y ( 2 ) = 1 ) [ ] 0 = ] y_)= P}=1)=mid y 1 y 독립적이지 않습니다.

1, (\ 독립적이고 동일한 분산형일 교환이 가능하지만 그 반대가 반드시 [12]올바른 것은 아닙니다.

무한 교환성

무한 교환성은 무한 1 2, 모든 유한 서브셋을 교환할 수 있는 속성입니다.즉, 임의의 n에 대해 는 교환 가능합니다.[12]

계층적 모델

구성 요소들

베이지안 계층 모델링은 사후 [1]분포를 도출할 때 두 가지 중요한 개념을 사용한다.

  1. 하이퍼 모수: 이전 분포의 모수
  2. 하이퍼프라이어: 하이퍼파라미터의 분포

임의의 변수 Y가 파라미터 as를 평균으로, 1분산으로 하는 정규 분포를 따른다고 가정합니다. , Y ( , )\ Y N ( \ )칠데관계 N }은 "분포"로 읽을 수 있습니다.또한 파라미터 및 분산1의 정규 분포가 있다고 가정합니다.예를 들어 "N (, N ( \ 다른 분포가 있습니다.y 표준 정규 분포 ( , \ {} ( 0 , μ \ 하이퍼파라미터라고 불리며 ( ,1 ) { \ { N( 0 , )는 하이퍼프라이어 분포의 예입니다.Y 분포 표기법은 다른 파라미터가 추가됨에 따라 달라집니다.를 들어 Y ~ ( ) ( \ Y \ \ , \ \ N ( \ 1 )。다른 스테이지가 있는 경우 \ \ variance variance mean mean β β mean mean β β β β β β β β β β β β β β β β β β β β β β β β β β β β \ barance ~ ( ,) { \ N ( \, \)、 { {\ 、 {\ {\ 、 \ \ 하이퍼파라미터라고 불리며 분포도 하이퍼프라이어집니다.[6]

프레임워크

j 관찰 대상으로 (\ \ _j})를y j(\})의 데이터 생성 프로세스를 하는 파라미터로 합니다.파라미터 , , j { \ 1}, \ _{j}}, {j {ta}, {}, {ta}, {ts}, { 생성되었다고 가정합니다.분포는 하이퍼 파라미터 에 의해 제어되며 일반 모집단에서 교환할 수 있습니다.
베이지안 계층 모델에는 다음 단계가 포함됩니다.

스테이지 1에서 볼 수 있듯이 P j ,){ P _ 가능성이 높고, 그 이전의 분포로서 P ) , ) { P_{ 있습니다. 따라 달라집니다. { \theta _ {

단계별 사전 배포는 다음과 같이 나눌 수 있습니다.

[조건부 확률의 정의에서]

( or) \ P \ )

따라서 후방 분포는 다음과 비례합니다.

[베이즈 정리]
[13]

이것을 더 잘 설명하기 위해, 예를 들어보자: 한 교사가 학생이 SAT에서 얼마나 잘했는지를 평가하기를 원한다.교사는 학생의 고등학교 성적과 현재 성적 평균(GPA)에 대한 정보를 이용하여 견적을 낸다.Y(\ Y로 표시된 학생의 현재 GPA는 가 \인 확률함수(\displaystyle \theta ~ Y 가능성이 있습니다. 파라미터"\SAT 점수는 학생(신입생, 2학년생, 3학년생)[14]의 고교 인 또 다른 매개변수{\(\에 의해 지수화된 공통 인구 분포에서 나온 표본으로 간주됩니다.즉, ~ (\ P ( \)) 입니다.또, 하이퍼 {\ {\ {\ {\ {\ (\ \ GPA에서 주어진 SAT 점수를 풀려면

문제의 모든 정보는 사후 분배를 위해 해결에 사용됩니다.사전 분포와 우도 함수만을 사용하여 해결하는 대신, 하이퍼프라이어를 사용하면 [15]모수의 동작에 대해 보다 정확한 믿음을 만들기 위해 더 많은 정보를 얻을 수 있습니다.

2단계 계층 모델

일반적으로 2단계 계층적 모델에서 관심 있는 공동 후방 분포는 다음과 같다.

[15]

3단계 계층 모델

3단계 계층 모형의 경우 후방 분포는 다음과 같이 제공됩니다.

[15]

베이지안 비선형 혼합효과 모형

베이지안 비선형 혼합 효과 모델을 사용한 베이지안 연구 주기: (a) 표준 연구 주기 및 (b) 베이지안 고유의 워크플로우.

베이지안 계층 모델링의 프레임워크는 다양한 애플리케이션에서 자주 사용됩니다.특히 베이지안 비선형 혼합 효과 모델은 최근 상당한 관심을 받고 있다.베이지안 비선형 혼합 효과 모델의 기본 버전은 다음과 같은 3단계로 표현된다.

스테이지 1: 개인 레벨 모델

스테이지 2: 모집단 모델

스테이지 3: 이전

여기서 j j 에서의 i i 피험자의 연속 응답을 나타내고 b i i 이다.모델에 관련된 파라미터는 그리스 문자로 기재되어 있습니다 ( ; 1, , K) { f ( ; \ { , \, \_ { } )는K \ K } -차원 , , \ K \ tyle 로 파라미터화된 기존 함수 파라미터입니다\ f '점수' 함수로 개인의 시간 궤적을 기술한다이 모델에서는 j \ style \ {ij }, i \ \_ { 각각 개인 내 가변성과 개인 간 가변성을 기술하고 있다.3단계: 이전을 고려하지 않으면 모형이 빈도가 높은 비선형 혼합 효과 모형으로 감소합니다.


베이지안 비선형 혼합 효과 모델 적용 시 중심 과제는 후방 밀도를 평가하는 것이다.


오른쪽 패널에는 베이지안 비선형 혼합효과 [17]모델을 사용한 베이지안 연구 사이클이 표시됩니다.베이지안 비선형 혼합 효과 모델을 사용하는 연구 주기는 (a) 표준 연구 주기와 (b) 베이지안 고유의 워크플로우라는 두 단계로 구성된다.표준 연구 주기에는 문헌 검토, 문제 정의 및 연구 질문 및 가설 지정이 포함됩니다.베이지안 고유의 워크플로우는 세 가지 하위 단계로 구성된다. (b)–(i) 배경 지식과 사전 도출에 기초한 사전 분포 공식화, (b)–(ii) 비선형 ff 및 (b)–(iii) 사후 추론을 하는 우도 함수를 결정한다.결과적인 후방 추론은 새로운 연구 주기를 시작하는 데 사용될 수 있다.

레퍼런스

  1. ^ a b Allenby, Rossi, McCulloch(2005년 1월)."계층적 베이즈 모델: 실무자 가이드"마케팅 분야에서의 베이지안 애플리케이션 저널, 페이지 1~4.2014년 4월 26일 취득, 페이지 3
  2. ^ Gelman, Andrew; Carlin, John B.; Stern, Hal S. & Rubin, Donald B. (2004). Bayesian Data Analysis (second ed.). Boca Raton, Florida: CRC Press. pp. 4–5. ISBN 1-58488-388-X.
  3. ^ Lee, Se Yoon; Lei, Bowen; Mallick, Bani (2020). "Estimation of COVID-19 spread curves integrating global data and borrowing information". PLOS ONE. 15 (7): e0236860. arXiv:2005.00662. doi:10.1371/journal.pone.0236860. PMC 7390340. PMID 32726361.
  4. ^ Lee, Se Yoon; Mallick, Bani (2021). "Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas". Sankhya B. doi:10.1007/s13571-020-00245-8.
  5. ^ 겔만 외 2004년, 페이지 6
  6. ^ a b 겔만 외 2004년, 페이지 117
  7. ^ a b Good, I.J. (1980). "Some history of the hierarchical Bayesian methodology". Trabajos de Estadistica y de Investigacion Operativa. 31: 489–519. doi:10.1007/BF02888365. S2CID 121270218.
  8. ^ 베르나르도, 스미스(1994년).베이지안 이론치체스터(영국): John Wiley & Sons, ISBN 0-471-92416-4, 23페이지
  9. ^ a b 겔만 외 2004년, 페이지 6-8.
  10. ^ 베르나르도, 데그루트, 린들리(1983년 9월).'제2차 발렌시아 국제회의 진행'베이지안 통계 정보 2.암스테르담:엘세비어 사이언스 퍼블리셔 B.V, ISBN 0-444-87746-0, 페이지 167-168
  11. ^ 겔만 외 2004, 페이지 121~125.
  12. ^ a b 디아코니스, 프리맨(1980년)."무한 교환 시퀀스"확률사, 745–747페이지
  13. ^ 베르나르도, 데그루트, 린들리(1983년 9월).'제2차 발렌시아 국제회의 진행'베이지안 통계 정보 2.암스테르담:엘세비어 과학출판사 B.V, ISBN 0-444-87746-0, 371-372페이지
  14. ^ 겔만 외 2004, 페이지 120-120.
  15. ^ a b c 박스 G. E. P., 티오 G. C. (1965년)"베이지안 관점에서 본 다중 파라미터 문제"베이지안 관점에서 본 다중 파라미터 문제 제36권 5호뉴욕시: John Wiley & Sons, ISBN 0-471-57428-7
  16. ^ Lee, Se Yoon (2022). "Bayesian Nonlinear Models for Repeated Measurement Data: An Overview, Implementation, and Applications". Mathematics. doi:10.3390/math10060898.
  17. ^ Lee, Se Yoon (2022). "Bayesian Nonlinear Models for Repeated Measurement Data: An Overview, Implementation, and Applications". Mathematics. doi:10.3390/math10060898.