베이지안 통계

Bayesian statistics

베이지안 통계학확률의 베이지안 해석에 기초한 통계학 분야의 이론으로, 여기서 확률사건대한 믿음의 정도를 나타낸다.믿음의 정도는 이전 실험의 결과와 같은 사건에 대한 사전 지식이나 사건에 대한 개인적인 믿음에 기초할 수 있습니다.이것은 확률을 많은 시행 [1]후 사건의 상대 빈도의 한계로 보는 빈도론 해석과 같은 확률에 대한 다른 많은 해석과는 다르다.

베이지안 통계 방법은 베이즈의 정리를 사용하여 새로운 데이터를 얻은 후 확률을 계산하고 업데이트합니다.베이즈의 정리는 [2][3]사건과 관련된 사건이나 조건에 대한 사전 정보나 믿음뿐만 아니라 데이터에 기초한 사건의 조건부 확률을 기술한다.예를 들어, 베이지안 추론에서, 베이즈의 정리는 확률 분포 또는 통계 모델의 모수를 추정하기 위해 사용될 수 있다.베이지안 통계는 확률을 믿음의 정도로 취급하기 때문에, 베이즈의 정리는 모수 또는 [1][2]모수 집합에 믿음을 수량화하는 확률 분포를 직접 할당할 수 있다.

베이지안 통계는 1763년에 발표된 논문에서 베이지안 정리의 구체적인 사례를 공식화한 토마스 베이즈의 이름을 따서 명명되었다.18세기 말부터 19세기 초에 걸친 여러 논문에서, 피에르 시몬 라플라스는 확률의 [4]베이지안 해석을 발전시켰다.Laplace는 많은 통계 문제를 해결하기 위해 현재 베이지안으로 간주되는 방법을 사용했다.많은 베이지안 방법들이 후기 저자들에 의해 개발되었지만, 이 용어는 1950년대까지 그러한 방법들을 설명하기 위해 일반적으로 사용되지 않았다.20세기의 대부분 동안, 베이지안 방법은 철학적, 실용적인 고려사항으로 인해 많은 통계학자들에게 불리하게 여겨졌다.많은 베이지안 방법들은 완료하기 위해 많은 계산이 필요했고, 세기에 널리 사용된 대부분의 방법들은 빈도론적인 해석에 기초했다.그러나 강력한 컴퓨터와 마르코프 연쇄 몬테카를로와 같은 새로운 알고리즘의 등장으로, 베이지안 방법은 21세기 [1][5]통계 내에서 점점 더 많이 사용되어 왔다.

베이즈 정리

베이즈의 정리는 베이지안 방법에서 새로운 데이터를 얻은 후 신뢰도인 확률을 갱신하는 데 사용된다.A( 스타일 B 2가지 이벤트를 고려할 때 B B 참일 때 A A 조건부 확률은 다음과 같습니다.[6]

서 P0(\ P 0 베이즈의 정리는 확률론의 기본적인 결과이지만, 베이지안 통계학에서는 특정한 해석을 가지고 있다.위의 방정식에서 A A 으로 제안(예: 동전이 앞면에 착지되는 시간의 50%)을 나타내며B)는 고려해야 할 증거 또는 새로운 데이터(예: 일련의 동전 던지기 결과)를 나타냅니다. P( A 스타일 A 자신의 신념을 표현하는 A A 사전 확률입니다.A A 사전 지식이나 정보를 수량화할 수도 있다. A 우도 함수이며 A(\A 참임을 고려할 때 B B 확률로 해석할 수 있다.가능성은 B B A 스타일 A를 지지하는 정도를 증거 B를 고려한 후의 확률 A( A 확률을 수량화한다.본질적으로, Bayes의 정리는 새로운 를 고려한 후 자신의 이전 P ( ({ P ([1] 갱신한다.

P 확률은 총확률하여 계산할수 있다.{ 1, , A n { \ { _ { _ 2 , \ , A { } } 이 의 모든 결과의 집합인 샘플 공간의 파티션인 경우[1][6]

결과가 무한히 많을 경우 모든 결과를 통합하여 총확률의 법칙을 사용하여 P P 해야 합니다.종종 P)\style P(Bdisplay P(B)\calculation에는 평가에 시간이 많이 걸리는 합계 또는 적분이 포함되기 때문에 계산이 어렵다.따라서 종종 동일한 분석에서 증거가 변경되지 않기 때문에 이전 및 가능성의 곱만 고려된다.후면은 이 [1]제품에 비례합니다.

후방 모드이며 종종 수학적 최적화 방법을 사용하여 베이지안 통계에서 계산되는 최대 사후 값은 동일하게 유지됩니다.후부는 마르코프 연쇄 몬테카를로법이나 변이 베이지안법[1]같은 방법으로 P 한 값을 계산하지 않아도 근사할 수 있다.

베이지안 방법의 개요

통계기법의 일반적인 집합은 다수의 활동으로 나눌 수 있으며, 그 중 다수는 특수한 베이지안 버전을 가지고 있다.

베이지안 추론

베이지안 추론은 [7]추론의 불확실성을 확률을 사용하여 정량화하는 통계적 추론을 말한다.고전적 빈도론 추론에서는 모형 모수와 가설이 고정된 것으로 간주됩니다.빈도수 추론에서 확률은 모수나 가설에 할당되지 않습니다.예를 들어, 공정화폐의 다음 반올림 결과와 같이 한 번만 발생할 수 있는 사건에 확률을 직접 할당하는 것은 빈도주의 추론에 의미가 없을 것이다.그러나 동전 던지기 횟수가 [8]증가함에 따라 앞면의 비율이 절반에 이른다고 말하는 것이 타당할 것이다.

통계 모델은 샘플 데이터가 생성되는 방법을 나타내는 일련의 통계 가정 및 프로세스를 지정합니다.통계 모델에는 수정할 수 있는 여러 매개 변수가 있습니다.예를 들어, 동전은 두 가지 가능한 결과를 모형화하는 베르누이 분포의 표본으로 나타낼 수 있습니다.베르누이 분포는 하나의 결과의 확률과 동일한 단일 모수를 가지며, 이는 대부분의 경우 머리 위에 착지할 확률이다.데이터에 대한 좋은 모델을 고안하는 것이 베이지안 추론의 중심이다.대부분의 경우 모형은 실제 공정에만 가깝고 [1]데이터에 영향을 미치는 특정 요인을 고려하지 않을 수 있습니다.베이지안 추론에서 확률은 모델 매개변수에 할당될 수 있습니다.매개변수는 랜덤 변수로 나타낼 수 있습니다.베이지안 추론은 더 많은 증거가 확보되거나 [1][9]알려진 후에 확률을 업데이트하기 위해 베이즈의 정리를 사용한다.

통계 모델링

베이지안 통계를 사용한 통계 모델의 공식화에는 알려지지 않은 모수에 대한 사전 분포의 지정이 필요하다는 식별 기능이 있다.실제로, 이전 분포의 모수 자체는 사전 분포를 가질 수 있으며, 다단계 모델링이라고도 하는 베이지안 계층적 [10][11][12]모델링으로 이어질 수 있습니다.특수한 경우는 베이지안 네트워크입니다.

베이지안 통계 분석을 수행하기 위해 모범 사례는 van de Shoot 등에 의해 논의된다.[13]

베이지안 통계 분석 결과를 보고하기 위해, 존 K. 크루슈케[14]공개 접근 기사에 베이지안 분석 보고 지침(BARG)이 제공된다.

실험 설계

베이지안 실험 설계는 '이전 믿음의 영향'이라고 불리는 개념을 포함한다.이 접근법은 순차 분석 기법을 사용하여 이전 실험의 결과를 다음 실험의 설계에 포함합니다.이는 사전 및 사후 분포를 사용하여 '믿음'을 업데이트함으로써 달성된다.이를 통해 실험 설계는 모든 유형의 자원을 잘 활용할 수 있습니다.그 예로는 멀티밴디트 문제가 있습니다.

베이지안 모델의 탐색적 분석

베이지안 모델의 탐색적 분석은 베이지안 모델링의 필요성과 특성에 대한 탐색적 데이터 분석 접근방식의 적응 또는 확장이다.페르시 디아코니스의 말을 [15]빌리자면:

탐색적 데이터 분석은 데이터의 구조 또는 간단한 설명을 밝히는 것을 추구합니다.우리는 숫자나 그래프를 보고 패턴을 찾으려고 합니다.배경 정보, 상상력, 패턴 인식 및 기타 데이터 분석 경험을 통해 제안된 잠재 고객을 추적합니다.

추론 과정은 후방 예측 분포 및 이전 예측 분포와 같은 다른 분포와 함께 베이지안 통계에서 중심 역할을 하는 후방 분포를 생성한다.이러한 분포의 정확한 시각화, 분석 및 해석은 추론 [16]과정에 동기를 부여하는 질문에 적절하게 답하기 위한 핵심이다.

베이지안 모델로 작업할 때 추론 자체 외에도 다루어야 할 일련의 관련 작업이 있다.

  • 추론의 품질 진단, 이것은 마르코프 연쇄 몬테카를로 기법과 같은 수치적 방법을 사용할 때 필요하다.
  • 모델 가정 및 모델 예측에 대한 평가를 포함한 모델 비판
  • 모형 선택 또는 모형 평균화를 포함한 모형 비교
  • 특정 대상자를 위한 결과 준비

이러한 모든 작업은 베이지안 모델의 탐색적 분석 접근법의 일부이며, 성공적으로 수행하는 것이 반복적이고 대화형 모델링 프로세스의 핵심이다.이러한 작업에는 수치적 요약과 시각적 [17][18][19]요약이 모두 필요합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b c d e f g h i Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (2013). Bayesian Data Analysis (Third ed.). Chapman and Hall/CRC. ISBN 978-1-4398-4095-5.
  2. ^ a b McElreath, Richard (2020). Statistical Rethinking : A Bayesian Course with Examples in R and Stan (2nd ed.). Chapman and Hall/CRC. ISBN 978-0-367-13991-9.
  3. ^ Kruschke, John (2014). Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan (2nd ed.). Academic Press. ISBN 978-0-12-405888-0.
  4. ^ McGrayne, Sharon (2012). The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy (First ed.). Chapman and Hall/CRC. ISBN 978-0-3001-8822-6.
  5. ^ Fienberg, Stephen E. (2006). "When Did Bayesian Inference Become "Bayesian"?". Bayesian Analysis. 1 (1): 1–40. doi:10.1214/06-BA101.
  6. ^ a b Grinstead, Charles M.; Snell, J. Laurie (2006). Introduction to probability (2nd ed.). Providence, RI: American Mathematical Society. ISBN 978-0-8218-9414-9.
  7. ^ Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  8. ^ Wakefield, Jon (2013). Bayesian and frequentist regression methods. New York, NY: Springer. ISBN 978-1-4419-0924-4.
  9. ^ Congdon, Peter (2014). Applied Bayesian modelling (2nd ed.). Wiley. ISBN 978-1119951513.
  10. ^ Kruschke, J K; Vanpaemel, W (2015). "Bayesian Estimation in Hierarchical Models". In Busemeyer, J R; Wang, Z; Townsend, J T; Eidels, A (eds.). The Oxford Handbook of Computational and Mathematical Psychology (PDF). Oxford University Press. pp. 279–299.
  11. ^ 하지라메자날리, E. & Dadaneh, S. Z. & Karbalayghareh, A. & Zow, Z.& Qian, X. 차세대 시퀀싱 카운트 데이터에서 암 서브타입 발견을 위한 베이지안 다중 도메인 학습. 캐나다 몬트렐, NIPS 2018(Neural Information Processing Systems)에 관한 제32회 컨퍼런스.arXiv: 1810.09433
  12. ^ Lee, Se Yoon; Mallick, Bani (2021). "Bayesian Hierarchical Modeling: Application Towards Production Results in the Eagle Ford Shale of South Texas". Sankhya B. 84: 1–43. doi:10.1007/s13571-020-00245-8.
  13. ^ van de Schoot, Rens; Depaoli, Sarah; King, Ruth; Kramer, Bianca; Märtens, Kaspar; Tadesse, Mahlet G.; Vannucci, Marina; Gelman, Andrew; Veen, Duco; Willemsen, Joukje; Yau, Christopher (January 14, 2021). "Bayesian statistics and modelling". Nature Reviews Methods Primers. 1 (1): 1–26. doi:10.1038/s43586-020-00001-2. hdl:1874/415909. S2CID 234108684.
  14. ^ Kruschke, J K (Aug 16, 2021). "Bayesian Analysis Reporting Guidelines". Nature Human Behaviour. 5 (10): 1282–1291. doi:10.1038/s41562-021-01177-7. PMC 8526359. PMID 34400814.
  15. ^ Diaconis, Persi(2011) 데이터 분석 이론:고전 통계학을 통한 마법적 사고에서.John Wiley & Sons, Ltd: e55 doi: 10.1002/9781118150702.ch1
  16. ^ Kumar, Ravin; Carroll, Colin; Hartikainen, Ari; Martin, Osvaldo (2019). "ArviZ a unified library for exploratory analysis of Bayesian models in Python". Journal of Open Source Software. 4 (33): 1143. Bibcode:2019JOSS....4.1143K. doi:10.21105/joss.01143.
  17. ^ Gabry, Jonah; Simpson, Daniel; Vehtari, Aki; Betancourt, Michael; Gelman, Andrew (2019). "Visualization in Bayesian workflow". Journal of the Royal Statistical Society, Series A (Statistics in Society). 182 (2): 389–402. arXiv:1709.01449. doi:10.1111/rssa.12378. S2CID 26590874.
  18. ^ Vehtari, Aki; Gelman, Andrew; Simpson, Daniel; Carpenter, Bob; Bürkner, Paul-Christian (2021). "Rank-Normalization, Folding, and Localization: An Improved Rˆ for Assessing Convergence of MCMC (With Discussion)". Bayesian Analysis. 16 (2). arXiv:1903.08008. doi:10.1214/20-BA1221. S2CID 88522683.
  19. ^ Martin, Osvaldo (2018). Bayesian Analysis with Python: Introduction to statistical modeling and probabilistic programming using PyMC3 and ArviZ. Packt Publishing Ltd. ISBN 9781789341652.

추가 정보

외부 링크