계산통계
Computational statistics계산통계학 또는 통계컴퓨팅은 통계학과 컴퓨터 사이언스의 결합이다.이는 계산 방법을 사용하여 활성화된 통계 방법을 의미합니다.통계학의 수리과학에 특화된 계산과학(또는 과학컴퓨팅) 분야이다.이 분야도 급속히 발전하고 있어, 일반적인 [1]통계 교육의 일환으로서 보다 넓은 개념의 컴퓨팅을 가르쳐야 한다는 요구가 나오고 있습니다.
기존 통계에서와 마찬가지로 원시 데이터를 [2]지식으로 변환하는 것이 목표이지만, 초점은 표본 크기가 매우 크고 동종 데이터 세트가 [2]아닌 경우와 같은 컴퓨터 집약적인 통계 방법에 있습니다.
Carlo Lauro(전 국제통계컴퓨팅협회 회장)는 '통계컴퓨팅'을 "통계에 대한 컴퓨터 과학의 적용"으로 정의하고 '계산통계'를 구별하는 것을 제안했지만, '계산통계'와 '통계컴퓨팅'이라는 용어는 종종 서로 바꾸어 사용된다.s "컴퓨터 시대 이전에는 생각할 수 없었던 방법(예: 부트스트랩, 시뮬레이션)을 포함한 통계적 방법을 컴퓨터에 구현하기 위한 알고리즘 설계뿐만 아니라 분석적으로 다루기 어려운 문제에 대처하기 위한 알고리즘 설계에도 적용된다." [bootstrap][3]
'컴퓨터 통계'라는 용어는 또한 재샘플링 방법, 마르코프 연쇄 몬테카를로 방법, 국소 회귀, 커널 밀도 추정, 인공 신경망 및 일반화된 가법 모델을 포함한 계산 집약적인 통계 방법을 언급하기 위해 사용될 수 있다.
역사
계산 통계는 오늘날 널리 사용되고 있지만, 실제로는 통계 커뮤니티에서 받아들여진 역사가 비교적 짧습니다.대부분의 경우, 통계 분야의 창시자들은 계산 통계 방법론의 [4]개발에서 수학과 점근적 근사치에 의존했다.
통계 분야에서 "컴퓨터"라는 용어가 처음 사용된 것은 로버트 P의 미국 통계 협회 저널 아카이브에 실린 기사에서 비롯된다. 1891년 포터.이 기사는 미국의 [5]제11회 인구조사에서 헤르만 홀리스의 기계의 사용에 대해 논하고 있다.헤르만 홀리스의 기계는 일명 표 작성 기계라고도 불리며, 펀치 카드에 저장된 정보를 요약하는 것을 돕기 위해 고안된 전기 기계 기계였다.그것은 미국의 사업가, 발명가, 그리고 통계학자인 허먼 홀리스에 의해 발명되었다.그의 천공 카드 표 계산기 발명품은 1884년에 특허를 받았으며, 후에 1890년 미국의 인구 조사에 사용되었다.그 기술의 장점은 바로 알 수 있었다.약 5천만 명의 인구가 있는 1880년 인구 조사에서는 7년 이상이 걸렸다.1890년 인구 조사에서는 6천2백만 명 이상이 있었지만, 1년도 걸리지 않았습니다.이것은 기계화된 계산 통계와 반자동 데이터 처리 시스템의 시대의 시작을 나타냅니다.
1908년, 윌리엄 씰리 고셋은 현재 잘 알려진 몬테카를로 방법 시뮬레이션을 수행하였고, 이는 학생의 [6]t-분포를 발견하게 되었다.계산 방법의 도움으로, 그는 또한 해당하는 이론적 분포에 중첩된 경험적 분포의 플롯을 가지고 있다.컴퓨터는 시뮬레이션에 혁명을 일으켰고 고셋의 실험을 [7][8]연습에 지나지 않게 만들었다.
나중에, 과학자들은 의사 랜덤 편차를 생성하는 계산 방법을 제안하고, 역 누적 분포 함수 또는 수용 거부 방법을 사용하여 균일한 편차를 다른 분포 형태로 변환하는 방법을 수행했으며, 마르코프 연쇄 몬테 [9]카를로를 위한 상태 공간 방법론을 개발했다.
1950년대 중반까지 발전기의 랜덤성을 테스트하기 위한 많은 작업이 이루어졌습니다.대부분의 컴퓨터는 이제 난수표를 참조할 수 있습니다.1958년, 존 투키의 잭나이프가 개발되었습니다.이는 비표준 [10]조건에서 표본에서 모수 추정치의 편향을 줄이기 위한 방법입니다.이를 위해서는 실제 구현을 위한 컴퓨터가 필요합니다.지금까지 컴퓨터는 많은 지루한 통계 연구를 [11]실현 가능하게 만들었다.
방법들
최대우도 추정
최대우도 추정은 일부 관측 데이터가 주어진 가정된 확률 분포의 모수를 추정하는 데 사용됩니다.이는 관측 데이터가 가정된 통계 모델에서 가장 가능성이 높도록 우도 함수를 최대화함으로써 달성된다.
몬테카를로법
몬테카를로 통계 방법은 수치 결과를 얻기 위해 반복적인 무작위 표본 추출에 의존한다.개념은 원칙적으로 결정적일 수 있는 문제를 해결하기 위해 무작위성을 사용하는 것입니다.그것들은 종종 물리적 및 수학적 문제에 사용되며 다른 접근방식을 사용하기 어려울 때 가장 유용하다.몬테카를로 방법은 최적화, 수치 적분 및 확률 분포에서 도출의 세 가지 문제 클래스에서 주로 사용됩니다.
마르코프 연쇄 몬테카를로
마르코프 연쇄 몬테 카를로 방법은 알려진 함수에 비례하는 확률 밀도를 가진 연속 랜덤 변수로부터 샘플을 생성한다.이러한 표본을 사용하여 해당 변수에 대한 적분을 기대값 또는 분산으로 평가할 수 있습니다.단계가 많을수록 표본 분포가 실제 원하는 분포와 더 밀접하게 일치합니다.
적용들
계산 통계 저널
- 통계 정보 통신 - 시뮬레이션 및 계산
- 계산 통계
- 계산통계 및 데이터 분석
- 계산 및 그래픽 통계 저널
- 통계 계산 및 시뮬레이션 저널
- 통계 소프트웨어 저널
- R 저널
- 스타타 저널
- 통계 및 컴퓨팅
- Wiley 학제간 리뷰 계산 통계
어소시에이션
「 」를 참조해 주세요.
레퍼런스
- ^ 놀런, D. & 템플 랭, D. (2010년)"통계 커리큘럼에서의 컴퓨팅", 미국 통계학자 64(2), 페이지 97-107.
- ^ a b Wegman, Edward J. "컴퓨터 통계: 통계 이론과 실천을 위한 새로운 의제"워싱턴 과학 아카데미 저널, 제78권, 제4호, 1988년, 페이지 310–322. JSTOR
- ^ Lauro, Carlo (1996), "Computational statistics or statistical computing, is that the question?", Computational Statistics & Data Analysis, 23 (1): 191–193, doi:10.1016/0167-9473(96)88920-1
- ^ Watnik, Mitchell (2011). "Early Computational Statistics". Journal of Computational and Graphical Statistics. 20 (4): 811–817. doi:10.1198/jcgs.2011.204b. ISSN 1061-8600. S2CID 120111510.
- ^ Hendrickson, W. A.; Ward, K. B. (1975-10-27). "Atomic models for the polypeptide backbones of myohemerythrin and hemerythrin". Biochemical and Biophysical Research Communications. 66 (4): 1349–1356. doi:10.1016/0006-291x(75)90508-2. ISSN 1090-2104. PMID 5.
- ^ "Los Alamos science, Number 14". 1986-01-01. doi:10.2172/6935980.
{{cite journal}}
:Cite 저널 요구 사항journal=
(도움말) - ^ Trahan, Travis John (2019-10-03). "Recent Advances in Monte Carlo Methods at Los Alamos National Laboratory". doi:10.2172/1569710. OSTI 1569710.
{{cite journal}}
:Cite 저널 요구 사항journal=
(도움말) - ^ Metropolis, Nicholas; Ulam, S. (1949). "The Monte Carlo Method". Journal of the American Statistical Association. 44 (247): 335–341. doi:10.1080/01621459.1949.10483310. ISSN 0162-1459. PMID 18139350.
- ^ Robert, Christian; Casella, George (2011-02-01). "A Short History of Markov Chain Monte Carlo: Subjective Recollections from Incomplete Data". Statistical Science. 26 (1). doi:10.1214/10-sts351. ISSN 0883-4237. S2CID 2806098.
- ^ QUENOUILLE, M. H. (1956). "Notes on Bias in Estimation". Biometrika. 43 (3–4): 353–360. doi:10.1093/biomet/43.3-4.353. ISSN 0006-3444.
- ^ Teichroew, Daniel (1965). "A History of Distribution Sampling Prior to the Era of the Computer and its Relevance to Simulation". Journal of the American Statistical Association. 60 (309): 27–49. doi:10.1080/01621459.1965.10480773. ISSN 0162-1459.
추가 정보
기사들
- Albert, J.H.; Gentle, J.E. (2004), Albert, James H; Gentle, James E (eds.), "Special Section: Teaching Computational Statistics", The American Statistician, 58: 1, doi:10.1198/0003130042872, S2CID 219596225
- Wilkinson, Leland (2008), "The Future of Statistical Computing (with discussion)", Technometrics, 50 (4): 418–435, doi:10.1198/004017008000000460, S2CID 3521989
책들
- Drew, John H.; Evans, Diane L.; Glen, Andrew G.; Lemis, Lawrence M. (2007), Computational Probability: Algorithms and Applications in the Mathematical Sciences, Springer International Series in Operations Research & Management Science, Springer, ISBN 978-0-387-74675-3
- Gentle, James E. (2002), Elements of Computational Statistics, Springer, ISBN 0-387-95489-9
- Gentle, James E.; Härdle, Wolfgang; Mori, Yuichi, eds. (2004), Handbook of Computational Statistics: Concepts and Methods, Springer, ISBN 3-540-40464-3
- Givens, Geof H.; Hoeting, Jennifer A. (2005), Computational Statistics, Wiley Series in Probability and Statistics, Wiley-Interscience, ISBN 978-0-471-46124-1
- Klemens, Ben (2008), Modeling with Data: Tools and Techniques for Statistical Computing, Princeton University Press, ISBN 978-0-691-13314-0
- Monahan, John (2001), Numerical Methods of Statistics, Cambridge University Press, ISBN 978-0-521-79168-7
- Rose, Colin; Smith, Murray D. (2002), Mathematical Statistics with Mathematica, Springer Texts in Statistics, Springer, ISBN 0-387-95234-9
- Thisted, Ronald Aaron (1988), Elements of Statistical Computing: Numerical Computation, CRC Press, ISBN 0-412-01371-1
- Gharieb, Reda. R. (2017), Data Science: Scientific and Statistical Computing, Noor Publishing, ISBN 978-3-330-97256-8