통계적 추론

Statistical inference

통계적 추론은 확률 분포의 속성[1]추론하기 위해 데이터 분석을 사용하는 과정이다.추리 통계 분석은 예를 들어 가설을 테스트하고 추정치를 도출함으로써 모집단의 속성을 추론한다.관측된 데이터 집합은 더 큰 모집단에서 추출된다고 가정합니다.

추리 통계량기술 통계량과 대조될 수 있다.기술 통계량은 관측된 데이터의 속성에만 관련이 있으며 데이터가 더 큰 모집단에서 가져온다는 가정 하에 성립하지 않습니다.기계 학습 용어를 추론 가끔 대신", 이미 훈련된 모델을 평가함으로써 예측하다."을 의미하는 것이다. 이 컨텍스트 모델의 속성 추정하고에서[2]에 훈련 또는 학습(추론보다는), 그리고 예측을 위한 모델로 추론(예측 대신)이라고 한다를 사용하여 언급된다;또한 pre을 사용된다.출신의.ctive 추론

서론

통계적 추론은 모집단에서 추출한 데이터를 어떤 형태로든 표본 추출하여 모집단에 대한 명제를 만든다.추론을 도출하고자 하는 모집단에 대한 가설이 주어졌을 때, 통계적 추론은 (첫째) 데이터를 생성하는 프로세스의 통계적 모델을 선택하는 것과 (두 번째) [citation needed]모델로부터 명제를 추론하는 것으로 구성된다.

코니시 및 기타가와씨는 "통계적 추론의 문제의 대부분은 통계적 모델링과 관련된 문제라고 볼 수 있다"[3]고 말한다.이와 관련, 데이비드 콕스 경은 "주제적 문제에서 통계적 모델로의 변환이 어떻게 이루어지는지가 종종 분석에서 가장 중요한 부분"[4]이라고 말했다.

통계적 추론의 결론통계적 [5]제안이다.통계제안의 일반적인 형태는 다음과 같다.

  • 포인트 추정치, 즉 관심 모수에 가장 가까운 특정 값
  • 구간 추정치, 예를 들어 신뢰 구간(또는 설정된 추정치) 즉, 그러한 데이터셋의 반복 샘플링에서 그러한 데이터셋이 명시된 신뢰 수준에서 확률과 함께 참 매개변수 값을 포함하도록 모집단에서 추출한 데이터셋을 사용하여 구성된 구간.
  • 신뢰할 수 있는 간격, 즉 사후 신념의 95%를 포함하는 일련의 값
  • 가설[note 1]기각
  • 데이터 점을 그룹으로 분류하거나 군집화합니다.

모델 및 전제 조건

통계적 추론은 몇 가지 가정을 필요로 한다.통계 모델은 관측된 데이터와 유사한 데이터의 생성에 관한 일련의 가정이다.통계 모델에 대한 설명은 일반적으로 우리가 [6]추론을 도출하고자 하는 관심 모집단 수량의 역할을 강조한다.기술 통계량은 일반적으로 더 공식적인 추론을 [7]도출하기 전에 예비 단계로 사용됩니다.

모델/추정의 정도

통계학자는 모델링 가정의 세 가지 수준을 구분한다.

  • 완전 파라미터:데이터 생성 프로세스를 기술하는 확률 분포는 한정된 수의 미지의 [6]매개변수만을 포함하는 확률 분포 계열에 의해 완전히 기술된다고 가정한다.예를 들어, 모집단 값의 분포는 평균과 분산을 알 수 없는 정규 분포이며 데이터 집합은 '단순' 랜덤 표본 추출에 의해 생성된다고 가정할 수 있다.일반화 선형 모델군은 널리 사용되고 유연한 모형의 클래스입니다.
  • 비파라미터:데이터를 생성하는 공정에 대한 가정은 모수 통계량보다 훨씬 작으며 [8]최소값일 수도 있습니다.예를 들어, 모든 연속 확률 분포에는 중위수가 있으며 표본 중위수 또는 Hodges를 사용하여 추정할 수 있습니다.레만-Sen 추정기. 단순 무작위 표본 추출에서 데이터가 발생할 때 좋은 특성을 가집니다.
  • 반파라미터:이 용어는 일반적으로 완전 및 비모수적 접근법 사이의 가정을 의미한다.예를 들어, 모집단 분포의 평균이 유한하다고 가정할 수 있습니다.또한 모집단의 평균 반응 수준은 일부 공변량(모수적 가정)에 진정으로 선형적인 방식으로 의존하지만, 평균 주변의 분산을 설명하는 모수적 가정은 하지 않을 수 있다(즉, 이질적 반응성의 존재 또는 가능한 형태에 대하여).보다 일반적으로, 반모수 모델은 종종 '구조적'과 '랜덤 변동' 구성요소로 분리될 수 있습니다.한 구성요소는 파라미터로 처리되고 다른 구성요소는 비파라미터로 처리됩니다.알려진 Cox 모형은 일련의 반모수적 가정입니다.

유효한 모델/전제의 중요성

위 이미지는 정규성 가정을 평가하는 히스토그램을 보여 줍니다. 이 히스토그램은 종 곡선 아래의 짝수 산포를 통해 설명할 수 있습니다.

어떤 수준의 가정이 이루어지든 간에, 일반적으로 정확하게 보정된 추론은 이러한 가정이 정확해야 한다. 즉, 데이터 생성 메커니즘이 실제로 올바르게 지정되어야 한다.

'단순한' 무작위 표본 추출에 대한 잘못된 가정은 통계적 [9]추론을 무효화할 수 있다.보다 복잡한 반모수적 및 완전 모수적 가정도 우려의 원인이다.예를 들어, Cox 모형을 잘못 가정하면 잘못된 [10]결론이 나올 수 있습니다.모집단에서 정규성에 대한 잘못된 가정도 일부 회귀 기반 [11]추론을 무효화합니다.모든 모수 모델의 사용은 인간 모집단의 표본 추출 전문가들에 의해 회의적으로 보인다: "대부분의 표본 추출 통계학자들은 신뢰 구간을 다룰 때, 매우 큰 표본에 기초한 [추정자]에 대한 진술로 스스로를 제한한다. 여기서 중심 한계 정리는 이러한 [추정자]가 분포를 가질 것을 보장한다.모자는 거의 [12]정상입니다.특히 정규 분포는 "만약 우리가 어떤 종류의 경제 [12]인구를 다루고 있다면 완전히 비현실적이고 재앙적으로 현명하지 못한 가정일 것"이다.여기서 중심 한계 정리는 "매우 큰 표본에 대한" 표본 평균의 분포가 두꺼운 꼬리가 없는 분포가 아닌 경우 근사적으로 정규 분포임을 나타냅니다.

대략적인 분포

표본 통계량의 정확한 분포를 지정하는 것이 어렵기 때문에, 표본 통계량의 근사치를 위한 많은 방법이 개발되었다.

유한 표본의 경우 근사 결과는 한계 분포가 통계량의 표본 분포에 얼마나 근접하는지 측정합니다.예를 들어, 10,000개의 독립 표본의 경우 정규 분포 Berry-Esseen [13]정리에 따라 많은 모집단 분포에 대한 표본 평균의 분포(정확도 두 자리)에 근사합니다.그러나 시뮬레이션 연구와 통계학자의 [13]경험에 따르면, 많은 실질적인 목적을 위해 정규 근사는 10개 이상의 독립적인 표본이 있을 때 표본 평균 분포에 대한 좋은 근사치를 제공한다.1950년대 콜모고로프의 연구에 이어, 고급 통계는 근사 이론과 함수 분석을 사용하여 근사 오차를 정량화한다.이 접근방식에서는 확률 분포메트릭 기하학을 연구한다. 이 접근방식은 를 들어 쿨백-라이블러 발산, 브레그만 발산헬링거 [14][15][16]거리를 사용하여 근사 오차를 수량화한다.

표본이 무한히 큰 경우 중심 한계 정리와 같은 한계 결과는 표본 통계량의 한계 분포(존재하는 경우)를 나타냅니다.제한 결과는 유한 표본에 대한 진술이 아니며, 실제로 유한 [17][18][19]표본과 관련이 없습니다.그러나, 분포 제한의 점근 이론은 종종 유한 표본에 대한 작업에 사용됩니다.예를 들어, 제한 결과는 종종 계량경제학 및 생물 통계학에서 널리 사용되는 모멘트일반화 방법과 일반화 추정 방정식의 사용을 정당화하기 위해 호출된다.한계 분포와 실제 분포(공식적으로 근사치의 '오차') 사이의 차이의 크기는 [20]시뮬레이션을 사용하여 평가할 수 있다.결과를 유한 표본으로 제한하는 휴리스틱 적용은 특히 로그 오목형 우도가 있는 저차원 모델(예: 단일 매개 변수 지수 패밀리)에서 많은 애플리케이션에서 일반적인 관행이다.

랜덤화 기반 모델

랜덤화 설계에 의해 생성된 주어진 데이터 세트에 대해 랜덤화 설계에 의해 생성될 수 있었던 모든 계획에 대한 테스트 통계를 평가함으로써 통계의 랜덤화 분포(null-hypothesis)가 정의된다.빈도론적인 추론에서, 무작위화는 주관적 모델이 아닌 무작위화 분포에 기초할 수 있도록 하며, 이것은 특히 조사 표본 추출과 [21][22]실험 설계에 중요하다.무작위 연구의 통계적 추론은 또한 많은 다른 [23][24][25]상황보다 더 간단하다.베이지안 추론에서 무작위화는 또한 중요하다. 조사 표본 추출에서 대체 없이 표본의 사용은 모집단과의 교환성을 보장한다. 무작위 실험에서 무작위화는 공변량 [26]정보에 대한 무작위 가정에서의 결측을 보증한다.

객관적인 무작위화를 통해 적절한 유도 절차를 [27][28][29][30][31]수행할 수 있습니다.많은 통계학자들은 잘 정의된 랜덤화 [32]절차에 의해 생성된 데이터의 랜덤화 기반 분석을 선호합니다.(그러나 이론 지식과 실험 제어가 발달한 과학 분야에서는 무작위 실험이 추론의 질을 향상시키지 않고 실험 비용을 증가시킬 수 있다는 것은 사실이다.)[33][34]마찬가지로, 주요 통계 당국은 무작위 실험의 결과를 동일한 [35]현상에 대한 관측 연구보다 더 높은 신뢰성으로 추론을 허용하는 것으로 권고한다.그러나 관측 연구가 잘못된 랜덤화 실험보다 나을 수 있습니다.

랜덤화 실험의 통계 분석은 실험 프로토콜에 명시된 랜덤화 체계에 기초할 수 있으며 주관적 [36][37]모델이 필요하지 않다.

그러나 랜덤화 실험이나 랜덤 표본을 정확하게 설명하는 객관적 통계 모형을 사용하여 언제든지 일부 가설을 검정할 수 없습니다.어떤 경우에는, 그러한 무작위화된 연구는 비경제적이거나 비윤리적이다.

랜덤화 실험의 모형 기반 분석

랜덤화 [38]실험의 데이터를 분석할 때는 선형 또는 로지스틱 모형과 같은 통계 모형을 참조하는 것이 표준 관행입니다.그러나 랜덤화 방식은 통계 모델의 선택을 안내합니다.랜덤화 [22]방법을 모르면 적절한 모형을 선택할 수 없습니다.실험 프로토콜을 무시한 채 무작위 실험의 데이터를 분석하여 심각하게 오해의 소지가 있는 결과를 얻을 수 있다. 일반적인 실수는 실험에 사용된 차단을 잊어버리고 다른 실험 단위에 적용된 치료제의 독립적인 복제를 사용하여 동일한 실험 단위에 대한 반복 측정을 혼동하는 것을 포함한다.[39]참조해 주세요.

모델프리랜덤화추론

모델 프리 기법은 모델 기반 방법을 보완하며, 현실 단순화 환원주의 전략을 채택한다.전자는 프로세스의 문맥 친화성에 동적으로 적응하고 [38][40]관찰의 본질적 특성을 학습하는 알고리즘을 결합, 진화, 합체 및 훈련한다.

예를 들어, 모형이 없는 단순 선형 회귀 분석은 다음 중 하나를 기반으로 합니다.

  • 랜덤 설계. 여기서 관측치쌍(1,Y1 ( 2, 2),( n n (X n ), (합니다.(는) 독립적이며 동일한 분산(iID)입니다.
  • X 1, 2, X \ \ , 결정론적이지만 대응하는 응답 1, 2, n \ }, Y_}, Y_{n}는 랜덤입니다=}(yj와 독립적입니다

어느 경우든 공통 조건부 x ()의 특징에 대한 모델 없는 무작위화 추론은 일부 규칙성 조건(예: 기능적 부드러움)에 의존한다.예를 들어 모집단 특징 조건부 μ ( ) ( ) { ) = ( YX 에 대한 모델 없는 랜덤화 추론은μ ( \ 평활하다는 하에 로컬 평균 또는 로컬 다항식 적합을 통해 일관되게 추정할 수 있다.또한 점근 정규성 또는 재샘플링에 의존하여 모집단 특징, 이 경우 조건부 μ ( ) [41]에 대한 신뢰 구간을 구성할 수 있습니다.

추론의 패러다임

통계적 추론의 다른 학파가 설립되었습니다.이러한 학교(또는 "패러다임")는 상호 배타적이지 않으며, 한 패러다임에서 잘 작동하는 방법은 종종 다른 패러다임에서 매력적인 해석을 가지고 있습니다.

Bandyopadhyay & Forster는 4가지 패러다임을 설명합니다.고전적 (또는 빈번한) 패러다임, 베이지안 패러다임, 우도주의 패러다임 및 아카이킨 정보 기준 기반 패러다임.[42]

빈도주의 추론

이 패러다임은 모집단 분포의 반복 샘플링(주제적)을 고려하여 가까운 데이터 세트와 유사한 데이터 세트를 생성함으로써 명제의 신뢰성을 교정한다.반복 샘플링 시 데이터 집합의 특성을 고려함으로써 통계 제안의 빈도수 속성을 수량화할 수 있습니다. 그러나 실제로는 이러한 수량화가 어려울 수 있습니다.

빈도주의 추론의 예

빈번한 추론, 객관성 및 의사결정 이론

빈도주의 추론(또는 고전적 추론)의 한 가지 해석은 주파수 확률, 즉 모집단의 반복 표본 추출 측면에서만 적용할 수 있다는 것이다.그러나 Neyman의[43] 접근법은 실험 전 확률의 관점에서 이러한 절차를 개발한다.즉, 실험을 하기 전에 올바른 확률이 적절한 방법으로 제어되도록 결론을 도출하기 위한 규칙을 결정합니다. 즉, 그러한 확률에는 빈도론이나 반복 표본 추출 해석이 필요하지 않습니다.반대로, 베이지안 추론은 빈도론 접근법에 사용된 한계(그러나 알려지지 않은 매개 변수) 확률과 비교하여 조건부 확률(즉, 관측된 데이터에 따라 조건부) 측면에서 작동한다.

유의성 테스트와 신뢰 구간의 빈번한 절차는 효용 함수에 관계없이 구성할 수 있다.그러나 통계적 의사결정 이론과 같은 빈도주의 통계의 일부 요소는 효용 [citation needed]기능을 통합한다.특히, 최적 추론의 빈도주의 개발은 (최소-분산 비편향 추정기 또는 균일하게 가장 강력한 테스트와 같은) 효용 함수의 역할을 하는 손실 함수를 사용한다.손실함수는 통계학자가 통계절차가 최적성 [44]특성을 가지고 있다는 것을 증명하기 위해 명시적으로 진술할 필요는 없다.그러나 손실 함수는 최적성 특성을 기술하는 데 유용한 경우가 많습니다. 예를 들어, 중앙값 비편향 추정기는 기대 손실을 최소화하고 최소 제곱 추정기는 기대 손실을 최소화한다는 점에서 절대값 손실 함수에서 최적입니다.

빈도주의 추론을 사용하는 통계학자는 관심 매개변수와 사용할 추정치/검정 통계를 스스로 선택해야 하지만, 명백한 명시적 효용과 사전 분포의 부재는 빈도주의 절차를 '객관적'[45]으로 널리 보는 데 도움이 되었다.

베이지안 추론

베이지안 미적분은 확률의 언어를 사용하여 믿음의 정도를 기술합니다; 믿음은 긍정적이고 하나로 통합되며 확률 공리를 따릅니다.베이지안 추론은 통계 [46]명제를 작성하기 위한 기초로서 이용 가능한 사후 신념을 사용한다.베이지안 접근법을 사용하는 데는 몇 가지 다른 이유가 있다.

베이지안 추론의 예

베이지안 추론, 주관성 및 결정 이론

많은 비공식 베이지안 추론은 후술의 "직관적으로 합리적인" 요약에 기초한다.예를 들어, 후방 평균, 중위수 및 모드, 가장 높은 후방 밀도 구간 및 Bayes 요인은 모두 이러한 방식으로 동기 부여될 수 있습니다.이러한 종류의 추론을 위해 사용자의 효용 기능을 언급할 필요는 없지만, 이러한 요약은 모두 명시된 이전의 신념에 따라 (어느 정도) 달라지며, 일반적으로 주관적인 결론으로 간주된다(외부 입력이 필요하지 않은 사전 건설 방법은 제안되었지만 아직 완전히 개발되지는 않았다).

공식적으로, 베이지안 추론은 명시적으로 명시된 효용 또는 손실 함수를 참조하여 교정된다. '베이즈 규칙'은 사후 불확실성에 대해 평균화된 기대 효용을 최대화하는 규칙이다.따라서 공식적인 베이지안 추론은 결정 이론적인 의미에서 최적의 결정을 자동으로 제공한다.가정, 데이터 및 효용을 고려할 때, 모든 통계 추론이 베이지안 해석을 필요로 하는 것은 아니지만, 기본적으로 모든 문제에 대해 베이지안 추론을 할 수 있다.정식으로 베이지안이 아닌 분석은 (논리적으로) 일관성이 없을 수 있다. 적절한 우선 순위(즉, 하나에 통합 가능한 것)를 사용하는 베이지안 절차의 특징은 일관성이 보장된다는 것이다.베이지안 추론의 일부 지지자들은 추론이 이 의사결정 이론 체계에서 일어나야 하며, 베이지안 추론은 사후 믿음의 평가와 요약으로 결론지어서는 안 된다고 주장한다.

우도 기반 추론

우도론우도 함수를 사용하여 통계량에 접근합니다.일부 우도론자들은 통계를 증거의 계산 지원으로만 간주하여 추론을 거부한다.그러나 다른 사람들은 가장 잘 알려진 최대우도 추정인 우도 함수에 기초한 추론을 제안한다.

AIC 기반 추론

AIC(Akaike Information Criteria)는 주어진 데이터 집합에 대한 통계 모델의 상대적 품질을 추정하는 도구이다.데이터에 대한 모형 모음을 지정하면 AIC는 다른 각 모형과 비교하여 각 모형의 품질을 추정합니다.따라서 AIC는 모형 선택을 위한 수단을 제공합니다.

AIC는 정보이론에 기초하고 있습니다.AIC는 데이터를 생성한 프로세스를 나타내기 위해 주어진 모델을 사용할 때 손실되는 상대적 정보의 추정치를 제공합니다(이렇게 함으로써 모델의 적합성과 모델의 단순성 사이의 트레이드오프를 처리합니다).

추론을 위한 다른 패러다임

최소 설명 길이

최소 기술 길이(MDL) 원칙은 정보[47] 이론콜모고로프 [48]복잡성 이론의 아이디어에서 개발되었습니다.(MDL) 원칙은 데이터를 최대한 압축하는 통계 모델을 선택한다. 추론은 빈도론 또는 베이지안 접근법에서 할 수 있는 것과 같이 데이터에 대한 반사실적 또는 비실현적 "데이터 생성 메커니즘" 또는 확률 모델을 가정하지 않고 진행된다.

그러나 "데이터 생성 메커니즘"이 실제로 존재하는 경우, 섀넌의 소스 코딩 정리에 따라 데이터의 MDL 기술을 [49]평균적이고 점근적으로 제공합니다.설명 길이(또는 설명 복잡도)를 최소화할 때 MDL 추정은 최대우도 추정최대 사후 추정과 유사하다(최대 엔트로피 베이지안 사전 사용).단, MDL은 기초가 되는 확률 모델을 알고 있다고 가정하지 않는다. MDL 원칙은 예를 들어 데이터가 독립된 샘플링에서 [49][50]발생했다는 가정 없이 적용할 수도 있다.

MDL 원리는 정보 이론, 선형 회귀 [50]데이터 [48]마이닝의 통신 부호화 이론에서 적용되어 왔습니다.

MDL 기반 추리 절차 평가에서는 계산 복잡도 [51]이론의 기술 또는 기준을 사용하는 경우가 많습니다.

기준 추론

기준추론은 "기준분포"라고도 하는 기준확률에 기초한 통계추론에 대한 접근법이었다.후속 연구에서 이 접근방식은 정의되지 않고 적용 가능성이 극히 제한적이며 잘못된 [52][53]접근법이라고 불립니다.그러나 이 주장은 소위 신뢰분포유효한 확률분포가 아님을 보여주는 것과[54] 동일하며, 이것이 신뢰구간의 적용을 무효화하지 않았으므로, 기준변수로부터 도출된 결론을 반드시 무효화하지는 않는다.피셔의 기준 주장의 초기 작업을 Upper and Lower [55]확률을 사용하여 추론 이론의 특별한 경우로 재해석하려는 시도가 이루어졌다.

구조 추론

1938년부터 [56]1939년까지 피셔와 피트먼의 아이디어를 발전시킨 조지 A. Barnard그룹 패밀리에 불변 확률을 사용하는 접근방식인 "구조적 추론" 또는 "추론"[57]을 개발했다.Barnard는 "피듀셜" 절차가 잘 정의되고 유용할 수 있는 제한된 모델의 클래스에 대한 기준 추론의 이면에 있는 주장을 재구성했다.도날드 A. S. 프레이저는 그룹 이론에 기초한 구조[58] 추론을 위한 일반 이론을 개발하여 선형 [59]모델에 적용하였다.프레이저에 의해 공식화된 이론은 의사결정 이론과 베이지안 통계와 밀접한 관련이 있으며,[60] 존재하는 경우 최적의 빈도론 결정 규칙을 제공할 수 있다.

추론 항목

아래의 주제는 보통 통계적 추론 영역에 포함된다.

  1. 통계상의 전제 조건
  2. 통계결정론
  3. 추정 이론
  4. 통계 가설 검정
  5. 통계의견수정
  6. 실험 설계, 분산 분석회귀 분석
  7. 조사표본
  8. 통계 데이터 요약

예측 추론

예측 추론은 과거 관측치에 기초한 미래 관측치의 예측을 강조하는 통계 추론에 대한 접근법이다.

처음에 예측 추론은 관측 가능한 매개변수에 기초했고 [citation needed]확률을 연구하는 주된 목적이었지만, 브루노피네티가 개척한 새로운 매개변수 접근법 때문에 20세기에 인기가 떨어졌다.접근법은 오류가 있는 물리적 시스템(: 천체 역학)으로 현상을 모델링했다.드 피네티의 교환성에 대한 생각은, 장래의 관찰이 과거의 관찰과 같이 행동해야 한다는 것으로, 1974년 그의 1937년 [61]논문의 프랑스어 번역으로 영어권 세계의 주의를 끌게 되었고, 그 이후 세이모어 [62]가이세르와 같은 통계학자에 의해 제시되었다.

「 」를 참조해 주세요.

메모들

  1. ^ 피어스에 따르면 수용은 이 문제에 대한 조사가 당분간 중단된다는 것을 의미한다.과학에서는 모든 과학적 이론이 재검토될 수 있다.

레퍼런스

인용문

  1. ^ Upton, G., Cook, I. (2008) 옥스퍼드 통계 사전, OUP. ISBN978-0-19-954145-4.
  2. ^ "TensorFlow Lite inference". The term inference refers to the process of executing a TensorFlow Lite model on-device in order to make predictions based on input data.
  3. ^ 코니시&키타가와(2008), 75쪽.
  4. ^ Cox (2006), 197페이지.
  5. ^ "Statistical inference - Encyclopedia of Mathematics". www.encyclopediaofmath.org. Retrieved 2019-01-23.
  6. ^ a b Cox (2006) 2페이지
  7. ^ Evans, Michael; et al. (2004). Probability and Statistics: The Science of Uncertainty. Freeman and Company. p. 267. ISBN 9780716747420.
  8. ^ Van der Vaart, A.W.(1998) 점근 통계 케임브리지 대학 출판부.ISBN 0-521-78450-6(341페이지)
  9. ^ 크루스칼 1988
  10. ^ Freedman, D.A. (2008) "생존 분석:역학적 위험?"American Statistician (2008) 62: 110-119. (Freedman (2010)의 제11장 (169-192페이지)으로 재인쇄).
  11. ^ Berk, R. (2003) 회귀 분석: 건설적 비평 (사회과학의 고급 정량적 기법) (v. 11) 세이지 출판물.ISBN 0-7619-2904-5
  12. ^ a b Brewer, Ken (2002). Combined Survey Sampling Inference: Weighing of Basu's Elephants. Hodder Arnold. p. 6. ISBN 978-0340692295.
  13. ^ a b Jörgen Hoffman-Jörgensen's Probability With Overtowed Statistics, 제1권.399페이지[full citation needed]
  14. ^ 르캄 (1986)[page needed]
  15. ^ 에릭 토거슨(1991) 통계실험 비교, 수학 백과사전 제36권.케임브리지 대학 [full citation needed]출판부
  16. ^ Liese, Friedrich & Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer. ISBN 978-0-387-73193-3.
  17. ^ Kolmogorov(1963년, 페이지 369년) : "시행 횟수가 무한대로 증가함에 따라 주파수를 제한한다는 개념에 기초한 주파수 개념은 우리가 항상 한정된 수의 시행을 다루어야 하는 실제 실제 문제에 대한 확률론 결과의 적용 가능성을 입증하는 데 아무런 기여도 하지 않습니다."
  18. ^ "실제로 한계 정리 ' n n n에서 일어나는 일에 대한 내용이 논리적으로 결여되어 있습니다.그들이 할 수 있는 것은 특정 접근 방식을 제안하는 것뿐입니다.그 후에 해당 사례에서 성능을 확인해야 합니다." - Le Cam (1986) (14페이지)
  19. ^ Panzagl(1994) : "점근 이론의 결정적인 결점:우리가 점근 이론에서 기대하는 것은 약 ...을 유지하는 결과이다. 점근 이론이 제공해야 하는 것은 한계 정리이다."(ix페이지) "응용에 중요한 것은 한계가 아니라 근사치이다." (188페이지)
  20. ^ Panzagl(1994년) : "큰 표본 크기에 대한 한계정리를 대략 참이라고 간주함으로써 크기를 알 수 없는 오류를 범하게 된다. [ . . ] 나머지 오류에 대한 현실적인 정보는 시뮬레이션을 통해 얻을 수 있다." (ix 페이지)
  21. ^ Neyman, J.(1934) "대표적인 방법의 두 가지 다른 측면에 대하여:계층화 표본 추출 방법과 목적 선택 방법", 왕립통계학회지 97(4), 557-625 JSTOR 2342192
  22. ^ a b 힌켈만과 켐프손(2008)[page needed]
  23. ^ 통계학자가 아닌 사람을 위한 통계학 첫 번째 코스의 ASA 가이드라인.(ASA 웹사이트에서 입수 가능)
  24. ^ 데이비드 A. Freedman et alia's Statistics.
  25. ^ 무어 외 (2015년)
  26. ^ Gelman A. et al. (2013).베이지안 데이터 분석(Chapman & Hall).
  27. ^ 피어스(1877-1878)
  28. ^ 피어스(1883)
  29. ^ Freedman, Pisani & Purves 1978.
  30. ^ 데이비드 A. Freedman 통계 모델.
  31. ^ Rao, C.R. (1997) 통계와 진실: Puting Chance to Work, World Scientific.ISBN 981-02-3111-3
  32. ^ Peirce;Freedman;Moore et al.[citation needed] (2015).
  33. ^ Box, G.E.P. and Friends (2006) 거의 모든 것을 개선: 아이디어와 에세이, 개정판, 와일리ISBN 978-0-471-72755-2
  34. ^ Cox (2006), 페이지 196.
  35. ^ 통계학자가 아닌 사람을 위한 통계학 첫 번째 코스의 ASA 가이드라인.(ASA 웹사이트에서 입수 가능)
    • 데이비드 A.Freedman 등의 에일리어스 통계.
    • 무어 외 (2015년)
  36. ^ 네이만, 저지 1923년[1990년]농업실험에 대한 확률론의 적용에 대해서.원칙에 관한 에세이제9절." 통계과학 5(4): 465~472.도로타 M. 다브로스카와 테렌스 P입니다속도.
  37. ^ 힌켈만 & 켐프손 (2008)[page needed]
  38. ^ a b Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). "Randomization‐based statistical inference: A resampling and simulation infrastructure". Teaching Statistics. 40 (2): 64–73. doi:10.1111/test.12156. PMC 6155997. PMID 30270947.
  39. ^ 힌켈만과 켐프손(2008) 6장.
  40. ^ Tang, Ming; Gao, Chao; Goutman, Stephen; Kalinin, Alexandr; Mukherjee, Bhramar; Guan, Yuanfang; Dinov, Ivo (2019). "Model-Based and Model-Free Techniques for Amyotrophic Lateral Sclerosis Diagnostic Prediction and Patient Clustering". Neuroinformatics. 17 (3): 407–421. doi:10.1007/s12021-018-9406-9. PMC 6527505. PMID 30460455.
  41. ^ Politis, D.N. (2019). "Model-free inference in statistics: how and why". IMS Bulletin. 48.
  42. ^ Bandyopadhyay & Forster (2011).이 책의 서론(p.3)과 "섹션 III: 통계의 네 가지 패러다임"을 참조하십시오.
  43. ^ Neyman, J. (1937). "Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability". Philosophical Transactions of the Royal Society of London A. 236 (767): 333–380. Bibcode:1937RSPTA.236..333N. doi:10.1098/rsta.1937.0005. JSTOR 91337.
  44. ^ 판자글 서문
  45. ^ Little, Roderick J. (2006). "Calibrated Bayes: A Bayes/Frequentist Roadmap". The American Statistician. 60 (3): 213–223. doi:10.1198/000313006X117837. ISSN 0003-1305. JSTOR 27643780. S2CID 53505632.
  46. ^ Lee, Se Yoon (2021). "Gibbs sampler and coordinate ascent variational inference: A set-theoretical review". Communications in Statistics - Theory and Methods. 51 (6): 1549–1568. arXiv:2008.01006. doi:10.1080/03610926.2021.1921214. S2CID 220935477.
  47. ^ 수피(2000년)
  48. ^ a b Hansen & Yu (2001)
  49. ^ a b 한센과 유(2001), 747쪽.
  50. ^ a b Rissanen (1989), 84페이지
  51. ^ 조셉 F.트라우브, G.W. 와실코스키, H. 워즈니아코스키.(표준)[page needed]
  52. ^ 네이만(1956)
  53. ^ 자벨(1992)
  54. ^ Cox (2006) 66 페이지
  55. ^ 햄펠 2003.
  56. ^ 데이비슨,[full citation needed] 12페이지.
  57. ^ Barnard, G.A.(1995년) "선결과 기준론", 국제통계검토, 63(3), 309-323. JSTOR 1403482
  58. ^ Fraser, D. A. S. (1968). The structure of inference. New York: Wiley. ISBN 0-471-27548-4. OCLC 440926.
  59. ^ Fraser, D. A. S. (1979). Inference and linear models. London: McGraw-Hill. ISBN 0-07-021910-9. OCLC 3559629.
  60. ^ Taraldsen, Gunnar; Lindqvist, Bo Henry (2013-02-01). "Fiducial theory and optimal inference". The Annals of Statistics. 41 (1). arXiv:1301.1717. doi:10.1214/13-AOS1083. ISSN 0090-5364. S2CID 88520957.
  61. ^ 드 Finetti, 브루노(1937년)."라 Prévision:이 lois logiques,ses 소식통 subjectives".Annales 드 l'Institut 앙리 푸앵카레. 7(1):1–68.ISSN 0365-320X.드 Finetti, 브루노(1992년)에 번역을 하다."예지:그것의 논리적 법, 그곳의 주관적 Sources".Breakthroughs 통계학으로.스프링거 시리즈 통계학으로.를 대신하여 서명함. 134–174. doi:10.1007/978-1-4612-0919-5_10.아이 에스비엔 978-0-387-94037-3.
  62. ^ 가이서, 시모어(1993) 예측 추론: 소개, CRC 프레스.ISBN 0-412-03471-9

원천

추가 정보

외부 링크