잭나이프 재샘플링

Jackknife resampling

통계학에서 잭나이프는 치우침 및 분산 추정에 특히 유용한 재표본 추출 기법입니다.잭나이프는 부트스트랩과 같은 일반적인 다른 재샘플링 방법을 미리 기록합니다. n n의 샘플이 있는 경우 [1]잭나이프 추정기는 하나의 관측치를 생략하여 얻은 n- 각 서브샘플에서 파라미터 추정치를 집계하여 구축할 수 있습니다.

잭나이프 기술은 1949년부터 모리스 퀴누이(1924-1973)에 의해 개발되어 1956년에 개량되었다.John Tukey는 1958년에 이 기술을 확장하여 "잭나이프"라는 이름을 제안했는데, 이는 물리적인 잭나이프(콤팩트한 접이식 나이프)와 마찬가지로 [2]특정 문제를 목적에 맞게 보다 효율적으로 해결할 수 있지만 다양한 문제에 대한 해결책을 즉석에서 만들 수 있기 때문입니다.

잭나이프는 부트스트랩[2]선형 근사치입니다.

간단한 예: 평균 추정

매개변수의 잭나이프 추정기는 데이터 집합에서 각 관측치를 체계적으로 배제하고 나머지 관측치에 대한 매개변수 추정치를 계산한 다음 이러한 계산을 집계함으로써 찾을 수 있다.

예를 들어 추정할 파라미터가 랜덤 xx의 모집단 평균인 경우 특정 i.i.. x ,. . , x({}...,n}) 세트에 대해 자연 추정치는 샘플 평균입니다.

여기서 마지막 합계는 i i 집합 [ {, {n] = \ { 위에 있음을 나타내기 위해 다른 방법으로 사용됩니다.

다음으로 다음과 같이 진행합니다.For each we compute the mean of the jackknife subsample consisting of all but the -th data point, and this is called the -th jackknife replicate:

잭나이프가 ( 1),x (n) { } { { } , \, { \{ } {( n ) 이 근사치가 더 나을 것입니다.마지막으로 잭나이프 추정기를 입수하기 위해 의 잭나이프 평균값을 구합니다

j ac k의 바이어스 및 분산에 대해 질문할 수 있습니다 j a c k의 정의에서는 잭나이프 복제의 평균으로서 x try a c k { { { \ { jack }의 에 따라 명시적으로 계산할 수 있으며, 바이어스는 사소한 계산입니다.잭나이프 리플리케이션은 독립적이지 않기 때문에 x4 a k { \ style { _ { \ { } of of of since since since since since since since he 。

평균의 특수한 경우 잭나이프 추정치가 일반적인 추정치와 같다는 것을 명시적으로 보여줄 수 있습니다.

로써 아이덴티티 x xj k { \ { } { \ { } ={ 가 확립됩니다. 예상대로E [ j c ] [ ] [ x E [ { \ { x \ { jack } } x a { {mathrm {(는) 치우침이 없습니다.분산을 취하면V [ [ x / { V [ \ { }이) 됩니다. 그러나 이러한 속성은 평균이 아닌 다른 매개 변수의 경우 일반적으로 유지되지 않습니다.

평균 추정의 경우 이 간단한 예는 잭나이프 추정기의 구성을 설명하기 위한 것일 뿐이며, 분포의 평균 또는 다른 함수보다 높은 모멘트와 같은 다른 모수를 추정하는 경우에는 실제 하위 요소(및 유용성)가 나타난다.

a { style { x } { \ { jack }( 、 즉, ( ) ( - x ){ { 의 편향에 대한 경험적 견적을 작성하기 위해 할 수 있습니다.누군가 적당한 인자 c을과{)}})_{\mathrm{잭}}=c({\bar{x}}_{\mathrm{잭}}-{\bar{x}})};0{\displaystyle c>0}, 비록 이 경우에 우리가)¯ j ck=)¯{\displaystyle{\bar{)}}_{\mathrm{잭}}={\bar{)}}} 알고 있는 것이 이 건축, 그러나 그것은 reassur은 어떤 의미 있는 지식 더하지 않는다.에 왕이 값은 치우침(즉, 0)의 정확한 추정치를 제공합니다.

의 분산에 잭나이프의 추정치는 x의 ()\[3][4] 분산에서 계산할 수 있습니다.

왼쪽 등식은 var ( ) k{ { 정의하고 오른쪽 등식은 직접 확인할 수 있는 식별입니다.예상대로라면E [ ( x ) a k] [ / [ E [ { \ { } } } ( { \ { x} ) \ { } V [ x ] / n=} { bar} { bar } { bar } { }} } { bar } { } } } e } } 。

추정기의 치우침 추정

잭나이프 기법을 사용하여 전체 표본에 대해 계산된 추정기의 편향을 추정(수정)할 수 있습니다.

(\x(\ x 의 일부 함수라고 가정합니다x 1, . , displaystyle } , )의 를 바탕으로 x(\의 i.id 복사본으로 구성된다고 가정합니다., {}}이(가) 구성됩니다.

^{\{\ 값은 샘플에 따라 다르므로 이 값은 랜덤 샘플에서 다른 샘플로 변경됩니다.

편향은 다음과 같습니다.

여러 표본에서 값을 계산하여 평균화하고 E[ E의 경험적 근사치를 계산하고자 할 수 있지만, 전체 이 사용 가능한 경우 "기타 표본"이 없는 경우에는 불가능합니다... , n { style _ { , _ { }{\잭나이프 재샘플링 기술이 도움이 될 수 있습니다.

잭나이프 복제를 구성합니다.

여기서 각 리플리케이트는 1개의 데이터 포인트를 제외한 모든 데이터 포인트로 구성된 잭나이프 서브샘플에 기초한 "단일 배제" 추정치입니다.

다음으로 평균값을 정의합니다.

편향에 대한 잭나이프 추정치는 다음과 같습니다

결과 바이어스 변형 잭나이프 추정치는 다음과 같습니다.

그러면 편향이 O- 1에는 편향이 제거되고 다른 경우에는 [2]O 됩니다

추정기의 분산 추정

잭나이프 기법은 전체 표본에 대해 계산된 추정기의 분산을 추정하는 데도 사용할 수 있습니다.

「 」를 참조해 주세요.

문학.

메모들

  1. ^ Efron 1982, 페이지 2
  2. ^ a b c Cameron & Trivedi 2005, 375페이지
  3. ^ Efron 1982, 페이지 14
  4. ^ McIntosh, Avery I. "The Jackknife Estimation Method" (PDF). Boston University. Avery I. McIntosh. Retrieved 2016-04-30.: 페이지 3

레퍼런스