잭나이프 재샘플링
Jackknife resampling통계학에서 잭나이프는 치우침 및 분산 추정에 특히 유용한 재표본 추출 기법입니다.잭나이프는 부트스트랩과 같은 일반적인 다른 재샘플링 방법을 미리 기록합니다. n n의 샘플이 있는 경우 [1]잭나이프 추정기는 하나의 관측치를 생략하여 얻은 n-의 각 서브샘플에서 파라미터 추정치를 집계하여 구축할 수 있습니다.
잭나이프 기술은 1949년부터 모리스 퀴누이(1924-1973)에 의해 개발되어 1956년에 개량되었다.John Tukey는 1958년에 이 기술을 확장하여 "잭나이프"라는 이름을 제안했는데, 이는 물리적인 잭나이프(콤팩트한 접이식 나이프)와 마찬가지로 [2]특정 문제를 목적에 맞게 보다 효율적으로 해결할 수 있지만 다양한 문제에 대한 해결책을 즉석에서 만들 수 있기 때문입니다.
간단한 예: 평균 추정
매개변수의 잭나이프 추정기는 데이터 집합에서 각 관측치를 체계적으로 배제하고 나머지 관측치에 대한 매개변수 추정치를 계산한 다음 이러한 계산을 집계함으로써 찾을 수 있다.
예를 들어 추정할 파라미터가 랜덤 xx의 모집단 평균인 경우 특정 i.i.. x ,. . , x({}...,n}) 세트에 대해 자연 추정치는 샘플 평균입니다.
여기서 마지막 합계는 i i가 집합 [ {, {n] = \ { 위에 있음을 나타내기 위해 다른 방법으로 사용됩니다.
다음으로 다음과 같이 진행합니다.For each we compute the mean of the jackknife subsample consisting of all but the -th data point, and this is called the -th jackknife replicate:
잭나이프가 ( 1),x (n) { } { { } , \, { \{ } {( n ) 이 근사치가 더 나을 것입니다.마지막으로 잭나이프 추정기를 입수하기 위해 의 잭나이프 평균값을 구합니다
j ac k의 바이어스 및 분산에 대해 질문할 수 있습니다 j a c k의 정의에서는 잭나이프 복제의 평균으로서 x try a c k { { { \ { jack }의 에 따라 명시적으로 계산할 수 있으며, 바이어스는 사소한 계산입니다.잭나이프 리플리케이션은 독립적이지 않기 때문에 x4 a k { \ style { _ { \ { } of of of since since since since since since since he 。
평균의 특수한 경우 잭나이프 추정치가 일반적인 추정치와 같다는 것을 명시적으로 보여줄 수 있습니다.
로써 아이덴티티 x xj k { \ { } { \ { } ={ 가 확립됩니다. 예상대로E [ j c ] [ ] [ x E [ { \ { x \ { jack } } x a { {mathrm {은(는) 치우침이 없습니다.분산을 취하면V [ [ x / { V [ \ { }이) 됩니다. 그러나 이러한 속성은 평균이 아닌 다른 매개 변수의 경우 일반적으로 유지되지 않습니다.
평균 추정의 경우 이 간단한 예는 잭나이프 추정기의 구성을 설명하기 위한 것일 뿐이며, 분포의 평균 또는 다른 함수보다 높은 모멘트와 같은 다른 모수를 추정하는 경우에는 실제 하위 요소(및 유용성)가 나타난다.
a { style { x } { \ { jack }( 、 즉, ( ) ( - x ){ { 의 편향에 대한 경험적 견적을 작성하기 위해 할 수 있습니다.누군가 적당한 인자 c을과{)}})_{\mathrm{잭}}=c({\bar{x}}_{\mathrm{잭}}-{\bar{x}})};0{\displaystyle c>0}, 비록 이 경우에 우리가)¯ j ck=)¯{\displaystyle{\bar{)}}_{\mathrm{잭}}={\bar{)}}} 알고 있는 것이 이 건축, 그러나 그것은 reassur은 어떤 의미 있는 지식 더하지 않는다.에 왕이 값은 치우침(즉, 0)의 정확한 추정치를 제공합니다.
의 분산에 잭나이프의 추정치는 x의 ()\[3][4]의 분산에서 계산할 수 있습니다.
왼쪽 등식은 var ( ) k{ { 을 정의하고 오른쪽 등식은 직접 확인할 수 있는 식별입니다.예상대로라면E [ ( x ) a k] [ / [ E [ { \ { } } } ( { \ { x} ) \ { } V [ x ] / n=} { bar} { bar } { bar } { }} } { bar } { } } } e } } 。
추정기의 치우침 추정
잭나이프 기법을 사용하여 전체 표본에 대해 계산된 추정기의 편향을 추정(수정)할 수 있습니다.
(\가x(\ x 의 일부 함수라고 가정합니다x 1, . , displaystyle } , )의 한 를 바탕으로 x(\의 i.id 복사본으로 구성된다고 가정합니다., {}}이(가) 구성됩니다.
^{\{\ 값은 샘플에 따라 다르므로 이 값은 랜덤 샘플에서 다른 샘플로 변경됩니다.
의 편향은 다음과 같습니다.
여러 표본에서의 값을 계산하여 평균화하고 E[ E의 경험적 근사치를 계산하고자 할 수 있지만, 전체 이 사용 가능한 경우 "기타 표본"이 없는 경우에는 불가능합니다... , n { style _ { , _ { }{\ 。잭나이프 재샘플링 기술이 도움이 될 수 있습니다.
잭나이프 복제를 구성합니다.
여기서 각 리플리케이트는 1개의 데이터 포인트를 제외한 모든 데이터 포인트로 구성된 잭나이프 서브샘플에 기초한 "단일 배제" 추정치입니다.
다음으로 평균값을 정의합니다.
의 편향에 대한 잭나이프 추정치는 다음과 같습니다
결과 의 바이어스 변형 잭나이프 추정치는 다음과 같습니다.
그러면 편향이 O- 1인한 에는 편향이 제거되고 다른 경우에는 [2]O 로 됩니다
추정기의 분산 추정
잭나이프 기법은 전체 표본에 대해 계산된 추정기의 분산을 추정하는 데도 사용할 수 있습니다.
「 」를 참조해 주세요.
문학.
- Berger, Y.G. (2007). "A jackknife variance estimator for unistage stratified samples with unequal probabilities". Biometrika. 94 (4): 953–964. doi:10.1093/biomet/asm072.
- Berger, Y.G.; Rao, J.N.K. (2006). "Adjusted jackknife for imputation under unequal probability sampling without replacement". Journal of the Royal Statistical Society, Series B. 68 (3): 531–547. doi:10.1111/j.1467-9868.2006.00555.x.
- Berger, Y.G.; Skinner, C.J. (2005). "A jackknife variance estimator for unequal probability sampling". Journal of the Royal Statistical Society, Series B. 67 (1): 79–89. doi:10.1111/j.1467-9868.2005.00489.x.
- Jiang, J.; Lahiri, P.; Wan, S-M. (2002). "A unified jackknife theory for empirical best prediction with M-estimation". The Annals of Statistics. 30 (6): 1782–810. doi:10.1214/aos/1043351257.
- Jones, H.L. (1974). "Jackknife estimation of functions of stratum means". Biometrika. 61 (2): 343–348. doi:10.2307/2334363. JSTOR 2334363.
- Kish, L.; Frankel, M.R. (1974). "Inference from complex samples". Journal of the Royal Statistical Society, Series B. 36 (1): 1–37.
- Krewski, D.; Rao, J.N.K. (1981). "Inference from stratified samples: properties of the linearization, jackknife and balanced repeated replication methods". The Annals of Statistics. 9 (5): 1010–1019. doi:10.1214/aos/1176345580.
- Quenouille, M.H. (1956). "Notes on bias in estimation". Biometrika. 43 (3–4): 353–360. doi:10.1093/biomet/43.3-4.353.
- Rao, J.N.K.; Shao, J. (1992). "Jackknife variance estimation with survey data under hot deck imputation". Biometrika. 79 (4): 811–822. doi:10.1093/biomet/79.4.811.
- Rao, J.N.K.; Wu, C.F.J.; Yue, K. (1992). "Some recent work on resampling methods for complex surveys". Survey Methodology. 18 (2): 209–217.
- 샤오, J.와 투, D.(1995).잭나이프와 부트스트랩.스프링거-벨라그 주식회사
- Tukey, J.W. (1958). "Bias and confidence in not-quite large samples (abstract)". The Annals of Mathematical Statistics. 29 (2): 614.
- Wu, C.F.J. (1986). "Jackknife, Bootstrap and other resampling methods in regression analysis". The Annals of Statistics. 14 (4): 1261–1295. doi:10.1214/aos/1176350142.
메모들
레퍼런스
- Cameron, Adrian; Trivedi, Pravin K. (2005). Microeconometrics : methods and applications. Cambridge New York: Cambridge University Press. ISBN 9780521848053.
- Efron, Bradley; Stein, Charles (May 1981). "The Jackknife Estimate of Variance". The Annals of Statistics. 9 (3): 586–596. doi:10.1214/aos/1176345462. JSTOR 2240822.
- Efron, Bradley (1982). The jackknife, the bootstrap, and other resampling plans. Philadelphia, PA: Society for Industrial and Applied Mathematics. ISBN 9781611970319.
- Quenouille, Maurice H. (September 1949). "Problems in Plane Sampling". The Annals of Mathematical Statistics. 20 (3): 355–375. doi:10.1214/aoms/1177729989. JSTOR 2236533.
- Quenouille, Maurice H. (1956). "Notes on Bias in Estimation". Biometrika. 43 (3–4): 353–360. doi:10.1093/biomet/43.3-4.353. JSTOR 2332914.
- Tukey, John W. (1958). "Bias and confidence in not quite large samples (abstract)". The Annals of Mathematical Statistics. 29 (2): 614. doi:10.1214/aoms/1177706647.