U통계

U-statistic

통계학에서, U-통계학추정 이론에서 특히 중요한 통계의 한 종류이다. 문자 "U"는 편견이 없다는 것을 의미한다.기초 통계량에서 U-통계량은 최소 분산 치우침 없는 추정치를 생성하는 과정에서 자연스럽게 발생합니다.

U-통계학 이론은 [1][2]확률 분포의 큰 클래스에 대해 추정 가능한 모수(또는 통계 함수)의 각 편향되지 않은 추정기에서 최소 분산 비편향 추정기를 도출할 수 있도록 한다.추정 가능한 모수는 모집단의 누적 확률 분포측정 가능한 함수입니다.예를 들어, 모든 확률 분포에서 모집단 중위수는 추정 가능한 모수입니다.U-통계 이론은 확률 분포의 일반 클래스에 적용됩니다.

역사

특정 모수군에 대해 원래 파생된 많은 통계량이 일반 분포의 U-통계량으로 인식되었습니다.비모수 통계에서 U-통계 이론은 통계 절차(예: 추정기 및 검정)와 점근 정규성 및 그러한 [3]양의 분산(유한 표본)과 관련된 추정기를 확립하기 위해 사용된다.이 이론은 무작위 [4][5][6]그래프와 같은 확률적 과정뿐만 아니라 더 일반적인 통계학을 연구하는데 사용되어 왔다.

문제에 독립적이고 동일한 분포의 랜덤 변수가 포함되며 특정 모수를 추정해야 한다고 가정합니다.몇 개의 관측치만 기반으로 단순 비편향 추정치를 구성할 수 있다고 가정합니다. 이렇게 하면 주어진 관측치 수를 기준으로 기본 추정치가 정의됩니다.예를 들어, 단일 관측치는 그 자체로 평균의 치우침이 없는 추정치이며 관측치 쌍을 사용하여 분산의 치우침이 없는 추정치를 도출할 수 있습니다.이 추정치에 기초한 U-통계량은 하위 표본에 적용되는 기본 추정기의 평균(전체 관측치 집합에서 주어진 크기의 모든 조합 선택)으로 정의된다.

Sen(1992)은 U-통계를 도입하고 그에 관련된 이론을 제시한 Wassily Hooffding(1948)의 논문을 검토하며, 이를 통해 Sen은 통계 이론에서 U-통계가 갖는 중요성을 요약한다.Sen씨는 「호핑(1948년)의 영향은 현시점에서는 압도적이고, 앞으로도 계속 될 가능성이 높다」라고 말한다.[7]U-통계학의 이론은 독립적이고 동일하게 분포된 랜덤 변수의 경우 또는 스칼라 랜덤 [9]변수에 국한되지[8] 않습니다.

정의.

Hoffding(1948년)으로 인한 U-통계라는 용어는 다음과 같이 정의된다.

K K 실수 또는 복소수, f ( d (\ f ( K r r K(\ K 값 함수라고 . { n \ r }에 대해 관련된 U f :( d ) K ( \ { \ Kf ( 1, i의 평균으로 됩니다. r}중 {, …, n(\displaystyle 1 n\}개)의 인덱스정식으로

n( 1 , , x ) i - ( - ) ( i , , ir ) I r , f ( i 1, , i 1},\} - 0 - 0 - ) ( i )

특히 f{\f}가 대칭이면 는 다음과 같이 단순화됩니다.

n( 1, , ) (n r ) ( , , r) , ( i , ... , i r ) { n} ( x { 1 , \ , { n } ={} \ { r} \ 1 } sum { }

서 J r {\ J_ I { 나타냅니다.

})은 반드시 대칭 함수입니다.

U-통계는 통계 작업, 특히 독립적이고 균등하게 분포된 랜덤 변수의 맥락에서 매우 자연스럽거나, 보다 일반적으로 유한 모집단의 단순 무작위 표본 추출과 같은 교환 가능한 시퀀스의 경우, 정의 속성을 '평균 상속'이라고 한다.

피셔의 k-통계량과 Tukey의 폴리케이균질 다항식 U-통계량의 예입니다(Fisher, 1929; Tukey, 1950).

크기가 N인 모집단에서 크기가 n인 단순 랜덤 표본 θ의 경우, U-통계량은 표본 값 θn(x)에 대한 평균이 모집단 값 θN([clarification needed]x)와 정확히 같다는 특성을 갖는다.

몇 가지 예:f {\ f)= , U f n ( 1+µ + n) / { { {+의 평균은 샘플입니다.

만약 f(x1x2)cmx1− x2{\displaystyle f(x_{1},x_{2})= x_{1}-x_{2}}, U-statistic은 평균 쌍별 편차 fn(x1,…,)n)=2/(n(n− 1))거야. j)나는 −)j{\displaystyle f_{n}(x_{1},\ldots{n,x_})=2(n(n-1))\sum _{i>, j}x_{나는}-x_{j}}입니다. ∑, defin.에 대한 교육2 ( \ n \ 2)

( 1, 2) ( - x) 2/ ( \f ( _ - _ {2 )^{, U 통계는 샘플 n ( ) variance n ( i - n ) { n 2 { displaystyle \ 2) 。

k({ k - k , ( ) ( - n )n/(n -) ( - ) - {\ ( n - 1 ) 、 ske ( n - 2 )

다음 사례에서 중요한 점을 강조합니다.f , , 3 f 3개의 값의 중앙값 f 1, n { \ n n 값의 이 아닙니다.그러나 이 값은 모집단의 중위수가 아니라 세 값의 중위수 기대치에 대한 최소 분산 치우침 없는 추정치입니다.확률 분포군의 모수가 확률 가중 모멘트 또는 L-모멘트에 의해 추정되는 경우에는 유사한 추정치가 중심적인 역할을 한다.

「 」를 참조해 주세요.

메모들

  1. ^ Cox & Hinkley(1974), 페이지 200, 페이지 258
  2. ^ 호핑(1948), Eq(4.3),(4.4) 사이
  3. ^ 센(1992)
  4. ^ 페이지 508 inKoroljuk, V. S.; Borovskich, Yu. V. (1994). Theory of U-statistics. Mathematics and its Applications. Vol. 273 (Translated by P. V. Malyshev and D. V. Malyshev from the 1989 Russian original ed.). Dordrecht: Kluwer Academic Publishers Group. pp. x+552. ISBN 0-7923-2608-3. MR 1472486.
  5. ^ 페이지 381 ~382 (영어)
  6. ^ 페이지 12 (인
  7. ^ 센 (1992) 페이지 307
  8. ^ Sen(1992), p306
  9. ^ 보롭스키크의 마지막 장에서는 벡터 공간(분리 가능한 바나흐 공간)에서 값을 취하는 교환 가능한 랜덤 원소의 U-통계에 대해 논의한다.

레퍼런스