잘린 분포

Truncated distribution
잘린 배포
확률밀도함수
TnormPDF.png
서로 다른 모수 집합에 대한 잘린 정규 분포에 대한 확률 밀도 함수입니다.모든 경우 a = -10 b = 10입니다.검정: μ = -8, δ = 2, 파랑: μ = 0, δ = 2, 빨강: μ = 9, δ = 10, 주황: μ = 0, δ = 10.
지지하다
PDF
CDF
의미하다
중앙값

통계학에서 잘린 분포는 다른 확률 분포의 영역을 제한함으로써 생기는 조건부 분포입니다.실제 통계에서 잘린 분포는 발생을 기록하거나 심지어 알 수 있는 능력이 주어진 임계값보다 크거나 낮거나 지정된 범위 내에 있는 값으로 제한되는 경우 발생합니다.예를 들어, 학교의 어린이 생년월일을 조사하는 경우, 학교가 특정 날짜에 특정 연령대의 어린이만 수용한다는 점을 고려할 때, 일반적으로 해당 지역의 모든 어린이 생년월일에 잘릴 수 있다.정보를 얻기 위해 학교에 직접 접근하는 방법만 사용한다면, 지역 내 얼마나 많은 아이들이 학교 마감일 전후에 생년월일을 가지고 있는지에 대한 정보는 없을 것이다.

표본 추출은 실제 값을 기록하지 않고 필요한 범위를 벗어나는 항목에 대한 지식을 유지하는 것과 같은 경우,[1] 이는 여기서 잘라내는 것과 반대로 관측 중단이라고 합니다.

정의.

다음 설명에서는 이산 분포에도 동일한 아이디어가 적용되지만 연속 분포를 갖는 랜덤 변수의 관점에서 설명합니다.마찬가지로 이 설명에서는 절단이 세미 오픈 인터벌 y µ (a, b)에 해당한다고 가정하지만 다른 가능성은 쉽게 처리될 수 있습니다.

확률밀도함수 에 따라 분포하는 랜덤 변수 X)와 모두 무한지원한다고 가정합니다.예를 들어, 지원 y ( ,) \ y = ( , )} { displaystyle X} 가 되어 있는지 알 수 있도록 서포트를 2개의 상수 사이에 제한한 후 랜덤 변수의 확률 밀도를 확인한다고 가정합니다.즉, X{ } 가< b} 가 어떻게 싶다고 가정합니다.

서 g( ) () \ g ( x ) ( ) 。 < x < \ b} g ( ) \ g ( x )= } 입니다. g ( ) ( )I ( { < x b{ g ( x ) ( ) \ I( \ { < \ b \ )} 。 인디케이터 함수입니다.잘린 분포의 분모는 x{\ x에 대해 일정합니다.

는 fa < b f a b 밀도입니다.

a ( < X b ) x1(b ) -F( a) a ( x ) x ( \ \_ { }^{ x a \b ) {1} ( ) - ( a )} \ int { a } _ } }

잘린 분포에는 위쪽과 아래쪽에서 부품을 제거할 필요가 없습니다.분포의 맨 아래만 제거된 잘린 분포는 다음과 같습니다.

서 g( ) () \ g ( ) ( x ) = (x ) 0 \ g ( x ) ( ) 、 where where where where where、 F ()

분포의 상단이 제거된 잘린 분포는 다음과 같습니다.

서 g(x ) () \ ( ) =( x ) x ) \ g ( x ) ()다른 모든 x , y else else else ( ( ( ( ( ( ( ( ( where where where where where where where where= 0 \ f ()는 누적분포함수입니다.

잘린 랜덤 변수의 기대값

랜덤 변수 { X 알려진 값 {\ y보다 클 경우 밀도 분포F 따라 분포된 랜덤 변수의 기대값을 구한다고 가정합니다.잘린 랜덤 변수의 기대치는 다음과 같습니다.

서 g { g g() {g) =이며, x ) {(x) 0 입니다.

원래의 밀도 함수에 대한 지지{\displaystyle f}(우리는 끊임 없는 것), E(u(X)X의 속성 을의 활개 치게 내버려두는 것은{\displaystyle}과 b{\displaystyle b}고 상위 허용 한계 각각;y){\displaystyle E(u(X)X>, y)}, 너{\displaystyle u}어떤 연속적입니다.funct연속 유도체를 포함하는 이온:

[ [ ( )X < ( ) ( -E ( )X <) + (y) style \ E ( ) < ]

이 존재하는 경우, 즉 y u ( ) u( c ) 、 y ( ) () \ \( y ) ( c ) → y (c ) → lim f ' ( c )a b b

잘린 정규 분포가 중요[2]예입니다.

Tobit 모형은 잘린 분포를 사용합니다.다른 예로는 x=0에서 잘린 이항 분포와 x=0에서 잘린 포아송 분포가 있습니다.

랜덤 잘라내기

다음과 같은 설정이 있다고 가정합니다.절단값 t는 밀도 g에서 랜덤으로 선택되지만 이 값은 관찰되지 않습니다.그런 다음 잘린 분포에서 값 x를 무작위로 합니다.f ( ) (x ){ f t) = x { x 하여 관찰한 결과 { t 밀도에 대한 믿음을 업데이트한다고 가정합니다.

첫째, 정의상:

(x ) ( )( t ) t \ f ( x ) = \ _ }^{\ t

t는 x보다 커야 tdisplaystylet에 할 때는 xx의 하한을 f {x)} x {x)}는 각각 무조건 밀도 및 무조건 누적 분포 함수이다.

베이즈의 규칙에 따라

로 확장됩니다.

두 개의 균일한 분포(예)

t가 [0,T]에서 균일하게 분포되고 x t가 [0,t]에서 균일하게 분포된다고 가정합니다.g(t)와 f(x t)를 각각 t와 x를 설명하는 밀도라고 하자.x 을 관측하고 x 이 주어진 t의 분포를 확인하려고 합니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Dodge, Y. (2003) 옥스퍼드 통계 용어 사전.OUP ISBN0-19-920613-9
  2. ^ Johnson, N.L., Kotz, S., Balakrishnan, N.(1994) 연속 일변량 분포, 제1권, Wiley.ISBN 0-471-58495-9 (섹션 10.1)