잘린 분포

잘린 배포
	확률밀도함수 서로 다른 모수 집합에 대한 잘린 정규 분포에 대한 확률 밀도 함수입니다.모든 경우 a = -10 및 b = 10입니다.검정: μ = -8, δ = 2, 파랑: μ = 0, δ = 2, 빨강: μ = 9, δ = 10, 주황: μ = 0, δ = 10.
지지하다
PDF
CDF
의미하다
중앙값

통계학에서 잘린 분포는 다른 확률 분포의 영역을 제한함으로써 생기는 조건부 분포입니다.실제 통계에서 잘린 분포는 발생을 기록하거나 심지어 알 수 있는 능력이 주어진 임계값보다 크거나 낮거나 지정된 범위 내에 있는 값으로 제한되는 경우 발생합니다.예를 들어, 학교의 어린이 생년월일을 조사하는 경우, 학교가 특정 날짜에 특정 연령대의 어린이만 수용한다는 점을 고려할 때, 일반적으로 해당 지역의 모든 어린이 생년월일에 잘릴 수 있다.정보를 얻기 위해 학교에 직접 접근하는 방법만 사용한다면, 지역 내 얼마나 많은 아이들이 학교 마감일 전후에 생년월일을 가지고 있는지에 대한 정보는 없을 것이다.

표본 추출은 실제 값을 기록하지 않고 필요한 범위를 벗어나는 항목에 대한 지식을 유지하는 것과 같은 경우,^[1] 이는 여기서 잘라내는 것과 반대로 관측 중단이라고 합니다.

정의.

다음 설명에서는 이산 분포에도 동일한 아이디어가 적용되지만 연속 분포를 갖는 랜덤 변수의 관점에서 설명합니다.마찬가지로 이 설명에서는 절단이 세미 오픈 인터벌 y µ (a, b)에 해당한다고 가정하지만 다른 가능성은 쉽게 처리될 수 있습니다.

확률밀도함수 $(x$ 에 따라 분포하는 랜덤 변수 X $(x$ )와 $X$ $F(x)$ 를 $F(x)$ 모두 무한지원한다고 가정합니다.예를 들어, 지원 y $y=(a,b]$ ( $y=(a,b]$ , $y=(a,b]$ ) \ $displaystyle$ y = ( $a$ , $b$ ) $y=(a,b]$ } { displaystyle X} 가 $a<X\leq b$ $a<X\leq b$ 되어 있는지 알 수 있도록 서포트를 2개의 상수 사이에 제한한 후 랜덤 변수의 확률 밀도를 확인한다고 가정합니다.즉, X{ $displaystyle$ $X$ } 가 $X$ $a<X\leq b$ < $X$ b $a<X\leq b$ } 가 어떻게 $분포되어 있는지$ $알고$ 싶다고 가정합니다.

(\displaystyle f(x a)=param frac {g(x)}{F(b)-F(a)}}=param frac {f(x)\cdot I(\{a\leq b\}){F(a)}}}}\propto _{xf(x(x)\cdot i)

$g(x)=f(x)$ 서 g $g(x)=f(x)$ ( $g(x)=f(x)$ ) $g(x)=f(x)$ ( $g(x)=f(x)$ ) \ $displaystyle$ g ( x ) $= f$ ( $x$ ) 。 $a<x\leq b$ < x $a<x\leq b$ $a<x\leq b$ < $x$ \ $leq$ b $a<x\leq b$ } $g(x)=0$ g ( $g(x)=0$ ) $=$ $g(x)=0$ \ $displaystyle$ g ( x )= $0$ } 입니다 $g(x)=f(x)$ $g(x)=0$ . $g(x)=f(x)\cdot I(\{a<x\leq b\})$ g ( $g(x)=f(x)\cdot I(\{a<x\leq b\})$ ) $g(x)=f(x)\cdot I(\{a<x\leq b\})$ ( $g(x)=f(x)\cdot I(\{a<x\leq b\})$ ) $g(x)=f(x)\cdot I(\{a<x\leq b\})$ I ( { $g(x)=f(x)\cdot I(\{a<x\leq b\})$ < x $g(x)=f(x)\cdot I(\{a<x\leq b\})$ b $g(x)=f(x)\cdot I(\{a<x\leq b\})$ { $display style$ g ( x ) $= f$ ( $x$ ) \ $cdot$ I( \ { $a$ < $x$ \ $leq$ b \ ) $g(x)=f(x)\cdot I(\{a<x\leq b\})$ } 。 $여기서$ 는 $I$ 인디케이터 함수입니다.잘린 분포의 분모는 x{\ $displaystyle$ x $x$ 에 대해 일정합니다.

$f(x|a<X\leq b)$ 는 f $f(x|a<X\leq b)$ a < $f(x|a<X\leq b)$ b $){$ $displaystyle$ f $(x$ a $<X\leq$ b $)}$ 는 $f(x|a < X \leq b)$ 밀도입니다.

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

a

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

(

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

< X

b

b )

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

x

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

1

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

(

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

b ) -

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

F

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

( a

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

)

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

a

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

( x )

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

x

=

1

( \

displaystyle

\

int

_ {

a

}^{

b (

x a \

leq

b )

= frac

{1}

{F

(

b

( a

) -

F

( a )

\int _{a}^{b}f(x|a<X\leq b)dx={\frac {1}{F(b)-F(a)}}\int _{a}^{b}g(x)dx=1

} \ int { a } _ }

_

}

잘린 분포에는 위쪽과 아래쪽에서 부품을 제거할 필요가 없습니다.분포의 맨 아래만 제거된 잘린 분포는 다음과 같습니다.

f(x X>y)=param frac {g(x)}{1-F(y)}

$y<x$ 서 g $g(x)=f(x)$ ( $g(x)=f(x)$ ) $g(x)=f(x)$ ( $g(x)=f(x)$ $y<x$ ) \ $displaystyle$ g ( $x$ ) $=$ $g(x)=0$ $g(x)=f(x)$ ( x ) = $g(x)=0$ ( $g(x)=0$ x ) $g(x)=0$ 0 \ $displaystyle$ g ( x ) $= f$ ( $g(x)=f(x)$ $x$ ) 、 $F(x)$ where where where where where $y<x$ 、 F ( $x$ ) $F(x)$ 。

분포의 상단이 제거된 잘린 분포는 다음과 같습니다.

f(x X\leq y)=flac {g(x)}{F(y)}

$x\leq y$ 서 g $g(x)=f(x)$ ( $g(x)=f(x)$ x ) $g(x)=f(x)$ ( $g(x)=f(x)$ ) \ $displaystyle g$ $g(x)=f(x)$ ( $x$ $x\leq y$ ) = $f$ ( x ) $x\leq y$ x ) $g(x)=0$ $g(x)=0$ \ $displaystyle$ g ( x ) $F(x)$ $= f$ ( $g(x)=f(x)$ $x$ )다른 $g(x) = f(x)$ $g(x) = 0$ 모든 x , y $F(x)$ else else else ( ( ( ( ( ( ( ( ( $g(x)=0$ where where where where where where where where $g(x)=0$ = 0 \ $displaystyle$ f ( $g(x)=0$ $F(x)$ )는 $F(x)$ 누적분포함수입니다.

잘린 랜덤 변수의 기대값

랜덤 변수 $X$ { $displaystyle$ X $X$ 가 $f(x)$ 알려진 값 $y$ {\ $displaystyle$ y $y$ 보다 클 경우 밀도 $(x)$ 및 $F(x)$ 분포 $F(x)$ F $(x)$ 에 $F(x)$ 따라 분포된 랜덤 변수의 기대값을 구한다고 가정합니다.잘린 랜덤 변수의 기대치는 다음과 같습니다.

E(X)X>y=frac {int_{y}^{\infty}xg(x)dx}{1-F(y)}

$g(x)$ 서 g $x)$ { $displaystyle$ g $(x)}$ 는 $g(x)$ $x>y$ g( $g(x)=f(x)$ ) $g(x)=f(x)$ $)$ { $displaystyle$ g $(x$ ) = $f(x)}$ 이며 $g(x) = f(x)$ , $x>y$ x $> y$ 및 $g(x)=0$ ) $=$ $g(x)=0$ { $displaystyle g$ (x) $=$ 0 입니다 $g(x)=0$ .

원래의 밀도 함수에 대한 지지{\displaystyle f}(우리는 끊임 없는 것), E(u(X)X의 속성 을의 활개 치게 내버려두는 것은{\displaystyle}과 b{\displaystyle b}고 상위 허용 한계 각각;y){\displaystyle E(u(X)X>, y)}, 너{\displaystyle u}어떤 연속적입니다.funct연속 유도체를 포함하는 이온:

$\displaystyle \lim _{y\to a}E(u(X) X>y)=E(u(X))}$
$\displaystyle \lim _{y\to b}E(u(X) X>y)=u(b)}$
${\displaystyle\frac{\partial y}[E(u(X) X>y]=paramfrac {f(y)}{1-F(y)}}[E(u(X) X>y)-u(y)]}$

및

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

[

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

[

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

(

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

)

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

X <

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

(

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

)

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

(

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

-

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

E (

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

)

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

X <

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

) +

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

(

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

y

{\frac {\partial }{\partial y}}[E(u(X)|X<y)]={\frac {f(y)}{F(y)}}[-E(u(X)|X<y)+u(y)]

)

]{

display

style \

frac }{\ frac }[

E (

X

)

X

<

y

]

=paramfrac {f(y)}{F(y)}}[-E(u(X) X<y)+u(y)]}

$\displaystyle \lim _{y\to a}{\frac {\frac }[E(u(X) X>y)]=f(a)[E(u(X)-u(a)]}$
$\displaystyle \lim _{y\to b}{\frac {\partial y}}[E(u(X) X>y]=paramfrac {1}{2}}u'(b)}$

$\lim _{y\to c}u'(y)=u'(c)$ 이 존재하는 경우, 즉 $\lim _{y\to c}u'(y)=u'(c)$ y $\lim _{y\to c}u'(y)=u'(c)$ $\lim _{y\to c}u'(y)=u'(c)$ u $\lim _{y\to c}u'(y)=u'(c)$ ( $\lim _{y\to c}u'(y)=u'(c)$ ) $=$ u $\lim _{y\to c}u'(y)=u'(c)$ ( c ) 、 $\lim _{y\to c}u(y)=u(c)$ $\lim _{y\to c}u'(y)=u'(c)$ y $\lim _{y\to c}u(y)=u(c)$ $\lim _{y\to c}u(y)=u(c)$ ( $y$ ) $\lim _{y\to c}u'(y)=u'(c)$ $\lim _{y\to c}u(y)=u(c)$ ( $\lim _{y\to c}u(y)=u(c)$ ) \ $displaystyle \lim _$ $y$ \ $to cu$ ( y ) $=$ $\lim _{y\to c}f(y)=f(c)$ ( c ) → $\lim _{y\to c}f(y)=f(c)$ y $\lim _{y\to c}u(y)=u(c)$ ( $\lim _{y\to c}u(y)=u(c)$ c ) → lim f $\lim _{y\to c}f(y)=f(c)$ $\lim _{y\to c}f(y)=f(c)$ $\lim _{y\to c}f(y)=f(c)$ ' ( c ) $\displaystyle$ a $b$ b $displaystyle$ b $.$

예

잘린 정규 분포가 중요한 ^[2]예입니다.

Tobit 모형은 잘린 분포를 사용합니다.다른 예로는 x=0에서 잘린 이항 분포와 x=0에서 잘린 포아송 분포가 있습니다.

랜덤 잘라내기

다음과 같은 설정이 있다고 가정합니다.절단값 $displaystyle$ t는 밀도 $)\displaystyle$ g $(t$ 에서 랜덤으로 선택되지만 이 값은 관찰되지 않습니다.그런 다음 잘린 분포에서 값 $x$ $f(x|t)=Tr(x)$ x $x$ 를 무작위로 $f(x|t)=Tr(x)$ 합니다. $f(x|t)=Tr(x)$ f ( $f(x|t)=Tr(x)$ $f(x|t)=Tr(x)$ ) $=$ $f(x|t)=Tr(x)$ ( $f(x|t)=Tr(x)$ x ) $f(x|t)=Tr(x)$ { $displaystyle$ f $(x$ t) = $Tr(x$ x { $displaystyle$ x $}$ 를 $x$ $x$ 하여 관찰한 결과 $t$ { $displaystyle$ t $}$ 의 $t$ 밀도에 대한 믿음을 업데이트한다고 가정합니다.

첫째, 정의상:

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

(

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

x )

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

(

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

)

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

( t )

f(x)=\int _{x}^{\infty }f(x|t)g(t)dt

t \

displaystyle

f ( x ) = \

int

_

{x

}^{\

infty }f(x

t

)g(t)dt

및

\displaystyle F(a)=\int _{x}^{a}\left[\int _{-\infty }^{\infty }f(x t)g(t)dt\right]pairstyle.}

$\displaystyle$ t는 $t$ x $displaystyle$ 보다 커야 $합니다.따라서$ t $t$ displaystylet에 $t$ 할 때는 x $\displaystyle$ x의 하한을 $x$ $f(x)$ f $)$ { $displaystyle f($ x)} $F(x)$ x $)$ { $displaystyle F($ x)}는 $F(x)$ 각각 무조건 밀도 및 무조건 누적 분포 함수이다.

베이즈의 규칙에 따라

g(t x)=syslogfrac {f(x t)g(t)}{f(x)}

로 확장됩니다.

g(t x)=f(x t)g(t)}{\int _{x}^{\infty }f(x t)g(t)dt}}

두 개의 균일한 분포(예)

t가 [0,T]에서 균일하게 분포되고 x t가 [0,t]에서 균일하게 분포된다고 가정합니다.g(t)와 f(x t)를 각각 t와 x를 설명하는 밀도라고 하자.x 값을 관측하고 x 값이 주어진 t의 분포를 확인하려고 합니다.

g(t x)=syslogfrac {f(x t)g(t)}{f(x)}=syslogfrac {1}{t(\ln(T)-\ln(x)}}}\text{for all }t >x

「」를 참조해 주세요.

절사 평균

레퍼런스

^ Dodge, Y. (2003) 옥스퍼드 통계 용어 사전.OUP ISBN 0-19-920613-9
^ Johnson, N.L., Kotz, S., Balakrishnan, N.(1994) 연속 일변량 분포, 제1권, Wiley.ISBN 0-471-58495-9 (섹션 10.1)

[1] Dodge, Y. (2003) 옥스퍼드 통계 용어 사전.OUP ISBN 0-19-920613-9

[2] Johnson, N.L., Kotz, S., Balakrishnan, N.(1994) 연속 일변량 분포, 제1권, Wiley.ISBN 0-471-58495-9 (섹션 10.1)

[1]

[2]

Search

잘린 분포

네임스페이스

더

목차

정의.

잘린 랜덤 변수의 기대값

예

랜덤 잘라내기

두 개의 균일한 분포(예)

「」를 참조해 주세요.

레퍼런스

확률밀도함수 서로 다른 모수 집합에 대한 잘린 정규 분포에 대한 확률 밀도 함수입니다.모든 경우 a = -10 및 b = 10입니다.검정: μ = -8, δ = 2, 파랑: μ = 0, δ = 2, 빨강: μ = 9, δ = 10, 주황: μ = 0, δ = 10.
지지하다	$x\in(a,b)$
PDF	${g(x)}{F(b)-F(a)}$
CDF	${\frac _{a}^{dF(t)}{F(b)-F(a)}=440frac {F(x)-F(a)}{F(b)-F(a)}}$
의미하다	$(\displaystyle\frac_{a}^{b}xdF(x){F(b)-F(a)}})$
중앙값	$F^{-1}\left({\frac {F(a)+F(b)}}{2}}\right)$

Search

잘린 분포

정의.

잘린 랜덤 변수의 기대값

예

랜덤 잘라내기

두 개의 균일한 분포(예)

「 」를 참조해 주세요.

레퍼런스

「」를 참조해 주세요.