| 확률질량함수  |
| 누적분포함수  |
| 표기법 |  |
|---|
| 파라미터 | n n0 N : 시행 횟수 > \ > ( real ) > \ \> ( real ) |
|---|
| 지지하다 | x ∈ { 0 , ... , n } |
|---|
| PMF |
서B ( , ) ( ) (y )γ ( + ) ( ) = {) , \ ( 는 베타 함수입니다. |
|---|
| CDF |
여기서32 F(a;b;x)는 일반화 초기하 함수이다.  |
|---|
| 의미하다 |  |
|---|
| 분산 |  |
|---|
| 왜도 |  |
|---|
| 예: 첨도 | 텍스트 참조 |
|---|
| MGF | } 서 2F 2}1 })은 하이퍼 지오메트릭 함수입니다 |
|---|
| CF |
 |
|---|
| PGF |
 |
|---|
확률 이론과 통계학에서, 베타 이항 분포는 베르누이 시행의 고정 또는 알려진 개수의 각각에서 성공 확률이 알 수 없거나 랜덤일 때 발생하는 음이 아닌 정수의 유한한 지지 위에 이산 확률 분포의 집합이다.베타 이항 분포는 각 n개 시행에서 성공 확률이 고정되지 않고 베타 분포에서 랜덤하게 추출되는 이항 분포입니다.베이지안 통계, 경험적 베이즈 방법 및 고전 통계에서 이항형 분포 데이터의 과잉 산포를 포착하기 위해 자주 사용된다.
이항 분포와 베타 분포는 각각 다항 분포와 디리클레 분포의 일변량 버전이기 때문에 베타 이항 분포는 디리클레 다항 분포의 1차원 버전이다.α와 β가 정수인 특수한 경우를 음의 초기하 분포라고도 한다.
동기 부여 및 파생
복합 분포로서
베타 분포는 이항 분포의 켤레 분포입니다.이 사실은 이항 분포의 p p모수를
분포에서 무작위로 추출한 것으로 생각할 수 있는 분석적으로 다루기 쉬운 화합물 분포로 이어진다.예를 들어, 향후 nn의
에서 x의
헤드의 수를 예측하는 데 관심이 있다고 가정합니다.이것은 에 의해 주어집니다.
![{\displaystyle {\begin{aligned}f(x\mid n,\alpha ,\beta )&=\int _{0}^{1}\mathrm {Bin} (x|n,p)\mathrm {Beta} (p\mid \alpha ,\beta )\,dp\\[6pt]&={n \choose x}{\frac {1}{\mathrm {B} (\alpha ,\beta )}}\int _{0}^{1}p^{x+\alpha -1}(1-p)^{n-x+\beta -1}\,dp\\[6pt]&={n \choose x}{\frac {\mathrm {B} (x+\alpha ,n-x+\beta )}{\mathrm {B} (\alpha ,\beta )}}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/26b9fd585e7ef274a6dc491ae37690708c70a4d3)
베타 함수의 속성을 사용하여 대신 쓸 수 있습니다.

항아리 모형으로서의 베타 이항식
또한 β-이항 분포는 폴랴 항아리 모델로 알려진 α 및 β의 양의 정수 값에 대해 항아리 모델을 통해 동기 부여될 수 있다.구체적으로, 무작위 추첨이 이루어지는 α의 빨간색 공과 β의 검은색 공이 들어 있는 항아리를 상상해 보십시오.빨간색 공이 관찰되면 빨간색 공 2개가 항아리로 반환됩니다.마찬가지로 검은 공을 뽑으면 검은 공 두 개가 항아리로 돌아간다.이것이 n회 반복되면 x개의 빨간색 구슬을 관찰할 확률은 매개변수 n, α 및 β를 가진 베타 이항 분포를 따릅니다.
랜덤 추첨이 단순 치환인 경우(관측된 공 위에 있는 공은 항아리에 추가되지 않음) 분포는 이항 분포를 따르며 랜덤 추첨이 치환되지 않은 경우 분포는 초기하 분포를 따릅니다.
모멘트와 속성
처음 세 번의 생소한 순간은
![{\begin{aligned}\mu _{1}&={\frac {n\alpha }{\alpha +\beta }}\\[8pt]\mu _{2}&={\frac {n\alpha [n(1+\alpha )+\beta ]}{(\alpha +\beta )(1+\alpha +\beta )}}\\[8pt]\mu _{3}&={\frac {n\alpha [n^{{2}}(1+\alpha )(2+\alpha )+3n(1+\alpha )\beta +\beta (\beta -\alpha )]}{(\alpha +\beta )(1+\alpha +\beta )(2+\alpha +\beta )}}\end{aligned}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d8b08123d7cc1c1b79069bd5d3d3f78776de5945)
그리고 첨도는
![\beta_2 = \frac{(\alpha + \beta)^2 (1+\alpha+\beta)}{n \alpha \beta( \alpha + \beta + 2)(\alpha + \beta + 3)(\alpha + \beta + n) } \left[ (\alpha + \beta)(\alpha + \beta - 1 + 6n) + 3 \alpha\beta(n - 2) + 6n^2 -\frac{3\alpha\beta n(6-n)}{\alpha + \beta} - \frac{18\alpha\beta n^{2}}{(\alpha+\beta)^2} \right].](https://wikimedia.org/api/rest_v1/media/math/render/svg/8a0a324a1e2fa8215447cc6cf5761738050f371f)
+β { p=α frac {\} {\alpha +\을
두면 평균은 다음과 같이 기록될 수 있습니다.

및 로서의 차이
![{\displaystyle \sigma ^{2}={\frac {n\alpha \beta (\alpha +\beta +n)}{(\alpha +\beta )^{2}(\alpha +\beta +1)}}=np(1-p){\frac {\alpha +\beta +n}{\alpha +\beta +1}}=np(1-p)[1+(n-1)\rho ]\!}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c332f6772b917eaeef2f47d6ab8a5a4abb34f575)
여기서 +1 {\ \rho t {\+\}
입니다. 는
"Intra class" 또는 "Intra cluster" 상관관계로 알려져 있습니다.과잉분산을 일으키는 것은 이 양의 상관관계이다.n { n=1
인 베타 변동과 이항 변동을 구분할 수 있는 정보가 없으며 두 모델의 분산이 동일합니다.
요인 모멘트
베타 이항 랜덤 변수 X의 r번째 요인 모멘트는 다음과 같습니다.
- flac}}{alpha,\flac {flac}}}}{alphaflac
![{\displaystyle \operatorname {E} {\bigl [}(X)_{r}{\bigr ]}={\frac {n!}{(n-r)!}}{\frac {B(\alpha +r,\beta )}{B(\alpha ,\beta )}}=(n)_{r}{\frac {B(\alpha +r,\beta )}{B(\alpha ,\beta )}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e64b19a39dd6dca38ff9f8796b5c2808115d2b56)
포인트 견적
모멘트법
모멘트 추정 방법은 베타 이항식의 첫 번째 모멘트와 두 번째 모멘트를 기록하고 샘플 를
와 동일하게 설정함으로써 얻을 수 있습니다.
![{\displaystyle {\begin{aligned}{\widehat {\alpha }}&={\frac {nm_{1}-m_{2}}{n({\frac {m_{2}}{m_{1}}}-m_{1}-1)+m_{1}}}\\[5pt]{\widehat {\beta }}&={\frac {(n-m_{1})(n-{\frac {m_{2}}{m_{1}}})}{n({\frac {m_{2}}{m_{1}}}-m_{1}-1)+m_{1}}}.\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/74abfcda5a1906399e3218f8a67446428ad1d557)
이러한 추정치는 비감각적으로 음수일 수 있으며, 이는 데이터가 이항 분포에 비해 분산되지 않았거나 분산되지 않았다는 증거입니다.이 경우 이항 분포와 초기하 분포가 각각 대안 후보입니다.
최대우도 추정
폐쇄형 최대우도 추정치는 비현실적이지만, pdf가 공통 함수(감마 함수 및/또는 베타 함수)로 구성되어 있기 때문에 직접 수치 최적화를 통해 쉽게 찾을 수 있습니다.경험적 데이터의 최대우도 추정치는 (Minka 2003)에 설명된 방법에 따라 다항식 폴랴 분포를 적합시키기 위한 일반 방법을 사용하여 계산할 수 있다.함수 vglm을 통한 R 패키지 VGAM은 최대 가능성을 통해 베타 이항 분포에 따라 분포된 응답으로 glm 유형 모델의 적합을 용이하게 한다.관측치 전체에 대해 n이 고정될 필요는 없습니다.
예
다음 데이터는 19세기 작센의 병원 기록에서 얻은 6115가구 중 13가족의 첫 12명의 자녀 중 남자 아이의 수를 보여준다(소칼과 롤프, 59쪽).13번째 아이는 원하는 성별에 도달했을 때 무작위로 중단하지 않는 가족의 효과를 둔화하는 것으로 무시된다.
| 남성 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 가족들 | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
처음 두 샘플 모멘트는

따라서 모멘트의 추정 방법은 다음과 같습니다.

최대우도 추정치는 수치로 확인할 수 있습니다.

최대 로그 우도는

여기서 AIC를 찾을 수 있습니다.

경쟁 이항 모델에 대한 AIC는 AIC = 25070.34이며, 따라서 베타 결합 모델이 데이터에 우수한 적합성을 제공한다는 것을 알 수 있다. 즉, 과대 산포에 대한 증거가 있다.Trivers와 Willard는 포유류의 자손들 사이에서 성별의 이질성에 대한 이론적 정당성을 가정한다.
특히 꼬리 부분에서 뛰어난 핏감이 뚜렷하다
| 남성 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 관찰된 패밀리 | 3 | 24 | 104 | 286 | 670 | 1033 | 1343 | 1112 | 829 | 478 | 181 | 45 | 7 |
| 예상 적합(베타-이항식) | 2.3 | 22.6 | 104.8 | 310.9 | 655.7 | 1036.2 | 1257.9 | 1182.1 | 853.6 | 461.9 | 177.9 | 43.8 | 5.2 |
| 적합 기대값(이항 p = 0.519215) | 0.9 | 12.1 | 71.8 | 258.5 | 628.1 | 1085.2 | 1367.3 | 1265.6 | 854.2 | 410.0 | 132.8 | 26.1 | 2.3 |
베이지안 통계의 베타 이항식
Bernouli 성공 베이지안 추정에서 베타 분포는 중요한 역할을 . X { , 2, n { \ } = \ { _ { , _ 2 , \ X _ { { n = \ { X _ { 1 } { X _ { 1
}} sample
.~ () \ X _ { } \ {}
) 。베이지안 패션에서의p \ p
}에 우리의 지식은 불확실하며 이전 p ~ ( , \ { beta } ( 1 \
에 의해 모델화되어 있다고 가정합니다.= _}} 다음
복합화를 통해, 사전 예측 분포
- ~ ( 1, , β) { } \ { { Bin } ( _ { , \ , \ }
} 。
1을
관찰한 결과 p p의 분포가 확인되었습니다.

서 C C는
정규화 상수입니다. 분포를 t ( +α , - 1 +) { style \} ( _ {1 + \, n { - _ {1 + \ )
} 로 인식합니다.
따라서 복합화를 통해 B i () ( \ \{} random 변수 2( \ n_ { { displaystyle n _ { n _ {2}} )의
미래 샘플 합계의 후방 예측 분포는 다음과 같습니다.
- ~ n ( , 1 + , - + )β { } \mathrm} (} , }+\, 1}-{1}+\

베타 이항 분포 랜덤 변수 생성
베타 2항 랜덤 X ~ n ( , ,β X \ ( , , \)} 를 그리려면 p~ a (, 、β \ \mathrm {Beta } ( \mathrm } )를
그리면 .
관련 분포
- e , ,β) ~ i( ) ( \ \ { ( 1, \ , \ sim \ mathrm {} ( )서
p \ p
} \ } + { frac } \ } \ } } 、 } } - n ( , , ) ~ ( , {} ( ,, 1(0 ) 。서U(a , ) { U (, b ) }는

이산 균일한 분포입니다. - s t B , s, ( - )) ~ ( ,p){ _ s\}\ , \ mathram ( , s ) + p
)은
(는) 이항 분포입니다. - n B B , , ( - ) B( , _ { \ \ }\{ } ( , \ n , n { - p } { } ) \ \
「 」를 참조해 주세요.
레퍼런스
외부 링크
|
|---|
디스크리트 일변량 | |
|---|
계속되는 일변량 | 에서 지원되는 유계 구간 | |
|---|
에서 지원되는 반신반의 간격 | |
|---|
서포트되고 있다 대체로 실선 | |
|---|
지지와 함께 종류가 다른 | |
|---|
|
|---|
혼재 일변량 | |
|---|
다변량 (공동) | |
|---|
| 방향성 | |
|---|
퇴화 단수 | |
|---|
| 가족들 | |
|---|
|