이항 분포

Binomial distribution
이항 분포
확률질량함수
Probability mass function for the binomial distribution
누적분포함수
Cumulative distribution function for the binomial distribution
표기법
매개변수 { – 시행 횟수
[ – 각 시행에 대한 성공 확률
지지하다 – 성공 횟수
PMF
CDF( - + ) + (정규화된 불완전 베타 함수)
의미하다
중앙값 p 또는
모드 + 또는 (+ -
분산
왜도
절두술
엔트로피
샤논으로nats의 경우 로그의 자연로그를 사용합니다.
MGF
CF
PGF
피셔 정보
(고정 경우 {\
= p=에 대한 이항 분포
파스칼의 삼각형에서 nk로

8층(n = 8)으로 된 Galton 박스의 공이 중앙 빈(k = 4)에 들어갈 확률은 입니다

확률 이론통계학에서, 모수 np를 갖는 이항 분포n개독립적실험에서 성공 횟수의 이산 확률 분포이며, 각각은 예-아니오 질문을 합니다.성공(확률 p) 또는 실패(확률 = -p q = 1 - 라는 각각의 부울 값 결과를 가지고 있습니다.단일 성공/failure 실험은 Bernouli 실험 또는 Bernouli 실험이라고도 하며, 일련의 결과를 Bernouli 과정이라고 합니다. 즉, n = 1인 단일 실험의 경우 이항 분포는 Bernouli 분포입니다.이항 분포는 통계적 유의성에 대한 대중적 이항 검정의 기초가 됩니다.[1]

이항 분포는 크기가 N인 모집단에서 대체하여 추출한 크기 n인 표본의 성공 횟수를 모형화하는 데 자주 사용됩니다. 표본 추출이 대체 없이 수행되는 경우, 추출은 독립적이지 않으므로 결과적인 분포는 이항 분포가 아닌 기하학적 분포입니다.그러나 n보다 훨씬 큰 N의 경우 이항 분포가 양호한 근사치를 유지하며 널리 사용됩니다.

정의들

확률질량함수

일반적으로 랜덤 변수 X가 매개 변수 n {\과 p ∈ [0,1]인 이항 분포를 따를 경우 X ~ B(n, p)로 적습니다.n개의 독립적인 베르누이 실험에서 정확히 k개의 성공을 얻을 확률은 확률 질량 함수에 의해 주어집니다.

포크 = 0, 1, 2, ..., n, 여기서

이항 계수이므로 분포의 이름입니다.수식은 다음과 같이 이해할 수 있습니다: k개의 성공은 확률 p에서k 발생하고 n - k개의 실패는 확률 - - 1 - p - k 그러나 k개의 성공은 n개의 시행 중 어디에서나 발생할 수 있습니다.n개의 시행으로 k개의 성공을 분배하는 방법은 ( k 가지입니다.

이항 분포 확률에 대한 참조표를 작성할 때 일반적으로 표는 최대 n/2개의 값으로 채워집니다.왜냐하면 k > n/2의 경우, 확률은 다음과 같이 보어에 의해 계산될 수 있기 때문입니다.

f(k, n, p)를 k의 함수로 보면, 이를 극대화하는 k 값이 있습니다. k 값은 다음을 계산하여 알 수 있습니다.

1과 비교해 보겠습니다.다음을[2] 만족시키는 정수 M이 항상 존재합니다.

(n + 1)p정수경우를 제외하고 f(k, n, p)는 k < M일 때 단조 증가하고 k > M일 때 단조 감소합니다.이 경우 f가 최대가 되는 값은 (n + 1)p와 (n + 1)p - 1 두 가지입니다. M은 베르누이 시행에서 가장 가능성이 높은 (즉, 가장 가능성이 높은) 결과이며 모드라고 불립니다.

편향된 동전을 던졌을 때 0.3의 확률로 앞면이 나온다고 가정합니다.6번의 던지기에서 정확히 4번의 머리를 볼 확률은

누적분포함수

누적 분포 함수는 다음과 같이 나타낼 수 있습니다.

여기서 ⌊ 는 k 아래의 "바닥", 즉 k보다 작거나 같은 최대 정수입니다.

다음과 같이 정규화된 불완전 베타 함수로 나타낼 수도 있습니다.[3]

F-분포누적분포함수와 동일한 값:[4]

누적 분포 함수에 대한 몇 가지 폐쇄형 경계가 아래에 나와 있습니다.

특성.

기댓값 및 분산

X ~ B(n, p), 즉 X가 이항 분포된 랜덤 변수이며 n이 실험의 총 개수이고 p가 실험에서 성공적인 결과를 얻을 확률은 다음과 같습니다.[5]

이는 기대 값의 선형성과 함께 X가 기대 p인 n개의 동일한 베르누이 확률 변수의 합이라는 사실에서 따옵니다.즉, X 이 매개변수 p를 갖는 동일한(그리고 독립적인) 베르누이 확률변수라면, = X ++ X=} 그리고

분산은 다음과 같습니다.

이는 독립적인 확률 변수의 합의 분산이 분산의 합이라는 사실에서도 마찬가지로 나타납니다.

더 높은 순간

= [ ( -[X] ] c] }=\ ([ X로 정의된 처음 6개의 중심 모멘트 는 다음과 같습니다.

중심이 아닌 순간들은 만족합니다.

일반적으로

여기서{ atopk는 두 번째 종류의 스털링 수이고, n = ( - ) ⋯ (n- + ){\k}}= - k + 는 n의 k번째 하강 파워입니다단순 경계는 높은 포아송 모멘트를 통해 이항 모멘트를 경계화하는 방법으로 이어집니다.

이는 = ( p) c = O인 경우c ]{\ [이(가) E⁡ [c {\ \ { [에서 떨어진 상수 인자임을 보여줍니다.

모드

일반적으로 이항 B(n, p) 분포의 모드는 ⌊(+ 와 같으며 여기서 ⌊ ⋅ ⌋ 플로어 함수입니다.그러나 (n + 1)p가 정수이고 p가 0도 1도 아닐 때, 분포에는 (n + 1)p와 (n + 1)p - 1의 두 가지 모드가 있습니다.p가 0 또는 1일 경우 모드는 0이 되며 n도 그에 상응합니다.이러한 경우는 다음과 같이 요약할 수 있습니다.

증명: let

= p= f f()= )=의 값이 0이 아닙니다 = 1 p=의 경우 = f)=이고 f ( = {\=입니다. p = =의 경우 모드가 0이고 = p=의 경우 n 입니다

< < 0 < < 이(가) 되도록 합니다 우리는 다음을 찾습니다.

( + ) f( )( n- ) ( k+ )( -) )}}={\

이로부터 다음과 같이 합니다.

+ p- 이(가) 정수일( + p -1 {\)p-1( +)p {\1)(가) 모드입니다.+ - 이 \{∉에서Z {\ (n + in \mathbb {Z}을(를) ⌊하는 경우,(+ -1⌋ + = ⌋(+ + +=+ rfoor }만 모드입니다

중앙값

일반적으로 이항 분포의 중위수를 구하는 단일 공식은 없으며, 유일하지 않은 경우도 있습니다.그러나 몇 가지 특별한 결과가 확인되었습니다.

  • (가) 정수이면 평균, 중위수 및 모드가 일치하며 과(와) 동일합니다[10][11]
  • 중위수 m은 구간 ⌊ ⌋ ≤ ⌈ n 내에 있어야 합니다
  • 중위수 은 평균에서 멀리 떨어져 있을 수 없습니다 { { -
  • 중위수는 하며{, 1 - p{\ 에서 m - n m = round(np)와 같습니다( = p = {\이고 n이 홀수인 경우는 제외).
  • p가 유리수일 때( = p = {\n개의 홀수를 제외하고) 중위수는 고유합니다.
  • = p = {\이고 n이 홀수일 때 구간 12 (- ) 12(+ ) 이항 분포의 중위수입니다. = p = {\ {1이고 n이 짝수이면 m = n m = {\이(가) 고유 중위수입니다.

꼬리의 경계

knp의 경우, 누적 분포 F n )= ){\ Fp) =\ k 최대 k개의 성공 확률에 대해 상한을 도출할있습니다. ( ≥ k )= ( -k; -p) k) = 이므로 이러한 경계는 knp에 대한 누적 분포 함수의 상단 꼬리에 대한 경계로도 볼 수 있습니다

호핑의 부등식은 단순한 경계를 만듭니다.

하지만 아주 꽉 조이지는 않습니다.특히 p = 1의 경우 F(k;n,p) = 0(고정 k의 경우 k < n)을 갖지만, Hoeffding의 경계는 양의 상수로 평가됩니다.

체르노프 바운드에서 더 날카로운 바운드를 얻을 수 있습니다.[15]

여기서 D(a)는 a-코인과 p-코인 사이의 상대적 엔트로피(또는 쿨백-라이블러 발산)(즉, 베르누이(a)와 베르누이(p) 분포 사이의):

점근적으로 이 경계는 상당히 엄격합니다. 자세한 내용은 을 참조하십시오.

또한 집중 방지 알려진 Fn) {\ F(k에서 하한을 얻을 수 있습니다.스털링 공식으로 이항 계수를 근사하면 다음을 알 수[16] 있습니다.

더 단순하지만 더 느슨한 경계를 의미합니다.

p = 1/2이고 k ≥ 3n/8이면 짝수 n이면 분모를 일정하게 만들 수 있습니다.

통계적 추론

파라미터 추정

n을 알고 있으면 성공 비율을 사용하여 모수 p를 추정할 수 있습니다.

이 추정기는 최대 우도 추정기와 모멘트 방법을 사용하여 찾을 수 있습니다.이 추정기는 최소한의 충분하고 완전한 통계량(즉, x)을 기반으로 하기 때문에 레만-셰페 정리를 사용하여 입증된 최소 분산으로 편견이 없고 균일합니다.또한 확률과 MSE 모두 일관성이 있습니다.

베타 분포공액 사전 분포로 사용할 때 p에 대한 닫힌 형태 Bayes 추정기도 존재합니다.일반 (, { (\beta 을(를) 이전에 사용할 때, 사후 평균 추정기는 다음과 같습니다.

Bayes 추정기는 점근적으로 효율적이며 표본 크기가 무한대(n → ∞)에 가까워지면 MLE 솔루션에 접근합니다.베이즈 추정기는 편향되어 있고(이전 값에 따라 다름), 허용 가능하며 확률이 일관됩니다.

정보없는 사전으로 표준 균일 분포를 사용하는 특별한 경우, ( = = 1 )= U( ) = beta =1) = 사후 평균 추정기는 다음과 같습니다

(사후 모드는 표준 추정기로만 이어져야 합니다.)이 방법은 Pierre-Simon Laplace에 의해 18세기에 도입된 계승의 법칙이라고 불립니다.

매우 드문 이벤트를 가진 p와 작은 n(예: x=0인 경우)을 추정할 때 표준 추정기를 사용하면 ^= }}=0이(가) 비현실적이고 바람직하지 않습니다.이러한 경우에는 다양한 대안적 추정치가 있습니다.[18]Bayes 추정기를 사용하여 다음과 같은 결과를 얻을 수 있습니다.

다른 방법은 3의 규칙을 사용하여 구한 신뢰 구간의 상한을 사용하는 것입니다.

신뢰구간

n의 값이 상당히 큰 경우에도 평균의 실제 분포는 유의하게 비정규적입니다.[19]이러한 문제 때문에 신뢰 구간을 추정하는 몇 가지 방법이 제안되었습니다.

아래의 신뢰 구간 방정식에서 변수의 의미는 다음과 같습니다.

  • n1 n 성공 횟수, 총 시행 횟수입니다.
  • n n p\,}}= {\은(는) 성공의 비율입니다.
  • 는 목표 α 에 해당하는 표준 정규 분포(즉, 프로빗)의 - α{\} 분위입니다 예를 들어, 95% 신뢰 수준의 오차α {\ \ = 0.05이므로 - 2 - {\{1= 0.975 = 1.96 입니다.

왈드법

0.5/n연속성 보정을 추가할 수 있습니다.[clarification needed]

아그레스티-쿨 방법

[20]

여기서 p의 추정치는 다음과 같이 수정됩니다.

메서드는 n> > 및 n n 의 경우 잘 작동합니다 의 경우 여기를 참조하십시오 = 의 경우 }= 0은(는) 아래의 윌슨(점수) 메서드를 사용합니다.

아크사인법

[23]

윌슨 (점수) 방법

아래 수식의 표기법은 두 가지 측면에서 이전 수식과 다릅니다.[24]

  • 첫째, zx 아래 수식에서 약간 다른 해석을 가지고 있는데, '(1 - x)-분위수'의 축약어가 아니라 '표준 정규분포의 x분위수'라는 통상적인 의미를 가지고 있습니다.
  • 둘째, 이 공식은 두 개의 경계를 정의하는 데 플러스 마이너스를 사용하지 않습니다.대신 = / 2 z = 를 사용하여 하한값을 얻거나 = -/ 2 z = 를 사용하여 상한값을 얻을 수 있습니다.예를 들어, 95% 신뢰 수준의 경우 α{\ = 0.05이므로 = z / = =- z=} =} = - 을 사용하여 상한을 설정하고 = z - / = z = z=2} =} = 을 사용하여 상한을 설정합니다
[25]

비교

이른바 "정확"(Clopper–Pearson) 방법이 가장 보수적입니다.[19] (정확하다는 것은 완벽하게 정확하다는 것을 의미하는 것이 아니라 추정치가 참값보다 덜 보수적이지 않다는 것을 의미합니다.)

교과서에서 흔히 권장하는 왈드 방식이 가장 편향적입니다.[clarification needed]

관련분포

이항식의 합

X ~ B(n, p) 및 Y ~ B(m, p)가 동일한 확률 p의 독립 이항 변수이면 X + Y는 다시 이항 변수입니다. 분포는 Z=X+Y ~ B(n+m, p):

이항 분포 랜덤 변수 X ~ B(n, p)는 n개의 베르누이 분포 랜덤 변수의 합으로 간주할 수 있습니다.따라서 두 이항 분포 랜덤 변수 X ~ B(n, p) 및 Y ~ B(m, p)의 합은 n + m Bernouli 분포 랜덤 변수의 합과 같으며, 이는 Z=X+Y ~ B(n+m, p)를 의미합니다.이는 덧셈 규칙을 사용하여 직접 증명할 수도 있습니다.

그러나 XY가 같은 확률 p를 가지지 않는다면, 합의 분산은 + ¯)로 분포된 이항 변수의 분산보다 작을 것입니다 +,

포아송 이항 분포

이항 분포는 독립적인 비동일 Bernouli 시행 횟수 B(pi)의 합에 대한 분포인 포아송 이항 분포의 특수한 경우입니다.[27]

두 이항 분포의 비율

이 결과는 1978년 Katz와 공동저자들에 의해 처음 도출되었습니다.[28]

X ~ B(n, p1)Y ~ B(m, p2)를 독립적이라고 합니다.T를 = (X/n) / (Y/m)이라 합니다.

그러면 로그(T)는 평균 로그(p1/p2)와 분산((1/p1) - 1)/n + (1/p2) - 1)/m으로 근사적으로 정규 분포됩니다.

조건부 이항식

X ~ B(n, p) 및 Y X ~ B(X, q)(X가 주어지면 Y의 조건부 분포)인 경우 Y는 분포 Y ~ B(n, pq)인 단순 이항 랜덤 변수입니다.

예를 들어, 한 바구니 U에 n개X 공을 던지고 그것을 친 공을 다른 바구니 UY 던졌다고 생각해보세요. pUX 칠 확률이라면, X ~ B(n, p)는X U를 친 공의 개수입니다. qY U를 칠 확률이라면Y, U를 친 공의 개수는 Y ~ B(X, q)이고, 따라서 Y ~ B(n, pq)입니다.

[증명]

X~ ( B ~ B( 이므로확률의 법칙에 의하여,

)( ) =( m)( - - m 이므로 }}={\ 위의 식을 다음과 같이 표현할 수 있습니다.

인수 = - } = 를 사용하여 k 에 종속되지 않는 항을 모두 합에서 꺼내면 이제 산출됩니다.

에서 i= - i = k - m을 대입하면,

위의 합(괄호 안의)은 이항 정리에 의해 - + -p) n- (p - p + 1 - - m와 같음을 유의하십시오.이것을 최종적으로 수익률에 대입하면

따라서 원하는 대로 ~ ( ) B

베르누이 분포

베르누이 분포는 이항 분포의 특별한 경우인데, 여기서 n = 1. 기호적으로 X ~ B(1, p)는 X ~ 베르누이(p)와 같은 의미를 갖습니다.반대로 임의의 이항 분포 B(n, p)는 각각 동일한 확률 p를 갖는 n개의 독립적인 Bernouli 시행의 합인 Bernouli(p)의 분포입니다.[29]

정상근사

n = 6 및 p = 0.5에 대한 이항 확률 질량 함수 및 정규 확률 밀도 함수 근사치

n이 충분히 크면 분포의 스큐가 너무 크지 않습니다.이 경우 정규 분포에 의해 B(n, p)에 대한 합리적인 근사치가 제공됩니다.

그리고 이 기본 근사치는 적절한 연속성 보정을 사용함으로써 간단한 방법으로 개선될 수 있습니다.기본 근사치는 일반적으로 n이 증가할수록(최소 20개) 향상되고 p가 0 또는 1에 가깝지 않을 때 더 좋습니다.[30]n이 충분히 큰지, p가 0 또는 1의 극단치로부터 충분히 먼지를 결정하기 위해 다양한 경험칙이 사용될 수 있습니다.

  • 한 가지 규칙은[30] 왜도의 절대값이 0.3보다 엄격하게 작으면 n > 5에 대해 정규 근사치가 적합하다는 것입니다. 즉, 다음과 같습니다.

이는 베리-에신 정리를 이용하여 정확하게 만들 수 있습니다.

  • 보다 강력한 규칙은 평균의 3 표준 편차 내에 있는 모든 것이 가능한 값의 범위 내에 있는 경우에만 정규 근사치가 적절하다는 것을 나타냅니다. 즉, 다음과 같은 경우에만 해당됩니다.
이 3-표준 편차 규칙은 위의 첫 번째 규칙을 의미하는 다음 조건과 동등합니다.
[증명]

규칙 ± -p )( n) 3은(는) 다음 요청과 완전히 같습니다.

산출량을 중심으로 항 이동:

< < < p < 이므로 제곱 검정력을 적용하고 각 인자 2{\ n(- {\ - p로 나누어 원하는 조건을 얻을 수 있습니다

이 조건들은 > n >9를) 자동적으로 의미함에 유의하십시오 반면, 제곱근을 다시 적용하고 3으로 나누면,

첫 번째 부등식에서 두 번째 부등식 집합을 빼면 다음과 같은 결과가 나옵니다.

그래서 원하는 첫 번째 규칙이 충족되고,

  • 일반적으로 사용되는 또 다른 규칙은 - - p 값이 모두 5보다 크거나 같아야 한다는 것입니다.그러나 구체적인 숫자는 출처마다 다르며, 원하는 근사치에 따라 다릅니다.특히 5개가 아닌 9개를 사용할 경우 앞 단락에서 언급한 결과를 의미합니다.
[증명]

( - - p 값이 모두 9보다 크다고 가정합니다.< < < p < 이기 때문에 우리는 그것을 쉽게 가지고 있습니다

각 인자 p -p 로 나누면 3-표준 편차 규칙의 대체 형태를 추론할 수 있습니다

다음은 연속성 보정을 적용한 예입니다.이항 랜덤 변수 X에 대한 Pr(X ≤ 8)을 계산하려고 합니다.Y에 정규 근사치로 주어진 분포가 있으면 Pr(X ≤ 8)은 Pr(Y ≤ 8.5)로 근사됩니다.0.5를 더하면 연속성 보정이 됩니다. 보정되지 않은 정규 근사치는 정확도가 현저히 떨어집니다.

드 모이브르-라플라스 정리로 알려진 이 근사치는 손으로 계산할 때 시간을 크게 절약할 수 있습니다. ( n을 갖는 정확한 계산은 매우 부담이 됩니다.) 역사적으로, 이것은 아브라함모이브르의 책 "기회교리"에서 소개된 정규 분포의 첫 번째 사용이었습니다.오늘날 B(n, p)는 매개변수 p를 갖는 n개의 독립적이고 동일하게 분포된 베르누이 변수의 합이기 때문에 중심 극한 정리의 결과로 볼 수 있습니다.이 사실은 일반적인 검정 통계량에서 p의 표본 비율 및 추정량인 x/n을 사용하여 p의 값에 대한 가설 검정인 "비율 z-검정"의 기초가 됩니다.[31]

예를 들어, 어떤 사람이 많은 모집단에서 n명의 사람을 임의로 표본 추출하여 특정 설명문에 동의하는지 여부를 묻습니다.동의하는 사람의 비율은 물론 표본에 따라 달라집니다.n명의 그룹이 반복적으로 그리고 실제로 무작위로 표본이 추출된 경우, 비율은 모집단에서 일치하는 실제 비율 p와 동일하고 표준 편차를 갖는 근사 정규 분포를 따를 것입니다.

포아송 근사치

이항 분포는 시행 횟수가 무한대로 가는 반면 곱 np는 유한 한계로 수렴함에 따라 포아송 분포 쪽으로 수렴합니다.따라서 모수가 λ = np인 포아송 분포는 n이 충분히 크고 p가 충분히 작은 경우 이항 분포의 B(n, p)에 대한 근사치로 사용할 수 있습니다.두 가지 경험 법칙에 따르면, n ≥ 20이고 p ≤ 0.05인 경우 또는 n ≥ 100이고 np ≤ 10인 경우 이 근사치는 좋습니다.

포아송 근사치의 정확도에 관해서는 Novak,[33] ch. 4 및 참조를 참조하십시오.

분포 제한

기대 값이 0이고 분산이 1인 정규 분포에 접근합니다.이 결과는 X의 분포가 기대 값 0과 분산 1로 점근적으로 정규화되었다고 말하는 것으로 느슨하게 표현되기도 합니다.이 결과는 중심 극한 정리의 특정한 경우입니다.

베타분포

이항 분포와 베타 분포는 동일한 모형의 반복실험에 대한 다른 보기입니다.이항 분포는 각각 성공 확률이 p인 n개의 독립적인 사건이 주어졌을 때 k 성공PMF입니다.수학적으로 α = k + 1이고 β = n - k + 1일 때 베타 분포와 이항 분포는 n + 1의 인자로 관계가 있습니다.

또한 베타 분포는 베이지안 추론에서 이항 분포에 대한 일련의 사전 확률 분포를 제공합니다.[34]

균일한 사전 분포가 주어지면, k개의 성공을 관측한 n개의 독립적인 사건이 주어졌을 때 성공 확률 p에 대한 사후 분포가 베타 분포입니다.[35]

난수생성

한계 분포가 이항 분포인 난수 생성 방법은 잘 확립되어 있습니다.[36][37]이항 분포에서 랜덤 변동 표본을 생성하는 한 가지 방법은 반전 알고리즘을 사용하는 것입니다.이를 위해서0부터 n까지의 모든 값 k대해 Pr(X = k)이 될 확률을 계산해야 합니다. (이 확률들은 전체 표본 공간을 포괄하기 위해 1에 가까운 값을 합해야 합니다.)그런 다음 의사 난수 생성기를 사용하여 0과 1 사이의 균일한 샘플을 생성함으로써 첫 번째 단계에서 계산된 확률을 사용하여 계산된 샘플을 이산 수로 변환할 수 있습니다.

역사

이 분포는 제이콥 베르누이에 의해 도출되었습니다.그는 p = r/(r + s)(여기서 p는 성공 확률이고 rs는 양의 정수)인 경우를 고려했습니다.블레즈 파스칼은 이전에 p = 1/2인 경우를 고려하여 현재 파스칼의 삼각형으로 인식되는 것에서 대응하는 이항 계수를 표화했습니다.

참고 항목

참고문헌

  1. ^ Westland, J. Christopher (2020). Audit Analytics: Data Science for the Accounting Profession. Chicago, IL, USA: Springer. p. 53. ISBN 978-3-030-49091-1.
  2. ^ Feller, W. (1968). An Introduction to Probability Theory and Its Applications (Third ed.). New York: Wiley. p. 151 (theorem in section VI.3).
  3. ^ Wadsworth, G. P. (1960). Introduction to Probability and Random Variables. New York: McGraw-Hill. p. 52.
  4. ^ Jowett, G. H. (1963). "The Relationship Between the Binomial and F Distributions". Journal of the Royal Statistical Society, Series D. 13 (1): 55–57. doi:10.2307/2986663. JSTOR 2986663.
  5. ^ 증명 위키 참조
  6. ^ Knoblauch, Andreas (2008), "Closed-Form Expressions for the Moments of the Binomial Probability Distribution", SIAM Journal on Applied Mathematics, 69 (1): 197–204, doi:10.1137/070700024, JSTOR 40233780
  7. ^ Nguyen, Duy (2021), "A probabilistic approach to the moments of binomial random variables and application", The American Statistician, 75 (1): 101–103, doi:10.1080/00031305.2019.1679257, S2CID 209923008
  8. ^ D. Ahle, Thomas (2022), "Sharp and Simple Bounds for the raw Moments of the Binomial and Poisson Distributions", Statistics & Probability Letters, 182: 109306, arXiv:2103.17027, doi:10.1016/j.spl.2021.109306
  9. ^ 참고 항목
  10. ^ Neumann, P. (1966). "Über den Median der Binomial- and Poissonverteilung". Wissenschaftliche Zeitschrift der Technischen Universität Dresden (in German). 19: 29–33.
  11. ^ 세상에, 닉.(2010년 7월)."평균이 정수일 때 이항 평균", The Mathematical Gazette 94, 331-332.
  12. ^ a b Kaas, R.; Buhrman, J.M. (1980). "Mean, Median and Mode in Binomial Distributions". Statistica Neerlandica. 34 (1): 13–18. doi:10.1111/j.1467-9574.1980.tb00681.x.
  13. ^ Hamza, K. (1995). "The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions". Statistics & Probability Letters. 23: 21–25. doi:10.1016/0167-7152(94)00090-U.
  14. ^ Nowakowski, Sz. (2021). "Uniqueness of a Median of a Binomial Distribution with Rational Probability". Advances in Mathematics: Scientific Journal. 10 (4): 1951–1958. arXiv:2004.03280. doi:10.37418/amsj.10.4.9. ISSN 1857-8365. S2CID 215238991.
  15. ^ a b Arratia, R.; Gordon, L. (1989). "Tutorial on large deviations for the binomial distribution". Bulletin of Mathematical Biology. 51 (1): 125–131. doi:10.1007/BF02458840. PMID 2706397. S2CID 189884382.
  16. ^ Robert B. Ash (1990). Information Theory. Dover Publications. p. 115. ISBN 9780486665214.
  17. ^ Matoušek, J.; Vondrak, J. "The Probabilistic Method" (PDF). lecture notes. Archived (PDF) from the original on 2022-10-09.
  18. ^ Razzaghi, Mehdi (2002). "On the estimation of binomial success probability with zero occurrence in sample". Journal of Modern Applied Statistical Methods. 1 (2): 326–332. doi:10.22237/jmasm/1036110000.
  19. ^ a b Brown, Lawrence D.; Cai, T. Tony; DasGupta, Anirban (2001), "Interval Estimation for a Binomial Proportion", Statistical Science, 16 (2): 101–133, CiteSeerX 10.1.1.323.7752, doi:10.1214/ss/1009213286, retrieved 2015-01-05
  20. ^ Agresti, Alan; Coull, Brent A. (May 1998), "Approximate is better than 'exact' for interval estimation of binomial proportions" (PDF), The American Statistician, 52 (2): 119–126, doi:10.2307/2685469, JSTOR 2685469, retrieved 2015-01-05
  21. ^ Gulotta, Joseph. "Agresti-Coull Interval Method". pellucid.atlassian.net. Retrieved 18 May 2021.
  22. ^ "Confidence intervals". itl.nist.gov. Retrieved 18 May 2021.
  23. ^ Pires, M. A. (2002). "Confidence intervals for a binomial proportion: comparison of methods and software evaluation" (PDF). In Klinke, S.; Ahrend, P.; Richter, L. (eds.). Proceedings of the Conference CompStat 2002. Short Communications and Posters. Archived (PDF) from the original on 2022-10-09.
  24. ^ Wilson, Edwin B. (June 1927), "Probable inference, the law of succession, and statistical inference" (PDF), Journal of the American Statistical Association, 22 (158): 209–212, doi:10.2307/2276774, JSTOR 2276774, archived from the original (PDF) on 2015-01-13, retrieved 2015-01-05
  25. ^ "Confidence intervals". Engineering Statistics Handbook. NIST/Sematech. 2012. Retrieved 2017-07-23.
  26. ^ Dekking, F.M.; Kraaikamp, C.; Lopohaa, H.P.; Meester, L.E. (2005). A Modern Introduction of Probability and Statistics (1 ed.). Springer-Verlag London. ISBN 978-1-84628-168-6.
  27. ^ Wang, Y. H. (1993). "On the number of successes in independent trials" (PDF). Statistica Sinica. 3 (2): 295–312. Archived from the original (PDF) on 2016-03-03.
  28. ^ Katz, D.; et al. (1978). "Obtaining confidence intervals for the risk ratio in cohort studies". Biometrics. 34 (3): 469–474. doi:10.2307/2530610. JSTOR 2530610.
  29. ^ Taboga, Marco. "Lectures on Probability Theory and Mathematical Statistics". statlect.com. Retrieved 18 December 2017.
  30. ^ a b Box, Hunter and Hunter (1978). Statistics for experimenters. Wiley. p. 130. ISBN 9780471093152.
  31. ^ NIST/SEMATECH, "7.2.4. 불량자 비율이 요건을 충족하고 있습니까?"라고 통계 방법 e-handbook.
  32. ^ a b NIST/SEMATECH, "6.3.3.1. 관리도 계산", 통계 방법 전자 핸드북.
  33. ^ Novak S.Y. (2011) 금융에 응용한 극한 가치 방법런던: CRC/채프먼 & 홀/테일러 & 프란시스ISBN 9781-43983-5746.
  34. ^ MacKay, David (2003). Information Theory, Inference and Learning Algorithms. Cambridge University Press; First Edition. ISBN 978-0521642989.
  35. ^ "Beta distribution".
  36. ^ Devroye, Luc (1986) 불균일 랜덤 변수 생성, 뉴욕: Springer-Verlag.(특히 X장, 이산 일변량 분포 참조)
  37. ^ Kachitvichyanukul, V.; Schmeiser, B. W. (1988). "Binomial random variate generation". Communications of the ACM. 31 (2): 216–222. doi:10.1145/42372.42381. S2CID 18698828.
  38. ^ 만델브로, B. B., 피셔, A. J., & Calvet, L. E. (1997)자산 수익률의 다중 프랙탈 모형. 3.2 이항 측도는 다중 프랙탈의 가장 간단한

추가열람

외부 링크