다항 분포

다항식
매개변수	n 시행eger); k개의 상호 배타적 이벤eger); 이벤트 확률, 여기서 + 1 {\ +k}=1}
지지하다
PMF
의미하다
분산	;
엔트로피
MGF
CF	서 i - }-
PGF

확률 이론에서 다항 분포는 이항 분포의 일반화입니다. 예를 들어, k면 주사위의 각 변에 대한 계수 확률을 n번 모형화합니다. 주어진 고정된 성공 확률을 갖는 k개의 범주 중 정확히 하나에 대한 성공으로 이어지는 n개의 독립적인 시행의 경우, 다항식 분포는 다양한 범주에 대한 성공 횟수의 특정 조합 확률을 제공합니다.

k가 2이고 n이 1일 때 다항 분포는 베르누이 분포입니다. k가 2이고 n이 1보다 크면 이항 분포입니다. k가 2보다 크고 n이 1일 때 범주형 분포입니다. 범주형 분포에 "multinoulli"라는 용어를 사용하여 이러한 4방향 관계를 강조하기도 합니다(따라서 접미사를 결정하고 접미사 k를 결정합니다).

베르누이 분포는 단일 베르누이 시행의 결과를 모델링합니다. 즉, 한 번 동전을 뒤집으면 성공(두 번째 동전 획득) 또는 실패(꼬리 획득)가 발생하는지 여부를 모델링합니다. 이항 분포는 이를 동일한 코인에 대해 독립적인 플립(Bernouli 시행)을 수행한 헤드의 수로 일반화합니다. 다항 분포는 n개의 실험 결과를 모형화하는데, 여기서 각 시행의 결과는 k면 다이닝 횟수를 굴리는 것과 같은 범주형 분포를 갖습니다.

고정된 유한한 수라 하자. 수학적으로, 우리는 상응하는 확률 p₁, ..., p_k 및 n개의 독립적인 시행으로 상호 배타적인 결과를 가능하게 했습니다. k 결과는 상호 배타적이고 반드시 발생해야 하기 때문에 i = 1 $\sum _{i=1}^{k}p_{i}=1$ ..., $\sum _{i=1}^{k}p_{i}=1$ $\sum _{i=1}^{k}p_{i}=1$ ∑ $\sum _{i=1}^{k}p_{i}=1$ = $\sum _{i=1}^{k}p_{i}=1$ k $pi$ = 1 ${\displaystyle$ \ $sum _{i$ =1}^{ $k}$ p_ $\sum _{i=1}^{k}p_{i}=1$ i}=1}에 대한 p ≥ 0이 있습니다. 그런 다음 확률 변수 X가 n번의 시행 동안 관찰된 결과 수 i를 나타내는 경우 벡터 X = (X, ..., X)는 모수 n과 p를 갖는 다항 분포를 따르며, 여기서 p = (p, ..., p)입니다. 시행은 독립적이지만 결과 X는_i n을 합산해야 하기 때문에 종속적입니다.

정의들

확률 질량 함수

각 추첨 후에 추출된 공을 교체하여 가방에서 k개의 다른 색깔을 가진 n개의 공을 추출하는 실험을 한다고 가정해 보겠습니다. 같은 색의 공은 동등합니다. 색 i(i = 1, ..., k)의 추출된 공의 개수인 변수를 X로 표시하고, 주어진 추출이 색 i에 있을 확률을 p로 표시합니다. 이 다항 분포의 확률 질량 함수는 다음과 같습니다.

{\begin{aligned}f(x_{1},\ldots ,x_{k};n,p_{1},\ldots ,p_{k})&{}=\Pr(X_{1}=x_{1}{\text{ and }}\dots {\text{ and }}X_{k}=x_{k})\\&{}={\begin {case}{\displaystyle {n!\over x_{1}!\cdots x_{k}!}p_{1}^{x_{1}}\times \cdots \times p_{k}^{x_{k}}},\quad & {\text{hum _{i=1}^{k}x_{i}=n\\\\\0&{\text{otherwise,}\end{case}}\end{align}}

음이 아닌 정수₁ x, ..., x의_k 경우.

확률 질량 함수는 감마 함수를 사용하여 다음과 같이 표현할 수 있습니다.

f(x_{1},\dots ,x_{k};p_{1},\ldots ,p_{k})={\frac {\Gamma (\sum _{i}x_{i}+1)}{\prod _{i}\Gamma (x_{i}+1)}}\prod _{i=1}^{k}p_{i}^{x_{i}}.

이 형태는 이전의 공액인 디리클레 분포와 유사함을 보여줍니다.

예

대국 3자 선거에서 A 후보가 20%, B 후보가 30%, C 후보가 50%의 득표율을 기록했다고 가정해 보겠습니다. 무작위로 6명의 유권자를 선택한다면 표본에서 정확히 A 후보 지지자가 1명, B 후보 지지자가 2명, C 후보 지지자가 3명일 확률은 얼마입니까?

참고: 우리는 투표 인구가 많다고 가정하고 있기 때문에, 일단 투표자가 표본으로 선택되면 확률은 변하지 않는다고 생각하는 것이 합리적이고 허용됩니다. 엄밀히 말하면 이것은 대체 없이 표본을 추출하는 것이므로 정확한 분포는 다변량 초기하학적 분포이지만 고정 표본 크기에 비해 모집단이 커짐에 따라 분포가 수렴합니다.^[1].

\Pr(A=1,B=2,C=3)={\frac {6!}{1!2!3!}}(0.2^{1})(0.3^{2})(0.5^{3})=0.135

특성.

정규화

다항 분포는 다음에 따라 정규화됩니다.

\sum _{\sum _{j=1}^{k}x_{j}=n}F(x_{1},...,x_{k};n,p_{1},...,p_{k})=1

여기서 합은 $\sum _{j=1}^{k}x_{j}=n$ $x_{j}$ $x_{j$ 의 모든 순열에서 ∑ $\sum _{j=1}^{k}x_{j}=n$ = 1k x $\sum _{j=1}^{k}x_{j}=n$ = n ${\displaystyle \sum$ _{ $j$ = $1$ }^{k} $x_$ {j}=n}이(가) 됩니다.

기댓값 및 분산

제가 n번의 시행에서 관찰한 결과의 예상 횟수는

\operatorname {E}(X_{i})=np_{i}.\,

공분산 행렬은 다음과 같습니다. 각 대각선 항목은 이항 분포 확률 변수의 분산이므로

\operatorname {Var}(X_{i})=np_{i}(1-p_{i}).\,

비대각형 항목은 공분산입니다.

\operatorname {Cov} (X_{i},X_{j})=-np_{i}p_{j}\,

i, j district의 경우.

고정된 n의 경우 다항 벡터의 한 성분의 증가는 다른 성분의 감소를 필요로 하기 때문에 모든 공분산은 음수입니다.

이 표현식들을 i,j 요소 $\operatorname {cov} (X_{i},X_{j}),$ ⁡( $Xj$ ), ${\displaystyle \operatorname {cov}(X_{$ i},X_{j})가 있는 행렬로 결합하면, 그 결과는 k - 1 순위의 k × k 양의 반정의 공분산 행렬입니다. k = n이고 p가 모두 같은 특별한 경우에 공분산 행렬은 중심 행렬입니다.

해당 상관 행렬의 항목은 다음과 같습니다.

\rho (X_{i},X_{i})=1.

\rho (X_{i},X_{j})={\frac {\operatorname {Cov} (X_{i},X_{j})}{\sqrt {\operatorname {Var} (X_{i})\operatorname {Var} (X_{j})}}}={\frac {-p_{i}p_{j}}{\sqrt {p_{i}(1-p_{i})p_{j}(1-p_{j})}}}=-{\sqrt {\frac {p_{i}p_{j}}{(1-p_{i})(1-p_{j})}}}.

시행 횟수 n이 이 식에서 제외됩니다.

각각의 k 성분은 첨자 i의 적절한 값을 위해 매개변수 n과 p를_i 갖는 이항 분포를 개별적으로 갖습니다.

다항 분포의 지지는 집합입니다.

\{(n_{1},\dots ,n_{k})\in \mathbb {N} ^{k}\mid n_{1}+\cdots +n_{k}=n\}.\,

그 요소의 수는

{n+k-1 \"k-1을 선택합니다.

행렬 표기법

행렬 표기법에서는,

\operatorname {E}(\mathbf {X})=n\mathbf {p},\,

그리고.

\operatorname {Var}(\mathbf {X})=n\lbrace \operatorname {diag}(\mathbf {p})-\mathbf {p} \mathbf {p} ^{\rm {T}\rbrace,\,

$p$ = 열 벡터 $p$ 의 행 벡터 전치를 사용합니다.

시각화

일반화된 파스칼의 삼각형의 조각으로

이항 분포를 파스칼 삼각형의 (정규화된) 1차원 (1D) 조각으로 해석할 수 있듯이, 다항 분포도 파스칼 삼각형의 2D (삼각형) 조각 또는 파스칼 삼각형의 고차원 유사체의 3D/4D/+ (피라미드 모양) 조각으로 해석할 수 있습니다. 이것은 분포의 범위에 대한 해석을 보여줍니다: 임의의 차원에서 이산화된 등변 "피라미드", 즉 격자가 있는 단순.^{[citation needed]}

다항식 계수로

마찬가지로, 확장할 $(p+q)^{n}$ 때 $(p+q)^{n}$ ( $(p+q)^{n}$ + $(p+q)^{n}$ n ${\$ + $q)^{n}$ 의 다항식 계수로 이항 분포를 해석할 수 있는 것처럼, 다항 분포는 $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ ( $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ 1 $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ + $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ 2 $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ + $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ + ⋯ + $(p_{1}+p_{2}+p_{3}+\cdots +p_{k})^{n}$ k) n ${\displaystyle (p_{1$ } + $p_$ {2} + p_{3 $} +\cdots$ + $p_{$ k})^{n}의 계수로 해석할 수 있으며, 계수만 합하면 최대 1이 됩니다.

대편차설

점근법

스털링의 공식에 의해, $N$ x $N,x_{1},...,x_{n}\to \infty$ $N,x_{1},...,x_{n}\to \infty$ $N,x_{1},...,x_{n}\to \infty$ $N,x_{1},...,x_{n}\to \infty$ → ∞ ${\displaystyle N$ ,x_{ $1},...,x_{n$ }\to $N,x_{1},...,x_{n}\to \infty$ \fty $N,x_{1},...,x_{n}\to \infty$ }의 극한에서, 우리는

\ln {\binom {N}{x_{1},\cdots x_{n}}}+\sum _{i=1}^{n}x_{i}\ln p_{i}=-ND_{KL}({\hat {p}}\ p)-{\frac {n-1}{2}}\ln(2\pi N)-{\frac {1}{2}}\sum _{i=1}^{n}\ln({\hat {p}}_{i})+o(1)

여기서 데이터의 상대 주파수

{\hat {p}}_{i}=x_{i}/N

{\hat {p}}_{i}=x_{i}/N

=

{\hat {p}}_{i}=x_{i}/N

{\hat {p}}_{i}=x_{i}/N

/ N

{\displaystyle {\hat {p}_{i

} =

x_{i}/N}

은 경험적

{\hat {p}}

p

{\hat {p}}

{\hat {p}

로부터의 확률로 해석될 수 있으며

{\hat {p}}

D_{KL}

D_{KL

은 쿨백-라이블러 발산입니다.

이 공식은 다음과 같이 해석할 수 있습니다.

δ ${\displaystyle$ \ $Delta$ _{n}}, { $,$ 2 $n}$ $displaystyle \{$ 1, $2$ n\}}에 대한 가능한 모든 분포의 공간을 생각해 보십시오. 심플렉스입니다. 범주형 분포 $p$ ${\displaystyle p}($ 다항 분포를 구성하는 방법)에서 $N$ 의 $N$ 개의 $N$ 독립 샘플을 얻은 후 경험적 분포 ${\hat {p}}$ ${\$ 를 얻습니다 ${\hat {p}}$

점근 공식에 의해 경험적 ${\hat {p}}$ p ${\hat {p}}$ ${\hat {p}$ 가 실제 분포 p $p$ 에서 벗어날 확률은 $ND_{KL}({\hat {p}}\|p)$ ‖ p) {\ $displaystyle$ ND_{ $KL}({\hat$ {p $ND_{KL}({\hat {p}}\|p)$ p)}의 속도로 기하급수적으로 감소합니다. p ${\$ 이 ${\hat {p}}$ (가) $p$ 과(가) 더 많은 실험과 더 다른 ${\hat {p}}$ 일수록 그러한 경험적 분포를 볼 가능성이 적습니다 $p$

If $A$ is a closed subset of $\Delta _{n}$ , then by dividing up $A$ into pieces, and reasoning about the growth rate of $Pr({\hat {p}}\in A_{\epsilon })$ on each piece $A_{\epsilon }$ , 우리는 다음과 같은 사노프의 정리를 얻습니다.

\lim _{N\to \infty }{\frac {1}{N}}\ln Pr({\hat {p}\in A}=-\inf _{\hat {p}\in A}D_{KL}({\hat {p}\p)

큰 N에서의 농도

지수적 붕괴로 인해 큰 $N$ ${\displaystyle$ N $}$ 에서는 $N$ 거의 모든 확률 질량이 $p$ $p$ 의 작은 이웃에 집중됩니다 $p$ 이 작은 이웃에서 우리는 $D_{KL}$ ${\$ 의 테일러 전개에서 0이 아닌 첫 번째 항을 취하여 다음을 얻을 수 있습니다 $D_{KL}$

\ln {\binom {N}{x_{1},\cdots x_{n}}}p_{1}^{x_{1}}\cdots p_{n}^{x_{n}}\approx -{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}=-{\frac {1}{2}}\sum _{i}{\frac {(x_{i}-Np_{i})^{2}}{Np_{i}}}

이는 다음 정리를 제시하는 가우스 분포와 유사합니다.

정리. $N$ → $N\to \infty$ ∞ {\ $displaystyle$ N\ $to$ \infty} 한계에서, $N\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}=\sum _{i}{\frac {(x_{i}-Np_{i})^{2}}{Np_{i}}}$ converges in distribution to the chi-squared distribution ${\displaystyle \chi$ $^{2$

다항식 분포

\mathrm {Multinomial} (N;0.2,0.3,0.5)

를

\mathrm {Multinomial} (N;0.2,0.3,0.5)

\mathrm {Multinomial} (N;0.2,0.3,0.5)

\mathrm {Multinomial} (N;0.2,0.3,0.5)

\mathrm {Multinomial} (N;0.2,0.3,0.5)

{\displaystyle \mathrm {다항식}(N;

0

.2, 0.3, 0.5)}

로

\mathrm {Multinomial} (N;0.2,0.3,0.5)

표본을 추출하고 2차원 심플렉스(여기서는 검은 삼각형으로 표시됨) 내에 표본의 히트맵을 표시하면

N

→

N\to \infty

∞ {\

displaystyle

N\

to

infty}로 표시됩니다. 분포는 점

(0.2,0.3,0.5)

(0.2,0.3,0.5)

0

(0.2,0.3,0.5)

{\displaystyle(0.2,

0

.3, 0.5)}

을 중심으로 가우시안으로 수렴하고

(0.2,0.3,0.5)

윤곽선은 타원으로 수렴하며, 반지름은

1/{\sqrt {N}}

/ N

{\

으로 수렴합니다

1/{\sqrt {N}}

한편, 점 사이의 간격은

1/N

/ N

{\displaystyle

1

/N}

으로 수렴합니다

1/N

그래서 이산 다항 분포는 연속 가우스 분포로 수렴합니다.

[증명]

The space of all distributions over categories $\{1,2,\ldots ,n\}$ is a simplex: $\Delta _{n}=\left\{(y_{1},\ldots ,y_{n})\colon y_{1},\ldots ,y_{n}\geq 0,\sum _{i}y_{i}=1\right\}$ , $N$ N개의 $N$ 실험 후 가능한 모든 경험적 분포 집합은 심플렉스의 부분 집합입니다: $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ δ n, N = $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ { ( $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ 1 $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ / $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ , $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ …, $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ n / $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ ) $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ : $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ x $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ , $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ …, $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ n ∈ N, ∑ i $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ x $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ = $\Delta _{n,N}=\left\{(x_{1}/N,\ldots ,x_{n}/N)\colon x_{1},\ldots ,x_{n}\in \mathbb {N} ,\sum _{i}x_{i}=N\right\}$ N $} {\displaystyle$ \ $Delta _{n,$ N} = $\left\{(x_{$ 1}/ $N,\ldots,x_$ {n $}/N)\colon$ x_{ $1},\ldots,$ x_{n}\in \mathbb {N} $\sum$ _ ${i}x_{i}=N\right$ 즉, $(\mathbb {Z} ^{n})/N$ $δ$ n ${\displaystyle \Delta$ _{n}와 $(\mathbb {Z} ^{n})/N$ ( $)$ / N $(\mathbb {Z$ n}/N} 사이의 교차점입니다.

$N$ ${\displaystyle$ N $}$ 이 증가함에 따라 확률 질량의 대부분은 p ${\displaystyle$ p}근처의 $\Delta _{n,N}$ δ n, N ${\displaystyle \Delta$ _{n,N}의 부분 집합에 집중되며, p ${\displaystyle$ p}근처의 확률 $p$ 는 다음과 같이 잘 근사화됩니다.

{\binom {N}{x_{1},\cdots x_{n}}}p_{1}^{x_{1}}\cdots p_{n}^{x_{n}}\approx e^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

이를 통해 질량이 집중되는 부분 집합은

1/{\sqrt {N}}

/ N

{\

정도의 반지름을

1/{\sqrt {N}}

갖지만 부분 집합의 점들은

1/N

/ N

{\displaystyle

1

/N}

정도의 거리로 분리되므로

1/N

큰

N

N

에서는

N

점들이 연속체로 병합됩니다. 이를 이산 확률 분포에서 연속 확률 밀도로 변환하려면

\Delta _{n,N}

δ n

,

N

{\displaystyle \Delta _

{n,

}}

의 각 점이 차지하는 볼륨을 δ

\Delta _{n}

n

{\displaystyle

\Delta _{n,N}에 곱해야 합니다. 그러나 대칭에 의해, 모든 점은 정확히 동일한 부피를 차지하므로(경계에서 무시할 수 있는 집합을 제외하고) 확률 밀도

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

ρ (p^) =

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

-

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

N

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

∑

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

i (

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

^

\rho ({\hat {p}})=Ce^{-{\frac {N}{2}}\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}}

i -

pi

) 2 pi

{\displaystyle \

rho(\hat {p})

=Ce^{-{\frac

{

N}{2}}\sum

_{

i}{\frac {({\hat

{p

}}_{i}-p_{i})^{2}}{p_{i}}},

C

서 C

{\displaystyle

C

}

는 상수입니다.

마지막으로, 심플렉스 $\Delta _{n}$ δ n ${\displaystyle \Delta$ _{n}는 $Rn {\displaystyle \mathbb {$ R $\mathbb {R} ^{n}$ n}}의 $\mathbb {R} ^{n}$ 가 아니라 $(n-1)$ n $-$ 1) ${\displaystyle ($ n-1)} $(n-1)$ 평면 $(n-1)$ 에서만 원하는 결과를 얻을 수 있습니다.

큰 N에서의 조건부 농도

위의 집중 현상은 선형 제약 조건에 따라 조건을 지정하는 경우로 쉽게 일반화할 수 있습니다. 이것이 피어슨의 카이제곱 검정에 대한 이론적 정당성입니다.

정리. $N개의 {\displaystyle$ N}개의 점이있는 $N$ 세트에서 관측된 주파수 $xi$ ∈ N {\ $displaystyle x_{i$ }\in $\mathbb$ {N}이(가) 주어지면 $,$ k + $1개의 {\displaystyle$ k+1}개의 독립 선형 제약 조건을 $k+1$ 합니다.

{\begin{cases}\sum _{i}{\hat {p}}_{i}=1,\\\sum _{i}a_{1i}{\hat {p}}_{i}=b_{1},\\\sum _{i}a_{2i}{\hat {p}}_{i}=b_{2},\\\cdots ,\\\sum _{i}a_{ki}{\hat {p}}_{i}=b_{k}\end{cases}}

{\hat {p}}_{i}=x_{i}/N

p

{\hat {p}}_{i}=x_{i}/N

{\hat {p}}_{i}=x_{i}/N

=

{\hat {p}}_{i}=x_{i}/N

i /

{\hat {p}}_{i}=x_{i}/N

{\

displaystyle

{\

hat {p}_

{i} =

x_{i}/

N}이(가) 모든 제약 조건을 동시에 만족하도록 첫 번째 제약 조건이 단순히 경험적 분포가 하나로 합되어야 한다는 것을 notice합니다.

q

{\displaystyle

q}을

(

를) 선형 제약 조건에 의해 허용되는 심플렉스의 하위 영역에

p

I

{\displaystyle

I}

- 이전 분포 p

{\displaystyle

p

}

의 투영이라고

I

표시합니다

q

.

N

→

N\to \infty

∞ {\

displaystyle

N\

to

\infty} 한계에서, sampled counts

N{\hat {p}}_{i}

from the multinomial distribution conditional on the linear constraints are governed by

{\displaystyle 2ND_{KL}({\hat {p}}\vert \vert q)\approx N\sum _{i}{\frac {({\hat

{p}}_{i}-q_{i})^{2}}{q_{i}}}

는

\chi ^{2}(n-1-k)

squared

\chi ^{2}(n-1-k)

χ

2

\chi ^{2}(n-1-k)

-

\chi ^{2}(n-1-k)

1 - k)

{\displaystyle \chi^{

2

\chi ^{2}(n-1-k)

n-1 - k)}로 분포가 수렴됩니다.

[증명]

카운트 변수 $N{\hat {p}}_{i}$ p $N{\hat {p}}_{i}$ $N{\hat {p}_{i}$ 에서 결합된 선형 방정식의 디오판토스 문제에서도 유사한 증명이 적용되지만 $N{\hat {p}}_{i}$ 이번에는 $\Delta _{n,N}$ δ n, N ${\displaystyle \Delta_$ {n, $(\mathbb {Z} ^{n})/N$ $}}$ 은 $(\mathbb {Z} ^{n})/N$ ( $(\mathbb {Z} ^{n})/N$ / N ${\displaystyle(\mathbb {Z} ^{n}/N}$ 과 $\Delta _{n}$ $δ$ n ${\displaystyle \Delta$ _{ $}$ 및 k ${\displaystyle$ k} 하이퍼플레인의 교차점이며, 모두 선형 독립적입니다. 따라서 확률 밀도 $\rho ({\hat {p}})$ ρ $(p$ ^) ${\displaystyle \rho(\$ hat {p}})}은 $(n-k-1)$ 는) ( $(n-k-1)$ - k $(n-k-1)$ - 1) ${\displaystyle($ n-k-1)}차원 $(n-k-1)$ 으로 $(n-k-1)$ 제한됩니다. In particular, expanding the KL divergence $D_{KL}({\hat {p}}\vert \vert p)$ around its minimum $q$ (the $I$ -projection of $p$ on ${\displaystyle \Delta _{n,$ 제한된 문제에서 $N$ 는 $I$ $I$ 에 $I$ 대한 피타고라스 정리에 의해 $N{\hat {p}}_{i}$ ${\$ 카운트의 상수 및 선형 항이 조건부 확률에서 사라지고 $N{\hat {p}}_{i}$ 해당 카운트를 다중으로 샘플링합니다.

Notice that by definition, every one of ${\hat {p}}_{1},{\hat {p}}_{2},...,{\hat {p}}_{n}$ must be a rational number, whereas $p_{1},p_{2},...,p_{n}$ may be chosen from any real number in $[0,1]$ $displaystyle [0,1]}$ 이며 $[0,1]$ 디오판토스 방정식 체계를 만족할 필요는 없습니다. 점근적으로 $N$ → $N\rightarrow \infty$ ∞ {\ $displaystyle$ N\ $right$ ${\hat {p}}_{i}$ $N\rightarrow \infty$ \infty ${\hat {p}}_{i}$ 으)인 p $^i$ {\ $displaystyle {\hat$ {p $_$ {i}}s(으)는 $[0,1]$ 0 $,1$ ] ${\displaystyle$ 0,1 $[0,1]$ 으)보다 높은 $[0,1]$ 확률로 간주할 수 있습니다.

경험적으로 관찰된 $b_{1},\ldots ,b_{k}$ $b_{1},\ldots ,b_{k}$ b $b_{1},\ldots ,b_{k}$ b ${\$ 순간 또는 유병률 등)에서 벗어나 정리를 일반화할 수 있습니다.

정리.

$p$ $f_{1},...,f_{k}$ $f_{1},...,f_{k}$ $f_{1},...,f_{k}$ $f_{1},...,f_{k}$ $f_{1},...,f_{k}$ ${\displaystyle f_{1$ }, $..., f_{k$ 가 주어지면 $p$ p $p$ 의 이웃에서 연속적으로 미분 가능하도록 벡터 $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ 1 $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ ∇ $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ ( $p$ $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ ∇ f k (p $) {\displaystyle$ (1, 1, ..., 1),\n $blap_{1}(p),...,$ $\n$ $ablaf_{k}(p)}$ 은(는 $(1,1,...,1),\nabla f_{1}(p),...,\nabla f_{k}(p)$ ) 선형 독립적입니다.
given sequences $\epsilon _{1}(N),...,\epsilon _{n}(N)$ , such that asymptotically ${\frac {1}{N}}\ll \epsilon _{k}(N)\ll {\frac {1}{\sqrt {N}}}$ for each $k\in \{1,...,n\}$ ;
then for the multinomial distribution conditional on constraints ${\displaystyle f_{1}({\hat {p}})\in [f_{1}(p)-\epsilon _{1}(N),$ $f_{1}(p)+\epsilon _{1}(N)],...,f_{n}({\hat {p}})\in [f_{n}(p)-\epsilon _{n}(N),f_{n}(p)+\epsilon _{n}(N)]}$ , we have the quantity $N\sum _{i}{\frac {({\hat {p}}_{i}-p_{i})^{2}}{p_{i}}}=\sum _{i}{\frac {(x_{i}-Np_{i})^{2}}{Np_{i}}}$ converging in distribution to ${\displaystyle \chi$ $N$ $→$ $N\to \infty$ $∞$ {\ $displaystyle$ N\ $to$ \infty} 한계에서 $^{2}(n-1-k)}($ 으)입니다.

${\hat {p}}_{i}$ p ${\hat {p}}_{i}$ ${\$ 가 ${\hat {p}}_{i}$ 동일한 경우, 정리는 최대 엔트로피 주변의 엔트로피 농도로 감소합니다.^[3]^[4]

통계적 추론

다항 분포에 대한 동등성 검정

동등성 검정의 목표는 이론적 다항 분포와 관측된 계수 빈도 사이의 일치를 설정하는 것입니다. 이론적 분포는 완전히 지정된 다항 분포 또는 다항 분포의 모수 계열일 수 있습니다.

$q$ $q$ 를 이론적 다항 분포라고 하고 $q$ p ${\displaystyle$ p $}$ 를 $p$ 한 기본 분포라고 합니다 $p$ . The distributions $p$ and $q$ are considered equivalent if $d(p,q)<\varepsilon$ for a distance $d$ and a tolerance parameter $\varepsilon >0$ . 동등성 테스트 문제는 $H_{0}=\{d(p,q)\geq \varepsilon \}$ $H_{0}=\{d(p,q)\geq \varepsilon \}$ = $H_{0}=\{d(p,q)\geq \varepsilon \}$ { d $H_{0}=\{d(p,q)\geq \varepsilon \}$ ( $H_{0}=\{d(p,q)\geq \varepsilon \}$ $H_{0}=\{d(p,q)\geq \varepsilon \}$ ≥ ε } {\ $displaystyle H_$ {0} = $\{d (p$ , q $)\geq$ \varepsilon $H_{0}=\{d(p,q)\geq \varepsilon \}$ \} 대 $H_{1}=\{d(p,q)<\varepsilon \}$ 1 = {d (p, q) < ε } {\displaystyle H_{1} =\{d (p, q) <\varepsilon \}입니다. 실제 기본 $배포$ p ${\displaystyle$ p $}$ 을(를) 알 $p$ 수 없습니다. 대신 계산 빈도 $p_{n}$ ${\$ 이(가 $n$ ) 관찰되며 $p_{n}$ , 여기서 $n$ $n$ 은 샘플 크기입니다. An equivalence test uses $p_{n}$ to reject $H_{0}$ . If $H_{0}$ can be rejected then the equivalence between $p$ and $q$ is shown at a given significance level. 유클리드 거리에 대한 동등성 테스트는 Wellek(2010)의 교과서에서 찾을 수 있습니다.^[5] 총 변동 거리에 대한 동등성 테스트는 Ostrovski(2017)에서 개발되었습니다.^[6] 특정 누적 거리에 대한 정확한 동등성 테스트는 Frey(2009)에서 제안됩니다.^[7]

실제 기본 분포 p $p$ 와 ${\mathcal {M}}$ 분포 M ${\mathcal {M}$ 계열 사이의 거리는 $d(p,{\mathcal {M}})=\min _{h\in {\mathcal {M}}}d(p,h)$ $d(p,{\mathcal {M}})=\min _{h\in {\mathcal {M}}}d(p,h)$ = $d(p,{\mathcal {M}})=\min _{h\in {\mathcal {M}}}d(p,h)$ ∈ $d(p,{\mathcal {M}})=\min _{h\in {\mathcal {M}}}d(p,h)$ p $,$ h) ${\displaystyle$ d(p, ${\mathcal$ {M $})$ = $\min$ _{h\ $in {\mathcal {M}}$ d $d(p,{\mathcal {M}})=\min _{h\in {\mathcal {M}}}d(p,h)$ p,h)}로 정의됩니다. 그런 다음 동등성 테스트 문제는 $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ = $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ { $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ ( $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ ≥ ε } {\ $displaystyle H_$ {0} = $\{$ d(p, ${\mathcal {M})\geq$ \varepsilon $H_{0}=\{d(p,{\mathcal {M}})\geq \varepsilon \}$ \} 및 $H_{1}=\{d(p,{\mathcal {M}})<\varepsilon \}$ 1 = {d (p, M) < ε } {\displaystyle H_{1} =\{d(p, {\mathcal {M})}<\varepsilon \}에 의해 주어집니다. $d(p,{\mathcal {M}})$ d $d(p,{\mathcal {M}})$ $d(p,{\mathcal {M}})$ $d(p,{\mathcal {M})$ 는 일반적으로 수치 최적화를 사용하여 계산됩니다 $d(p,{\mathcal {M}})$ . 이 사례에 대한 테스트는 최근 Ostrovski(2018)에서 개발되었습니다.^[8]

두 비율의 차이에 대한 신뢰 구간

다항 분포에서 발생하는 두 사건 중에서

다항 분포의 설정에서, $p_{i}-p_{j}$ - $p_{i}-p_{j}$ ${\$ 두 사건의 관측치 비율 차이에 대한 신뢰 구간을 구성합니다 $p_{i}-p_{j}$ ${\hat {p}_{i$ ={\ $frac {X_{i}}{n}}$ 에서 샘플 ${\hat {p}}_{i}={\frac {X_{i}}{n}}$ p ${\hat {p}}_{i}={\frac {X_{i}}{n}}$ ${\hat {p}}_{i}={\frac {X_{i}}{n}}$ = X ${\hat {p}}_{i}={\frac {X_{i}}{n}}$ 의 음의 공분산을 통합해야 하며, ${\hat {p}}_{j}={\frac {X_{j}}{n}}$ j = ${\hat {p}}_{j}={\frac {X_{j}}{n}}$ ${\hat {p}}_{j}={\frac {X_{j}}{n}}$ ${\displaystyle {\hat {p}_{j$ }={\ $frac {X_{j$

이 주제에 대한 일부 문헌은 일치 쌍 이진 데이터의 사용 사례에 초점을 맞추었는데, 공식을 모든 다항 분포에 대한 $p_{i}-p_{j}$ ${\$ 의 일반적인 경우로 변환할 때 세심한 주의가 필요합니다. 현재 섹션의 공식은 일반화되고 다음 섹션의 공식은 일치 쌍 이진 데이터 사용 사례에 초점을 맞춥니다.

비율 차이에 대한 Wald의 표준 오차(SE)는 다음을 사용하여 추정할 수 있습니다.^[9]^{: 378}^[10]

${\widehat {\operatorname {SE}({\hat {p}_{i}-{\hat {p}_{j})}}={\sqrt {\frac {({\hat {p}}_{i}+{\hat {p}}_{j})-({\hat {p}}_{i}-{\hat {p}}_{j})^{2}}{n}}}$

$100(1-\alpha )\%$ - α $100(1-\alpha )\%$ % $100(1-\alpha)\%$ 근사 $100(1-\alpha )\%$ 신뢰 구간의 경우 오차 한계는 다음과 같이 표준 정규 분포에서 적절한 분위수를 통합할 수 있습니다.

${\displaystyle({\hat {p}_{i}-{\hat {p}_{j})\pm z_{\alpha /2}\cdot {\widehat {\operatorname {SE}({\hat {p}_{i}-{\hat {p}_{j})}}}$

[증명]

표본 크기( $n$ ${\displaystyle$ n $n$ 가 증가함에 따라 표본 비율은 다차원 중심 극한 정리(Cramér-Wold 정리를 사용하여 나타낼 수도 있음) 덕분에 대략 다변량 정규 분포를 따릅니다. 따라서 그들의 차이도 거의 정상입니다. 또한 이러한 추정기는 약하게 일치하며 SE 추정기에 연결하면 약하게 일치합니다. Hence, thanks to Slutsky's theorem, the pivotal quantity ${\displaystyle {\frac {({\hat {p}}_{i}-{\hat {p}}_{j})-(p_{i}-p_{j})}{\widehat {\operatorname {SE} ({\hat {p}}_{i}-{\hat {p}}_{j})$ $}}}}$ 대략 ${\frac {({\hat {p}}_{i}-{\hat {p}}_{j})-(p_{i}-p_{j})}{\widehat {\operatorname {SE} ({\hat {p}}_{i}-{\hat {p}}_{j})}}}$ 표준 정규 분포를 따릅니다. 그리고 그로부터 위의 대략적인 신뢰 구간이 직접 도출됩니다.

The SE can be constructed using the calculus of the variance of the difference of two random variables: ${\begin{aligned}{\widehat {\operatorname {SE} ({\hat {p}}_{i}-{\hat {p}}_{j})}}&={\sqrt {{\frac {{\hat {p}}_{i}(1-{\hat {p}}_{i})}{n}}+{\frac {{\hat {p}}_{j}(1-{\hat {p}}_{j})}{n}}-2\left(-{\frac {{\hat {p}}_{i}{\hat {p}}_{j}}{n}}\right)}}\\&={\sqrt {{\frac {1}{n}}\left({\hat {p}}_{i}+{\hat {p}}_{j}-{\hat {p}}_{i}^{2}-{\hat {p}}_{j}^{2}+2{\hat {p}}_{i}{\hat {p}}_{j}\right)}}\\&={\sqrt {\frac {({\hat {p}}_{i}+{\hat {p}}_{j})-({\hat {p}}_{i}-{\hat {p}}_{j})^{2}}{n}}}\end{aligned}}$ ${\displaystyle {\begin{aligned}{\widehat {\operatorname {SE} ({\hat {p}}_{i}-{\hat {p}}_{j})$ $}}&={\sqrt {{\frac {{\hat {p}}_{i}(1-{\hat {p}}_{i})$ $}{n}}+{\frac {{\hat {p}}_{j}(1-{\hat {p}}_{j})$ $}{n}}-2\left(-{\frac {{\hat {p}}_{i}{\hat {p}}_{j}}{n}}\right)$ $}}\\&={\sqrt {{\frac {1}{n}}\left({\hat {p}}_{i}+{\hat {p}}_{j}-{\hat {p}}_{i}^{2}-{\hat {p}}_{j}^{2}+2{\hat {p}}_{i}{\hat {p}}_{j}\right)$ $}}\\&={\sqrt {\frac {({\hat {p}}_{i}+{\hat {p}}_{j})-({\hat {p}}_{i}-{\hat {p}}_{j})^{2}}{n}}}\end{aligned}}}$

연속성 수정을 포함한 수정은 다음과 같이 오류 한계에 ${\frac {1}{n}}$ ${\frac {1}{n}}$ ${\$ 을(를) 추가합니다.^[11]^{: 102–3}

${\displaystyle({\hat {p}_{i}-{\hat {p}_{j})\pm \left(z_{\alpha /2}\cdot {\widehat {\operatorname {SE}({\hat {p}_{i}-{\hat {p}_{j})}}+{\frac {1}{n}}\right)}$

일치 쌍 이진 데이터의 경우

일치 쌍 이진 데이터의 경우, 일반적인 작업은 일치하는 이벤트의 비율 차이의 신뢰 구간을 구축하는 것입니다. 예를 들어, 어떤 질병에 대한 검사를 받을 수도 있고, 두 시점(1, 2)에서 일부 모집단에 대한 검사 결과를 확인하여 해당 기간 동안 질병에 대한 양성 비율에 변화가 있었는지 확인할 수도 있습니다.

이러한 시나리오는 각 이벤트 조합이 포함된 요소의 수와 함께 2x2 분할표를 사용하여 나타낼 수 있습니다. 샘플링 주파수에는 f $f_{11},f_{10},f_{01},f_{00}$ f $f_{11},f_{10},f_{01},f_{00}$ f $f_{11},f_{10},f_{01},f_{00}$ f $f_{11},f_{10},f_{01},f_{00}$ ${\$ 모집단 주파수에는 대문자 F: F $F_{11},F_{10},F_{01},F_{00}$ F $F_{11},F_{10},F_{01},F_{00}$ $F_{11},F_{10},F_{01},F_{00}$ $F_{11},F_{10},F_{01},F_{00}$ $F_{11},F_{10},F_{01},F_{00}$ $F_{11},F_{10},F_{01},F_{00}$ ${\$ $F_{00$ 이 네 가지 조합은 다항 분포(4가지 잠재적 결과가 있음)에서 오는 것으로 모델링할 수 있습니다. 표본과 모집단의 크기는 각각 대문자 n과 N이 될 수 있습니다. 그리고 그러한 경우, 다음 (표본화된) 분할표의 한계로부터 비율의 차이에 대한 신뢰 구간을 구축하는 데 관심이 있습니다.

	테스트 2 양성	테스트 2 음성	행합계
테스트 1 양성	$f_{11}$	$f_{10}$	$f_{1*}=f_{11}+f_{10}$
테스트 1 음성	$f_{01}$	$f_{00}$	$f_{0*}=f_{01}+f_{00}$
열합계	$f_{*1}=f_{11}+f_{01$	$f_{*0}=f_{10}+f_{00$	$n$

이 경우 한계 비율의 차이를 확인하는 것은 $p_{1*}={\frac {F_{1*}}{N}}={\frac {F_{11}+F_{10}}{N}}$ 정의를 사용하는 데 관심이 있음을 의미합니다. p $p_{1*}={\frac {F_{1*}}{N}}={\frac {F_{11}+F_{10}}{N}}$ ∗ = $p_{1*}={\frac {F_{1*}}{N}}={\frac {F_{11}+F_{10}}{N}}$ $p_{1*}={\frac {F_{1*}}{N}}={\frac {F_{11}+F_{10}}{N}}$ ∗ $p_{1*}={\frac {F_{1*}}{N}}={\frac {F_{11}+F_{10}}{N}}$ = $p_{1*}={\frac {F_{1*}}{N}}={\frac {F_{11}+F_{10}}{N}}$ F 11 + F $10$ N ${\displaystyle$ p_{1*} = {\ $frac$ {F_{1*}} {N} = ${\frac$ {F_{11} + F_{10}} { $N$ $p_{*1}={\frac {F_{*1}}{N}}={\frac {F_{11}+F_{01}}{N}}$ $∗$ $p_{*1}={\frac {F_{*1}}{N}}={\frac {F_{11}+F_{01}}{N}}$ $=$ $p_{*1}={\frac {F_{*1}}{N}}={\frac {F_{11}+F_{01}}{N}}$ $∗$ 1 $p_{*1}={\frac {F_{*1}}{N}}={\frac {F_{11}+F_{01}}{N}}$ $=$ F 11 + F $01$ N ${\displaystyle p_$ {*1} $=$ {\frac {F_{*1}} {N} $=$ ${\frac$ {F_{11} + F_{01}} { $N$ 신뢰 구간을 구축하려는 차이점은 다음과 같습니다.

$p_{*1}-p_{1*}={\frac {F_{11}+F_{01}}{N}}-{\frac {F_{11}+F_{10}}{N}}={\frac {F_{01}}{N}}-{\frac {F_{10}}{N}}=p_{01}-p_{10}$

따라서 한계 양의 비율에 대한 신뢰 구간( $p_{*1}-p_{1*}$ ∗ $p_{*1}-p_{1*}$ 1 - $p_{*1}-p_{1*}$ p 1 ∗ ${\displaystyle$ {*1}-p_{1*}})은 2×2 $p_{01}-p_{10}$ 의 2차 대각선에서 비율의 차이에 대한 신뢰 구간을 구축하는 것과 동일합니다 $(p$ 01 - p 10 ${\displaystyle p_$ {01}-p_{10}}).

이전 섹션의 Te Wald 신뢰 구간을 이 설정에 적용할 수 있으며 대체 표기법을 사용하여 문헌에 표시됩니다. 특히, SE는 표본 비율 대신 분할표 빈도를 기반으로 하는 경우가 많습니다. 예를 들어, 위에 제공된 Wald 신뢰 구간은 다음과 같이 작성할 수 있습니다.^[11]^{: 102–3}

${\widehat {\operatorname {SE} (p_{*1}-p_{1*})}}={\widehat {\operatorname {SE} (p_{01}-p_{10})}}={\frac {\sqrt {n(f_{10}+f_{01})-(f_{10}-f_{01})^{2}}}{n{\sqrt {n}}}}$

문헌에 대한 추가 연구를 통해 연속성 보정 방법으로 Wald와 Wald 모두에서 몇 가지 단점이 확인되었으며, 실제 적용을 위한 다른 방법이 제안되었습니다.^[11]

이러한 수정 중 하나는 아그레스티와 민스 발드+2(다른 작품과^[12] 유사)를 포함하는데, 여기에는 각 셀 주파수에 ${\frac {1}{2}}$ 된 ${\frac {1}{2}}$ ${\frac {1}{2}}$ 의 ${\frac {1}{2}}$ 가 있습니다.^[13] 따라서 Wald+2 신뢰 구간이 발생합니다. 베이지안 해석에서 이는 모든 모수가 0.5(사실상 Jeffreys 이전)인 디리클렛 분포를 사전으로 취하는 추정치를 구축하는 것과 같습니다. wald+2라는 이름의 +2는 4개의 가능한 사건이 있는 다항식 분포인 2x2 분할표의 맥락에서 각 분포에 1/2개의 관측치를 추가하기 때문에 전체적으로 2개의 관측치를 추가하는 것으로 해석할 수 있습니다.

따라서 일치하는 쌍 데이터의 경우 다음과 같이 수정된 SE가 발생합니다.

${\widehat {\operatorname {SE} (p_{*1}-p_{1*})}}={\frac {\sqrt {(n+2)(f_{10}+f_{01}+1)-(f_{10}-f_{01})^{2}}}{(n+2){\sqrt {(n+2)}}}}$

다음과 같이 원래 Wald 공식에 연결할 수 있습니다.

${\displaystyle(p_{*1}-p_{1*}){\frac {n}{n+2}\pm z_{\alpha /2}\cdot {\widehat {\operatorname {SE}({\hat {p}_{i}-{\hat {p}_{j})}}_{wald+2}}$

다른 수정 사항으로는 Bonett and Price's Adjusted Wald, Newcome's Score 등이 있습니다.

계산법

랜덤 변수 생성

먼저 매개 변수 $p_{1},\ldots ,p_{k}$ 1 $p_{1},\ldots ,p_{k}$ $p_{1},\ldots ,p_{k}$ ${\$ 가 내림차순으로 정렬되도록 $p_{1},\ldots ,p_{k}$ 순서를 바꿉니다(이는 계산 속도를 높이기 위한 것일 뿐 반드시 필요한 것은 아닙니다). 이제 각 시행에 대해 균일한 (0, 1) 분포로부터 보조 변수 X를 그립니다. 결과는 구성 요소입니다.

j=\min \left\{j'\in \{1,\dots,k\}\colon \left(\sum _{i=1}^{j'}p_{i}\right)-X\geq 0\right\

{X = 1, X = 0 for k ≠ j}는 $p_{1},\ldots ,p_{k}$ p $p_{1},\ldots ,p_{k}$ $…,$ $pk {\display$ p_{ $1},\ldots,$ p_{k}} 및 n = $p_{1},\ldots ,p_{k}$ 다항 $p_{1},\ldots ,p_{k}$ 에서 얻은 하나의 관측치입니다. 이 실험의 독립적인 반복의 합은 n이 그러한 반복의 수와 동일한 다항 분포에서 얻은 관측치입니다.

반복 조건부 이항 표본을 사용한 표본 추출

$\sum _{i=1}^{k}X_{i}=N$ ${\displaystyle p_$ ${1}, p_{2},\ldots, p_{k}}$ 및 ∑ $\sum _{i=1}^{k}X_{i}=N$ = $1k$ $\sum _{i=1}^{k}X_{i}=N$ = N ${\displaystyle \sum$ _{ $i$ = $1$ }^{k}X_{i}=N}이(가) 지정된 매개 변수 $p_{1},p_{2},\ldots ,p_{k}$ $p_{1},p_{2},\ldots ,p_{k}$ ${\displaystyle$ p_{1}, 임의의 상태 $X_{i}$ ${\$ 에 있는 번호에 대해 상태 공간을 $i$ $i$ 이 $i$ $i$ 가) 아닌 $i$ $i$ 로 분할하여 반복적으로 샘플링할 수 있습니다.

알고리즘 : 순차 조건부 이항 샘플링

S = N rho = 1 for i in [1,k-1]:  if rho != 0:  X[i] ~ Binom(S,p[i]/rho)  else X[i] = 0  S = S - X[i]  rho = rho - p[i] X[k] = S

휴리스틱적으로 이항 샘플의 각 응용 프로그램은 사용 가능한 샘플 수를 줄이고 논리적 일관성을 보장하기 위해 조건부 확률도 마찬가지로 업데이트됩니다.^[14]

소프트웨어 구현

다항식CIR 패키지를 사용하면 관측치 집합이 주어지면 다항 분포의 확률에 대한 동시 신뢰 구간을 계산할 수 있습니다.

추가읽기

Evans, Morton; Hastings, Nicholas; Peacock, Brian (2000). Statistical Distributions (3rd ed.). New York: Wiley. pp. 134–136. ISBN 0-471-37124-6.
Weisstein, Eric W. "Multinomial Distribution". MathWorld. Wolfram Research.

참고문헌

^ "probability - multinomial distribution sampling". Cross Validated. Retrieved 2022-07-28.
^ Loukas, Orestis; Chung, Ho Ryun (2023). "Total Empiricism: Learning from Data". arXiv:2311.08315 [math.ST].
^ Loukas, Orestis; Chung, Ho Ryun (April 2022). "Categorical Distributions of Maximum Entropy under Marginal Constraints". arXiv:2204.03406.
^ Loukas, Orestis; Chung, Ho Ryun (June 2022). "Entropy-based Characterization of Modeling Constraints". arXiv:2206.14105.
^ Wellek, Stefan (2010). Testing statistical hypotheses of equivalence and noninferiority. Chapman and Hall/CRC. ISBN 978-1439808184.
^ Ostrovski, Vladimir (May 2017). "Testing equivalence of multinomial distributions". Statistics & Probability Letters. 124: 77–82. doi:10.1016/j.spl.2017.01.004. S2CID 126293429.공식 웹 링크(구독 필수). 대체, 무료 웹 링크.
^ Frey, Jesse (March 2009). "An exact multinomial test for equivalence". The Canadian Journal of Statistics. 37: 47–59. doi:10.1002/cjs.10000. S2CID 122486567.공식 웹 링크(구독 필수).
^ Ostrovski, Vladimir (March 2018). "Testing equivalence to families of multinomial distributions with application to the independence model". Statistics & Probability Letters. 139: 61–66. doi:10.1016/j.spl.2018.03.014. S2CID 126261081.공식 웹 링크(구독 필수). 대체, 무료 웹 링크.
^ Fleiss, Joseph L.; Levin, Bruce; Paik, Myunghee Cho (2003). Statistical Methods for Rates and Proportions (3rd ed.). Hoboken, N.J: J. Wiley. p. 760. ISBN 9780471526292.
^ Newcombe, R. G. (1998). "Interval Estimation for the Difference Between Independent Proportions: Comparison of Eleven Methods". Statistics in Medicine. 17: 873–890. doi:10.1002/(SICI)1097-0258(19980430)17:8<873::AID-SIM779>3.0.CO;2-I.
^ ^a ^b ^c "Confidence Intervals for the Difference Between Two Correlated Proportions" (PDF). NCSS. Retrieved 2022-03-22.
^ Agresti, A.; Caffo, B. (2000). "Simple and effective confidence intervals for proportions and difference of proportions result from adding two successes and two failures". The American Statistician. 54 (4): 280–288.
^ Agresti, Alan; Min, Yongyi (2005). "Simple improved confidence intervals for comparing matched proportions" (PDF). Statistics in Medicine. 24 (5): 729–740.
^ "11.5: The Multinomial Distribution". Statistics LibreTexts. 2020-05-05. Retrieved 2023-09-13.
^ "MultinomialCI - Confidence Intervals for Multinomial Proportions". CRAN. Retrieved 2024-03-23.

[1] "probability - multinomial distribution sampling". Cross Validated. Retrieved 2022-07-28.

[2] Loukas, Orestis; Chung, Ho Ryun (2023). "Total Empiricism: Learning from Data". arXiv:2311.08315 [math.ST].

[3] Loukas, Orestis; Chung, Ho Ryun (April 2022). "Categorical Distributions of Maximum Entropy under Marginal Constraints". arXiv:2204.03406.

[4] Loukas, Orestis; Chung, Ho Ryun (June 2022). "Entropy-based Characterization of Modeling Constraints". arXiv:2206.14105.

[5] Wellek, Stefan (2010). Testing statistical hypotheses of equivalence and noninferiority. Chapman and Hall/CRC. ISBN 978-1439808184.

[6] Ostrovski, Vladimir (May 2017). "Testing equivalence of multinomial distributions". Statistics & Probability Letters. 124: 77–82. doi:10.1016/j.spl.2017.01.004. S2CID 126293429.공식 웹 링크(구독 필수). 대체, 무료 웹 링크.

[7] Frey, Jesse (March 2009). "An exact multinomial test for equivalence". The Canadian Journal of Statistics. 37: 47–59. doi:10.1002/cjs.10000. S2CID 122486567.공식 웹 링크(구독 필수).

[8] Ostrovski, Vladimir (March 2018). "Testing equivalence to families of multinomial distributions with application to the independence model". Statistics & Probability Letters. 139: 61–66. doi:10.1016/j.spl.2018.03.014. S2CID 126261081.공식 웹 링크(구독 필수). 대체, 무료 웹 링크.

[9] Fleiss, Joseph L.; Levin, Bruce; Paik, Myunghee Cho (2003). Statistical Methods for Rates and Proportions (3rd ed.). Hoboken, N.J: J. Wiley. p. 760. ISBN 9780471526292.

[10] Newcombe, R. G. (1998). "Interval Estimation for the Difference Between Independent Proportions: Comparison of Eleven Methods". Statistics in Medicine. 17: 873–890. doi:10.1002/(SICI)1097-0258(19980430)17:8<873::AID-SIM779>3.0.CO;2-I.

[pass_sample_size_software-11] "Confidence Intervals for the Difference Between Two Correlated Proportions" (PDF). NCSS. Retrieved 2022-03-22.

[12] Agresti, A.; Caffo, B. (2000). "Simple and effective confidence intervals for proportions and difference of proportions result from adding two successes and two failures". The American Statistician. 54 (4): 280–288.

[13] Agresti, Alan; Min, Yongyi (2005). "Simple improved confidence intervals for comparing matched proportions" (PDF). Statistics in Medicine. 24 (5): 729–740.

[14] "11.5: The Multinomial Distribution". Statistics LibreTexts. 2020-05-05. Retrieved 2023-09-13.

[15] "MultinomialCI - Confidence Intervals for Multinomial Proportions". CRAN. Retrieved 2024-03-23.

[1]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

Search

다항 분포

네임스페이스

더

목차

정의들

확률 질량 함수

예

특성.

정규화

기댓값 및 분산

행렬 표기법

시각화

일반화된 파스칼의 삼각형의 조각으로

다항식 계수로

대편차설

점근법

큰 N에서의 농도

큰 N에서의 조건부 농도

관련분포

통계적 추론

다항 분포에 대한 동등성 검정

두 비율의 차이에 대한 신뢰 구간

다항 분포에서 발생하는 두 사건 중에서

일치 쌍 이진 데이터의 경우

계산법

랜덤 변수 생성

반복 조건부 이항 표본을 사용한 표본 추출

알고리즘 : 순차 조건부 이항 샘플링

소프트웨어 구현

추가읽기

참고문헌

매개변수	$n>0$ ${\displaystyle$ n $>0}$ 시행 $n>0$ eger) $k>0$ ${\displaystyle$ k $>0}$ 개의 상호 배타적 이벤 $k>0$ eger) $p_{1},\ldots ,p_{k}$ $p_{1},\ldots ,p_{k}$ $p_{1},\ldots ,p_{k}$ $p_{1},\ldots,p_{k}$ 이벤트 확률, 여기서 $p_{1}+\dots +p_{k}=1$ $p_{1},\ldots ,p_{k}$ $p_{1}+\dots +p_{k}=1$ + $⋯$ $p_{1},\ldots ,p_{k}$ $pk =$ 1 {\ $displaystyle p_$ $p_{1},\ldots ,p_{k}$ $\dots$ + $p_{1},\ldots ,p_{k}$ $_{$ k}=1}
지지하다	$\left\lbrace (x_{1},\dots ,x_{k})\,{\Big \vert }\,\sum _{i=1}^{k}x_{i}=n,x_{i}\geq 0\ (i=1,\dots ,k)\right\rbrace$
PMF	${\frac {n!}{x_{1}!\cdots x_{k}!}}p_{1}^{x_{1}}\cdots p_{k}^{x_{k}}$
의미하다	$\operatorname {E}(X_{i})=np_{i}$
분산	$\operatorname {Var}(X_{i})=np_{i}(1-p_{i})$ $\operatorname {Cov} (X_{i},X_{j})=-np_{i}p_{j}~~(i\neq j)$
엔트로피	$-\log(n!)-n\sum _{i=1}^{k}p_{i}\log(p_{i})+\sum _{i=1}^{k}\sum _{x_{i}=0}^{n}{\binom {n}{x_{i}}}p_{i}^{x_{i}}(1-p_{i})^{n-x_{i}}\log(x_{i}!)$
MGF	${\biggl (}\sum _{i=1}^{k}p_{i}e^{t_{i}}{\biggr )}^{n}$
CF	$\left(\sum _{j=1}^{k}p_{j}e^{it_{j}}\right)^{n}$ $^{n}}$ $i^{2}=-1$ 서 i $i^{2}=-1$ $=$ $i^{2}=-1$ - $i^{2}=-1$ ${\displaystyle i^{2$ } $=$ - $1}$
PGF	${\biggl (}\sum _{i=1}^{k}p_{i}z_{i}{\biggr )}^{n}{\text{ for }}(z_{1},\ldots ,z_{k})\in \mathbb {C} ^{k}$