이 정의에는 양쪽 끝x = 0및 x = 1이 포함되며, 이는 예를 들어 아크사인 분포의 특별한 경우인 경계된 간격에서 지원되는 다른 연속 분포에 대한 정의와 일치하며, N. L. Johnson 및 S. Kotz와 같은 여러 저자와 일관된다.[1][2][3][4] 그러나 x= 0과 x= 1을 포함하는 것은 α,β< 1에 대해서는 효과가 없다. 따라서 W를 포함한 몇 명의 다른 저자에게도 효과가 있다. Feller,[5][6][7]끝 x = 0과 x= 1을 제외하도록 선택하고(두 끝이 실제로 밀도 함수의 영역에 속하지 않도록 하기 위해), 대신 0 < x < 1을 고려한다.
두 모양 구 유고 슬라비아의 화폐 단위 때문에 베타 분포는 한계의 베르누이 분포에 접근하는 N.L. 존슨 그리고 S. Kotz,[1]등 몇몇 저자들, 베타 분포, 기호 전통적으로 베르누이 분포의 매개 변수에 사용되는 연상의 형상 변수에 대해 기호 p와 q(α과 β 대신)을 사용한다.만났다ers α와 β는 0의 값에 접근한다.
다음에서 매개변수 α와 β로 분포된 임의 변수 X 베타 분포를 다음과 같이 나타낸다.[8][9]
통계 문헌에 사용된 베타 분포 랜덤 변수에 대한 다른 으로는 X ~B ,) X {) 및 [10]~ \이 있다[5]
베타 분포는 평균 μ(0 < μ< 1))와 두 형상 모수α+ β > 0([9] 페이지 83)의 합으로 재결정할 수도 있다. 베이지스 정리를 이항우도함수와 선행확률에 적용한 결과로 생기는 후방 베타 분포의 형상 매개변수를 αPosterior와 βPosterior로 나타냄으로써 표본 크기 = α·Posterior + β·Posterior 두 형상 매개변수의 추가 해석은 Haldane 사전 프로바빌리에 대해서만 정확하다.ty 베타(0,0). 구체적으로는 베이지(균일) 이전 베타(1,1)의 경우 정확한 해석은 표본 크기 = α·포스터리어 + β 후방 - 2 또는 ν = (샘플 크기) + 2가 될 것이다. 표본 크기가 2보다 훨씬 크면 이 두 전자의 차이는 무시할 수 있다. (자세한 내용은 베이지안 추론 섹션을 참조하십시오.) 이 조의 나머지 부분에서는 = = α + β를 "샘플 크기"라고 부르겠지만, 엄격히 말하면 베이지스 정리 이전에 할데인 베타(0,0)를 사용할 때만 이항우도 함수의 "샘플 크기"라는 것을 기억해야 한다.
이 파라메트리제이션은 베이지안 매개변수 추정에 유용할 수 있다. 예를 들어, 많은 개인에게 시험을 실시할 수 있다. 각 개인의 점수(0 each score ≤ 1)가 모집단 수준 베타 분포에서 도출된다고 가정할 경우, 중요한 통계량은 이 모집단 수준 분포의 평균이다. 평균 및 표본 크기 매개변수는 다음을 통해[9] 형상 매개변수 α 및 β와 관련된다.
α = μν, β = (1 − μ)ν
이 파라메트리제이션에 따르면, 표본 크기에 대한 양의 실제보다 비정보적 사전 확률을, 모호한 사전 확률(예: 지수 또는 감마 분포)을 독립적이고, 사전 데이터 및/또는 신념이 이를 정당화하는 경우, 표본 크기에 대한 양성 리얼에 배치할 수 있다.
모드 및 농도
모드와 "농도" = α+ {\alpha +\을(를) 베타 분포에 대한 파라미터를 계산하는 데도 사용할 수 있다.[11]
베타 분포의 평균과 분산을 원래 파라미터 α와 β의 관점에서 방정식으로 위 절에 제시된 (결합) 방정식의 체계를 풀면, α와 β 파라미터를 평균(μ)과 분산(var)의 관점에서 표현할 수 있다.
베타 분포의 이러한 파라메트리제이션은 원래의 파라메타 α 및 β에 근거한 파라메트리제이션보다 더 직관적인 이해로 이어질 수 있다. 예를 들어, 평균과 분산 측면에서 모드, 왜도, 과도한 첨도 및 미분 엔트로피를 표현함으로써,
4개의 매개변수
두 형상 모수 α와 β를 가진 베타 분포는 [0,1] 또는 (0,1) 범위에서 지지된다. 2추가 매개 변수를 최소를 나타내는,을 도입함으로써 그 분포의 위치와 규모만 바꾸면 됩니다. 가능하고 최대 c(c>), 가치의 distribution,[1]에 의한 선형 변환을 대체함은 무차원 변수 x에서 용어의 새로운 가변 y(지지를[a,c]이나(a,c))과 매개 변수 a와 c:
네 모수 베타 분포의 확률밀도함수는 범위(c-a), (밀도 곡선 아래의 총 면적이 1의 확률과 같도록)에 의해 스케일링되는 두 모수 분포와 같으며, "y" 변수는 다음과 같이 이동 및 스케일링된다.
무작위 변수 Y가 4개의 파라미터 α, β, a및 c로 베타 분산된다는 사실은 다음과 같이 표시된다.
중심 위치의 측정은 다음과 같이 스케일링(c-a) 및 시프트(a)한다.
(기하 평균과 고조파 평균은 평균, 중위수 및 모드가 변환할 수 있는 방식으로 선형 변환에 의해 변환될 수 없다.)
Y의 형상 모수는 평균 및 분산 단위로 작성할 수 있다.
통계적 분산 측정치는 범위(c-a)에 의해 확장되며(이미 평균에 집중되어 있으므로 이동할 필요가 없음), 평균 편차에 대해 선형적으로, 분산에 대해 비선형적으로 다음과 같이 조정된다.
왜도 및 과도한 첨도는 비차원 수량(평균을 중심으로 하고 표준 편차에 의해 정규화된 순간으로서)이기 때문에, 이들은 매개변수a와 c에 독립적이므로 X의 측면에서 위에 제시된 표현과 동일하다(지원 [0,1] 또는 (0,1)).
특성.
중심 경향의 척도
모드
α, β > 1을 갖는 베타 분포 랜덤변수X의 모드는 분포의 가장 가능성이 높은 값(PDF의 피크에 대응)이며, 다음과 같은 표현으로 주어진다.[1]
두 파라미터가 모두 1(α, β < 1) 미만일 경우, 이것이 반모드: 확률밀도곡선의 최저점이다.[3]
α = β를 허용하면 모드에 대한 표현은 1/2로 단순화되며, α = β > 1의 경우 모드(α,β< 1일 때 반모드)가 분포의 중심에 있다는 것을 보여준다: 그러한 경우 대칭이다. 임의의 α 및 β 값은 이 문서의 도형 섹션을 참조하십시오. 이러한 몇 가지 경우에 밀도함수의 최대값은 한쪽 또는 양쪽 끝에서 발생한다. 어떤 경우에는 끝에서 발생하는 밀도함수의 (최대) 값이 유한하다. 예를 들어 α = 2, β = 1(또는 α = 1, β = 2)의 경우 밀도 함수는 양끝에서 유한한 우측 삼각분포가 된다. 다른 몇 가지 경우, 밀도함수의 값이 무한대에 접근하는 한 쪽 끝에는 특이점이 있다. 예를 들어 α = β = 1/2인 경우 베타 분포는 아크사인 분포로 단순화된다. 수학자들 사이에서는 이러한 사례들 중 몇 가지에 대해, 그리고 끝(x = 0, x = 1)을 모드라고 할 수 있는가에 대해 논쟁이 있다.[6][8]
다음은 한 매개변수가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.[citation needed]
베타 분포의 중위수 값에 대한 합리적인 근사치(α 및 β 둘 다 1보다 크거나 같음)는 공식에[13] 의해 제시된다.
α, β ≥ 1일 때, 이 근사치의 상대 오차(절대 오차를 중위수로 나눈 값)는 4% 미만이며 α ≥ 2와 β ≥ 2 모두 1% 미만이다. 절대 오차를 평균과 모드의 차이로 나눈 값도 마찬가지로 작다.
평균
0 α α ≤ 5 및0 β β ≤ 5에 대한 베타 분포의 평균
두 개의 파라미터 α와 β를 가진 베타 분포 랜덤 변수X의 기대값(평균)(μ)은 다음 파라미터의 비율 β/α만 갖는 함수다.[1]
위의 표현에서 α= β를 허용하면 μ = 1/2을 얻으며, α = β의 경우 평균이 분포의 중심에 있음을 보여준다: 대칭이다. 또한 위의 표현에서 다음과 같은 한계를 얻을 수 있다.
따라서 β/α → 0의 경우 또는α/β → ∞의 경우 평균은 오른쪽 끝 x = 1에 위치한다. 이러한 제한 비율의 경우, 베타 분포는 오른쪽 끝의 디락 델타 함수 스파이크x = 1, 확률 1 및 다른 모든 곳에서 0 확률을 갖는 1점 퇴화 분포가 된다. 오른쪽 끝 x = 1에 집중된 100% 확률(절대 확실성)이 있다.
마찬가지로 β/α → α → β → 0의 경우, 평균은 왼쪽 끝 x= 0에 위치한다. 베타 분포는 디락 델타 함수의 스파이크가 왼쪽 끝에 x = 0이고 확률 1이며 다른 모든 곳에서 0 확률을 갖는 1 포인트 Degenate 분포가 된다. 왼쪽 끝 x = 0에 집중된 100% 확률(절대 확실성)이 있다. 다음은 한 파라미터가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.
반면(로는 중심 모드의 양쪽에, 더 긴 꼬리 모드 활용 지점)가 α,β 을(베타와(α, β)전형적인 단봉 분포, 2)거나"U자형의"유니폼 두가지 시스템이 있는을 차린 이중근 샘플 평균(위치의 견적)이 견본에의와 있지 않은 경우는 반대의 경우(w. 알려져 있ith 베타(α, β 1)와 같은 모드는 분포의 끝에 위치한다. Mosteller와 Tukey가 [14]말한 바와 같이 (207 페이지) "두 개의 극단적 관측의 평균은 모든 표본 정보를 사용한다. 이는 짧은 꼬리 분포의 경우 극단적 관측치가 어떻게 더 가중되어야 하는지를 보여준다." 대조적으로, 표본 중위수가 극단적 표본 관측치를 고려에서 떨어뜨리기 때문에 분포의 가장자리에 모드를 갖는 "U자형" 이원 분포의 중위수(α, β 1)는 α, β1과 같은 베타(α, β)가 견고하지 않다. 이후 원점으로 되는 대로 걷다의 마지막 방문의 시간의 발생 확률은 아크 사인 유통 Beta(1/2,1/2)을 중앙 분리대 이렇게 하는 부당한 sa보다 랜덤 워크의 깨달음의 숫자의 의미는 훨씬 견고한 추정자[5][15]배포된다 이것의 실질적인 적용을 무작위로 산책을 예를 들어 발생한다.mple 이 경우 추정치를 측정한다.
기하 평균
(Mean - GeomicalMean) 0 ~ 2의 베타 분포 대 α 및 β의 경우 기하 평균에 대한 α와 β 사이의 비대칭성을 나타낸다.
베타 분포를 위한 기하학적 평균 보라색 = G(x), 노란색 = G(1 - x), 작은 값 앞에 α 및 β
베타 분포를 위한 기하학적 평균. 보라색 = G(x), 노란색 = G(1 - x), 큰 값 앞에 α 및 β
랜덤 변수X를 갖는 분포의 기하학적평균X G의 로그는 ln(X)의 산술 평균 또는 동등하게 기대값이다.
따라서 형상 모수 α와 β를 갖는 베타 분포의 기하학적 평균은 다음과 같이 α와 β의 디감마 함수의 지수화다.
형상 모수 α = β가 같은 베타 분포의 경우 왜도 = 0, 모드 = 평균 = 중위수 = 1/2을 따르지만 기하 평균은 1/2: 0X< G < 1/2 미만이다. 그 이유는 로그 변환은 X가 0에 가까워질수록 ln(X)이 음의 무한대로 강하게 향하는 경향이 강한 반면 ln(X)은 X → 1로 flatting되기 때문에 X의 값을 0에 가깝게 가중시키기 때문이다.
선 α= β를 따라 다음과 같은 한계가 적용된다.
다음은 한 파라미터가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.
함께 표시된 그림은 형상 모수 α 및 β에 대한 평균과 기하학적 평균의 차이를 0에서 2까지 보여준다. α와 β가 무한에 접근함에 따라 그 차이가 0에 가까워지고 α와 β의 값이 0에 근접함에 따라 차이가 커지게 된다는 사실 이외에도 형상변수 α와 β에 관해서 기하 평균의 명백한 비대칭성을 관찰할 수 있다. 기하 평균과 평균의 차이는 β와 α의 크기를 교환할 때보다 β에 대한 작은 값의 경우 더 크다.
N. L. Johnson과 S. Kotz는[1] 다음과 같은 기하 평균에 근사치를 산출하는 digamma 함수 ψ(α) ≈ ln(α - 1/2)에 대한 대수 근사치를 제안한다.
마찬가지로 기하 평균이 1/2이 되는 데 필요한 형상 모수의 값을 계산할 수 있다. 매개변수 β의 값을 고려할 때 기하 평균이 1/2이 되는 데 필요한 다른 매개변수 α의 값은? 답은 (β> 1) 필요한 α 값은 β + 1/2을 β → β로 향하는 경향이 있다는 것이다. For example, all these couples have the same geometric mean of 1/2: [β = 1, α = 1.4427], [β = 2, α = 2.46958], [β = 3, α = 3.47943], [β = 4, α = 4.48449], [β = 5, α = 5.48756], [β = 10, α = 10.4938], [β = 100, α = 100.499].
다른 어떤 평균에 대해서도 거짓임이 증명될 수 있는 기하 평균의 근본적인 속성은 다음과 같다.
이것은 표준화된 결과의 평균을 낼 때 기하학적 평균이 기준 값에 대한 비율로 표시되는 유일한 정확한 평균을 의미한다.[16] 이것은 베타 분포가 백분율의 무작위 행동에 적합한 모델이고 특히 비율의 통계적 모델링에 적합하기 때문에 관련성이 있다. 기하 평균은 최대우도 추정의 중심 역할을 한다. 단원의 "모수 추정, 최대우도"를 참조한다. 실제로, 무작위 변수 X에 기반한 기하학적평균X G 외에 최대우도 추정을 수행할 때, 또 다른 기하학적 평균도 자연스럽게 나타난다: 선형 변환에 기반한 기하학적 평균 –(1 - X),G(1−X):로 표시된 X의 거울-이미지:
선 α= β를 따라 다음과 같은 한계가 적용된다.
다음은 한 파라미터가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.
대략 다음과 같은 값을 갖는다.
G와X G(1−X) 모두 비대칭이지만, 두 형상 모수가 모두 α= β인 경우 기하 평균은 같다: G = G. 이X(1−X) 동등성은 두 기하 평균 사이에 표시되는 다음과 같은 대칭으로부터 나타난다.
조화 평균
0 < α < 5 및 0 < β < 5의 베타 분포에 대한 고조파 평균
0 ~ 2 베타 분포 대 α 및 β의 고조파 평균
베타 분포에 대한 조화 평균 보라색 = H(X), 노란색 = H(1 - X), 작은 값 앞에 α 및 β
베타 분포에 대한 고조파 평균 보라색 = H(X), 노란색 = H(1 - X), 큰 값 앞에 α 및 β
랜덤 변수X를 갖는 분포의 고조파 평균(HX)의 역은 1/X 또는 동등하게 기대값의 산술 평균이다. 따라서 형상 모수 α와 β를 갖는 베타 분포의 고조파 평균(HX)은 다음과 같다.
베타 분포의 고조파 평균(HX)은 α < 1이 있는 경우 형상 모수 α에 대한 정의 식이 [0, 1]에 제한되지 않기 때문에 정의되지 않는다.
α = β를 획득한 위의 식에 허용
α = β의 경우 고조파 평균은 0, α = β = 1의 경우, α = β → β의 경우 1/2의 범위를 나타낸다.
다음은 한 파라미터가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.
조화 평균은 기하 평균 외에도 네 모수 사례에 대한 최대우도 추정의 역할을 한다. 실제로 4개의 모수 사례에 대해 최대우도X 추정을 수행할 때 랜덤 변수 X에 기반한 고조파 평균 H 외에 다른 고조파 평균도 자연적으로 나타난다: 선형 변환(1 - X)에 기반한 고조파 평균, H1 − X:
β < 1을 갖는 베타 분포의 고조파 평균(H(1 − X))은 정의되지 않았는데, 이는 형상 모수 β에 대한 정의 식이 [0, 1]에서 단일보다 작기 때문이다.
α = β를 획득한 위의 식에 허용
α = β의 경우 고조파 평균은 0, α = β = 1의 경우, α = β → β의 경우 1/2의 범위를 나타낸다.
다음은 한 파라미터가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.
H와X H1−X 모두 비대칭이지만, 두 형상 모수가 모두 α = β인 경우 고조파 평균은 다음과 같다. HX = H1−X. 이 평등은 두 고조파 평균 사이에 표시되는 다음과 같은 대칭에서 나타난다.
통계적 산포도
분산
모수 α와 β를 갖는 베타 분포 랜덤 변수X의 분산(평균을 중심으로 한 두 번째 모멘트)은 다음과 같다.[1][17]
α = β를 획득한 위의 식에 허용
α = β의 경우 α= β가 증가함에 따라 분산이 단조롭게 감소한다는 것을 보여준다. 이 식에서 α= β= 0을 설정하면 한계치에 근접하여 발생하는 최대 분산 var(X) = 1/4을[1]α= β= 0에서 찾는다.
베타 분포는 평균 μ(0 < μ< 1) 및 표본 크기 ν= α+ β (ν> 0) 단위로 파라메트리될 수도 있다(하위 하위섹션 평균 및 표본 크기 참조).
이 파라메트리제이션(parametrization)을 사용하면 다음과 같이 평균 μ와 표본 크기 ν의 측면에서 분산을 표현할 수 있다.
ν= α+ β> 0이므로 그 var(X) < μ(1 -μ)를 따른다.
대칭 분포의 경우 평균은 분포의 중간, μ= 1/2이므로 다음과 같다.
또한 다음 한계(상기된 변수만 한계에 접근하는 경우)는 위의 식에서 얻을 수 있다.
기하분산 및 공분산
기하학적 분산 대 α 및 β를 기록한다.
기하학적 분산 대 α 및 β를 기록한다.
랜덤 변수X를 갖는 분포의 기하학적 분산 ln(varGX)의 로그는 X, ln(GX)의 기하학적 평균을 중심으로 한 X의 로그의 두 번째 모멘트다.
따라서 기하학적 분산은 다음과 같다.
Fisher 정보 매트릭스와 로그우도함수의 곡면성에서는 반사 변수 1 - X의 기하학적 분산 로그와 X와 1 - X의 기하학적 공분산 로그가 나타난다.
베타 분포의 경우, 베타 분포의 표현을 두 감마 분포의 비율로 사용하고 적분을 통해 구별함으로써 더 높은 순서의 로그 모멘트를 도출할 수 있다. 그것들은 고차 다감마 함수의 관점에서 표현될 수 있다. "기타, 변환된 랜덤 변수의 모멘트, 로그로 변환된 랜덤 변수의 모멘트" 섹션을 참조하십시오. ln X와 ln(1-X)의 로그 변수와 공분산의 분산은 다음과 같다.
함께 표시된 그림은 로그 기하학적 분산 및 로그 기하학적 공분산 대 형상 모수 α 및 β를 보여준다. 그림에서는 형상 모수 α와 β가 2보다 큰 경우 로그 기하학적 분산과 로그 기하학적 공분산이 0에 가깝고, 형상 모수 값 α와 β보다 작은 값에 대한 로그 기하학적 분산이 빠르게 상승한다는 것을 보여준다. 로그 기하학적 분산은 형상 모수의 모든 값에 대해 양수적이다. 로그 기하학적 공분산은 형상 모수의 모든 값에 대해 음수적이며, α 및 β에 대한 단일성보다 작은 큰 음수 값에 도달한다.
다음은 한 파라미터가 유한한 한계(0이 아닌)와 이러한 한계에 접근하는 다른 한계는 다음과 같다.
두 개의 파라미터가 서로 다른 한계:
ln(varGX)과 ln(varG(1 − X))이 모두 비대칭이지만 형상 모수가 α = β인 경우 ln(varGX) = ln(varG(1−X))이 있다. 이러한 평등은 두 로그 기하학적 분산 사이에 표시되는 다음과 같은 대칭에서 나타난다.
로그 기하학적 공분산은 대칭:
평균 주위의 평균 절대 편차
평균 복근 비율.성으로 데브Dev. 0 ~ 5 범위의 α 및 β를 갖는 베타 분포용
평균 복근 비율.성으로 데브Dev. 평균 0 μ μ μ μ ≤ 1 및 표본 크기 0 < ν ≤ 10을 갖는 베타 분포의 경우
형상 모수 α 및 β를 갖는 베타 분포의 평균 주위의 평균 절대 편차는 다음과 같다.[6]
평균 주위의 평균 절대편차는 평균으로부터의 제곱 편차가 아니라 선형(절대) 편차에 의존하므로 모드의 양쪽에 꼬리와 변곡점이 있는 베타(α, β) 분포, α, β > 2의 베타(α, β) 분포에 대한 표준편차보다 통계분산의 견실한 추정치다. 따라서 평균에서 매우 큰 편차의 효과는 지나치게 가중되지 않는다.
감마함수에 대한 스털링의 근사치 사용, N.L.존슨과 S.Kotz는[1] unity보다 큰 형상변수 값에 대해 다음과 같은 근사치를 도출하였다(이 근사치의 상대오차는 α = β = 1의 경우 -3.5%에 불과하며, α → β → β → ∞으로 0으로 감소한다).
At the limit α → ∞, β → ∞, the ratio of the mean absolute deviation to the standard deviation (for the beta distribution) becomes equal to the ratio of the same measures for the normal distribution: . For α = β = 1 this ratio equals , 그래서 α = β = 1 ~ α, β → β는 8.5% 감소한다. α = β = 0의 경우 표준 편차는 평균 주위의 평균 절대 편차와 정확히 동일하다. 따라서 이 비율은 α = β = 0에서 α = 0으로 15% 감소하고, α = 0에서 α = 0으로 β → β → β → 0과 같은 치우친 베타 분포의 경우, 평균 절대 편차 대 표준 편차의 비율은 무한에 근접한다(각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각각 0으로 0으로 0으로, 0에 접근한다).n 표준 편차보다 빠르게 0에 접근한다.
분산과 평균의 함수로서의 왜도의 동반 그래프는 최대 분산(1/4)이 왜도 0과 대칭 조건(μ = 1/2)과 결합되고, 평균이 한 끝 또는 다른 끝에 위치할 때 최대 왜도(양 또는 음의 무한도)가 발생하므로 확률 분포의 "질량"이 동심률임을 나타낸다.끝부분에서 ed(확장 분산)
표본 크기 for = α + β 및 분산 변수의 측면에서 왜도의 제곱에 대한 다음 식은 네 가지 모수의 모멘트 추정 방법에 유용하다.
이 표현식은 α = β에 대해 0의 왜도를 정확하게 나타내며, 그 경우("" 섹션 참조): = ( 1+ ) {1}{(1
대칭 케이스(α = β)의 경우 왜도 = 전체 범위에 걸쳐 0이며, 다음과 같은 한계가 적용된다.
비대칭 케이스(α ≠ β)의 경우, 위의 식에서 다음과 같은 한계(상기된 변수만 한계치에 근접하는 경우)를 얻을 수 있다.
쿠르토시스
분산 및 평균 함수로서의 베타 분포에 대한 과도한 첨도
베타 분포의 첨도가 기어의 상태를 잘 나타내는 것으로 보고되었기 때문에 기어의 손상을 평가하기 위해 음향 해석에 베타 분포가 적용되었다.[18] 첨도는 사람의 발걸음으로 발생하는 지진 신호를 다른 신호와 구별하는 데도 이용되어 왔다. 지상에서 이동하는 사람이나 다른 표적이 지진파의 형태로 연속적인 신호를 생성하기 때문에, 그 표적이 생성하는 지진파에 따라 다른 표적을 분리할 수 있다. 첨도는 충동적인 신호에 민감하기 때문에 차량이나 바람, 소음 등에 의해 발생하는 다른 신호보다 사람의 발걸음으로 발생하는 신호에 훨씬 더 민감하다.[19] 불행히도, 첨도에 대한 표기법은 표준화되지 않았다. 케니와 케이트는[20] 과도한 첨도에 γ2 기호를 사용하지만 아브라모위츠와 스테건은[21] 다른 용어를 사용한다. 첨도(평균을 중심으로 한 네 번째 순간, 분산의 제곱으로 정규화됨)와 초과 첨도 사이의 혼동을[22] 방지하기 위해 기호를 사용할 때 다음과 같이 철자를 표기한다.[6][7]
α = β를 획득한 위의 식에 허용
도 = - 6 + == =
따라서 대칭 베타 분포의 경우 초과 첨도는 음성으로, 한계에서 {α = β} → 0으로 최소값인 -2에서 증가하며, 최대값인 {α = β} → ∞에 근접한다. -2 값은 모든 분포(베타 분포뿐만 아니라 모든 종류의 분포)가 달성할 수 있는 초과 첨도의 최소 값이다. 이 최소값은 모든 확률 밀도가 각 끝 x = 0 및 x = 1에 완전히 집중되어 있을 때 도달되며, 중간 중간에는 아무것도 없다. 각 끝에서 동일한 확률 1/2을 갖는 2점 베르누이 분포(코인 토스: 자세한 내용은 "왜도의 제곱으로 경계된 키토시스" 아래 섹션을 참조). 확률 분포의 "잠재적 특이치"(또는 "잠재적 희귀한 극단값")의 척도로서 첨도에 대한 설명은 베타 분포를 포함한 모든 분포에 대해 정확하다. 드물게 베타 분포에서 극단값이 발생할 수 있는 경우, 그 첨도가 높을수록, 그렇지 않으면 첨도가 더 낮다. α β β, 치우친 베타 분포의 경우, 모드에서 벗어난 쪽이 가끔 극단값을 생성하기 때문에 초과 첨도는 무제한의 양의 값(특히 α → 유한 β, 유한 α의 경우 β → 0)에 도달할 수 있다. 최소 첨도는 질량 밀도가 양쪽 끝(따라서 평균이 중심에 있음)에 균등하게 집중될 때 발생하며, 끝 사이의 질량 밀도는 확률적으로 존재하지 않는다.
분산의 함수로서의 초과 첨도와 평균의 그림은 초과 첨도의 최소값(-2, 모든 분포에 대한 초과 첨도에 대한 최소 가능 값)이 최대 분산 값(1/4)과 대칭 조건: 중간점(μ = 1/2)에서 발생하는 평균과 밀접하게 결합되어 있음을 보여준다. 이는 왜도가 0인 α = β = 0의 대칭 사례에서 발생한다. 한계에서 이것은 각 디락 델타 함수 끝 x = 0, x = 1 및 0 확률의 2점 베르누이 분포다. (동전 던지기: 동전의 한 면은 x = 0이고 다른 면은 x = 1.) 양 끝의 두 모드(스파이크) 사이에 아무 것도 없는 양면 분포이기 때문에 분산이 최대다. 초과 첨도는 최소값이다: 확률 밀도 "질량"은 평균에서 0이며 각 끝의 두 피크에 집중된다. 초과 첨도는 확률밀도함수가 양쪽 끝에 두 개의 스파이크가 있을 때 가능한 최소값(모든 분포에 대해)에 도달한다. 즉, 그 사이에 아무 것도 없는 바이"피크"이다.
한편, 그림에서는 평균이 한쪽 끝 또는 다른 쪽 끝(μ = 0 또는 μ = 1)에 가까운 극단적으로 치우친 경우 분산이 0에 가깝고, 분포의 평균이 어느 한쪽 끝에 가까워지면 초과 첨도가 무한에 빠르게 접근한다는 것을 보여준다.
또는, 과도한 첨도는 또한 다음과 같은 두 가지 매개변수, 즉 왜도의 제곱과 표본 크기 ν의 단위로 표현될 수 있다.
이 마지막 표현으로부터,[23] 사실상 1세기 전에 Karl Pearson이 그의 논문에서 베타 배포에 대해 발표한 것과 같은 한계를 얻을 수 있다(아래 "왜도의 사각형으로 둘러싸인 키르토시스" 부분을 참조). 위의 표현에서 α + β= ν = 0을 설정하면, Pearson의 하한 경계(경계 아래의 왜도 및 과다한 첨도에 대한 값(과도한 첨도 + 2 - 왜도2 = 0)는 어떤 분포에서도 발생할 수 없으며, 따라서 Karl Pearson은 이 경계 아래의 영역을 "불가능한 지역"이라고 적절하게 불렀다. α + β = ν → ∞의 한계는 피어슨의 상한선을 결정한다.
따라서:
ν = α + β의 값은 0 ~ 무한대, 0 < ν < ∞, 과 첨도 대 제곱 왜도 평면에서 베타 분포의 전체 영역에 걸쳐 있다.
대칭 케이스(α = β)의 경우 다음과 같은 한계가 적용된다.
비대칭 사례(α ≠ β)의 경우, 위의 식에서 다음과 같은 한계(알려진 변수만 한계치에 근접함)를 얻을 수 있다.
로짓 변환은 일반적으로 다양한 형상(J자형 포함)을 로짓 변수에 걸쳐 종 모양의 밀도로 변환하며, 원래 변수에 대한 끝 특이치를 제거할 수 있기 때문에 흥미롭다.[27]
Johnson은[28] 모멘트 생성 함수 및 형상 모수의 큰 값에 대한 근사치를 포함하여 로짓 변환 변수 ln(X/1-X)의 분포를 고려했다. 이러한 변환은 원래의 변수 X에 근거한 유한 지지대[0, 1]를 실제 선의 양방향으로 무한 지지대(-11, +11)로 확장한다.
더 높은 순서의 로그 모멘트는 베타 분포의 표현을 두 감마 분포의 비율로 사용하고 적분을 통해 구별함으로써 얻을 수 있다. 그것들은 다음과 같이 고차 다감마 함수의 관점에서 표현할 수 있다.
digamma 함수ψ은 적분에서 이어지는 고조파 숫자에 대한 오일러의 적분 공식의 결과로 미분 엔트로피 공식에 나타난다.
베타 분포의 차동엔트로피는 0보다 큰 모든 α 및 β의 값에 음수이며, 여기서 차동 엔트로피는 최대값인 0에 도달하는 α = β = 1(베타 분포의 값이 균일한 분포와 동일)을 제외한다. 가능한 모든 이벤트를 장착할 때 불확실성이 최대이므로 베타 분포가 균일한 분포와 같을 때 최대 엔트로피가 발생해야 한다.
α 또는 β가 0에 근접하는 경우, 미분 엔트로피는 음의 무한대의 최소 값에 접근한다. (둘 중 하나 또는 둘 다) α 또는 β가 0에 근접하는 경우, 최대 순서의 양이 있다. 모든 확률 밀도는 끝에 집중되며, 끝 사이에 위치한 지점에는 0 확률 밀도가 있다. 마찬가지로 (ei 또는 둘 다) α 또는 β가 무한대에 접근하는 경우, 미분 엔트로피는 음의 무한대의 최소값과 최대 순서에 접근한다. α 또는 β 중 하나가 무한에 접근하면(그리고 다른 하나가 유한하면) 모든 확률밀도가 끝에서 집중되며, 확률밀도는 다른 모든 곳에서 0이다. 두 형상변수 모두 동일(대칭 케이스), α = β, 무한대에 동시에 접근하면 확률밀도는 중간 x = 1/2에 집중된 스파이크(디락 델타 함수)가 되고, 따라서 중간 x = 1/2 및 0 확률의 100%가 다른 모든 곳에 존재한다.
(연속 케이스) 미분 엔트로피는 섀넌이 원래 논문(여기서 그는 그것을 "연속 분포의 엔트로피"라고 명명)에서 이산 엔트로피를 정의한 동일한 논문의 결론 부분으로[30] 소개되었다. 그 이후 미분 엔트로피는 무한 오프셋에 의해 이산 엔트로피의 극한 한계와 다를 수 있으므로 미분 엔트로피는 음수(베타 분포에 해당)가 될 수 있다는 것이 알려져 있다. 정말 중요한 것은 엔트로피의 상대적 가치다.
X1 ~ 베타(α, β)와2 X ~ 베타(α,, β′)라는 두 개의 베타 분산 랜덤 변수를 고려할 때 교차 엔트로피는 (Nats로 측정)[31]
교차 엔트로피는 두 가설 사이의 거리를 측정하는 오류 측정법으로 사용되어 왔다.[32][33] 절대값은 두 분포가 동일할 때 최소값이다. 이 값은 로그 최대우도와 가장 밀접하게 관련된 정보 측정값이다("모수 추정치" 섹션 참조). 최대우도 추정")).
상대 엔트로피, 즉 Kullback-Leibler differenceDKL(X1X2)는 실제로 분포가 X1~Beta(α,, β))일 때 분포가2 X~Beta(α′, β′)라고 가정하는 비효율성의 척도다. 다음과 같이 정의된다(Nats로 측정).
상대 엔트로피, 즉 쿨백-라이블러 분비는 항상 음성이 아니다. 다음과 같은 몇 가지 수치의 예는 다음과 같다.
Kullback-Leibler difference는 개별 베타 분포가 베타(1, 1)와 베타(3, 3)가 대칭인 경우 대칭KLD2(X1) xKLD1(X2)가 아니지만 엔트로피 h(X12)가 서로 다르다. Kullback difference의 값은 더 높은 (차동) 엔트로피에서 더 낮은 (차동) 엔트로피로 가는지 또는 다른 방향으로 가는지에 따라 달라진다. 위의 수적 예에서 Kullback difference는 분포가 (종 모양) 베타(1, 1)가 아니라 (종 모양) 베타(3, 3)라고 가정하는 비효율을 측정한다. 베타(1, 1)의 "h" 엔트로피가 베타(1, 1)의 "h" 엔트로피보다 높은 것은 균일한 분포 베타(1, 1)의 장애가 최대이기 때문이다. 쿨백의 차이는 엔트로피를 감소시키는 방향으로 측정했을 때 2배 이상 높다(0.267864 대신 0.598803). 즉 (균일) 베타(1, 1) 분포가 반대쪽이 아니라 (벨 모양) 베타(3, 3)라고 가정하는 방향이다. 이러한 제한적인 의미에서 컬백의 다양성은 열역학 제2법칙과 일치한다.
위의 정의와 베타 분포가 즐기는 미러-트래픽 f(x; α, β) = f(1-x; α, β)를 따른다.
통계적 조치 간의 관계
평균, 모드 및 중위수 관계
1 < α < β이면 모드 mode 중위수 ≤ 평균.[13] 모드(α, β > 1에 한함) 및 평균을 α 및 β 단위로 표현:
1 < β < α이면 불평등의 순서가 역전된다. α 들어,β>인데의 반면에 최대와 최소치 사이의 거리의 평균과 중앙값의 1은 절대 거리가 5%, 평균과 모드를 사이의 절대 거리 x의 최대와 최소 사이의 값, α의(병적)은 경우)거리의 50%1과 β=1whic(에 손을 내밀 수 있다.h 베타 분포가 균일한 분포에 접근하고 미분 엔트로피가 최대값에 근접하며, 따라서 최대 "값"이 된다.
산술과 기하학의 불평등으로부터는 기하 평균이 평균보다 낮다는 것을 알 수 있다. 마찬가지로 조화 평균은 기하 평균보다 낮다. 함께 나타낸 그래프는 α = β의 값에 관계없이 평균과 중위수가 모두 1/2과 정확히 같으며, α = β > 1의 모드도 1/2과 같으나 기하학적 및 고조파 평균은 1/2보다 낮으며 이 값만 α = β → β로 무증상적으로 접근한다는 것을 보여준다.
꼬불꼬불한 네모꼴로 둘러싸인 첨도
베타 분포 α 및 β 파라미터 대 초과 Kurtosis 및 제곱 Skwness
Feller가 언급한 바와 같이 [5]Pearson 시스템에서는 베타 확률 밀도가 타입 I로 나타난다(베타 분포와 Pearson의 타입 I 분포의 차이는 표면적일 뿐이며 첨도와 왜도 사이의 관계에 관한 다음 논의에 대해서는 아무런 차이가 없다). Karl Pearson은 1916년에 발표한 논문의 그림 1에서 첨도를 수직축(수평축)으로 하고, 왜도의 사각형을 수평축(수평축)으로 한 그래프를 보여주었는데, 이 그래프는 다수의 분포가 표시되었다.[34] 베타 분포에 의해 점유된 영역은 (스커니스2, 커토시스) 평면 또는 (스커니스2, 과다한 커토시스) 평면에서 다음 두 개의 선으로 경계를 이룬다.
또는 동등하게
(강력한 디지털 컴퓨터가 없었던 당시) 칼 피어슨은 그 이상의 경계를 정확하게 계산했는데,[4][23] 예를 들어 "U자형"과 "J자형" 분포를 분리하는 것이다. 하부 경계선(과도한 첨도 + 2 - 왜도2 = 0)은 형상 모수 α와 β 값을 모두 0에 가깝게 하여 "U자형" 베타 분포에 의해 생성된다. 상한 경계선(과도한 첨도 - (3/2) 왜도2 = 0)은 모수 중 하나의 값이 매우 크고 다른 모수의 값이 매우 작은 극단적으로 치우친 분포에 의해 생성된다. 칼 피어슨은 이 상부 경계선(과도한 첨도 - (3/2) 왜도2 = 0)도 피어슨의 분포 III와의 교차점이며, 한쪽 방향(양극성 무한대 아래)에 무제한 지지력을 가지고 있으며, 종 모양이나 J자형일 수 있다는 것을 보여주었다. 그의 아들 에곤 피어슨은 베타 분포에 의해 점유된 지역(큐토시스/제곱-제곱-제곱-제곱-제곱-제곱-제곱-제곱-제곱 분포 I)이 이 경계(과다 커토시스 - (3/2) 왜도2 = 0)에 근접할 때 비중앙 카이-제곱 분포와 공유된다는 것을 보여주었다. 칼 피어슨[35](Peerson 1895, 페이지 357, 360, 373–376)도 감마 분포가 피어슨 타입 III 분포임을 보여주었다. 따라서 Pearson의 타입 III 분포에 대한 이 경계선을 감마선이라고 한다. (감마 분포의 초과 첨도가 6/k이고 왜도의 제곱이 4/k이므로 (과도한 첨도 - (3/2) 왜도2 = 0) 모수 "k"의 값에 관계없이 감마 분포에 의해 동일하게 만족된다는 사실에서 이를 알 수 있다. 나중에 Pearson은 카이-제곱 분포가 Pearson 유형 III의 특수한 경우이며 이 경계선도 공유한다는 점에 주목하였다(카이-제곱 분포의 경우 초과 첨도는 12/k이고 왜도의 제곱은 8/k이므로 (과다 - (3/2) 왜도2 = 0)는 o와 관계없이 동일하게 충족된다.f 매개 변수 "k"의 값. 이는 카이-제곱 분포 X ~ χ2(k)는 감마 분포의 특수한 경우로서 파라메트리제이션 X ~ γ(k/2, 1/2)은 여기서 k는 카이-제곱 분포의 "자유도"를 지정하는 양의 정수이므로 예상된 것이다.
상부 경계 부근의 베타 분포(과도한 첨도 - (3/2) 왜도2 = 0)의 예는 α = 0.1, β = 1000으로 주어지며, 이에 대한 비율(과도한 첨도)/(척도2) = 1.49835는 아래에서 1.5의 상한에 접근한다. 하한에 가까운 베타 분포의 예(과도한 첨도 + 2 - 왜도2 = 0)는 α= 0.0001, β = 0.1로 주어지며, 식(과도한2 첨도 + 2)/(왜도) = 1.01621은 위에서부터 1의 하한에 접근한다. 0에 대칭적으로 접근하는 α와 β 모두에 대한 극소수 한계에서 초과 첨도는 -2에서 최소 값에 도달한다. 이 최소값은 하한 경계선이 수직축(종단)과 교차하는 지점에서 발생한다. (그러나 피어슨의 원래 차트에서 서수체는 과도한 첨도가 아닌 첨도가 되며, 위쪽으로가 아니라 아래쪽으로 증가한다.)
하한선(과도한 첨도 + 2 - 왜도2 = 0) 아래의 왜도 및 과다 첨도에 대한 값은 어떤 분포에서도 발생할 수 없으며, 따라서 칼 피어슨은 이 경계 아래의 영역을 "불가능한 지역"이라고 적절하게 불렀다. 이 "불가능 영역"의 경계는 (대칭 또는 치우침) 양방향 "U"자형 분포에 의해 결정되며, 이 분포는 매개변수 α와 β가 0에 접근하여 모든 확률 밀도가 끝에 집중된다. x = 0, 1은 실질적으로 사이에 아무것도 없는 상태에서. α ≈ β ≈ 0의 경우 확률밀도가 두 끝 x = 0과 x = 1에 집중되기 때문에, 이 "불가능한 경계"는 2점 분포에 의해 결정된다. 즉, 확률 p가 있는 한 값과 확률 q = 1-p인 다른 값만 가질 수 있다. 대칭 α = β, 왜도 0, 초과 첨도 osis -2 (이는 모든 분포에서 가능한 가장 낮은 초과 첨도)로 이 한계 경계에 접근하는 경우, 확률은 p ≈ q ≈ 1/2이다. 이 한계 경계에 접근하는 경우 왜도, 과도한 첨도 osis -2 + 왜도2, 확률 밀도는 다른 쪽 끝(사이에 사실상 없음)보다 한 쪽 끝에 더 집중되며, 확률 = p= + = - p = - p = p = 1 - p = p = 1 - p + 오른쪽 끝 x = 1.
함께 표시된 그림은 변곡점 위치(0에서 1까지의 범위까지 수직으로 표시) 대 α 및 β(0에서 5까지의 수평 축)를 보여준다. α = 1, β = 1, α = 2, β = 2와 교차하는 표면에는 큰 절단이 있다. 이러한 값에서 베타 분포가 2 모드에서 1 모드로 변경되어 없음 모드로 변경되기 때문이다.
모양들
대칭 베타 분포 대 x 및 α = 0 ~ 30의 β에 대한 PDF
대칭 베타 분포 대 x 및 α = 0 ~ 2의 β에 대한 PDF
x 및β = 0.5α(0 ~ 9)의 치우친 베타 분포에 대한 PDF
왜곡된 베타 분포 대 x 및 β = 0.5α(0 ~ 9)에 대한 PDF
왜곡된 베타 분포 대 x 및 β = 0 ~ 10의 8α에 대한 PDF
베타 밀도 함수는 두 파라미터 α와 β의 값에 따라 매우 다양한 형상을 취할 수 있다. 베타 분포가 이렇게 다양한 형상을 취할 수 있는 능력(매개 변수 두 개만 사용)은 실제 측정 모델링을 위한 광범위한 응용 프로그램을 찾는 데 일부 책임이 있다.
X ~ 베타(α, β)일 경우 - X ~β(, 베타 프라임 분포는 "제2종류의 베타 분포"라고도 한다.
X ~ 베타(α, β)일 경우 - 1~ β(.
만약 X ~ 베타(n/2, m/2)가 ( 1- )~ (, m) n > 0 및 m > 0)로 가정하면, Fisher–Senedecor F 분포.
If then min + X(max − min) ~ PERT(min, max, m, λ) where PERT denotes a PERT distribution used in PERT analysis, and m=가장 가능성 있는 가치.[39] 전통적으로[40] PERT 분석에서 λ = 4.
베타(1/2, 1/2)는 아크사인 분포와 동일하다. 이 분포는 베르누이와 이항 분포의 제프리스 사전 확률이기도 하다. 아크사인 확률밀도는 몇 가지 무작위 보행 기본 이론에 나타나는 분포다. 페어 코인 토스 랜덤워크에서는 마지막 원산지 방문시 발생확률을 (U자형) 아크사인 분포로 분배한다.[5][15] 2인용 페어코인토스 게임에서는 무작위 보행(원점에서 시작된)이 원점 이상일 경우 한 선수가 선두에 있다고 한다. 길이 2N의 경기에서 주어진 선수가 선두에 설 가능성이 가장 높은 횟수는 N이 아니다. 반대로 N은 선수가 선두에 설 가능성이 가장 적은 수다. 납에서 가장 가능성이 높은 횟수는 0 또는 2N(아크신 분포에 따름)이다.
When the distribution is required over a known interval other than [0, 1] with random variable X, say [a, c] with random variable Y, then replace with and with 형상 모수에 대한 위의 두 개의 방정식(아래 "대체 파라메트리제이션, 4개의 파라미터" 섹션 참조).[43] 여기서:
알 수 없는 4개의 매개 변수
모수 추정치 대 (표본) 초과 첨도 및 (표본) 제곱 왜도 베타 분포에 대한 솔루션
All four parameters ( of a beta distribution supported in the [a, c] interval -see section "Alternative parametrizations, Four parameters"-) can be estimated, using the method of moments developed by Karl Pearson, by equating 처음 네 개의 중심 모멘트의 표본 및 모집단 값(분산, 분산, 왜도 및 과다 첨도).[1][44][45] 과도한 첨도는 왜도의 제곱과 표본 크기 ν = α + β(이전 섹션 "쿠르토시스" 참조)로 다음과 같이 표현되었다.
표본 크기 ν= α + β에 대해 다음과 같이 왜도의 제곱과 과다한 첨도의 관점에서 풀려면 이 방정식을 사용할 수 있다.[44]
이전에 파생된 제한 경계 사이에 공간(원래 칼 Pearson[23]에 의해 행해진)은 비대칭도 정사각형의 한 축에 위치한 좌표와 다른 축은 과도한 첨(이전의 장"Kurtosis 월의 제곱을 경계로 제목을 보여 정의한의 베타 분산을 위해 이 비율(3의 인수로 곱해).eskewness":
0왜도의 경우, 0왜도의 경우, α = β, 따라서 α = 2β, 따라서 α = β = β/2이기 때문에 즉시 해결할 수 있다.
( 첨도는 0의 왜도가 0인 베타 분포에 음수이므로 따라서 표본 형상 모수는 0에 근접하고 초과 첨도는 -2에 근접할 때 -2에 도달할 때 -2에 이르는 양수(양수)이다.ach 무한대와 초과 첨도는 0에 가깝다.
0이 아닌 표본의 왜도는 두 개의 결합된 방정식의 시스템을 풀어야 한다. 왜도와 과도한 첨도는 매개변수 , {^은 결합된 eq를 해결하여 샘플 과도한 첨도와 고유하게 결정할 수 있다.두 개의 알려진 변수(대칭 왜도 및 표본 초과 첨도)와 두 개의 알 수 없는 변수(형상 모수):
함께 표시된 그림은 이 두 용액을 (초과 첨도 표본)와 (초과 왜도 표본)의 수평 축이 있는 공간의 표면으로, 형상 모수를 수직 축으로 나타낸다. 표면은 위의 방정식에서 명시한 대로 표본 초과 첨도가 표본의 제곱 왜도에 의해 제한되어야 하는 조건에 의해 구속된다. 두 표면은 0 왜도로 정의된 오른쪽 가장자리에서 만난다. 이 오른쪽 가장자리를 따라 α = β < 1, α = β = 1, α = β = 1, 1 < α = β < 2의 경우 거꾸로-U 모양, α = β > 2의 경우 종 모양이다. 표면은 또한 "불가능한 경계" 선으로 정의된 전면(하단) 가장자리에서도 만난다(과다 + 2 - 왜도2 = 0). 이 전면(하단) 경계를 따라 두 형상 매개변수가 모두 0에 근접하며 확률밀도는 다른 쪽 끝(사이에 실질적으로 아무것도 없는 상태)보다 한 쪽 끝에 더 집중되며, 끝 x = 0과= +에 확률 p= + p}}}}}}}}}}}}}}}}}}}}}}}}{\}}}}}}}}}}}}}}}}}}tfrac +\오른쪽끝 x = 1. 두 표면은 뒤쪽 가장자리를 향해 더 멀리 떨어져 있다. 이 후면 가장자리에서는 표면 매개변수가 서로 상당히 다르다. 줄의 동네에서 예를 들어, 보우만과 Shenton,[46]에 의해 언급되어 샘플링(샘플 과도한 첨도:-(3/2)(샘플 비대칭도)2)0)(뒤쪽 가장자리의 파란 색 베이지 색을 충족하는just-J-shaped 부분),"위험할 정도로 혼란스럽진에 가깝다", 때문에 저 선이 분모의 표현 위의 추정 ν)α+β이 0.한d 그러므로 ν은 그 선이 가까워질수록 무한에 접근한다. Bowman과 Shenton은 "더 높은 모멘트 매개변수(카르트증 및 왜도)는 (그 선 근처) 매우 연약하다"고 썼다. 하지만 평균과 표준 편차는 상당히 신뢰할 수 있다고 말했다. 따라서 문제는 과도한 첨도가 왜도 제곱의 3/2에 근접하는 매우 치우친 분포에 대한 네 가지 모수 추정의 경우에 대한 것이다. 이 경계선은 모수 중 하나의 값이 매우 크고 다른 모수의 값이 매우 작은 극단적으로 치우친 분포에 의해 생성된다. 숫자 예제와 이 후방 가장자리 경계선에 대한 추가 설명(샘플 초과 첨도 - (3/2)(샘플 왜도)2 = 0))은 "왜도의 제곱으로 경계된 충치" 섹션을 참조하십시오. Karl Pearson 본인에 의해 언급되었듯이, 이 문제는 실제적으로 크게 일어날 것 같지 않은 형상 모수의 매우 다른 값을 가진 매우 치우친 J자형(또는 거울-이미지 J자형) 분포에서만 발생하기 때문에 그다지 실제적으로 중요하지 않을 수 있다. 실제로 발생하는 일반적인 기울어진 종 모양 분포는 이러한 모수 추정 문제를 가지고 있지 않다.
나머지 두 파라미터 는 다양한 방정식을 사용하여 표본 평균과 표본 분산을 사용하여 결정할 수 있다.[1][44] 한 가지 대안은 표본 분산과 표본 첨도를 기준으로 지원 간격 범위- ) 를 계산하는 것이다. 이를 위해 범위- ^표본 분산 측면에서 과도한 첨도를 표현하는 방정식, 표본 크기 ν("쿠르토시스" 및 "대체 파라메트리제이션, 4개 파라미터" 참조)을 해결할 수 있다.
다음을 얻으려면:
또 다른 대안은 표본 분산과 표본 왜도를 기준으로 지원 구간 범위- ) 를 계산하는 것이다.[44] 이를 위해 범위- c의 관점에서, 표본 분산 측면에서 왜도 제곱을 표현하는 방정식, 표본 크기 ν("Skewness" 및 "대체 파라메트리조화, 4개 파라미터" 참조)을 해결할 수 있다.
나머지 파라미터는 샘플 평균과 이전에 획득한 파라미터로 확인할 수 있다 (- a) , ^, = +^
그리고 마지막으로 =( - )+
위의 공식에서 예를 들어 샘플 모멘트의 추정치로서 다음과 같은 것을 취할 수 있다.
검체 왜도 추정기 G와1검체 첨도에 대한 G는2DAP/SAS,PSPP/SPSS 및 Excel에서 사용한다. 그러나 BDP에서는 사용하지 않으며 ( ) 1998년에는 Minitab에서 사용하지 않았다. 사실, Joanes과 처녀들은 1998년 study[48]에서 뒤틀림과 첨 estimators BMDP과 MINITAB(그 당시)에서 사용되고 정상적인 샘플에서 오류 mean-squared 작은 차이는 했지만, 비뚤어짐과 첨 estimators DAP/SAS, PSPP/SPSS, 즉 G1과 G2에 사용되는 아주에서 샘플에서 작은 mean-squared의 오류를 발견했고 결론을 내렸다.스큐에드 분배 왜도와 첨도에 대한 최선의 추정기는 왜도의 양(Joanes와 Gill이 나타낸 것처럼[48])에 따라 달라지기 때문에 사용자가 당면한 문제에 따라 최선의 추정기를 선택해야 함을 명시하기 위해 위의 공식에 "샘플 왜도" 등을 명시하는 것이 이러한 이유 때문이다.
최대우도
알 수 없는 파라미터 2개
베타 분포 최대값(α = β = 2)의 최대값(공동 로그 우도/N)
베타 분포 최대값(α = β ∈)에 대한 최대값(공동 로그우도/N) {0.25,0.5,1,2,4,6,8}
감마 분포에 대한 최대우도 추정의 경우에도 그렇듯이 베타 분포의 최대우도 추정치는 형상 모수의 임의 값에 대한 일반적인 폐쇄형 폼 솔루션을 가지고 있지 않다. X1, ..., X가N 각각 베타 분포를 갖는 독립 랜덤 변수인 경우, Niid 관측치에 대한 공동 로그우도 함수는 다음과 같다.
형상 모수에 대한 최대값을 찾으려면 형상 모수에 대한 부분파생성을 취하고 형상 모수의 최대우도 추정기를 0으로 설정하는 식을 포함한다.
또는 최대 음의 곡률 조건도 기하학적 평균G와XG의(1−X) 다음과 같은 로그파생물이 양성이라는 것을 명시하는 것과 동등하다.
이러한 경사는 실제로 양성이지만 다른 경사는 음성이 된다.
α 및 β에 대한 평균과 중위수의 기울기는 유사한 부호 동작을 나타낸다.
형상 모수에 관한 부분파생물이 최대 0인 조건에서, 형상 모수 추정치 ,]를 얻기 위해 반전되어야 하는 결합 최대우도 추정 방정식의 다음 시스템(평균 로그 우도)을 얻는다.표본 X1, ..., X:[1]의N (알려진) 로그 평균을 기준으로
where we recognize as the logarithm of the sample geometric mean and as the logarithm of the sample geometric mean based on (1 − X), the mirror-image of X. =에 따라 달라진다
형상 모수 추정치의 digamma 함수를 포함하는 이러한 결합 방정식은 , {\alpha }}},{\{\beta}}}}}과 같은 수치 방법으로 해결해야 한다. 예를 들어 벡만 외 연구진은 다음과 같다.[49] Gnanadesikan 등에서는 몇 가지 사례에 대해 수치적 해결책을 제시한다.[50]N.L.존슨과 S.Kotz[1]이"너무 작은"몸매를 위해 매개 변수 예측β ^{\displaystyle{\hat{\alpha}},{\hat{\beta}}}^ α, digamma 기능을 위해 대수 근사(^α)ψ ≈ ln (α ^ − 12){\displaystyle \psi({\hat{\alpha}})\approx \ln({\hat{\alpha}}-{\tfrac{1}{2}})} 수 있다고 한다. 를 사용한다d 이 근사치에서 도출된 방정식은 정확하게 해결될 수 있기 때문에 반복용액의 초기 값을 구한다.
반복 용액의 초기 값(표본 기하 평균에 대한 추정 형상 모수)에 대한 다음과 같은 용액으로 이어진다.
또는 모멘트 방법에 의해 제공된 추정치는 대신 디감마 함수의 관점에서 최대우도 결합 방정식의 반복적 해법에 대한 초기 값으로 사용할 수 있다.
랜덤 변수 X를 사용하는 [0, 1] 이외의 알려진 간격에 걸쳐 분포가 필요한 경우, [a, c]를 랜덤 변수 Y로 말한 다음 첫 번째 방정식에서 ln(Xi)를 로 대체한다.
그리고 두 번째 방정식의 ln(1-Xi)을 다음으로 교체한다.
(아래 "대체 매개변수, 4개의 매개변수" 섹션을 참조하십시오.)
형상 모수 중 하나를 알면 문제가 상당히 단순해진다. 다음과 같은 로짓 변환을 사용하여 알 수 없는 형상 매개변수를 해결할 수 있다( 그렇지 않으면 대칭인 경우 -eq 매개변수 두 개를 모두 알 수 있다).
이 로짓 변환은 변수 X를 거울-이미지(1 - X)로 나눈 변환의 로그로, 그 결과 "반전 베타 분포" 또는 베타 프라임 분포(두 번째 종류 또는 Pearson의 타입 VI의 베타 분포라고도 함)가 지원 [0, +197]로 되어 있다. 존슨이 연구한로짓 변환 ln - X 에서 앞서 논했듯이, 로짓 변환 X 1 - X {\displaystyle \ln {\frac {X}{1-X}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}은(원 변수 X에 기초한 유한 지지선을 실선의 양방향으로 확장하여 실선 양방향으로 무한 지원 범위를 확장한다.[28]
예를 들어 이(가) 알려진 경우, 알 수 없는 파라미터 {\을(를) 이 방정식의 우측에 있는[51] 역디감마 함수의 관점에서 얻을 수 있다.
In particular, if one of the shape parameters has a value of unity, for example for (the power function distribution with bounded support [0,1]), using the identity ψ(x + 1) = ψ(x) + 1/x in the equation {\X 알 수 없는 파라미터 {\의 최대우도 추정기는 [1]정확히 다음과 같다.
The beta has support [0, 1], therefore , and hence , and therefore
결론적으로 베타 분포의 형상 모수에 대한 최대우도 추정치는 (일반적으로) 표본 기하학적 평균과 (1-X)에 기초한 표본 기하학적 평균의 복잡한 함수로서 X의 거울-이미지 이다. 모멘트 방법으로 두 형상 모수를 추정하기 위해 분산(평균에 더하여)이 필요한 경우, 기하학적 평균만으로 충분할 수 있는 최대우도법으로 두 형상 모수를 추정하기 위해 (로직 또는 기하학적) 분산이 필요하지 않은 이유는 무엇인가? 답은 평균이 기하학적 평균만큼 많은 정보를 제공하지 않기 때문이다. 형상 모수 α = β가 같은 베타 분포의 경우, 평균은 형상 모수의 값에 관계없이 정확히 1/2이므로 통계적 분산(분산)의 값과 무관하다. 한편, 형상 모수 α = β가 같은 베타 분포의 기하학적 평균은 형상 모수의 값에 따라 달라지며, 따라서 더 많은 정보를 포함하고 있다. 또한 베타 분포의 기하학적 평균은 평균에 의해 충족되는 대칭 조건을 만족시키지 못하므로 (1 - X에 근거한 기하학적 평균과 기하학적 평균을 모두 사용함으로써 최대우도법은 분산을 채택할 필요 없이 두 모수 α = β에 대한 최선의 추정치를 제공할 수 있다.
Niid 관측치당 공동 로그 우도를 다음과 같이 충분한 통계량(표본 기하학적 평균)으로 표현할 수 있다.
형상 모수 α와 β의 함수로서 우도 함수의 동작을 보기 위해 표본 기하 평균의 고정 값에 대한 N 관측치당 관절 로그 우도를 표시할 수 있다. 이러한 그래프에서 형상 모수 추정기 은 우도 함수의 최대값에 해당한다. 모든 우도 함수가 α = β = 1에서 교차한다는 것을 보여주는 동봉 그래프를 참조하십시오. 이는 최대 엔트로피를 제공하는 형상 모수의 값에 해당된다(단일성과 동일한 형상 모수에 최대 엔트로피가 발생한다: 균일 분포). 그림에서 우도 함수가 0에 가까운 형상 모수 추정기의 값에 대해 날카로운 피크를 제공하지만 형상 모수 추정기의 값이 1보다 크면 우도 함수는 정의되지 않은 피크로 상당히 평평해진다. 분명히 베타 분포의 최대우도 모수 추정 방법은 형상 모수 추정기의 값에 따라 피크 정의의 불확실성이 증가함에 따라 형상 모수 추정기의 큰 값에 대해 덜 허용된다. 우도함수의 곡면성에 대한 식이 기하학적 분산이라는 것을 알아채면 같은 결론에 도달할 수 있다.
이러한 분산(따라서 곡선)은 형상 모수 α와 β의 작은 값에 비해 훨씬 크다. 그러나 형상 모수 값 α, β > 1의 경우 분산(따라서 곡선)이 평평해진다. 마찬가지로, 이 결과는 Cramér-Rao 경계에서 따르며, 베타 분포에 대한 피셔 정보 매트릭스 성분은 이러한 로그 분산이기 때문이다. Cramér-Rao 경계에는 의편향되지 않은 추정기 α^ {\displaystyle 의 분산은 피셔 정보의 역수에 의해 제한된다고 명시되어 있다.
따라서 대수 분산이 감소함에 따라 추정기의 분산이 α 및 β 증가함에 따라 증가한다.
또한 다음과 같이 표본 기하 평균의 로그에 대한 digamma 함수 식 측면에서 Niid 관측치당 공동 로그 우도를 표현할 수 있다.
이 표현식은 교차 엔트로피의 음과 동일하다("정보(엔트로피)"의 섹션 참조). 따라서 형상 모수의 최대 합선 로그우도(Niid 관측치당)를 찾는 것은 형상 모수의 함수로서 베타 분포에 대한 교차 엔트로피의 최소값을 찾는 것과 동일하다.
다음과 같이 정의된 교차 엔트로피:
알 수 없는 4개의 매개 변수
이 절차는 알려지지 않은 두 파라미터 사례에서 뒤따르는 절차와 유사하다. Y1, ..., Y가N 각각 4개의 모수를 갖는 베타 분포를 갖는 독립 랜덤 변수인 경우, Niid 관측치에 대한 공동 로그우도 함수는 다음과 같다.
형상 모수에 대한 최대값을 찾으려면 형상 모수에 대한 부분파생성을 취하고 형상 모수의 최대우도 추정기를 0으로 설정하는 식을 포함한다.
방정식은 4개의 매개변수 , , mat{\mat{\에 대한 최대우도 추정치 측면에서 4개의 결합된 방정식의 다음 계통(첫 번째 두 번째 방정식은 기하학적 평균이고 두 번째 방정식은 조화 평균이다)으로 다시 배열할 수 있다.:
표본 기하 평균을 사용하여:
매개변수 은(는) 비선형 방식으로 기하학적 평균 식 안에 내장되어 있다(전원 1/N). 이는 일반적으로 반복 목적의 초기 값 근사치에 대해서도 폐쇄형 폼 솔루션을 배제한다. 한 가지 대안은 네 가지 매개변수 사례에 대한 모멘트 해결 방법에서 얻은 값을 반복을 위한 초기 값으로 사용하는 것이다. 또한 고조파 평균에 대한 표현은 ^ ,> 1 에 대해서만 잘 정의되어 있어, 4-모수 사례에서 형상 모수에 대한 최대우도 해법은 제외된다 4개의 매개변수 사례에 대한 Fisher의 정보 매트릭스는 α, β > 2에 대해서만 양-확정성이며(자세한 내용은 Fisher 정보 매트릭스에 대한 섹션, 4개의 매개변수 사례 참조), 종 모양(대칭 또는 비대칭) 베타 분포에 대한 변곡점이 모드의 양쪽에 위치한다. 다음 Fisher 정보 구성요소(로그우도 함수의 곡면성에 대한 기대를 나타냄)는 다음 값에서 특이치를 가진다.
(자세한 내용은 Fisher 정보 매트릭스 섹션을 참조하십시오.) 따라서 4-모수 베타 분포 계열에 속하는 일부 잘 알려진 분포에 대해 균등 분포(1, 1, a, c) 및 아크사인 분포(1/2, 1/2, a, c)와 같이 최대우도 추정치를 엄격하게 수행할 수 없다. N.L.존슨과 S.Kotz[1]고 만약과 c는 알려지지 않은 것 말고"다고 말하고 c, α과 β의 최대 가능성 estimators 필요한 조화 방법에 대해서는 방정식을 무시한다면 위 절차(그 두마리의 알려지지 않은 매개 변수인 경우에, X로 X로)(Y는 −를)(c는 −))와 c의 재판 값의 연속 사용에 대한 쌍(, c) 때까지 반복할 수 있다.which 최대우도(a와 c를 주어진 경우)는 가능한 한 크며, 달성된다."(여기서는 명확성을 위해 매개변수에 대한 표기법이 현재 표기법으로 번역되었다).
Fisher 정보 매트릭스
랜덤 변수 X에 확률 밀도 f(x;α)를 갖도록 한다. 로그우도함수의 (알 수 없고 추정될) 매개변수 α에 관한 부분파생물을 점수라고 한다. 점수의 두 번째 순간을 피셔 정보라고 부른다.
점수에 대한 기대치가 0이므로 피셔 정보도 점수의 평균을 중심으로 한 두 번째 순간, 즉 점수의 분산이다.
로그우도함수가 매개변수 α에 대하여 그리고 특정 규칙성 조건 하에서 2배 차이가 나는 경우 피셔 정보도 다음과 같이 작성할 수 있다([52]계산 목적에 더 편리한 형태인 경우가 많다).
따라서 피셔 정보는 로그우도함수의 매개변수 α에 대한 두 번째 파생상품의 기대치에 대한 음수다. 따라서 피셔 정보는 α의 로그우도함수의 곡면성을 측정하는 척도다. 낮은 곡률(따라서 곡률 반경이 높음), 평탄한 로그우도 함수 곡선은 Fisher 정보가 낮은 반면 곡률이 큰 로그우도 함수 곡선(따라서 곡률 반경이 낮음)은 Fisher 정보가 높다. 피셔 정보 매트릭스가 매개변수 평가("관측된 피셔 정보 매트릭스")에서 계산되는 경우, 이는 2차 항까지 측정한 테일러의 시리즈 근사치로 참 로그우도 표면을 대체하는 것과 같다.[53] 피셔 정보의 맥락에서 단어 정보는 매개변수에 대한 정보를 참조한다. 추정기 분산 특성, 추정치, 충분성 및 추정기 분산 특성 등의 정보 Cramér-Rao 바운트는 피셔 정보의 역행은 매개변수 α의 추정기 분산에 대한 하한선이라고 명시한다.
매개변수 α의 추정기를 추정할 수 있는 정밀도는 로그우도함수의 Fisher Information에 의해 제한된다. 피셔 정보는 분포의 모수를 추정하는 데 수반되는 최소 오차의 척도로, 모수의 두 대립 가설을 구별하는 데 필요한 실험의 해결력의 척도로 볼 수 있다.[54]
N개의 매개변수가 있는 경우
그런 다음 피셔 정보는 N×N양수 세미데마인대칭 행렬인 Fisher Information Matrix의 형태를 취하며, 대표적인 요소는 다음과 같다.
특정한 규칙성 조건 하에서 [52]피셔 정보 매트릭스도 다음과 같은 형태로 작성될 수 있으며, 이는 종종 계산에 더 편리하다.
X1, ..., XNiid 랜덤 변수를 사용하여 X, ..., XN. Costa 및 Cover[55]면으로1 N차원 "상자"를 구성할 수 있는 반면, (Shannon) 차동 엔트로피 h(X)는 일반적인 세트의 부피와 관련이 있다는 것을 보여준다(표본 엔트로피를 실제 엔트로피에 가깝게 함).
두 개의 매개변수
형상 모수 α 및 β로 파라메타된 베타 분포 파라미터를 갖는 X1, ..., XN 독립 랜덤 변수의 경우 Niid 관측치에 대한 공동 로그우도 함수는 다음과 같다.
두 매개변수 사례의 경우, 피셔 정보에는 대각선 2개와 비대각선 2개의 구성요소가 있다. 피셔 정보 매트릭스는 대칭적이기 때문에, 이러한 외부 대각선 구성요소 중 하나는 독립적이다. 따라서 피셔 정보 매트릭스는 3개의 독립적인 구성요소(대각선 2개와 1/대각선 1개)를 가지고 있다.
아리알과 나다라자는[56] 피셔의 정보 매트릭스를 4-모수 케이스에 대해 계산했는데, 여기서 두 매개변수 케이스를 다음과 같이 얻을 수 있다.
Fisher 정보 매트릭스가 대칭이기 때문에
피셔 정보 구성요소는 로그 기하학적 분산 및 로그 기하학적 공분산과 동일하다. 따라서, 그것들은 삼각함수로서 표현될 수 있으며, 다감마함수의 두 번째인 ψ1(α), 디감마함수의 파생형으로 정의된다.
또한 이러한 파생상품은 "모수 추정", "최대우도", "미지 두 개의 모수"라는 제목의 절에서 도출되며 로그우도함수의 그림도 이 절에 표시된다. "기하 분산과 공분산"이라는 제목의 섹션에는 형상 모수 α와 β의 함수로서 로그 기하학적 분산과 로그 기하학적 공분산 등 피셔 정보 매트릭스 성분에 대한 플롯과 추가 논의가 포함되어 있다. "기타 순간", "변환된 변수의 순간", "변환된 변수의 순간", "변환된 변수의 순간"이라는 제목의 섹션에는 로그로 변환된 변수의 순간들에 대한 공식이 포함되어 있다. Images for the Fisher information components and are shown in the section titled "Geometric variance".
피셔의 정보 매트릭스의 결정요인은 (예를 들어 제프리스의 사전 확률을 계산하기 위한) 관심사다. 피셔 정보 매트릭스의 개별 구성요소에 대한 식에서 베타 분포에 대한 피셔(대칭) 정보 매트릭스의 결정 요인은 다음과 같다.
실베스터의 기준(대각 원소가 모두 양의 것인지 확인)으로부터, 두 파라미터 사례에 대한 피셔 정보 매트릭스가 양의-확정성이라는 것을 따른다(형상 파라미터가 양의 α > 0과 β > 0이라는 표준 조건 하에서).
4개의 매개변수
α = β 대 범위(c - a) 및지수 α = β에 대한 Fisher Information I(a,a)
피셔 정보 α = β, 대 범위(c - a) 및 지수 α = β에 대한α,a
Y1, ..., Y가N 각각 지수 α와 β, 그리고 a(분포 범위의 최소치)와 c(분포 범위의 최대치)의 베타 분포를 갖는 독립 랜덤 변수인 경우("대체 파라메트리제이션", "4개 파라미터")는 확률 밀도 함수를 가지고 있다.
4개의 매개변수 사례에 대해, 피셔 정보는 4*4=16개의 구성요소를 가지고 있다. 12개의 비대각형 구성 요소 = (총 4×4 - 대각선 4개) 피셔 정보 매트릭스는 대칭적이기 때문에 이들 성분의 절반(12/2=6)은 독립적이다. 따라서 피셔 정보 매트릭스는 6개의 독립된 대각선 + 4개의 대각선 = 10개의 독립 구성요소를 가지고 있다. 아리알과 나다라자는[56] 네 가지 매개변수 사례에 대한 피셔의 정보 매트릭스를 다음과 같이 계산했다.
위의 식에서 식 var[ln(X)] = ln(varGX)에서 Y 대신X를 사용하는 것은 오류가 아니다. 로그 기하학적 분산과 로그 기하학적 공분산의 측면에서 표현된 것은 네 가지 매개변수 사례에서 지수(α, β)에 관한 부분파생물을 취했을 때 두 매개변수 사례와 동일한 표현식을 얻기 때문에 두 매개변수 X ~ 베타(α, β) 파라메트리제이션의 함수로서 발생한다. 4개의 매개변수 Fisher 정보 매트릭스는 분포 범위의 최소 a 및 최대 c와 독립적이다. 지수 α와 β에 관한 로그우도함수의 이중 분화에 대한 유일한 0이 아닌 항은 베타함수 로그의 두 번째 파생상품인 ln(B(α, β)이다. 이 항은 분포 범위의 최소 a와 최대 c와는 무관하다. 이 용어의 이중 분화는 삼각함수를 낳는다. "최대우도", "2개의 알 수 없는 매개변수" 및 "4개의 알 수 없는 매개변수"라는 제목의 섹션도 이러한 사실을 보여준다.
N.i.d. 표본에 대한 피셔 정보는 개별 피셔 정보의 N배(Eq. 11.279, 커버 및 토마스의[31] 394페이지)이다. (아얄과 나다라자는[56] 피셔 정보의 다음 성분을 계산하기 위해 단일 관측치 N = 1을 취하며, 이는 N 관측치당 로그 우도의 파생상품을 고려하는 것과 동일한 결과를 초래한다. 게다가의 잘못된 표현 아래, 아리알과 나다라야의 이(가) 수정되었다.)
매개변수 "a"(분포 범위의 최소값)에 대한 Fisher 정보 매트릭스의 두 가지 대각선 항목: ,및 파라미터 "c"(분포 범위의 최대값): , 은(는) 각각 지수 α > 2와 β > 2에 대해서만 정의된다. 피셔 정보 매트릭스 최소 "는 에서 2에 접근하는 지수 α에 대해 무한에 접근하고, 최대 "c"는 지수 β 승인락에 대해 무한에 접근하는 피셔 정보 매트릭스 , , c 위에서 힌지 2
4개의 매개변수 사례에 대한 Fisher 정보 매트릭스는 최소 "a"와 최대 "c"의 개별 값에 의존하지 않고 전체 범위(c-a)에만 의존한다. 더욱이 범위(c-a)에 의존하는 피셔 정보 매트릭스의 성분은 그 역(또는 역의 제곱)을 통해서만 의존하므로 피셔 정보는 증가 범위(c-a)에 따라 감소한다.
The accompanying images show the Fisher information components and . Images for the Fisher information components and 은(는) "기하 분산"이라는 제목의 절에 나와 있다. 이 모든 피셔 정보 구성요소는 분지의 "벽"이 매개변수의 낮은 값에 위치하여 분지처럼 보인다.
다음과 같은 4-모수-베타-분포 피셔 정보 구성요소는 2-모수: X-Beta(1-X) 변환비(1-X)/X에 대한 기대치와 그 거울 이미지(1-X)의 기대치(1-A)에 따라 크기가 조정되어 해석에 도움이 될 수 있다.
이것들은 또한 "인턴 베타 분포" 또는 베타 프라임 분포(두 번째 종류의 베타 분포 또는 Pearson의 타입 VI로도 알려져 있음)의 예상 값이며, 거울 이미지는 범위에 따라 크기가 조정된다(c - a).
또한 다음과 같은 Fisher 정보 구성요소는 다음과 같이 변환 변수(1-X)/X 비율에 기초한 분산(1-X) 또는 분산 단위로 표현할 수 있다.
이러한 기대치에 대해서는 "선형 변환, 제품 및 반전 랜덤 변수의 순간" 절을 참조하십시오.
피셔의 정보 매트릭스의 결정요인은 (예를 들어 제프리스의 사전 확률을 계산하기 위한) 관심사다. 개별 성분에 대한 식에서 4개의 매개변수를 갖는 베타 분포에 대한 피셔(대칭) 정보 매트릭스의 결정 요인은 다음과 같다.
실베스터의 기준(대각 원소가 모두 양성인지 확인)을 사용하며, 대각선 성분 I , 및 I , c 는 α=2와 β=2에 따라 4개의 파라미터 사례에 대한 피셔 정보 매트릭스가 된다. α>2 및 β>2에 대한 양성반응이다. α > 2와 β > 2의 베타 분포는 (대칭 또는 비대칭) 종 모양이기 때문에, 피셔 정보 매트릭스는 종 모양(대칭 또는 비대칭) 베타 분포에 대해서만 양의-확정성이며, 변곡점은 모드의 어느 한 쪽에 위치한다. Thus, important well known distributions belonging to the four-parameter beta distribution family, like the parabolic distribution (Beta(2,2,a,c)) and the uniform distribution (Beta(1,1,a,c)) have Fisher information components ( 4개 변수 사례에서 폭발(무한에 접근)하는 기능(피셔 정보 구성요소는 모두 두 개의 파라미터 사례에 대해 정의되어 있지만). 4-모수 위그너 세미크레 분포(3/2,3/2,a,c)와 아크사인 분포(1/2,1/2,a,c)는 4-모수 사례에 대한 피셔 정보 결정요인이 음수다.
t ( ,1) : 균일한 분포 확률 밀도는 Bayesian 추론에서 사전 확률의 무지를 나타내기 위해 Thomas Bayes에 의해 제안되었다. 그것은 완전한 무지의 상태를 기술하는 것이 아니라 적어도 하나의 성공과 하나의 실패를 관찰한 지식의 상태를 기술하고 있으며, 따라서 우리는 두 주 모두 물리적으로 가능하다는 사전 지식을 가지고 있다.
베타 분포를 베이시안 추론에서 사용하는 것은 이항 분포(버누이 포함)와 기하 분포에 대한 결합 사전 확률 분포의 계열을 제공하기 때문이다. 베타 분포의 도메인은 확률로 볼 수 있으며, 사실 베타 분포는 확률 값 p:[27]
베이지안 추론에서 이전 모수 값에 대한 무지를 나타내는 사전 확률로 사용되는 베타 분포의 예로는 베타(1,1), 베타(0,0), 베타(1/2,1/2)가 있다.
베타 분포의 고전적 적용은 18세기에 피에르 시몬 라플레이스가[57]일출 문제를 처리하는 과정에서 도입한 계승의 법칙이다. 조건부독립형 베르누이 시험에서 확률 p와 함께 성공했을 때, 다음 시험에서 기대값의 는s + + {\ 이 추정치는 bay가 제공한 p에 대한 후방 분포의 기대값, 즉 베타(s+1, n-s+1)라고 명시하고 있다es' 규칙은 p(예: 베타(1, 1)에 대해 동일한 사전 확률을 가정하고 p가 n 시험에서 성공했다고 관찰하는 경우에 적용된다. 라플레이스의 후계자 지배는 저명한 과학자들로부터 비판을 받아왔다. R. T. 콕스는 라플레이스가 일출문제(p. 89)[58]에 대한 계승규칙을 적용한 것을 "원칙의 적절한 사용에 대한 희롱"이라고 표현했다. 케임즈는 발언([59]상공 회의소XXX,p. 382)"참으로 이 그렇게 그것을 즐겁게 하기 위해 정리를 신임할 수 없는 것은 어리석은 짓이다."칼 Pearson[60]n재판에서 n성공 후 너무 낮은 가혹하고 받아들일 수 없는 같은 과학자들에 의해에 대한 표현으로 여겨져 왔다 확률이 다음(n+1)재판이 될 것이다 성공,,는 겨우 50%을 보여 주었다. 제안된 과학 법칙을 시험하기 위한 과학 실험 과정 제프리스 [61](p.18) (creding C. D. Broad[62] ) (creding C. D. Broad )의 라플레이스의 계승 규칙은 다음 재판에서 높은 성공 확률((n+1)/(n+2)을 설정하지만, 크기에 견줄 수 있는 추가 표본(n+1)이 동등하게 성공할 확률은 중간 정도(50%)에 불과하다. 퍼크스가 지적한 대로 "승계 규칙 자체는 받아들이기 어렵다.[63] 그것은 관측된 실제 주행이 평균 주행이므로 항상 평균 주행이 끝났다는 가정을 내포하는 다음 시행에 확률을 할당한다. 우리가 평균 주행의 중간에 있다고 가정하는 것이 더 합리적이라고 생각할 것이다. 두 확률 모두 합당한 신념에 부합하려면 분명히 더 높은 값이 필요하다." 라플레이스의 계승 규칙과 관련된 이러한 문제들은 할데인, 퍼크스, 제프리스 등이 다른 형태의 사전 확률을 찾도록 동기를 부여했다("베이지안 추론" 다음 절 참조). Jaynes에 따르면,[54] 승계 규칙의 주요 문제는 s=0 또는 s=n일 때 유효하지 않다는 것이다(승계 규칙의 유효성을 분석하려면 승계 규칙을 참조하라).
베이즈-라플라스 이전 확률(베타(1,1))
베타 분포는 베타(1,1)에 대한 최대 차분 엔트로피: 분포 영역의 모든 값이 동일한 밀도를 갖는 균일한 확률 밀도를 달성한다. 이 균일한 분포 베타(1,1)는 정확한 사전 분포에 대한 무지를 표현하기 위한 사전 확률 분포로 토마스 베이지스에[64] 의해 제안되었다. 이 사전 배포는 피에르-시몬 라플라스(Pierre-Simon Laplace)에 의해 채택되었다(분명히 그의 저술에서 의심의[57] 기미가 거의 없이). 따라서 20세기 전반의 출판물에서는 "바예스-라플라스 규칙" 또는 "반복 확률"의 "라플라스 규칙"으로도 알려져 있었다. 19세기 후반과 20세기 초반에 과학자들은 균일한 "동일한" 확률 밀도의 가정은 실제 함수(예를 들어 선형 또는 로그 척도가 가장 적절한지 여부)와 사용된 파라메트리제이션에 달려 있다는 것을 깨달았다. 특히, 유한 지지 분포의 끝 부분(예: x = 0에 대한 초기 지지 분포의 경우x = 0에 가까움)에 대한 동작은 특히 주의를 요했다. 케임즈는([59]상공 회의소XXX,p.는 381))로:만약 그것이 아무것도 보여 준다"따라서 경험, 통계 비율을 0과 통합의 그 지역 내 긍정적인 이론과 야의 아주 현저하게 말씀 드렸다시피, 있다는 것을 보여 주가 0과 1사이의 모든 값equiprobable 있든지 베이즈의 한결같은 사전 확률(베타(1,1)의 사용을 비난했다.0의 이웃에 있는 긍정적인 특성과 부정적인 이론과 단결 이웃에 있는 부정적인 특성의 상관관계. "
Haldane의 이전 확률(0,0)
t ( 0 ) : 사전 정보에 대한 완전한 무지를 나타내는 Haldane 사전 확률로, 실험이 성공인지 실패인지 물리적으로 가능한지조차 확신할 수 없다. 베타 분포는 α, β → 0으로, 모든 확률 밀도가 0과 1로 양 끝에 집중된 2점 베르누이 분포에 접근하며, 그 사이에는 아무 것도 없다. 동전토스: 동전의 한 면은 0이고 다른 면은 1이다.
베타(0,0) 분포는 J.B.S. Haldane에 의해 제안되었고,[65] Haldane은 완전한 불확실성을 나타내는 사전 확률은 p−1(1-p)에 비례해야 한다고 제안했다.−1p−1(1-p)−1 함수는 두 형상 모수가 모두 0: α, β → 0에 가까워짐에 따라 베타 분포의 분자의 한계로 볼 수 있다. 베타 함수(베타 분포의 분모에서)는 0, α, β → 0에 근접하는 두 파라미터에 대해 무한에 접근한다. 따라서 베타−1 함수로 나눈 p(1-p)−1는 0과 1의 각 끝에서 동일한 확률 1/2을 갖는 2점 베르누이 분포에 접근하며, 그 사이에 α, β → 0. 코인토스: 동전의 한 면은 0이고 다른 면은 1이다. Haldane 사전 확률 분포 베타(0,0)는 각 끝의 특이점으로 인해 통합(0부터 1)이 1로 엄격히 수렴되지 못하기 때문에 "이전보다 개선된" 것이다. 그러나 표본 크기가 매우 작지 않는 한, 이는 후확률을 계산하는 데 문제가 되지 않는다. 더욱이 젤너는[66]로그오드 척도에서 (로짓 변환 ln(p/1-p)) 이전의 할데인이 균일하게 평탄한 이전이라고 지적한다. 로짓이 변형된 변수 ln(p/1-p) (영역(-field, with)을 가진)의 균일한 사전 확률이 도메인[0, 1]의 Haldane에 해당한다는 사실은 해롤드 제프리스가 <확률론>(1939년) 초판(1939년)[61]에서 지적한 바 있다. Jeffreys는 "물론 우리가 베이즈-라플라스 지배를 극단으로 치닫게 한다면 우리는 누구의 사고 방식에도 부합하지 않는 결과를 초래할 것이다"라고 쓰고 있다. (Haldane) 규칙 dx/(1-x)는 반대로 지나친다. 표본이 일부 재산과 관련하여 하나의 유형인 경우 전체 모집단이 그러한 유형일 확률 1이 있다는 결론을 내릴 수 있을 것이다." "균일함"이 파라메트리제이션에 달려 있다는 사실은 제프리스가 다른 파라메트리제이션에 따라 불변할 이전의 형태를 찾도록 만들었다.
Jeffreys prior probability for the beta distribution: the square root of the determinant of Fisher's information matrix: 는 형상 모수 α, β의 삼각함수 function의1 함수다.
후향 베타 밀도 = "s", 실패 = s/(s + f)의 "f" = 1/2 및 s + f = {3,10,50}, 3개의 다른 이전 확률 함수에 기초한다. Haldane(0,0), Jeffreys(1/2,1/2)와 Bayes(1,1)가 있다. 이미지는 표본 크기가 50인 후방의 이전 값 사이에 거의 차이가 없음을 보여준다(p = 1/2 부근에 더 뚜렷한 피크가 있음). 매우 작은 표본 크기에 대한 유의한 차이(표본 크기에 대한 평탄한 분포 3)
후방 베타 밀도(시료 포함) = "s", 실패 = s/(s + f) = 1/4, s + f ∈ {3,10,50}의 세 가지 다른 이전 확률 함수에 기초함수: Haldane(0,0), Jeffreys(1/2,1/2)와 Bayes(1,1)가 있다. 이미지는 표본 크기가 50인 후방의 이전 값 사이에 거의 차이가 없음을 보여준다(p = 1/4 부근의 더 뚜렷한 피크가 있음). 매우 작은 표본 크기에 대해 유의한 차이가 나타난다(표본 크기의 퇴화된 경우에 대한 매우 치우친 분포 = 3, 이 변질되고 가능성이 낮은 경우 Haldane 이전의 경우 p = 1/4 대신 p = 0에 모드를 갖는 역 "J" 모양이 나타난다. 표본 데이터가 충분할 경우 베이즈(1,1), 제프리스(1/2,1/2) 및 홀데인(0,0)의 세 전위는 유사한 후확률 밀도를 산출해야 한다.
후방 베타 밀도 = s, 고장 = s/(s + f) = 1/4, 그리고 s + f ∈ {4,12,40}, 세 가지 다른 사전 확률 함수에 기초하여 s + f ∈ {4,12,40} Haldane(0,0), Jeffreys(1/2,1/2)와 Bayes(1,1)가 있다. 이미지는 표본 크기가 40인 후방의 이전 값 사이에 거의 차이가 없음을 보여준다(p = 1/4 부근의 더 뚜렷한 피크가 있음). 매우 작은 표본 크기에 대해 유의한 차이가 나타남
해롤드 제프리스는 정보[61][67] 매트릭스의 결정요인의 제곱근에 비례하는 재귀화에 따라 불변해야 하는 비정보적 사전 확률 측정을 사용할 것을 제안했다. 베르누이 분포의 경우, 이것은 다음과 같이 나타낼 수 있다: 확률 p ∈ [0, 1]의 "헤드"이고 확률 1 - p의 "꼬리"인 동전의 경우, 주어진 (H,T) ∈ {(0,1)의 경우, (1,0)} 확률은 p(1H - p)T이다. T = 1 - H이므로 베르누이 분포는 pH(1 - p)이다.1 − Hp를 유일한 파라미터로 간주하면, 베르누이 분포의 로그 우도는 다음과 같다.
따라서 피셔 정보 매트릭스는 오직 하나의 구성요소(매트릭스는 하나의 매개변수: p)만 있기 때문에 다음과 같다.
따라서 베르누이 및 이항 분포의 경우, 제프리스 이전 분포는 ( -p 에 비례하는데 이는 도메인 변수 x = p와 형상 매개변수 α = β = 1/2인 아크사인 분포에 비례한다.
제프리스에 대한 정규화 상수는 후확률에 대한 베이즈 정리에서 상수가 상쇄되기 때문에 최종 결과에는 중요하지 않다는 것을 다음 절에서 보여줄 것이다. 따라서 베타(1/2,1/2)는 베르누이와 이항 분포 모두에서 이전 제프리스로 사용된다. 다음 절에서 보듯이 이 식을 베이지스 정리에서 우도의 이전 확률 곱으로 사용할 때, 후방 확률은 베타 분포로 판명된다. 그러나 제프리스 이전은 베르누이와 이항 분포의 경우- p에 비례하지만 베타 분포에는 비례하지 않음을 깨닫는 것이 중요하다. 베타 분포 이전의 제프리스는 베타 분포에 대한 피셔 정보의 결정요인에 의해 주어지는데, 이것은 "피셔 정보 매트릭스"라는 절에 나타난 바와 같이 형상 모수 α와 β의 삼각함수 function의1 함수로서 다음과 같다.
앞에서 논의한 바와 같이, 베르누이와 이항 분포 이전의 제프리스는 아크신 분포 베타(1/2,1/2)에 비례하며, 베르누이와 이항 분포의 모수 p의 함수로서 분지처럼 보이는 1차원 곡선이다. 분지의 벽은 p가 끝 p → 0, p → 1의 특이점에 접근하여 형성되며, 여기서 베타(1/2,1/2)는 무한에 접근한다. 베타 분포 이전의 제프리스는 베타 분포의 형상 매개변수 α와 β의 함수로서 2차원 표면(3차원 공간에 내장)으로, 그 벽 중 2개만이 코너 α = β = 0(그리고 나머지 2개의 벽은 누락)에서 만나는 분지처럼 보인다. 이 2차원 표면의 인접한 두 벽은 형상 매개변수 α와 β가 α, β → 0에서 (삼각마 함수의) 특이점에 접근하여 형성된다. 이 경우 베타 분포에 대한 피셔의 정보 매트릭스의 결정요인이 0에 근접하기 때문에 α, β → ∞에 대한 벽이 없다.
제프리스 사전 확률은 Haldane과 Bayes의 사전 확률의 후측 확률 결과 사이에 중간인 후측 확률(이항우도 함수와 곱한 경우)이 나타난다는 것을 다음 절에서 확인할 것이다.
제프리스 이전의 경우는 분석적으로 얻기가 어려울 수 있으며, 어떤 경우에는 (삼각형 분포와 같은 단순한 분포 함수에 대해서도) 존재하지 않는다. 버거, 베르나르도, 선은 2009년 논문에서[68] 비대칭 삼각형 분포에 대해 (제프리스 이전과는 달리) 존재한다는 기준 사전 확률 분포를 정의했다. 이전 참조에 대한 폐쇄형 표현식을 얻을 수 없지만, 수치 계산에 따르면 이전 (속성)에 의해 거의 완벽하게 적합된다.
여기서 θ은 지지[0, 1]를 가진 비대칭 삼각형 분포의 정점 변수다(삼각형 분포에 관한 위키백과의 기사에서 정점 c = θ, 왼쪽 끝 a = 0, 오른쪽 끝 b = 1)에 대응한다. 버거 외 연구진도 베타(1/2,1/2)가 비대칭 삼각분포에 앞서 버거-베르나르도-썬의 정확한 참조가 될 수 있다는 경험적 논거를 제시한다. 따라서 베타(1/2,1/2)는 제프리스가 베르누이와 이항 분포에 앞서 있을 뿐만 아니라 비대칭 삼각 분포(이전에 제프리스가 존재하지 않는 경우)에 앞서 버거-베르나르도-썬 참조인 것처럼 보이며, 프로젝트 관리 및 프로의 비용과 기간을 설명하기 위해 PERT 분석에 사용되는 분포가 된다.일을 방해하다
Clarke와 Barron은[69] 지속적인 양의 이전 사례들 중에서 제프리스 이전(존재할 때)이 n 크기의 표본과 매개변수 사이의 섀넌의 상호 정보를 점증적으로 최대화하므로, 제프리스 이전이 가장 비정보적인 사전(샤논 정보로서의 정보 측정)이라는 것을 증명한다. 그 증거는 iid 랜덤 변수에 대한 확률 밀도 함수 사이의 Kullback-Leibler 차이 검사에 있다.
다른 이전 확률 선택이 후방 베타 분포에 미치는 영향
"n" 버눌리시험 n = s + f에서 성공과 f 실패를 초래하는 랜덤 변수 X의 모집단에서 표본을 추출한 경우, 주어진x = p(아래 표현식의 표기법 x = p)에 대한 우도함수는 도메인 x가 이항 분포에서 p 매개변수 값을 의미한다는 것을 강조할 것이다.n)은 다음과 같은 이항 분포다.
이전 확률 정보에 대한 믿음이 매개변수 α Pre 및 β Pre를 가진 베타 분포에 의해 합리적으로 잘 근사치되는 경우:
연속 사건 공간에 대한 베이지스의 정리에 따르면, 후방 확률은 이전 확률과 우도함수의 산물에 의해 주어지며(증거 s와 f = n - s를 감안) 정규화하여 곡선 아래의 영역이 다음과 같이 1과 같도록 한다.
분자와 후확률의 분모에 모두 나타나며, 통합 변수 x에 의존하지 않기 때문에 취소되며 최종 결과와 무관하다. 마찬가지로 이전 확률에 대한 정규화 계수 B(αPrior,βPrior)는 취소되며 최종 결과에는 중요하지 않다. 비정규화된 이전 버전을 사용하는 경우에도 동일한 후부 확률 결과를 얻을 수 있다.
왜냐하면 정상화 요인이 모두 사라지기 때문이다. 따라서 여러 저자들(제프리스 본인을 포함)은 정규화 상수가 취소되기 때문에 정규화되지 않은 사전 공식을 사용한다. 후확률의 분자는 결국 이전 확률과 우도함수의 (비정규화된) 산물에 불과하며, 분모는 0부터 1까지의 적분이다. 분모에 있는 베타 함수 B(s + αPrefer, n - s + β Pre)는 총 후방 확률을 단결에 통합하기 위한 정규화 상수로 나타난다.
총 시행 횟수에 대한 성공 횟수의 s/n 비율은 이항 사례에서 충분한 통계량이며, 이는 다음 결과와 관련이 있다.
베이지스의 이전 확률(베타(1,1))의 경우, 후방 확률은 다음과 같다.
Jeffreys의 이전 확률(1/2,1/2)의 경우, 후방 확률은 다음과 같다.
그리고 Haldane 사전 확률(0,0)의 경우, 후방 확률은 다음과 같다.
위의 표현에서 s/n = 1/2)에 대해 위의 세 가지 사전 확률은 모두 후방 확률 평균 = 모드 = 1/2에 대해 동일한 위치를 나타낸다는 것을 따른다. s/n < 1/2의 경우, 다음과 같은 전거를 사용한 후확률의 평균은 다음과 같다: 베이지스 이전 > 이전의 평균 제프리스 이전 > 이전의 평균 > Haldane 이전 평균이다. s/n > 1/2의 경우, Haldane 사전 확률이 가장 큰 후방 평균이 되도록 이러한 불평등의 순서가 역전된다. Haldane 선행 확률 베타(0,0)는 총 시행 횟수에 대한 성공 횟수의 비율 s/n과 동일한 평균("다음" 시험의 성공 확률에 대한 예상 값)을 가진 후방 확률 밀도를 초래한다. 따라서 Haldane 이전 실험에서는 다음 실험에서 예상되는 값을 최대 확률과 동일하게 하여 후방으로 확률을 산출한다. 베이지스 이전 확률 베타(1,1)는 s/n(최대우도)과 동일한 모드를 갖는 후방 확률 밀도를 초래한다.
100% 실험이 s = n에 성공한 경우, 베이지스 선행 확률 베타(1,1)는 승계 규칙(n + 1)/(n + 2)과 동일한 후행 기대값을, 홀데인 선행 베타(0,0)는 후행 기대값 1(다음 시험에서 절대 성공확률)을 얻는다. Jeffreys 이전 확률로 인해 (n + 1/2)/(n + 1)와 같은 후방 기대값이 발생한다. 특전사[63](303쪽)는 "이것은 새로운 계승 규칙을 제공하고, 취할 '합리적' 입장을 표현한다. 즉, n개의 성공이 깨지지 않은 후 우리는 평균 주행을 통해 약 반쪽이라는 가정, 즉 (2n + 2) 시험에서 한번의 실패를 예상한다는 가정과 동등한 다음 시험의 확률을 가정한다"고 지적한다. 베이즈-라플라스 규칙은 우리가 평균 주행의 거의 마지막에 있거나 (n + 2) 시험에서 한번의 실패를 예상한다는 것을 암시한다. 그 비교는 '합리성'의 관점에서 분명히 새로운 결과(현재 제프리스 이전이라고 불리는 것)를 선호한다."
반대로 100%의 실험에서 실패(s = 0)를 초래한 경우, 베이지스 선행 확률 베타(1,1)는 다음 시험의 성공에 대한 후방 기대치가 1/(n + 2)와 같고, 홀데인 선행 베타(0,0)는 다음 시험의 성공에 대한 후방 기대치가 0(절대 실패확률)으로 나타난다.e 다음 시험). Jeffreys의 선행 확률로 다음 시험의 성공에 대한 후방 기대값이 (1/2)/(n + 1)와 같으며, Perks[63](p. 303)는 "Bayes-Laplace 결과 1/(n + 2)보다 훨씬 합리적으로 멀리 떨어진 결과"라고 지적한다.
Jaynes[54] 질문(1,1) 통합이 수렴되지 않기 때문에 사례 s = 0 또는 s = n에 대해 이러한 공식을 사용한다(1,1)는 s = 0 또는 s = n에 대한 부적절한 선행이다. 실제로 베이지스의 양 끝 사이에 존재하는 모드에 필요한 조건 0(<s<n)은 대개 충족되며, 따라서 베이지스 이전(이하 0 < s < n))은 도메인의 양 끝 사이에 위치하는 후방 모드가 된다.
승계 규칙에 관한 섹션에서 언급했듯이, K. 피어슨은 n 시험에서 n번의 성공 후(Bayes Beta(1,1) 분포에 선행 확률로 Bayes Beta(1,1)의 다음 실험이 모두 성공할 확률은 정확히 1/2이며, 이전과 같이 Haldane Beta(0,0) 분포에 기초한다. 확률, 이 후방 확률은 1이다(n 실험에서 n번의 성공 후 다음 (n + 1) 실험은 모두 성공일 것이다). Perks[63](우편 303)로 n는 경향이 있다는, 현재는 제프리스로 사오신 알려진 것을 위해, 이 확률)...(2n+1/2)(2n+1), n=1,2,3은 15/24, 315/480, 9009/13440을 준다, 빠르게 1/2의 극한값이 다가오고=})((n+3/2)(n+2)0.70710678. 깨지{\displaystyle 1/{\sqrt{2}}=0.70710678\ldots((n+1/2)(n+1)것을 보여 준다.에서primity. Perks는 이전의 Jeffreys로 알려진 것이 "Bayes-Laplace 결과나 Haldane 대체 규칙에 대한 결과보다 확실히 더 '합리적'이라고 말하고 있다. 그것은 분명히 유도 과정과 훨씬 더 나은 대응력을 제공한다. 목적에 '절대적으로' 타당한지, 즉 아직 충분히 큰지, 단결에 이르는 부조리가 없는지는 다른 사람이 결정할 문제다. 그러나 그 결과는 샘플링 실험에 앞서 완전한 무관심과 지식의 부재를 가정하는 데 달려 있다는 것을 깨달아야 한다."
다음 세 가지 이전 확률 분포로 얻은 후분포의 분산은 다음과 같다.
베이지스의 이전 확률(베타(1,1))의 경우, 후분산은 다음과 같다.
Jeffreys의 이전 확률(1/2,1/2)의 경우, 후분산은 다음과 같다.
그리고 Haldane 사전 확률(0,0)의 경우, 후분산은 다음과 같다.
따라서 Silvey에서 언급한 바와 같이,[52] 큰 n의 경우 분산이 작고 따라서 후방 분포가 고도로 집중된 반면, 가정된 이전 분포는 매우 분산되었다. 이것은 막연한 사전 지식이 유익한 실험에 의해 (베이지스 정리를 통해) 보다 정확한 사후지식으로 변형되기 때문에, 사람들이 바라는 것과 일치한다. 소 n의 경우 Haldane Beta(0,0) 이전은 후분산이 가장 큰 반면 Bayes Beta(1,1) 이전은 후분산이 더 집중된다. Jeffreys 이전 베타(1/2,1/2)는 다른 두 개 사이의 후분산을 초래한다. n이 증가하면 분산이 급격히 감소하여 세 개의 이전 값에 대한 후방 분산이 모두 거의 동일한 값으로 수렴된다(n → ∞로 0 분산에 근접함). Haldane 선행 확률 베타(0,0)가 총 시행 횟수에 대한 성공 횟수의 비율 s/n과 동일한 평균("다음" 시험의 성공 확률에 대한 예상 값)으로 후행 확률 밀도를 나타낸다는 이전의 결과를 상기하면, 위의 표현에서도 Haldane 선행 확률의 비율을 따른다. 베타(0,0)는 최대우도 추정치 s/n 및 표본 크기("분산" 섹션)의 측면에서 표현된 분산과 동일한 분산을 갖는 후방으로 귀결된다.
평균 μ = s/n 및 표본 크기 ∆ = n.
베이시안 추론에서 이항 분포에 앞서 사전 분포 베타(αPrior,βPrior)를 사용하는 것은 실제 관측된 성공과 실패 횟수에 (αPrior - 1) "성공"의 사이비 관측과 (βPrior - 1) "실패"의 사이비 관측을 추가한 다음 pr에 의한 이항 분포의 모수 p를 추정하는 것과 같다.실제와 사이비 둘 다에 대한 성공 가능성 동일한 이전 베타(1,1)는 베타(1,1)의 경우 (αPrior - 1) = 0 및 (βPrior - 1) = 0을 따르므로 유사 관측을 추가 또는 빼지 않는다. Haldane prefer Beta(0,0)는 각각에서 하나의 사이비 관찰을 뺄 수 있고 Jeffreys prefer Beta(1/2,1/2)는 1/2의 사이비 관찰 성공과 동일한 실패 횟수를 뺄 수 있다. 이 뺄셈은 후분포를 부드럽게 하는 효과가 있다. 성공 비율이 50%(s/n β 1/2)의 αPrior 및 βPrior 값이 1보다 작을 경우(따라서 음수(αPrior - 1) 및 (βPrior - 1)는 첨사성을 선호하며, 즉, p 매개변수가 0 또는 1에 더 가까운 분포가 된다. 실제로 0과 1 사이의 αPrior와 βPrior 값은 함께 작동할 때 농도 파라미터로 기능한다.
함께 표시된 그림은 표본 크기 n n {3,10,50}, 성공 사례 ∈ {n/2,n/4} 및 베타(αPrior,βPrior) ∈ {Beta(0,0), 베타(1/2,1/2), 베타(1,1)에 대한 후방 확률 밀도 함수를 보여준다. 또한 n = {4,12,40}, 성공 s = {n/4} 및 베타(αPrior,βPrior) { {Beta(0,0), 베타(1/2,1/2)에 대한 사례, 베타(1,1)도 나와 있다. 첫 번째 그림에는 대칭 사례가 표시되며, 성공 사례의 경우 평균 = 모드 = 1/2인 경우 두 번째 그림은 치우친 사례의 경우 {n/4}을(를) 보여준다. 영상을 보면 표본 크기가 50인 후방의 전위(p = 1/2 부근의 더 뚜렷한 피크로 특징지어짐) 사이에는 거의 차이가 없다는 것을 알 수 있다. 매우 작은 표본 크기에 대해 유의한 차이가 나타난다(특히 표본 크기 = 3의 퇴화된 경우에 대한 평탄한 분포의 경우). 따라서 s = {n/4}의 성공이 있는 치우친 사례는 대칭 사례보다 작은 표본 크기에서 이전 선택에서 더 큰 효과를 나타낸다. 대칭 분포의 경우 베이즈 이전 베타(1,1)는 가장 "피크" 및 가장 높은 후방 분포를, 할데인 이전 베타(0,0)는 가장 평탄하고 가장 낮은 피크 분포를 나타낸다. 제프리스 이전의 베타(1/2,1/2)가 그들 사이에 놓여 있다. 거의 대칭 분포의 경우 너무 치우치지 않은 분포의 경우 이전 분포의 효과는 유사하다. 표본 크기가 매우 작은 경우(이 경우 표본 크기가 3인 경우)와 치우친 분포(이 예에서 s ∈ {n/4)의 경우, Haldane 이전 분포는 왼쪽 끝에 특이점이 있는 역 J자형 분포를 초래할 수 있다. 때문에 s주문의 단결보다 홀데인의 posterior에 앞선 모드를 끝 사이에 위치하고 있으며, 때문에 s)3/4이 아닌 정수 번호, 따라서 이항 distri의 초기 가정을 침해하는 것이어야 한다 그러나 이 타락한 경우 이 예에서(n=3=3/4<>만 있었고, 그래서가 어떻게 되, 1, 타락한 값에 있다.b우도에 대한 보상) 그리고 그것은 합리적인 표본 크기의 일반적인 경우에서 문제가 되지 않는다(예를 들어, 조건 1 < s < n - 1, 양 끝 사이에 존재하는 모드가 충족된다).
만약 사람이 둘 다 2진을 알면서도든지 베이즈(균일)전 Beta(1,1)적용된다 그의 책의 12장(우편 385)에서, Jaynes[54]은 홀데인 전 Beta(0,0)지식의 완전한 무지의 우리가 심지어 실험은 성공과 실패를 낳기 위해서는, 육체적이 가능한지 확신이 서지 못한 전 단계 설명합니다, 주장하고 있다.오s는 가능하다. Jaynes는 다음과 같이 말했다: "베이지-라플라스 (베타 (1,1))는 완전한 무지의 상태가 아니라, 우리가 하나의 성공과 하나의 실패를 관찰한 지식의 상태를 설명하는 것으로 해석한다...일단 적어도 한 번의 성공과 한 번의 실패를 보고 나면, 그 실험이 육체적 가능성의 의미에서 진정한 이진법이라는 것을 알게 된다." Jaynes[54]구체적으로. 이 부적절한,un-normalized에 181,423과 제인스 book[54]의 장 12일 말한다 대신에, 전에 그가 지금 제프리스의 i.로 알려진 것을 소개했다 전"1/p dp"제프리스 경이 그의 book,[61]7년이 지난 1939년 판에 소개된 제프리스"제프리스 전"의를 대신하여 서명함 전에 Beta(1/2,1/2)(Jaynes 논의를 논하지 않는다nvariant prior: 피셔의 정보 매트릭스 결정 인자의 제곱근. "1/p"는 제프리스(1946)의 기하급수적 분포이전에 불변한 것이며, 베르누이 또는 이항 분포에 대해서는 그렇지 않다. 그러나 제프리스 베타(1/2,1/2)가 할데인 베타(0,0)와 베이즈 베타(1,1) 사이의 지식 상태를 나타내는 것은 위의 논의에서 비롯된다.
마찬가지로 칼 피어슨은 1892년 저서 『과학의[70][71]문법』(19900년판 페이지 144)에서 "베야(1,1) 이전의 제복이 완전한 무지가 아니며, 사전 정보가 "우리의 무지를 균등하게 분배"할 정당화될 때 사용해야 한다"고 주장했다. K. 피어슨은 다음과 같이 썼다: "우리가 만든 것으로 보이는 유일한 가정은 이것이다: 자연, 일상, 아노미(그리스어 ααμία, 즉 a-"없음"과 노모 "법"은 똑같이 발생할 가능성이 있는 것으로 간주된다. 우리가 자연에 대해 가지고 있지 않은 지식을 포함하기 때문에, 이제 우리는 이런 가정조차 할 수 없었다. 우리는 일반적으로 동전의 체질과 작용에 대한 경험을 이용하여 머리와 꼬리가 똑같이 개연성이 있다고 주장하지만, 우리가 자연에 대해 아무것도 알지 못하듯이, 일상과 균열이 똑같이 개연성이 있다고 경험 전에 주장할 권리는 없다. 우리의 무지에서 우리는 자연이 모든 일상, 모든 평균(보통) 또는 어떤 비율로든 둘의 혼합으로 구성될 수 있고, 그러한 모든 것이 똑같이 개연성이 있다는 것을 경험 전에 고려해야 한다. 경험 후의 이러한 구성 중 어느 것이 가장 가능성이 높은지는 그 경험이 어떤 것이었는가에 따라 분명히 달라져야 한다."
표본 데이터가 충분하고 후확률 모드가 도메인의 극한(x=0 또는 x=1) 중 하나에 위치하지 않는 경우, 베이즈(1,1)와 제프리스(1/2,1/2) 및 할데인(0,0)의 세 전위는 유사한 후확률 밀도를 산출해야 한다. 그렇지 않으면, Gelman(알.[72](우편 65)지적," 그렇다면 몇 자료에 따르면 비정보적 사전 분포의 선택이 차이가 사용할 수 있으면 하나를 사전 분포에 관련 정보를 두어야 한다", 또는 Berger[10](페이지의 주 125)지적할 때 다른 합리적인 전과 현저히 다른 답을 비켜 주지만 금방음을 지적하기 위해서는해답이 하나 있을까? 이전의 믿음에 따라 결론이 나면서 과학적 불확실성이 존재한다는 것을 인정하는 편이 낫지 않을까."
웨이블렛은 0에서 시작하여 증가하다가 다시 0으로 감소하는 진폭을 가진 파동 같은 진동이다. 그것은 일반적으로 즉시 분해되는 "간첩 진동"으로 시각화할 수 있다. 웨이블렛은 오디오 신호와 이미지를 포함한 다양한 종류의 데이터에서 정보를 추출하는 데 사용될 수 있다. 따라서, 파도는 신호 처리에 유용한 특정 특성을 가지도록 의도적으로 제작된다. Wavelet은 시간과 주파수 양쪽에서 국부화되지만, 표준 Fourier 변환은 주파수에서만 국부화된다. 따라서 표준 푸리에 변환은 정지 공정에만 적용되는 반면, 파장은 정지하지 않은 공정에만 적용된다. 베타 분포를 기반으로 연속 파장을 구성할 수 있다. 베타 웨이블렛은[74] 모양 매개 변수 α와 β의 두 가지 형태로 미세 조정된 하르 웨이블렛의 부드러운 품종으로 볼 수 있다.
프로젝트 관리: 태스크 비용 및 일정 모델링
베타 분포는 최소값과 최대값으로 정의된 간격 내에서 발생하도록 제약된 이벤트를 모델링하는 데 사용될 수 있다. 이러한 이유로, 베타 분포는 삼각형 분포와 함께 PERT, 임계 경로 방법(CPM), 공동 비용 스케줄 모델링(JCSM) 및 기타 프로젝트 관리/제어 시스템에서 광범위하게 사용되어 완료 시간과 작업 비용을 설명한다. 프로젝트 관리에서는 베타 분포의 평균과 표준 편차를 추정하기 위해 속기 연산이 널리 사용된다.[40]
여기서 a는 최소값, c는 최대값, b는 가장 가능성이 높은 값(α > 1과 β > 1에 대한 모드)이다.
평균)=+ + c 은(는) PERT3점 추정으로 알려져 있으며, 다음 β 값 중 하나에 대해 정확하다(이 범위 내의 임의 α의 경우).
그렇지 않으면 베타 분포에 대한 다른 값인 α 및 β에 대한 낮은 근사치가 될 수 있으며, 평균에서 40%, 분산에서 549%의 평균 오차가 나타난다.[75][76][77]—Beamforming—Beamforming에 대한 애플리케이션은 패턴[78] 합성 형태에서 찾을 수 있고 적용할 수 있다.
계산 방법
베타 분산 랜덤 변수 생성
X와 Y가 독립적인 경우, ~( , ) 및~ ( , ) ,\을(\te)로 한다.
베타 변수를 생성하는 하나의 알고리즘은 X +Y 를 생성하는 것이다. 여기서 X는 매개변수를 가진 감마 변수(α, 1)이고 Y는 매개변수를 가진 독립 감마 변수(β, 1)이다.[79] 사실 여기서 X+ and are independent, and . If and is independent of and , then +\,\) X + + + {\Y}{X+}{X은(는) + 와 독립적임. This shows that the product of independent and random variables is a random variable.
또한, n 균등분포 변수의 k번째 순서 통계량은 n+ - k) 이므로, α와 β가 작은 정수라면 대안은 α + β - 1개의 균일한 변동을 생성하고 α-th 최소값을 선택하는 것이다.[41]
베타 분포를 생성하는 또 다른 방법은 Polya urn 모델에 의한 것이다. 이 방법에 따르면, α "검은색" 공과 β "흰색" 공으로 "단란"으로 시작하고 교체로 균일하게 그린다. 매번 시험할 때마다 마지막으로 그린 공의 색깔에 따라 공이 추가된다. 점증상으로는 베타 분포에 따라 흑백 공의 비율이 분포하게 되는데, 여기서 실험의 반복마다 다른 값을 산출하게 된다.
토마스든지 베이즈, 사후 출판된 종이[64], 1763년 에, 리처드 프라이스에 의해 출간한 그의 성공의 베르누이의 시행의 확률(이 기사에"응용 프로그램, 베이즈 추론"라는 제목의 보)의 밀도지만 종이 또는 그것의 prope에 대해서는 베타 분포의 순간들 분석하지 않는 베타 분포를 얻었다.rties
베타 분포에 대한 최초의 체계적인 현대적 논의는 아마도 수학 통계학의 규율을 확립한 공로를 인정받은 영국의 영향력 있는 수학자 칼 피어슨FRS[80](1857년 3월 27일~1936년[81] 4월 27일) 때문일 것이다.[82] Pearson의 논문에서[23][35] 베타 분포는 미분방정식의 솔루션으로서, 임의의 이동과 재스케일링을 제외하고 본질적으로 동일한 Pearson의 Type I 분포(베타 및 Pearson Type I 분포는 항상 적절한 매개변수 선택에 의해 균등화될 수 있다). 실제로 제2차 세계대전 전 몇 십 년 동안의 몇몇 영어책과 저널 기사에서는 베타 분포를 피어슨의 제1종 분포라고 부르는 것이 일반적이었다. 윌리엄 P.그의 1906년 논문에서 Elderton(1877–1962)"빈도 곡선과 상관 관계"[44]추가 분석은 피어슨의 형식은 베타 분포 순간들의 4변수 사건의 메서드의 토의 등 나는 유통,,(Elderton이라고 설명하는 것)을 U자형, J-shaped의 다이어그램을 삐었어 J-shaped,"cocked-hat"모양, horizonta.나는직선으로 된 사건들 엘더튼은 "나는 피어슨 교수에게 주로 빚을 지고 있지만, 그 빚은 형식적으로 감사를 표할 수 없는 종류의 것"이라고 썼다. 엘더튼은 1906년 자신의 모노그래프에서 베타 분포에 대한 인상적인 양의 정보를 제공하며, 여기에는 모드로 선택되는 분포의 원점에 대한 방정식과 다른 Pearson 분포: 타입 I ~ VII가 포함된다. 엘더튼은 베타 및 감마 함수에 대한 하나의 부록("II")을 포함하여 다수의 부록도 포함시켰다. 이후 판에서 엘더튼은 평균으로 선택한 분포의 원점에 대한 방정식과 피어슨 분포 8I를 통한 분석을 추가했다.
Bowman과 Shenton의 언급에 따르면, "피셔와 피어슨은 (매개변수) 추정에 대한 접근법에 있어서 특히 베타 분포의 경우 (피슨의) 모멘트 방법 및 (피셔의 최대우도법)과 관련하여 의견 차이가 있었다." 보우만과 선튼에 따르면 "제1형(베타 유통) 모델이 논란의 중심이 된 사례는 순전히 유행이었습니다. 로널드 피셔(Ronald Fisher, 1890년 2월 17일 ~ 1962년 7월 29일)는 20세기 전반 통계학의 거인 중 한 사람이었으며, 칼 피어슨과 오랫동안 지속되어온 대중적 갈등은 권위 있는 학술지에 실린 여러 기사에서 그 뒤를 따를 수 있다. 예를 들어,, 그리고 임의적으로 순간의 피어슨의 방법의 피셔의 비난, 피어슨의 기사"순간 법과 최대 가능성 법"[47](대학, 런던, 그의 위치 di에서 그의 은퇴 3년 이후에 발간되 보는 베타 분포를 위한 4개의 매개 변수의 평가에 관한.vi피어슨이 쓴 피셔와 피어슨의 아들 에곤 사이에서 내가 아는 한 피셔 교수의 방법 적용에 대해 현재 발표된 유일한 사례다. 놀랍게도 그 방법은 (Peerson) Method of Moments에 의해 빈도 곡선의 상수를 먼저 계산한 다음 그것에 대해 상수화하는데 달려 있다. 피셔는 "Method of Maximum Possibility"라는 용어에 의해 "Maximum Ubility"를 얻는데 더 가까운 근사치를 얻는다.
데이빗과 에드워즈의 통계[83] 역사에 관한 논문에서는 1911년 이탈리아 통계학자, 인구학자, 사회학자코라도지니가 지니계수를 개발한 덕분에 베타 분포를 표준화한 최초의 현대적 처리를 인용하고 있다.[84]N.L.존슨과 S.Kotz, 통계과학의 역사인물에 관한 포괄적이고 매우 유익한 모노그래프에서[85]Corrado Gini는[86] "Bayesian 초기...초기 베타 분포의 매개변수를 도출하는 문제를 다루면서 소위 경험적 베이즈 접근법의 출현을 예상한 기법을 선별했다."
^ Jump up to: abHahn, Gerald J.; Shapiro, S. (1994). Statistical Models in Engineering (Wiley Classics Library). Wiley-Interscience. ISBN978-0471040651.
^ Jump up to: abcdefghGupta (Editor), Arjun K. (2004). Handbook of Beta Distribution and Its Applications. CRC Press. ISBN978-0824753962.CS1 maint: 추가 텍스트: 작성자 목록(링크)
^ Jump up to: abcKruschke, John K. (2011). Doing Bayesian data analysis: A tutorial with R and BUGS. p. 83: Academic Press / Elsevier. ISBN978-0123814852.CS1 maint: 위치(링크)
^ Jump up to: abBerger, James O. (2010). Statistical Decision Theory and Bayesian Analysis (2nd ed.). Springer. ISBN978-1441930743.
^Kruschke, John K. (2015). Doing Bayesian Data Analysis: A Tutorial with R, JAGS and Stan. Academic Press / Elsevier. ISBN978-0-12-405888-0.
^Balding, David J.; Nichols, Richard A. (1995). "A method for quantifying differentiation between populations at multi-allelic loci and its implications for investigating identity and paternity". Genetica. Springer. 96 (1–2): 3–12. doi:10.1007/BF01441146. PMID7607457. S2CID30680826.
^Oguamanam, D.C.D.; Martin, H. R.; Huissoon, J. P. (1995). "On the application of the beta distribution to gear damage analysis". Applied Acoustics. 45 (3): 247–261. doi:10.1016/0003-682X(95)00001-P.
^A. C. G. 베르두고 라조와 P. N. 라티. IEEE Trans는 "연속 확률 분포의 엔트로피에 대하여"라고 말했다. Inf. 이론, IT-24:120–122, 1978.
^섀넌, 클로드 E, "수학적 의사소통 이론", 벨 시스템 기술 저널, 27:623–656,1948.PDF
^ Jump up to: abcCover, Thomas M. and Joy A. Thomas (2006). Elements of Information Theory 2nd Edition (Wiley Series in Telecommunications and Signal Processing). Wiley-Interscience; 2 edition. ISBN978-0471241959.
^헤레리아스-벨라스코, 호세 마누엘과 헤르레리아스-플레게주엘로, 라파엘과 레네 반 도프, 요한. PERT 평균 및 분산 재방문. European Journal of Operational Research(210), 페이지 448–451.
^ Jump up to: abMalcolm, D. G.; Roseboom, J. H.; Clark, C. E.; Fazar, W. (September–October 1958). "Application of a Technique for Research and Development Program Evaluation". Operations Research. 7 (5): 646–669. doi:10.1287/opre.7.5.646. ISSN0030-364X.
^ Jump up to: abcJoanes, D. N.; C. A. Gill (1998). "Comparing measures of sample skewness and kurtosis". The Statistician. 47 (Part 1): 183–189. doi:10.1111/1467-9884.00122.
^Beckman, R. J.; G. L. Tietjen (1978). "Maximum likelihood estimation for the beta distribution". Journal of Statistical Computation and Simulation. 7 (3–4): 253–258. doi:10.1080/00949657808810232.
^Gnanadesikan, R.,Pinkham and Hughes (1967). "Maximum likelihood estimation of the parameters of the beta distribution from smallest order statistics". Technometrics. 9 (4): 607–620. doi:10.2307/1266199. JSTOR1266199.
^Cox, Richard T. (1961). Algebra of Probable Inference. The Johns Hopkins University Press. ISBN978-0801869822.
^ Jump up to: abKeynes, John Maynard (2010) [1921]. A Treatise on Probability: The Connection Between Philosophy and the History of Science. Wildside Press. ISBN978-1434406965.
^Pearson, Karl (1907). "On the Influence of Past Experience on Future Expectation". Philosophical Magazine. 6 (13): 365–378.
^Broad, C. D. (October 1918). "On the relation between induction and probability". MIND, A Quarterly Review of Psychology and Philosophy. 27 (New Series) (108): 389–404. doi:10.1093/mind/XXVII.4.389. JSTOR2249035.
^K. 부캐넌, J. 젠슨, C. 플로레스 몰리나, S. 휠랜드와 G. H. 허프, IEEE 안테나 및 전파에 관한 거래, vol. 68, 7, 페이지 5353-5364, 2020년 7월, doi:10.1109/TAP.20.29788887의 "분산 어레이 및 공유 조리개 분포를 이용한 Null Beamstering".
^David, H. A. and A.W.F. Edwards (2001). Annotated Readings in the History of Statistics. Springer; 1 edition. ISBN978-0387988443.
^Gini, Corrado (1911). "Considerazioni Sulle Probabilità Posteriori e Applicazioni al Rapporto dei Sessi Nelle Nascite Umane". Studi Economico-Giuridici della Università de Cagliari. Anno III (reproduced in Metron 15, 133, 171, 1949): 5–41.
^Johnson (Editor), Norman L. and Samuel Kotz (1997). Leading Personalities in Statistical Sciences: From the Seventeenth Century to the Present (Wiley Series in Probability and Statistics. Wiley. ISBN978-0471163817.CS1 maint: 추가 텍스트: 작성자 목록(링크)