로짓 정규 분포

Logit-normal distribution
로짓 정규
확률밀도함수
Plot of the Logitnormal PDF
누적분포함수
Plot of the Logitnormal PDF
표기법
매개변수 σ2 > 0 — 제곱 척도(실제),
㎕∈ R — 위치
지원x ∈ (0, 1)
PDF
CDF
평균분석적 해결책 없음
중앙값
모드분석적 해결책 없음
분산분석적 해결책 없음
MGF분석적 해결책 없음

확률론에서 로짓-정규 분포로짓이 정규 분포를 갖는 랜덤 변수의 확률 분포다.Y가 정규 분포를 따르는 랜덤 변수이고 P가 표준 로지스틱 함수경우 X = P(Y)는 로지트 정규 분포를 가지며, 마찬가지X가 로지트(X)= 로그(X/(1-X)가 정규 분포를 따르는 경우 Y = 로지트(X)= 로그(X-X)가 정규 분포를 따른다.로지스틱 정규 분포라고도 하며,[1] 다항 로짓 버전(예:)[2][3][4][5]을 가리킨다.null

변수가 0과 1로 경계되고 0과 1의 값이 절대 발생하지 않는 비율인 경우 로짓 정규 분포를 따를 수 있다.null

특성화

확률밀도함수

로짓 정규 분포의 확률밀도함수(PDF)는 0 < x < 1에 대해 다음과 같다.

여기서 μμ는 변수 로짓평균표준 편차(정의상 변수의 로짓은 정규 분포)이다.null

μ 기호를 변경하여 얻은 밀도는 f(1-x;-μ, μ)와 같다는 점에서 대칭이며, 0.5의 반대쪽(0,1)으로 모드를 이동시킨다.null

μ(시설)와 μ(색상)의 다양한 조합에 대한 대수 정규 PDF 그림

순간

로짓 정규 분포의 순간에는 분석 솔루션이 없다.순간은 수치적 통합으로 추정할 수 있지만, , , σ 의 값이 끝점 0과 1에서 무한대로 분산되는 경우 수치적 통합은 엄두도 못 낼 수 있다.다른 방법은 로짓 정규 분포를 정규 랜덤 변수의 변환이라고 하는 관측치를 사용하는 것이다.This allows us to approximate the -th moment via the following quasi Monte Carlo estimate

여기서 (는) 표준 로지스틱 함수로서 ,, - 1 평균과 분산 를 갖는 정규 분포의 역 누적분포함수 입니다[clarification needed]

모드 또는 모드

밀도의 파생물이 0이면 모드 x의 위치는 다음 방정식을 만족한다.

매개변수의 일부 값에는 두 가지 해결책이 있다. 즉, 분포는 이원이다.null

다변량 일반화

로지스틱 정규 분포는 다변량 정규 분포의 로지스틱 변환을 통해 D차원 확률 벡터에 대한 로짓-정규 분포의 일반화다.[6][7][8]null

확률밀도함수

확률밀도함수는 다음과 같다.

여기서 - 은(는 x {\ \의 첫 번째(D-1) 성분 벡터를 나타내며, D 는 D차원 확률 벡터의 단순함을 나타낸다.This follows from applying the additive logistic transformation to map a multivariate normal random variable to the simplex:

로지스틱 변환 후 가우스 밀도 함수 및 해당 로지스틱 정규 밀도 함수.

고유한 역방향 매핑은 다음을 통해 제공된다.

.

성분의 합이 1에 이르는 벡터 x의 경우다.s자형 원소가 있는 x의 경우, 즉, 다음과 같은 경우

우리는 가지고 있다.

여기서 인수의 로그와 분할은 요소별로 취해진다.변환의 Jacobian 행렬이 요소 x - x ) 과(와) 대각선이기 때문이다

통계분석에서 사용

로지스틱 정규 분포는 확률 벡터의 성분들 사이의 상관관계를 포착할 수 있다는 점에서 디리클레 분포에 대한 보다 유연한 대안이다.또한 데이터 벡터 구성요소의 로그 비율에 대한 질문에 대답할 수 있도록 함으로써 구성 데이터의 통계 분석을 단순화할 수 있는 잠재력을 가지고 있다.절대 성분 값보다는 비율에 관심을 갖는 경우가 많다.null

확률 심플렉스(probility simplex)는 경계가 있는 공간으로, 의 벡터에 일반적으로 적용되는 표준 기법을 덜 의미 있게 만든다.애치슨은 그러한 방법을 단순한 벡터에 직접 적용할 때 거짓 음성 상관관계의 문제를 설명했다.[7]그러나 적층 로지스틱 변환의 역방향으로 의 합성 데이터를 매핑하면 - 이러한 데이터 표현에 표준 기법을 적용할 수 있다.이 접근방식은 로지스틱 정규 분포의 사용을 정당화하므로 "단순함의 가우스"로 간주할 수 있다.null

디리클레 분포와의 관계

디리클레 분포에 대한 로지스틱 정규 근사치

Dirichlet과 로지스틱 정규 분포는 모수의 선택에 있어 결코 정확히 같지 않다.그러나 애치슨은 Kullback-Leibler difference(KL)가 최소화되도록 로지스틱 정규의 디리클레를 근사화하는 방법을 설명했다.

이는 다음을 통해 최소화된다.

Dirichlet 분포의 모멘트 특성을 사용하여 digamma trigamma 함수의 관점에서 솔루션을 작성할 수 있다.

This approximation is particularly accurate for large . In fact, one can show that for , we have that 화살표

참고 항목

참조

  1. ^ J 애치슨과 SM 심."로지스틱-정규 분포:일부 재산과 용도."바이오메트리카, 1980년Google Scholar 링크
  2. ^ http://people.csail.mit.edu/tomasz/papers/huang_hln_tech_report_2006.pdf
  3. ^ 피터 호프, 2003년링크
  4. ^ "SpringerReference - Meteor". www.springerreference.com. Retrieved 18 April 2018.
  5. ^ "Log-normal and logistic-normal terminology - AI and Social Science – Brendan O'Connor". brenocon.com. Retrieved 18 April 2018.
  6. ^ Aitchison, J.; Shen, S. M. (1980). "Logistic-normal distributions: Some properties and uses". Biometrika. 67 (2): 261. doi:10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.
  7. ^ a b J. 애치슨"구성 데이터의 통계적 분석"통계 및 적용 확률에 대한 모노그래프, 채프먼 및 홀, 1986.
  8. ^ Hinde, John (2011). "Logistic Normal Distribution". In Lovric, Miodrag (ed.). International Encyclopedia of Statistical Sciences. Springer. pp. 754–755. doi:10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5.

추가 읽기

외부 링크