로짓 정규 분포
Logit-normal distribution 확률밀도함수 ![]() | |||
누적분포함수 ![]() | |||
표기법 | |||
---|---|---|---|
매개변수 | σ2 > 0 — 제곱 척도(실제), ㎕∈ R — 위치 | ||
지원 | x ∈ (0, 1) | ||
CDF | |||
평균 | 분석적 해결책 없음 | ||
중앙값 | |||
모드 | 분석적 해결책 없음 | ||
분산 | 분석적 해결책 없음 | ||
MGF | 분석적 해결책 없음 |
확률론에서 로짓-정규 분포는 로짓이 정규 분포를 갖는 랜덤 변수의 확률 분포다.Y가 정규 분포를 따르는 랜덤 변수이고 P가 표준 로지스틱 함수인 경우 X = P(Y)는 로지트 정규 분포를 가지며, 마찬가지로 X가 로지트(X)= 로그(X/(1-X)가 정규 분포를 따르는 경우 Y = 로지트(X)= 로그(X-X)가 정규 분포를 따른다.로지스틱 정규 분포라고도 하며,[1] 다항 로짓 버전(예:)[2][3][4][5]을 가리킨다.null
변수가 0과 1로 경계되고 0과 1의 값이 절대 발생하지 않는 비율인 경우 로짓 정규 분포를 따를 수 있다.null
특성화
확률밀도함수
로짓 정규 분포의 확률밀도함수(PDF)는 0 < x < 1에 대해 다음과 같다.
여기서 μ와 μ는 변수 로짓의 평균 및 표준 편차(정의상 변수의 로짓은 정규 분포)이다.null
μ 기호를 변경하여 얻은 밀도는 f(1-x;-μ, μ)와 같다는 점에서 대칭이며, 0.5의 반대쪽(0,1)으로 모드를 이동시킨다.null
순간
로짓 정규 분포의 순간에는 분석 솔루션이 없다.순간은 수치적 통합으로 추정할 수 있지만, , , σ 의 값이 끝점 0과 1에서 무한대로 분산되는 경우 수치적 통합은 엄두도 못 낼 수 있다.다른 방법은 로짓 정규 분포를 정규 랜덤 변수의 변환이라고 하는 관측치를 사용하는 것이다.This allows us to approximate the -th moment via the following quasi Monte Carlo estimate
여기서 은 (는) 표준 로지스틱 함수로서 ,, - 1 은 평균과 분산 를 갖는 정규 분포의 역 누적분포함수 입니다[clarification needed]
모드 또는 모드
밀도의 파생물이 0이면 모드 x의 위치는 다음 방정식을 만족한다.
매개변수의 일부 값에는 두 가지 해결책이 있다. 즉, 분포는 이원이다.null
다변량 일반화
로지스틱 정규 분포는 다변량 정규 분포의 로지스틱 변환을 통해 D차원 확률 벡터에 대한 로짓-정규 분포의 일반화다.[6][7][8]null
확률밀도함수
확률밀도함수는 다음과 같다.
여기서 - 은(는 x {\ \의 첫 번째(D-1) 성분 벡터를 나타내며, D 는 D차원 확률 벡터의 단순함을 나타낸다.This follows from applying the additive logistic transformation to map a multivariate normal random variable to the simplex:
고유한 역방향 매핑은 다음을 통해 제공된다.
- .
성분의 합이 1에 이르는 벡터 x의 경우다.s자형 원소가 있는 x의 경우, 즉, 다음과 같은 경우
우리는 가지고 있다.
여기서 인수의 로그와 분할은 요소별로 취해진다.변환의 Jacobian 행렬이 요소 x - x ) 과(와) 대각선이기 때문이다
통계분석에서 사용
로지스틱 정규 분포는 확률 벡터의 성분들 사이의 상관관계를 포착할 수 있다는 점에서 디리클레 분포에 대한 보다 유연한 대안이다.또한 데이터 벡터 구성요소의 로그 비율에 대한 질문에 대답할 수 있도록 함으로써 구성 데이터의 통계 분석을 단순화할 수 있는 잠재력을 가지고 있다.절대 성분 값보다는 비율에 관심을 갖는 경우가 많다.null
확률 심플렉스(probility simplex)는 경계가 있는 공간으로, 의 벡터에 일반적으로 적용되는 표준 기법을 덜 의미 있게 만든다.애치슨은 그러한 방법을 단순한 벡터에 직접 적용할 때 거짓 음성 상관관계의 문제를 설명했다.[7]그러나 적층 로지스틱 변환의 역방향으로 의 합성 데이터를 매핑하면 - 이러한 데이터 표현에 표준 기법을 적용할 수 있다.이 접근방식은 로지스틱 정규 분포의 사용을 정당화하므로 "단순함의 가우스"로 간주할 수 있다.null
디리클레 분포와의 관계
Dirichlet과 로지스틱 정규 분포는 모수의 선택에 있어 결코 정확히 같지 않다.그러나 애치슨은 Kullback-Leibler difference(KL)가 최소화되도록 로지스틱 정규의 디리클레를 근사화하는 방법을 설명했다.
이는 다음을 통해 최소화된다.
Dirichlet 분포의 모멘트 특성을 사용하여 digamma 및 trigamma 함수의 관점에서 솔루션을 작성할 수 있다.
This approximation is particularly accurate for large . In fact, one can show that for , we have that 화살표
참고 항목
- 베타 분포 및 Kumaraswamy 분포, 유사한 모양의 경계 구간에서의 기타 2-모수 분포
참조
- ^ J 애치슨과 SM 심."로지스틱-정규 분포:일부 재산과 용도."바이오메트리카, 1980년Google Scholar 링크
- ^ http://people.csail.mit.edu/tomasz/papers/huang_hln_tech_report_2006.pdf
- ^ 피터 호프, 2003년링크
- ^ "SpringerReference - Meteor". www.springerreference.com. Retrieved 18 April 2018.
- ^ "Log-normal and logistic-normal terminology - AI and Social Science – Brendan O'Connor". brenocon.com. Retrieved 18 April 2018.
- ^ Aitchison, J.; Shen, S. M. (1980). "Logistic-normal distributions: Some properties and uses". Biometrika. 67 (2): 261. doi:10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.
- ^ a b J. 애치슨"구성 데이터의 통계적 분석"통계 및 적용 확률에 대한 모노그래프, 채프먼 및 홀, 1986.책
- ^ Hinde, John (2011). "Logistic Normal Distribution". In Lovric, Miodrag (ed.). International Encyclopedia of Statistical Sciences. Springer. pp. 754–755. doi:10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5.
추가 읽기
- Frederic, P. & Lad, F.(2008) 대수 정규 분포의 두 모멘트.통계-시뮬레이션 및 계산에서의 통신.37: 1263-1269
- Mead, R. (1965). "A Generalised Logit-Normal Distribution". Biometrics. 21 (3): 721–732. doi:10.2307/2528553. JSTOR 2528553.