로짓

Logit
로그의 기반이 e인 0 ~ 1의 도메인에 있는 로짓(p) 그림.

통계에서 로짓(//lo (dʒɪt/LOH-jit) 함수는 표준 로지스틱 분포와 관련된 퀀텀 함수다. 데이터 분석과 머신러닝, 특히 데이터 변환에 많은 활용이 있다.

으로 로짓은 표준 로지스틱 함수 (x )= 1/( + - x) 의 역행이므로 로짓은 로짓으로 정의된다

.

이 때문에 로짓은 확률 p - 로그와 같기 때문에 log-odds라고도 불린다.[1] 따라서 로짓은 프로빗 함수와 유사한 [2]0, 의 확률 값을( -,+ 의 실제 숫자에 매핑하는 함수 유형이다.

정의

p확률이라면 p/(1 - p)는 해당 승산이 되고, 확률의 로짓은 오즈의 로그(즉, 승산의 로그)이다.

1보다 큰 한 이 글에서는 사용된 로그 함수의 기초는 별로 중요하지 않지만, base e가 있는 자연 로그는 가장 자주 사용되는 것이다. 베이스 선택은 값에 대한 로그 단위 선택과 일치한다. 베이스 2는 섀넌에 해당하고 베이스 e는 "nat"에 해당하며 베이스 10은 하틀리에 해당된다. 이러한 단위는 정보-이론적 해석에 특히 사용된다. 베이스의 각 선택에 대해 로짓 함수는 음과 양의 무한도 사이의 값을 취한다.

숫자 "로지스틱" 함수는 다음과 같은 역 로짓에 의해 주어진다.

두 확률의 로짓 간의 차이는 승산비(R)의 로그로, 따라서 다음과 같은 추가와 차감만으로 오즈비의 올바른 조합을 작성하는 속기를 제공한다.

역사

출력이 확률값인 도메인에 선형 회귀법을 적용하기 위한 여러 가지 노력이 있었는데 이 영역에서는 실제 숫자- ,+ )가 아니라 (, ) ( 1) {\displaystyle (0 1)} 그러한 노력은 많은 경우에 범위를 매핑하여 이 문제를 모델링하는 데 초점을 맞추었다 ~ (- , + ) 까지 이동한 다음 변환된 값에 대해 선형 회귀 분석을 실행하십시오. 1934년 체스터 잇트너 블리스는 이 매핑을 수행하기 위해 누적 정규 분포 함수를 사용했으며, 그의 모델을 "확률 단위"의 약어로 불렀다.[3] 그러나 이것은 계산적으로 더 비싸다. 1944년 조셉 벡슨은 승산 로그를 사용했고 프로빗의 비유에 따라 이 함수 로짓(Logit)을 "로직 단위"의 약어로 불렀다. 로그 오즈는 찰스 샌더스 피어스(19세기 말)에 의해 광범위하게 사용되었다.[4] 1949년 G. A. Barnard는 일반적으로 사용되는 용어 로그오드를 만들었다.[5] 사건의 로그오드는 사건 확률의 로짓이다.[6]

사용 및 속성

  • 로지스틱 회귀 분석의 로짓일반화된 선형 모델에서 연결 함수의 특별한 경우로서 베르누이 분포의 표준 연결 함수다.
  • 로짓 함수는 이항 엔트로피 함수파생상품의 음수다.
  • 로짓은 다른 분야 중에서도 심리적, 교육적 평가에 응용된 측정용 확률론적 라스치 모델의 중심이기도 하다.
  • 로짓 함수(즉 로지스틱 함수)를 expit 함수라고도 한다.[7]
  • 식물 질병 역학에서 로짓은 데이터를 로지스틱 모형에 맞추기 위해 사용된다. 곰퍼츠와 모노몰룰러 모델은 모두 리차드 가족 모델로 알려져 있다.
  • 확률의 로그-오드 함수는 작은 확률의 경우 수치적 이점 때문에 상태 추정 알고리즘에[8] 종종 사용된다. 매우 작은 부동소수점 수를 곱하는 대신 로그-odds 확률을 합쳐서 (log-odds) 관절 확률을 계산할 수 있다.[9][10]

프로빗과의 비교

Comparison of the logit function with a scaled probit (i.e. the inverse CDF of the normal distribution), comparing vs. , which makes the slopes the same at the y-origin.

로짓 함수(및 로짓 모델)와 밀접한 관계가 있는 것은 프로빗 함수프로빗 모델이다. 로짓프로빗은 모두 0과 1 사이의 도메인을 갖는 s자형 함수로서, 두 함수를 모두 정량 함수(즉, 확률 분포의 누적 분포 함수(CDF)의 반대)로 만든다. 사실 로짓로지스틱 분포정량적 함수인 반면, 프로빗은 정규 분포의 정량적 함수인 것이다. 프로빗 함수는 - ( ) ^{-1로 표시되며, 여기서where ( ) (x) 언급한 대로 정규 분포의 CDF이다.

오른쪽 그래프에서 보듯이 프로빗 함수의 크기를 조정할 때 로짓프로빗 함수는 매우 유사하므로 y = 0의 기울기가 로짓의 기울기와 일치한다. 그 결과 특정 애플리케이션(예: 베이시안 통계에서)의 경우 구현이 더 쉽기 때문에 로짓 모델 대신 프로빗 모델을 사용하기도 한다.

참고 항목

참조

  1. ^ "LOG ODDS RATIO". nist.gov.
  2. ^ "Logit/Probit" (PDF).
  3. ^ a b J. S. Cramer (2003). "The origins and development of the logit model" (PDF). Cambridge UP.
  4. ^ Stigler, Stephen M. (1986). The history of statistics : the measurement of uncertainty before 1900. Cambridge, Massachusetts: Belknap Press of Harvard University Press. ISBN 978-0-674-40340-6.
  5. ^ Hilbe, Joseph M. (2009), Logistic Regression Models, CRC Press, p. 3, ISBN 9781420075779.
  6. ^ Cramer, J. S. (2003), Logit Models from Economics and Other Fields, Cambridge University Press, p. 13, ISBN 9781139438193.
  7. ^ "Archived copy". Archived from the original on 2011-07-06. Retrieved 2011-02-18.CS1 maint: 제목으로 보관된 복사본(링크)
  8. ^ Thrun, Sebastian (2003). "Learning Occupancy Grid Maps with Forward Sensor Models". Autonomous Robots. 15 (2): 111–127. doi:10.1023/A:1025584807625. ISSN 0929-5593.
  9. ^ Styler, Alex (2012). "Statistical Techniques in Robotics" (PDF). p. 2. Retrieved 2017-01-26.
  10. ^ Dickmann, J.; Appenrodt, N.; Klappstein, J.; Bloecher, H. L.; Muntzinger, M.; Sailer, A.; Hahn, M.; Brenk, C. (2015-01-01). "Making Bertha See Even More: Radar Contribution". IEEE Access. 3: 1233–1247. doi:10.1109/ACCESS.2015.2454533. ISSN 2169-3536.

추가 읽기

  • Ashton, Winifred D. (1972). The Logit Transformation: with special reference to its uses in Bioassay. Griffin's Statistical Monographs & Courses. 32. Charles Griffin. ISBN 978-0-85264-212-2.