다항 프로빗
Multinomial probit다음에 대한 시리즈 일부 |
회귀분석 |
---|
모델 |
추정 |
배경 |
이 기사는 대체로 또는 전적으로 단일 출처에 의존한다. – · · · · (2015년 7월) |
통계학 및 계량학에서 다항 프로빗 모델은 종속 변수가 포함될 수 있는 몇 가지 가능한 범주가 있을 때 사용되는 프로빗 모델의 일반화다. 이와 같이 멀티클래스 분류의 한 가지 방법으로서 다항 로짓 모델에 대한 대안이다. 둘 이상의 독립 변수에 대해 상관 관계가 있는 이항 결과를 모형화하는 데 사용되는 다변량 프로빗 모델과 혼동해서는 안 된다.
일반사양서
크기 m의 범주형 분포에서 다방향 선택 결과에 대한 일련의 관측치i Y(i = 1...n)가 있다고 가정한다(가능한 선택이 있다). 각 관측치 Y는i k 관측치 x1,i, ..., x의 설명k,i 변수(독립 변수, 예측 변수, 형상 등이라고도 함)의 집합이다. 몇 가지 예:
- 관찰된 결과는 유사한 증상을 가진 희귀질환 집합에 대해 "A형, B형, C형, 질병이 없으며"일 수 있으며, 설명 변수는 관련성이 있다고 생각되는 환자의 특성(성, 인종, 연령, 혈압, 체질량지수, 다양한 증상의 유무 등)일 수 있다.
- 관측된 결과는 다원 선거에서 특정 정당이나 후보에 대한 사람들의 투표로, 설명 변수는 각 개인의 인구통계학적 특성(예: 성, 인종, 연령, 소득 등)이다.
다항 프로빗 모델은 관련 설명 변수를 고려할 때 관찰되지 않은 다방향 시험의 가능한 결과를 예측하는 데 사용할 수 있는 통계적 모델이다. 이 과정에서 모델은 서로 다른 결과에 대한 서로 다른 설명 변수의 상대적 영향을 설명하려고 시도한다.
형식적으로 결과 Y는i 범주적으로 분포된 데이터로 설명되며, 여기서 관측치 i에 대한 각 결과값 h는 관측치와 관련된 설명 변수의 값에 의해 결정되기 때문에 관측치 i에 특정한 관찰되지 않은 확률 p로i,h 발생한다. 즉,
또는 동등하게
h의 각 가능한 값에 대해.
잠재 변수 모형
다항 프로빗은 흔히 잠재 변수 모델의 관점에서 다음과 같이 기록된다.
어디에
그러면
그것은
이 모형은 관련 없는 대안의 독립성을 반드시 존중하지 않도록 오류 변수들 간의 임의의 상관관계를 허용한다는 점에 유의하십시오.
이(가) ID 매트릭스일 때(상관성이나 이단성이 없는 경우) 모델을 독립 프로빗이라고 한다.
추정
![]() | 이 구간은 확장이 필요하다. 덧셈으로 도와줘도 된다.(2017년 2월 |
방정식의 추정 방법에 대한 자세한 내용은 Probit 모델 문서를 참조하십시오.
참조
- Greene, William H. (2012). Econometric Analysis (Seventh ed.). Boston: Pearson Education. pp. 810–811. ISBN 978-0-273-75356-8.