다항 프로빗

Multinomial probit

통계학계량학에서 다항 프로빗 모델은 종속 변수가 포함될 수 있는 몇 가지 가능한 범주가 있을 때 사용되는 프로빗 모델의 일반화다. 이와 같이 멀티클래스 분류의 한 가지 방법으로서 다항 로짓 모델에 대한 대안이다. 둘 이상의 독립 변수에 대해 상관 관계가 있는 이항 결과를 모형화하는 데 사용되는 다변량 프로빗 모델과 혼동해서는 안 된다.

일반사양서

크기 m범주형 분포에서 다방향 선택 결과에 대한 일련의 관측치i Y(i = 1...n)가 있다고 가정한다(가능한 선택이 있다). 각 관측치 Yi k 관측치 x1,i, ..., x의 설명k,i 변수(독립 변수, 예측 변수, 형상 등이라고도 함)의 집합이다. 몇 가지 예:

  • 관찰된 결과는 유사한 증상을 가진 희귀질환 집합에 대해 "A형, B형, C형, 질병이 없으며"일 수 있으며, 설명 변수는 관련성이 있다고 생각되는 환자의 특성(성, 인종, 연령, 혈압, 체질량지수, 다양한 증상의 유무 등)일 수 있다.
  • 관측된 결과는 다원 선거에서 특정 정당이나 후보에 대한 사람들의 투표로, 설명 변수는 각 개인의 인구통계학적 특성(예: 성, 인종, 연령, 소득 등)이다.

다항 프로빗 모델은 관련 설명 변수를 고려할 때 관찰되지 않은 다방향 시험의 가능한 결과를 예측하는 데 사용할 수 있는 통계적 모델이다. 이 과정에서 모델은 서로 다른 결과에 대한 서로 다른 설명 변수의 상대적 영향을 설명하려고 시도한다.

형식적으로 결과 Yi 범주적으로 분포된 데이터로 설명되며, 여기서 관측치 i에 대한 각 결과값 h는 관측치와 관련된 설명 변수의 값에 의해 결정되기 때문에 관측치 i에 특정한 관찰되지 않은 확률 pi,h 발생한다. 즉,

또는 동등하게

h의 각 가능한 값에 대해.

잠재 변수 모형

다항 프로빗은 흔히 잠재 변수 모델의 관점에서 다음과 같이 기록된다.

어디에

그러면

그것은

이 모형은 관련 없는 대안의 독립성을 반드시 존중하지 않도록 오류 변수들 간의 임의의 상관관계를 허용한다는 점에 유의하십시오.

이(가) ID 매트릭스일 때(상관성이나 이단성이 없는 경우) 모델을 독립 프로빗이라고 한다.

추정

방정식의 추정 방법에 대한 자세한 내용은 Probit 모델 문서를 참조하십시오.

참조

  • Greene, William H. (2012). Econometric Analysis (Seventh ed.). Boston: Pearson Education. pp. 810–811. ISBN 978-0-273-75356-8.