이산선택

Discrete choice

경제학에서는 이산 선택 모델 또는 질적 선택 모델에서 노동 시장에 진입하거나 진입하지 않거나 교통 수단 중 선택과 같은 둘 이상의 이산적 대안들 사이의 선택을 기술, 설명 및 예측한다. 그러한 선택은 소비되는 각 재화의 양이 연속적인 변수로 가정되는 표준 소비 모델과 대조된다. 연속적인 경우 미적분법(예: 1차 조건)을 사용하여 최적 선택량을 결정할 수 있으며, 수요는 회귀 분석을 사용하여 경험적으로 모델링할 수 있다. 한편, 이산 선택 분석에서는 최적화가 표준 1차 주문 조건에 의해 특징지어지지 않는, 잠재적 결과가 이산적인 상황을 검토한다. 따라서 이산 선택 분석은 연속 선택 변수의 문제에서처럼 "얼마"를 조사하지 않고 "어느 것"을 조사한다. 그러나 이산 선택 분석은 가구가 소유하기로 선택한 차량 수, 고객이 구매하기로 결정한 통신 서비스 시간(분)과 같이 몇 가지 구별되는 수량만 선택해야 하는 경우 선택한 수량을 검사하는 데도 사용할 수 있다.[2] 로지스틱 회귀 분석 및 프로빗 회귀 분석과 같은 기법을 이산선택의 경험적 분석에 사용할 수 있다.

이산 선택 모델은 이론적으로 또는 경험적으로 유한한 대안 집합 중 사람에 의해 만들어진 선택을 모델링한다. 모델은 예를 들어, 어떤 차를 살 것인지,[1][3] 어디로 대학을 갈 것인지,[4] 어떤 교통 수단(자동차, 버스, 철도)을 사용하여 수많은 다른 애플리케이션 중 어떤 것을 작업할[5] 것인지를 검토해왔다. 이산 선택 모델은 기업이나 정부 기관과 같은 조직의 선택을 검토하는데도 사용된다. 아래 논의에서 의사결정 단위는 개념들이 더 일반적으로 적용가능하지만 개인으로 가정한다. 대니얼 맥패든은 이산선택의 이론적 근거를 개발하는 선구적인 업적으로 2000년 노벨상을 수상했다.

이산선택모형은 통계적으로 각 개인이 선택한 것과 개인의 속성 및 개인이 이용할 수 있는 대안의 속성이 관련된다. 예를 들어, 사람이 어떤 차를 살 것인지 선택하는 것은 통계적으로 그 사람의 수입과 나이, 가격, 연비, 크기 및 사용 가능한 각 자동차의 다른 속성과 관련이 있다. 그 모델들은 한 사람이 특정한 대안을 선택할 확률을 추정한다. 이 모델들은 종종 대안들의 인구통계 및/또는 속성의 변화에 따라 사람들의 선택이 어떻게 변화할지 예측하는 데 사용된다.

이산선택모형은 개인이 대안의 집합 중에서 선택권을 선택할 확률을 명시한다. 이산선택행동의 확률론적 설명은 본질적으로 확률론적이라고 간주되는 개별 행동을 반영하지 않는 데 사용된다. 오히려, 우리가 선택을 확률론적 방식으로 설명하도록 이끄는 것은 정보의 부족이다. 실무에서 우리는 개인의 선택 결정에 영향을 미치는 모든 요인을 알 수 없다. 결정요인이 부분적으로 관찰되거나 불완전하게 측정되기 때문이다. 따라서 이산 선택 모델은 a) 선택 대안, b) 사람에 대한 취향 변화(개인 간 이질성) 및 시간에 따른(개인 간 이질성), c) 이기종 선택 세트를 설명하기 위해 확률적 가정과 규격에 의존한다. 다양한 제형을 요약하여 모델 그룹으로 분류했다.[6]

적용들

  • 마케팅 연구자들은 소비자 수요를 연구하고 경쟁적인 비즈니스 반응을 예측하기 위해 이산 선택 모델을 사용하여 선택 모델러들이 가격 책정, 제품 개발, 수요 예측 문제와 같은 다양한 비즈니스 문제를 해결할 수 있다. 시장조사에서는 이것을 흔히 콘조인트 분석이라고 한다.[1]
  • 운송 계획자들은 운전자가 어떤 경로를 택할 것인지, 그리고 누군가가 고속 교통 시스템을 이용할 것인지와 같은 계획된 운송 시스템에 대한 수요를 예측하기 위해 이산 선택 모델을 사용한다.[5][7] 이산 선택 모델의 첫 번째 적용은 운송 계획에 있었고 이산 선택 모델에서 가장 진보된 연구의 대부분은 운송 연구원들에 의해 수행된다.
  • 에너지 예측자와 정책 입안자들은 가정과 기업의 난방 시스템 선택, 기기 효율 수준 및 차량의 연비 수준에 대해 별도의 선택 모델을 사용한다.[8][9]
  • 환경연구는 별도의 선택 모델을 활용하여 재창조자가 선택한 낚시터나 스키장 등의 편의시설(예: 어업 또는 스키장)을 조사하고 야영장, 어족수, 보온 오두막 등)의 가치를 유추하고 수질개선 가치를 추정한다.[10]
  • 노동 경제학자들은 별도의 선택 모델을 사용하여 노동인구의 참여, 직업선택, 대학과 훈련프로그램의 선택 등을 검토한다.[4]
  • 생태학적 연구는 동물의 서식지 선택을 촉진하는 매개변수를 조사하기 위해 이산 선택 모델을 채택한다.[11]

이산 선택 모델의 공통 기능

이산 선택 모델은 이진 로짓, 이진 프로빗, 다항 로짓, 조건부 로짓, 다항 프로빗, 중첩 로짓, 일반화 익스트림 값 모델, 혼합 로짓 및 분해 로짓 등 다양한 형태를 취한다. 이 모델들은 모두 아래에 설명된 특징을 공통으로 가지고 있다.

초이스 세트

선택 집합은 사용자가 사용할 수 있는 대안 집합이다. 이산형 선택 모델의 경우 선택 세트는 다음 세 가지 요건을 충족해야 한다.

  1. 대안의 집합은 집합적으로 완전해야 하며, 이는 집합이 가능한 모든 대안을 포함한다는 것을 의미한다. 이 요구사항은 당사자가 반드시 세트에서 대안을 선택해야 함을 의미한다.
  2. 대안은 상호 배타적이어야 하며, 즉 하나의 대안을 선택하는 것은 다른 대안을 선택하지 않는다는 것을 의미한다. 이 요구사항은 당사자가 세트에서 하나의 대안만을 선택한다는 것을 의미한다.
  3. 세트에는 한정된 수의 대안이 포함되어야 한다. 이 세 번째 요건은 이산 선택 분석을 종속 변수가 무한히 많은 값을 취할 수 있는 회귀 분석의 형태와 구별한다.

예를 들어 직장에 어떤 교통수단을 가져갈지 결정하는 사람이 선택할 수 있는 선택에는 혼자 운전하기, 카풀하기, 버스 타기 등이 포함된다. 차를 몰고 기차역까지 이동한 뒤 열차를 타고 출근하는 등 주어진 여행에 여러 모드를 사용할 수 있다는 점에서 선택 세트가 복잡하다. 이 경우 선택 세트에는 가능한 각 모드 조합이 포함될 수 있다. 대안적으로, 선택은 자동차, 버스, 철도 및 기타(예: 보행, 자전거 등)로 구성된 세트로 "기본" 모드의 선택으로 정의할 수 있다. 대안적인 "기타"는 선택 세트를 완전하게 만들기 위해 포함되어 있다는 점에 유의하십시오.

사람마다 상황에 따라 선택지가 다를 수 있다. 예를 들어, 2009년 현재 캐나다에서는 사이온 자동차가 판매되지 않았기 때문에 캐나다의 신차 구매자들은 미국 소비자들의 선택권과 다른 선택권에 직면했다. 그러한 고려사항은 이산 선택 모델의 형성에 고려된다.

선택 확률 정의

이산선택모형은 개인이 특정대안을 선택할 확률을 지정하며, 그 확률은 대안 및 사람과 관련된 관측된 변수의 함수로 표현된다. 그것의 일반적인 형태에서, person n이 대안 i를 선택할 확률은 다음과 같이 표현된다.

어디에

(는) person n대면하는 대체 속성의 벡터다.
, 은(는) person n이 직면하는 다른 대안의 속성의 벡터다.
는 사람 n의 특성의 벡터로서,
}은(는) 확률에 대한 변수의 영향을 주는 일련의 매개변수로, 통계적으로 추정된다.

위의 운송 사례의 모드에서는 이동 시간, 비용 등 모드(xni)의 속성과 연간 소득, 연령, 성별 등 소비자(sn)의 특성을 이용하여 선택 확률을 계산할 수 있다. 대안의 속성은 사람에 따라 다를 수 있다. 예를 들어 자동차, 버스, 철도로 출근하는 비용과 시간은 그 사람의 집과 직장에 따라 사람마다 다르다.

속성:

  • Pni 0과 1 사이의 값이다.
  • := = 1, n 여기서 J는 대안의 총 수입니다.
  • (i )= N = P 여기서 N은 선택을 하는 사람의 수입니다.

다른 모델(즉, 다른 함수 G를 사용하는 모델)은 다른 특성을 가지고 있다. 아래에 눈에 띄는 모델들이 소개되어 있다.

소비자 효용

이산 선택 모델은 효용 이론에서 도출될 수 있다. 이러한 파생은 다음 세 가지 이유로 유용하다.

  1. 확률 Pni 정확한 의미를 부여한다.
  2. 그것은 대체 모델 규격(예: G의 기능적 형태 선택)에 동기를 부여하고 구별한다.
  3. 대안의 속성 변화로 인한 소비자잉여변동(보상변동)의 계산에 대한 이론적 근거를 제공한다.

Uni 대안 i를 선택함으로써 얻는 효용(또는 순이익 또는 웰빙)이다. 그 사람의 행동은 효용 극대화다. 즉, 사람 n은 가장 높은 효용성을 제공하는 대안을 선택한다. 개인의 선택은 각 대안에 대해 더미 변수 yni 지정된다.

선택을 검토하고 있는 연구자를 지금 생각해 보십시오. 개인의 선택은 많은 요인에 따라 달라지는데, 그 중 일부는 연구자가 관찰하고 일부는 그렇지 않다. 대안의 선택을 통해 얻는 효용성은 연구자가 관찰하는 변수에 따라 달라지는 부분과 연구자가 관찰하지 않는 변수에 따라 달라지는 부분으로 분해된다. 선형 형태에서 이 분해는 다음과 같이 표현된다.

어디에

  • 관찰된 변수의 나는{\displaystyle z_{ni}Zn}은 벡터는 대안의 특성 xni, 어쩌면 그 사람의 특성 sn, zn로}일부 num에 z()ni의 n){\displaystyle z_{ni}(x_{ni},s_{n})정도 표현될 수 있는 간에 달려 있는 사람 n에 나는 대체에 관련된 것.에리컬 함수 z,
  • (는) 관측된 변수의 계수 벡터로서,
  • 은(는) 개인의 선택에 영향을 미치는 모든 관찰되지 않은 요인의 영향을 포착한다.

선택 확률은 다음과 같다.

β을 감안할 때 선택 확률 확률은 무작위, εnj− εni(이후 연구원에게 그것을 지키지 않을 그 연구가의 관점에서 보면 임의적이다)각각의 독특한 양 아래 ∀ j ≠ 나는:β ziβ znj− n 있다.{\displaystyle \forall j\neq 나는:\beta z_{ni}-\beta z_{nj}.}일 경우 다른 선택 모델(즉. 출신의.G)의 다른 사양은 모든 i대한ni treatments의 다른 분포와 β의 다른 처리에서 발생한다.

효용 이론이 내포한 이산 선택 모델의 속성

차이만 중요하다.

개인이 특정 대안을 선택할 확률은 그 대안을 선택하는 효용과 다른 대안을 선택하는 효용을 비교함으로써 결정된다.

마지막 항에서 알 수 있듯이 선택 확률은 대안들 간의 효용 차이에 의해서만 결정되며, 효용의 절대적 수준에 따라 결정되지는 않는다. 동등하게, 모든 대안의 효용성에 상수를 추가하는 것은 선택 확률을 변경하지 않는다.

스케일을 정규화해야 함

유틸리티에는 단위가 없기 때문에 유틸리티의 규모를 정상화할 필요가 있다. 효용 척도는 종종 이산 선택 모형에서 오차항의 분산에 의해 정의된다. 이 분산은 데이터 수집 시기와 장소 등 데이터 집합의 특성에 따라 달라질 수 있다. 따라서 분산의 정규화는 다양한 데이터 집합에서 추정된 모수의 해석에 영향을 미친다.

눈에 띄는 유형의 이산 선택 모델

이산 선택 모델은 우선 이용 가능한 대안들의 수에 따라 분류될 수 있다.

* 이항 선택 모델(이항 분포): 2가지 대안
* 다항 선택 모델(폴리톰): 3개 이상의 대안 사용

다항 선택 모델은 모델 사양에 따라 추가로 분류할 수 있다.

* 표준 로짓과 같은 모델, 관측되지 않은 요인에서 대안에 대한 상관 관계가 없다고 가정하는 모델
* 대안 간 관찰되지 않은 요인에 상관 관계를 허용하는 모델

또한, 대안(즉, 1차 선택, 2차 선택, 3차 선택 등)의 순위 조사 및 등급 데이터에 대한 구체적인 모델 형식을 이용할 수 있다.

각 모델에 대한 자세한 내용은 다음 절에 수록되어 있다.

바이너리

A. 당사자의 속성은 포함하되 대안의 속성은 포함하지 않는 로짓

Un is the utility (or net benefit) that person n obtains from taking an action (as opposed to not taking the action). The utility the person obtains from taking the action depends on the characteristics of the person, some of which are observed by the researcher and some are not. The person takes the action, yn = 1, if Un > 0. The unobserved term, εn, is assumed to have a logistic distribution. The specification is written succinctly as:

B. Probit with attributes of the person but no attributes of the alternatives

The description of the model is the same as model A, except the unobserved terms are distributed standard normal instead of logistic.

where is cumulative distribution function of standard normal.

C. Logit with variables that vary over alternatives

Uni is the utility person n obtains from choosing alternative i. The utility of each alternative depends on the attributes of the alternatives interacted perhaps with the attributes of the person. The unobserved terms are assumed to have an extreme value distribution.[nb 1]

우리는 위의 모델 A와 이항 로짓과 이항 로짓과 연관시킬 수 있다. 특히 Pn1 다음과 같이 표현할 수도 있다.

두 개의 오차항이 iid 극단값인 경우,[nb 1] 오차항의 차이는 분산 로지스틱으로, 이는 두 규격의 등가성에 대한 기초가 된다.

D. 대안에 따라 다른 변수를 갖는 프로빗

모형에 대한 설명은 로지스틱이 아닌 두 개의 관측되지 않은 항이 표준 정규 분포를 따른다는 점을 제외하면 C 모델과 동일하다.

그러면 그 행동을 취할 확률은

여기서 φ은 표준 정규의 누적 분포 함수다.

대안 간의 상관 관계가 없는 다항 선택

E. 당사자의 속성은 포함하되 대안의 속성은 포함하지 않는 로짓

모든 대안의 효용은 동일한 변수, sn 따라 다르지만 계수는 다른 대안에 따라 다르다.

  • Uni = βisn + εni,
  • 효용 물질의 차이만 있기 때문에 의 대안으로 = 0 을(를) 정상화시킬 필요가 있다. = 을(를) 가정하여
  • εni 극한값이다[nb 1]

선택 확률은 형태를 취한다.

여기서 J는 총 대안의 수입니다.

F. 대안(조건부 로짓이라고도 함)에 따라 다른 변수가 있는 로짓

각 대안의 효용성은 아마도 개인의 속성과 상호작용하는 대안의 속성에 따라 달라진다.

where J is the total number of alternatives.

Note that model E can be expressed in the same form as model F by appropriate respecification of variables. Define where is the Kronecker delta and sn are from model E. Then, model F is obtained by using

where J is the total number of alternatives.

Multinomial choice with correlation among alternatives

A standard logit model is not always suitable, since it assumes that there is no correlation in unobserved factors over alternatives. This lack of correlation translates into a particular pattern of substitution among alternatives that might not always be realistic in a given situation. This pattern of substitution is often called the Independence of Irrelevant Alternatives (IIA) property of standard logit models. See the Red Bus/Blue Bus example in which this pattern does not hold,[12] or the path choice example.[13] A number of models have been proposed to allow correlation over alternatives and more general substitution patterns:

  • Nested Logit Model - Captures correlations between alternatives by partitioning the choice set into 'nests'
    • Cross-nested Logit model[14] (CNL) - Alternatives may belong to more than one nest
    • C-logit Model[15] - Captures correlations between alternatives using 'commonality factor'
    • Paired Combinatorial Logit Model[16] - Suitable for route choice problems.
  • 일반화 극한값[17] 모델 - 다항 로짓 및 내포 로짓이 속하는 랜덤 유틸리티[13] 모델에서 파생된 모델의 일반 클래스
  • 조건부 프로빗[18][19] - 공동 정규 분포를 사용하여 대안 간의 완전한 공분산 허용.
  • 혼합 로짓-[9][10][19] 모든 형태의 상관 관계 및 대체 패턴을 허용한다.[20] 혼합 로짓이 공동으로 정규 랜덤 항을 사용하는 경우, 모델을 "로짓 커널이 있는 다항 프로빗 모델"[13][21]이라고 부르기도 한다. 경로 선택에 적용할 수 있다.[22]

다음 절에서는 중첩 로짓, GEV, Probit 및 혼합 로짓 모델을 자세히 설명한다.

G. 내포된 로짓 및 일반화된 극단값(GEV) 모형

효용의 관측되지 않은 구성요소가 대안보다 독립적이기 보다는 대안보다 상호 연관되어 있다는 점을 제외하면 모델은 F모델과 동일하다.

  • Uni = βzni + εni,
  • εni 한계 분포는 극단값이지만,[nb 1] 이들의 공동 분포는 이들 사이의 상관관계를 허용한다.
  • 확률은 지정된 상관관계의 패턴에 따라 많은 형태를 취한다. 일반화된 극단값을 참조하십시오.

H. 다항 프로빗

관측되지 않은 항이 공동으로 정규 분포를 따른다는 점을 제외하면 모델은 G 모델과 동일하며, 이는 상관관계와 이단성 패턴을 모두 허용한다.

여기서 ( ) 평균 0과 공분산 을(를) 가진 공동 정규 밀도 입니다

이 선택 확률을 위한 적분은 닫힌 형태를 가지지 않으므로, 확률은 4차 또는 시뮬레이션에 의해 근사치된다.

(가) ID 매트릭스일 때(상관성 또는 이단성이 없는 경우) 모델을 독립 프로빗이라고 한다.

I. 혼합 로짓

혼합형 로짓 모델은 최근 몇 년간 몇 가지 이유로 점점 인기를 끌고 있다. 첫째, 모델은 외에 β 을(를) 랜덤하게 할 수 있다 }의 랜덤성은 유연한 대체 패턴을 생성하는 대안들 간의 상관관계를 수용한다. 둘째, 시뮬레이션의 발전으로 모형의 근사치가 상당히 쉬워졌다. 또한 McFaddenTrain은 설명 변수와 계수의 분포에 대한 적절한 사양을 가진 혼합 로짓에 의해 모든 참 선택 모델을 어느 정도 정확도에 가깝게 추정할 수 있다는 것을 보여주었다.[20]

  • Uni = βzni + εni,
  • ~ θ) 에 대한 \displaystyle 은(는 추정할 분포 모수(예: 평균 및 분산)의 집합이다
  • εni ~ iid 극단값,[nb 1]

선택 확률은

어디에

로짓 확률은 총 대안 , 에서 평가된다.

이 선택 확률의 적분은 닫힌 형태를 가지지 않기 때문에 그 확률은 시뮬레이션에 의해 근사치가 된다.[23]

선택에서 추정

이산 선택 모형은 최대우도 추정을 사용하여 추정하는 경우가 많다. 로짓 모형은 로지스틱 회귀 분석을 통해 추정할 수 있으며, 프로빗 모형은 프로빗 회귀 분석을 통해 추정할 수 있다. 최대 점수 추정기와 같은 비모수적 방법이 제안되었다.[24][25] 이러한 모델의 추정은 일반적으로 모수, 반모수 및 비모수 최대우도 방법을 통해 수행되지만 부분 최소 제곱 경로 모델링 접근법으로도 수행할 수 있다.[26] [27]

순위에서 추정

많은 상황에서, 단순히 그들이 선택한 대안보다 한 개인의 대안 서열이 관찰된다. 예를 들어, 새 차를 산 사람에게 그 차가 제공되지 않았다면 무엇을 샀겠느냐는 질문을 받을 수 있는데, 이것은 첫 번째 선택 외에도 그 사람의 두 번째 선택에 대한 정보를 제공한다. 또는 설문조사에서 응답자에게 다음과 같은 질문을 할 수 있다.

: 다음 휴대폰 통화 계획의 순위를 가장 선호하지 않는 것으로 정하십시오.
* 월 $60(무제한 시간: 분 단위), 2년 계약, 조기 해지 수수료 $100 포함
*언제든 400분에 월 30달러, 400분 후 분당 3센트, 조기 해지 수수료 125달러에 1년 계약
* 월 35달러(언제나 500분), 500분 후 분당 3센트, 계약금이나 조기 해지 수수료 없음
* 월 50달러(언제나 1000분), 1000분 이후 분당 5센트, 2년 계약, 조기 해지 수수료 75달러

위에서 설명한 모델들은 첫 번째 선택 이상의 순위를 고려하도록 개조될 수 있다. 순위 데이터의 가장 두드러진 모델은 분해된 로짓과 혼합 버전이다.

J. 폭발 로짓

표준 로짓(모델 F)과 동일한 가정 하에서 대안의 랭킹에 대한 확률은 표준 로짓의 산물이다. 일반적으로 선택된 대안에 대해 하나의 로짓 공식으로 표현되는 선택 상황을 확장("분해")하여 각 순위 대안에 대해 별도의 로짓 공식을 갖도록 하기 때문에 모델을 "분해된 로짓"이라고 한다. 분해된 로짓 모델은 표준 로짓 모델의 산물로, 각 대안이 순위에 따라 선택 세트가 감소하고 후속 선택에서 사용 가능한 선택 세트가 남게 된다.

일반성의 상실 없이, 대안 1이 첫 번째 선택이고, 2가 두 번째 선택인 것처럼, 그 대안들은 그 사람의 순위를 나타내기 위해 다시 붙여질 수 있다. J 대안의 순위를 1, 2, ..., J로 매기는 선택 확률은 그 다음이다.

표준 로짓과 마찬가지로, 분해된 로짓 모형은 관측되지 않은 요인에서 대안에 대한 상관관계가 없다고 가정한다. 폭발한 로짓은 표준 로짓이 일반화된 것과 같은 방식으로 일반화할 수 있어 대체 로짓과 무작위 맛 변동 간의 상관관계를 수용할 수 있다. "혼합된 로짓" 모델은 혼합 로짓 모델(모델 I)에서ni L에 대해 위에 주어진 랭킹의 확률로 얻는다.

이 모델은 계량학에서도 순위 순서 로짓 모델로 알려져 있으며 1981년 베그스, 카델, 하우스만이 그 분야에 도입하였다.[28][29] 한 가지 적용대상은 교수가 될 후보자의 순위를 설명하는 콤스 외 논문이다.[29] Plackett-로도 알려져 있다.생물 의학 문학의 루스 모델.[29][30][31]

주문형 모델

설문조사에서 응답자들은 종종 다음과 같은 등급을 부여해야 한다.

:대통령이 얼마나 잘 하고 있는지에 대한 평가를 내리십시오.
1: 아주 형편없이
2: 나쁘게
3: 알았어
4: 글쎄
5: 아주 좋아

아니면,

: 1은 완전히 동의하지 않는다는 뜻이고 5는 완전히 동의한다는 뜻인 1-5 척도에서 당신은 다음 진술에 얼마나 동의하는가? "연방정부는 압류 위기에 처한 사람들을 돕기 위해 더 많은 일을 해야 한다."

다항 이산 선택 모델은 이러한 질문에 대한 응답(모델 G, 모델 H, 모델 I)을 조사할 수 있다. 그러나 이러한 모델은 응답자가 가능한 각 답변에 대해 일부 효용을 얻고 가장 큰 효용을 제공하는 답변을 제공한다는 개념에 따라 도출된다. 응답자가 이 측정치가 얼마나 높은지에 대한 응답으로 질의응답과 관련된 어떤 잠재적 측정치나 지수를 가지고 있다고 생각하는 것이 더 자연스러울 수 있다. 순서형 로짓과 순서형 프로빗 모델은 이 개념에 따라 도출된다.

K. Ordered logit

Let Un represent the strength of survey respondent n’s feelings or opinion on the survey subject. Assume that there are cutoffs of the level of the opinion in choosing particular response. For instance, in the example of the helping people facing foreclosure, the person chooses

  • 1, if Un < a
  • 2, if a < Un < b
  • 3, if b < Un < c
  • 4, if c < Un < d
  • 5, if Un > d,

for some real numbers a, b, c, d.

Defining Logistic, then the probability of each possible response is:

The parameters of the model are the coefficients β and the cut-off points a − d, one of which must be normalized for identification. When there are only two possible responses, the ordered logit is the same a binary logit (model A), with one cut-off point normalized to zero.

L. Ordered probit

The description of the model is the same as model K, except the unobserved terms have normal distribution instead of logistic.

The choice probabilities are ( is the cumulative distribution function of the standard normal distribution):

참고 항목

메모들

  1. ^ a b c d e The density and cumulative distribution function of the extreme value distribution are given by and 분포는 일반화된 극단값 분포의 특수한 유형인 Gumbel 또는 I형 극값 분포라고도 한다.

참조

  1. ^ a b c Train, K. (1986). Qualitative Choice Analysis: Theory, Econometrics, and an Application to Automobile Demand. MIT Press.8장.
  2. ^ Train, K.; McFadden, D.; Ben-Akiva, M. (1987). "The Demand for Local Telephone Service: A Fully Discrete Model of Residential Call Patterns and Service Choice". RAND Journal of Economics. 18 (1): 109–123. doi:10.2307/2555538. JSTOR 2555538.
  3. ^ Train, K.; Winston, C. (2007). "Vehicle Choice Behavior and the Declining Market Share of US Automakers". International Economic Review. 48 (4): 1469–1496. doi:10.1111/j.1468-2354.2007.00471.x.
  4. ^ a b Fuller, W. C.; Manski, C.; Wise, D. (1982). "New Evidence on the Economic Determinants of Post-secondary Schooling Choices". Journal of Human Resources. 17 (4): 477–498. doi:10.2307/145612. JSTOR 145612.
  5. ^ a b Train, K. (1978). "A Validation Test of a Disaggregate Mode Choice Model" (PDF). Transportation Research. 12 (3): 167–174. doi:10.1016/0041-1647(78)90120-x.
  6. ^ Baltas, George; Doyle, Peter (2001). "Random utility models in marketing research: a survey". Journal of Business Research. 51 (2): 115–125. doi:10.1016/S0148-2963(99)00058-2.
  7. ^ Ramming, M. S. (2001). "Network Knowledge and Route Choice". Unpublished Ph.D. Thesis, Massachusetts Institute of Technology. MIT catalogue. hdl:1721.1/49797. Cite 저널은 필요로 한다. journal= (도움말)
  8. ^ Goett, Andrew; Hudson, Kathleen; Train, Kenneth E. (2002). "Customer Choice Among Retail Energy Suppliers". Energy Journal. 21 (4): 1–28.
  9. ^ a b Revelt, David; Train, Kenneth E. (1998). "Mixed Logit with Repeated Choices: Households' Choices of Appliance Efficiency Level". Review of Economics and Statistics. 80 (4): 647–657. doi:10.1162/003465398557735. JSTOR 2646846.
  10. ^ a b Train, Kenneth E. (1998). "Recreation Demand Models with Taste Variation". Land Economics. 74 (2): 230–239. CiteSeerX 10.1.1.27.4879. doi:10.2307/3147053. JSTOR 3147053.
  11. ^ Cooper, A. B.; Millspaugh, J. J. (1999). "The application of discrete choice models to wildlife resource selection studies". Ecology. 80 (2): 566–575. doi:10.1890/0012-9658(1999)080[0566:TAODCM]2.0.CO;2.
  12. ^ Ben-Akiva, M.; Lerman, S. (1985). Discrete Choice Analysis: Theory and Application to Travel Demand. Transportation Studies. Massachusetts: MIT Press.
  13. ^ a b c Ben-Akiva, M.; Bierlaire, M. (1999). "Discrete Choice Methods and Their Applications to Short Term Travel Decisions" (PDF). In Hall, R. W. (ed.). Handbook of Transportation Science.
  14. ^ Vovsha, P. (1997). "Application of Cross-Nested Logit Model to Mode Choice in Tel Aviv, Israel, Metropolitan Area". Transportation Research Record. 1607: 6–15. doi:10.3141/1607-02. Archived from the original on 2013-01-29.
  15. ^ Cascetta, E.; Nuzzolo, A.; Russo, F.; Vitetta, A. (1996). "A Modified Logit Route Choice Model Overcoming Path Overlapping Problems: Specification and Some Calibration Results for Interurban Networks" (PDF). In Lesort, J. B. (ed.). Transportation and Traffic Theory. Proceedings from the Thirteenth International Symposium on Transportation and Traffic Theory. Lyon, France: Pergamon. pp. 697–711.
  16. ^ Chu, C. (1989). "A Paired Combinatorial Logit Model for Travel Demand Analysis". Proceedings of the 5th World Conference on Transportation Research. 4. Ventura, CA. pp. 295–309.
  17. ^ McFadden, D. (1978). "Modeling the Choice of Residential Location" (PDF). In Karlqvist, A.; et al. (eds.). Spatial Interaction Theory and Residential Location. Amsterdam: North Holland. pp. 75–96.
  18. ^ Hausman, J.; Wise, D. (1978). "A Conditional Probit Model for Qualitative Choice: Discrete Decisions Recognizing Interdependence and Heterogenous Preferences". Econometrica. 48 (2): 403–426. doi:10.2307/1913909. JSTOR 1913909.
  19. ^ a b Train, K. (2003). Discrete Choice Methods with Simulation. Massachusetts: Cambridge University Press.
  20. ^ a b McFadden, D.; Train, K. (2000). "Mixed MNL Models for Discrete Response" (PDF). Journal of Applied Econometrics. 15 (5): 447–470. CiteSeerX 10.1.1.68.2871. doi:10.1002/1099-1255(200009/10)15:5<447::AID-JAE570>3.0.CO;2-1.
  21. ^ Ben-Akiva, M.; Bolduc, D. (1996). "Multinomial Probit with a Logit Kernel and a General Parametric Specification of the Covariance Structure" (PDF). Working Paper.
  22. ^ Bekhor, S.; Ben-Akiva, M.; Ramming, M. S. (2002). "Adaptation of Logit Kernel to Route Choice Situation". Transportation Research Record. 1805: 78–85. doi:10.3141/1805-10. Archived from the original on 2012-07-17.
  23. ^ [1] 자세한 내용은 혼합 로짓도 참조한다.
  24. ^ Manski, Charles F. (1975). "Maximum score estimation of the stochastic utility model of choice". Journal of Econometrics. Elsevier BV. 3 (3): 205–228. doi:10.1016/0304-4076(75)90032-9. ISSN 0304-4076.
  25. ^ Horowitz, Joel L. (1992). "A Smoothed Maximum Score Estimator for the Binary Response Model". Econometrica. JSTOR. 60 (3): 505–531. doi:10.2307/2951582. ISSN 0012-9682. JSTOR 2951582.
  26. ^ Park, Byeong U.; Simar, Léopold; Zelenyuk, Valentin (2017). "Nonparametric estimation of dynamic discrete choice models for time series data" (PDF). Computational Statistics & Data Analysis. 108: 97–120. doi:10.1016/j.csda.2016.10.024.
  27. ^ Hair, J.F.; Ringle, C.M.; Gudergan, S.P.; Fischer, A.; Nitzl, C.; Menictas, C. (2019). "Partial least squares structural equation modeling-based discrete choice modeling: an illustration in modeling retailer choice" (PDF). Business Research. 12: 115–142. doi:10.1007/s40685-018-0072-4.
  28. ^ Beggs, S.; Cardell, S.; Hausman, J. (1981). "Assessing the Potential Demand for Electric Cars". Journal of Econometrics. 17 (1): 1–19. doi:10.1016/0304-4076(81)90056-7.
  29. ^ a b c Combes, Pierre-Philippe; Linnemer, Laurent; Visser, Michael (2008). "Publish or Peer-Rich? The Role of Skills and Networks in Hiring Economics Professors". Labour Economics. 15 (3): 423–441. doi:10.1016/j.labeco.2007.04.003.
  30. ^ Plackett, R. L. (1975). "The Analysis of Permutations". Journal of the Royal Statistical Society, Series C. 24 (2): 193–202. JSTOR 2346567.
  31. ^ Luce, R. D. (1959). Individual Choice Behavior: A Theoretical Analysis. Wiley.

추가 읽기

  • 앤더슨, S, A. 드 팔마, J.F. Thisse(1992) 제품 차별화에 대한 이산 선택 이론, MIT 프레스,
  • Ben-Akiva, M.; Lerman, S. (1985). Discrete Choice Analysis: Theory and Application to Travel Demand. MIT Press.
  • Greene, William H. (2012). Econometric Analysis (Seventh ed.). Upper Saddle River: Pearson Prentice-Hall. pp. 770–862. ISBN 978-0-13-600383-0.
  • Hensher, D.; Rose, J.; Greene, W. (2005). Applied Choice Analysis: A Primer. Cambridge University Press.
  • Maddala, G. (1983). Limited-dependent and Qualitative Variables in Econometrics. Cambridge University Press.
  • McFadden, Daniel L. (1984). Econometric analysis of qualitative response models. Handbook of Econometrics, Volume II. Chapter 24. Elsevier Science Publishers BV.
  • Train, K. (2009) [2003]. Discrete Choice Methods with Simulation. Cambridge University Press.