선택 모델 시뮬레이션
Choice model simulation오늘날 개념 선택 모델은 널리 이해되고 실천되고 있지만, 선택 모델을 시뮬레이션하는 데 있어 실제적인 지식을 습득하는 것은 어려운 경우가 많습니다.많은 통계 패키지가 시뮬레이션을 위한 유용한 도구를 제공하지만, 데이터를 사용하여 새로운 선택 모델을 테스트하고 시뮬레이션하려는 연구자들은 스케일링 매개 변수와 같이 간단한 문제부터 규격 오류에 이르기까지 종종 문제에 직면한다.이 문서는 단순히 개별 선택 모델을 정의하는 데 그치지 않습니다.오히려 컴퓨터에서 이러한 모델을 시뮬레이션하는 방법에 대한 포괄적인 개요를 제공하는 것을 목표로 합니다.
선택 세트의 정의
연구자가 소비자 선택 데이터를 가지고 있고 선택 모델을 구성하고 데이터에 대해 시뮬레이션하려고 할 때 먼저 선택 세트를 정의해야 한다.이산 선택 모델의 선택 세트는 유한하고 포괄적이며 상호 배타적인 것으로 정의됩니다.예를 들어 노트북을 몇 대 소유할지에 대한 가정의 선택을 고려해 보십시오.연구자는 위에서 언급한 세 가지 특성을 만족하는 한 데이터의 성격과 원하는 해석에 따라 선택 세트를 정의할 수 있다.카테고리를 만족시키는 선택 세트의 예는 다음과 같습니다.
- 0, 1, 2대 이상의 노트북
- 0, 1, 2, 3대 이상의 노트북
- 2, 2, 3, 4, 노트북 4대 이상
소비자 유틸리티의 정의
한 학생이 마지막 기말고사 후에 어느 술집에 가서 맥주를 마셔야 할지 결정하려고 한다고 가정해 보자.대학가에는 아일랜드 술집과 미국 술집 두 곳이 있다고 가정해 보자.연구자는 맥주 가격(P)과 각 술집까지의 거리(D)를 기준으로 어느 술집을 선택할지 예측하려고 합니다.그런 다음 아일랜드 펍과 미국 펍을 선택하는 소비자 유틸리티를 정의할 수 있다.
- i { U_}=\ P_ _ (1)
- a P + D + a + a { U_ }=\ P_ _ (2)
여기서 \소비자 유틸리티에 영향을 미치는 관찰되지 않은 변수를 캡처합니다.
선택 확률의 정의
일단 소비자 효용이 지정되면, 연구자는 선택 확률을 도출할 수 있다.즉, 학생이 미국 펍보다 아일랜드 펍을 선택할 확률은
유틸리티 기능 중 관찰된 부분을 V로 나타냅니다.
- (3)
이산 선택 모델링은 {\} ( i - a { displaystyle _ { - \_ { )의 분포를 지정하고 {\ 의 범위에 걸친 적분을 풀어서 이를 하는 으로 됩니다.보다 일반적인 상황으로
- N개의 전기 소비 장치(n = 1, 2, ..., N),
- J개의 소비 선택(j = 1, 2, ..., J),
소비자 n이 j를 선택할 확률은 다음과 같이 쓸 수 있다.
- 4)
j 이외의 모든 i에 대해서
신분증
1. 무관한 점
방정식 (4)을 보면 오른쪽 확률 인수의 부등식이 변하지 않는 한 jnj})는 변하지 않는다는 것이 명백하다.즉, 1 Un에 상수를 곱하는 선택사항은 변경되지 않으므로 해석은 변경되지 않습니다.
2. 대체특이상수
모든 효용에 상수를 추가하는 것과 달리, 대체 특정 상수를 추가하면 선택 확률이 변경됩니다.(1)과 (2)에 대체 특이 상수i C와a C가 추가된다고 가정합니다.
그런 다음 추정된 대안 특이적 상수의 값에 따라 선택 확률이 달라질 수 있습니다.그리고 선택 확률을 (3)의 형식으로 쓰면
a i 와 의 차이만 선택 확률에 영향을 미친다(즉, 우리의 추정은 차이만 식별할 수 있다).따라서 모든 대체 특이 상수를 하나의 대체 상수로 정규화하는 것이 편리합니다.로 정규화하면 다음 모델을 추정할 수 있습니다.
선택 세트에 3개 이상의 선택지가 있는 경우, 임의의 선택지 i를 선택하고 다른 모든 선택지 고유 상수에서 })를 해당 선택지에 대한 대체 고유 상수를 정규화할 수 있습니다.
3. 사회통계학적 변수
아일랜드 술집과 미국 술집 중 하나를 결정할 때, 연구자가 소득과 같은 추가적인 사회통계학적 변수에 접근할 수 있다면, 그들은 다양한 방법으로 소비자 효용 방정식을 입력할 수 있다.학생의 소득을 Y로 나타냅니다.만약 연구원이 소득이 효용에 선형적으로 영향을 미친다고 믿는다면,
만약 연구원이 사회통계학적 변수가 가격과 같은 다른 변수와 상호작용한다고 믿는다면, 효용은 다음과 같이 기록될 수 있다.
일반 모델
앞서 언급한 바와 같이, 선택 확률의 계산과 정당성은 연구자가 명시한 오차(즉, 관측할 수 없는) 분포 함수의 특성에 의존한다.다음은 사양이 서로 다른 자주 사용되는 모델의 간단한 개요입니다.
1. 로짓:
- 관측되지 않은 요인의 분산이 같고 대안에 상관 관계가 없다고 가정합니다.
- iid 극단값 비관측 요인
- 극단값 차이의 누적 분포는 로지스틱 함수입니다.
- 로지스틱스 기능에는 클로즈드 폼 솔루션이 있습니다=> 시뮬레이션 불필요.
2. GEV(범용 극단값 분포)
- 여러 대안에서 관측되지 않은 요인의 상관 관계를 허용합니다.
- iid 극단값 비관측 요인
- 극단값 차이의 누적 분포는 로지스틱 함수입니다.
- 로지스틱스 기능에는 클로즈드 폼 솔루션이 있습니다=> 시뮬레이션 불필요.
3. 프로빗
- 관측되지 않은 요인은 합동 정규 분포를 가집니다.
- 정규 분포의 누적 분포에 대한 닫힌 형식이 없습니다.시뮬레이션이 필요합니다.
- 관측되지 않은 요인에서 모든 분포를 허용합니다.
- 정규 분포의 누적 분포에 대한 닫힌 형식이 없습니다.시뮬레이션이 필요합니다.
레퍼런스
- Nevo(2000)."랜덤 계수 로짓 수요 모델 추정에 대한 실무자 가이드", 경제 및 관리 전략 저널, 9(4), 513-548
- 콜롬비아, 미국 (2010년)노동 공급의 무작위 효용 모델을 사용한 균형 정책 시뮬레이션, Carlo Alberto Notebooks 156, Collegio Carlo Alberto.
- 케네스 E.Train, "시뮬레이션을 사용한 이산 선택 방법", 매사추세츠: Cambridge University Press, 2003.