동적 이산 선택

Dynamic discrete choice

동적 프로그래밍이산 선택 모델이라고도 알려진 동적 이산 선택(DDC) 모델은 미래의 함의가 있는 이산형 옵션에 대한 에이전트의 선택을 모델링한다.관측된 선택이 정적 효용 극대화의 결과라고 가정하기보다는, DDC 모델에서 관측된 선택은 이산 선택 모델의 기반이 되는 효용 이론을 일반화하면서 효용의 현재 가치를 에이전트로 극대화한 결과라고 가정한다.[1]

DDC 방법의 목표는 대리인의 의사결정 과정의 구조적 매개변수를 추정하는 것이다.일단 이러한 매개변수가 알려지면, 연구자는 추정치를 사용하여 대리인이 세계의 반사실적 상태에서 어떻게 행동할 것인지 시뮬레이션할 수 있다. (예를 들어, 예비 대학생의 등록금 인상에 대한 결정이 어떻게 변경될 것인가)

수학적 표현

에이전트 최대화 문제는 다음과 같이 수학적으로 작성할 수 있다.

어디에

  • 은(는) 상태 변수로서, 0{\ 에이전트의 초기 조건이다.
  • 은(는 J {\ 이산형 대안 중에서 결정을 나타낸다.
  • ( 0, ) (가) 할인 요인임
  • (는 기간 t {\ i {\에서 수신하는 흐름 비관측 요인 에 모두 의존한다.
  • (는) 시간 범위임
  • ( ) 은(는 n s 및 n t 있다즉, 에이전트는 주의 향후 전환에 대해 불확실하며, 또한 관찰되지 않은 요인의 향후 실현에 대해서도 불확실하다.

가정 및 표기법 단순화

동적 의사결정 문제의 다음과 같은 단순화된 가정과 표기법을 부과하는 것이 표준이다.

1. 흐름 효용은 추가적으로 분리할 수 있고 매개변수가 선형이다.

흐름 효용은 결정론적 요소와 확률적 요소로 구성되는 부가적인 합으로 작성할 수 있다.결정론적 구성요소는 구조 매개변수의 선형 함수로 작성할 수 있다.

2. 최적화 문제는 Bellman 방정식으로 쓸 수 있다.

{\ 개별n에 대한 ex ante 값 함수를 t 따라 하십시오. t {\

where the expectation operator is over the 's, and where represents the probability distribution over conditional on .상태 전환에 대한 기대는 이 확률 분포에 대한 적분을 취함으로써 달성된다.

( x ) 결정론적이고 확률론적인 구성 요소로 분해할 수 있다.

여기서 은(는) 시간 에서 대체 을(를) 선택하는 값이며 다음과 같이 기록된다.

여기서 이제 기대 이(가) j + 1 을(를) 인수한다

3. 최적화 문제는 마르코프 의사결정 과정을 따른다.

상태 마르코프 체인을 따른다.즉, t 의 달성은 x - {\에만 하며 - {\ 또는 이전 상태가 아니다.

조건부 값 함수 및 선택 확률

이전 절의 값 함수는 t 에서 대안 를 선택하는 조건부 값 함수가 되기 때문에 조건부 함수를 이렇게 쓰는 것이 선택 확률에 대한 공식을 구성하는 데 유용하다

선택 확률을 기록하려면, 연구자는 i s의 분포에 대해 가정을 해야 한다.정적 이산 선택 모델에서와 같이, 이 분포는 iid Type I 극단값, 일반화된 극단값, 다항 프로빗 또는 혼합 로짓으로 가정할 수 있다.

다항 로짓(즉, 타입 I 극단값 분포에서 iid를 추출)인 경우, 선택 확률을 위한 공식은 다음과 같다.

추정

동적 이산 선택 모델의 추정은 연구자가 구조 매개변수의 각 추측에 대해 역반복 문제를 해결해야 하기 때문에 특히 어렵다.

구조 매개변수를 추정하는 데 사용되는 가장 일반적인 방법은 최대우도 추정과 시뮬레이션 모멘트의 방법이다.

추정 방법 외에도 해법도 있다.문제의 복잡성 때문에 다른 해결 방법을 사용할 수 있다.이것들은 풀솔루션 방식비솔루션 방식으로 나눌 수 있다.

풀솔루션 방법

풀솔루션 방식의 가장 중요한 예는 1987년 존 러스트(John Rust)[2]가 개발한 중첩 고정점(NFXP) 알고리즘이다.NFXP 알고리즘은 설명서 매뉴얼에 자세히 설명되어 있다.[3]

2012년[4] Che-Lin Su와 Kenneth Judd의 최근 연구는 균형 제약이 있는 수학 프로그래밍의 특별한 경우인 우도함수의 제한된 최적화를 사용하는 또 다른 접근법 (1987년 Rust에 의해 난치될 수 있는 것으로 해석)을 시행한다.특히 우도함수는 모형이 부과하는 제약조건에 따라 극대화되며, 모형의 구조를 설명하는 추가 변수의 관점에서 표현된다.이 접근방식은 최적화 문제의 높은 차원성 때문에 Artelys Nitro와 같은 강력한 최적화 소프트웨어가 필요하다.일단 해결되면, 가능성을 최대화하는 구조적 매개변수와 모형의 해법이 모두 발견된다.

후기 기사[5] 러스트와 공저자는 NFXP와 비교한 MPEEC의 속도 이점이 크지 않다는 것을 보여준다.그러나, MPEC에서 요구하는 연산들은 모델의 구조에 의존하지 않기 때문에, 그것의 구현은 훨씬 덜 노동 집약적이다.

수많은 경쟁자들에도 불구하고, NFXP 최대우도 추정기는 마르코프 의사결정 모델의 선도적인 추정 방법으로 남아 있다.[5]

비솔루션 방법

풀솔루션 방법의 대안은 비솔루션 방법이다.이 경우 연구자는 각 모수 추측에 대해 역귀속 문제를 완전히 해결할 필요 없이 구조 매개변수를 추정할 수 있다.비솔루션 방법은 더 많은 가정을 요구하면서 일반적으로 더 빠르지만, 추가 가정은 많은 경우에 현실적이다.

대표적인 비솔루션 방법은 V가 개발한 조건부 선택 확률이다.조셉 핫즈와 로버트 A.밀러[6]

버스 엔진 교체 모델

세미날 페이퍼 러스트(1987)에서 개발된 버스 엔진 교체 모델은 실제 데이터를 사용해 추정된 이산 선택의 최초의 동적 확률 모델 중 하나이며, 이러한 유형의 문제에 대한 고전적인 예로서 계속 기능하고 있다.[4]

이 모델은 위스콘신주 매디슨 메트로폴리탄 버스 회사의 관리 감독인 해롤드 주셔가 직면한 단순 재생 최적 정지 확률론적 동적 문제다.각 기간 동안 운행 중인 모든 버스의 경우 해롤드 주셔는 엔진을 교체하고 관련 교체 비용을 부담할 것인지, 아니면 고장의 경우 보험과 승객 수송 손실 비용을 포함하여 계속 인상되는 운영 비용으로 버스를 계속 운행할 것인지를 결정해야 한다.

x {\t}}은(는) t {\ t ( ,){\t 에서 주행 기록계 수치(마일리지)를 나타내며, 이 값은 변수 {\\}, 엔진 및 벡터에 의존한다. property그러면 기간 유틸리티는 다음에 의해 주어진다.

여기서 은 결정(유지 또는 교체) 및 를 나타내며 (는) 해롤드 주셔가 관찰한 유틸리티의 구성요소를 나타내며, 존 러스트가 아니다.It is assumed that and are independent and identically distributed with the Type I extreme value distribution, and that are independent of (를) 으로 한다

그러면 최적의 결정은 Bellman 방정식을 만족시킨다.

여기서 , , d , ){\dx,d ( x) {\xi '\ x)은 관측되지 않은 상태 변수의 변환 밀도이다.벨만 방정식의 시간 지수는 모델이 무한 수평선 설정에서 공식화되고, 알 수 없는 최적 정책이 정지되어 있기 때문에, 즉 시간과 무관하게 떨어지게 된다.

x ′,θ)에 대한 분포 가정을 고려할 때 d )에 특정 선택 은 다음과 같다

여기서 , ,) 기능 방정식의 고유한 솔루션이다.

후자의 기능 방정식은 상태 공간 x 가 경계된 경우 수축 매핑을 정의하므로 어떤 에 대해서도 고유한 솔루션 )가 있을 것이고 나아가 암묵적 함수 정리가 유지될 이므로 (는 X이다. ,) ( ,d) theta의 부드러운 기능이다

내포 고정점 알고리즘을 사용한 추정

The contraction mapping above can be solved numerically for the fixed point that yields choice probabilities for any given value of . The log-likelihood function can then be formulated as

where and represent data on state variables (odometer readings) and decision (keep or replace) for individual buses, each in periods.

parameter {\ 매개 변수 displaystyle 의 특정 값을 부여하고 최대화하기 위한 고정점 문제의 공동 알고리즘은 존 러스트 내포 고정점 알고리즘(NFXP)에 의해 명명되었다.

내포된 고정점 알고리즘의 러스트의 구현은 확률 극대화를 위해 뉴턴-칸토로비치 반복을 사용하여 , x,\ 준뉴턴 방법(예: Berndt-Hall-Hall-Hausman 알고리즘)을 계산하여 이 문제에 매우 최적화되어 있다.[5]

엠펙을 사용한 추정

중첩 고정점 알고리즘에서 ∣ x , )는 매개변수 θ의 각 추측에 대해 재계산된다.대신 MPEC 방법은 제한된 최적화 문제를 해결한다.[4]

이 방법은 중첩된 고정점 알고리즘의 최적화되지 않은 구현보다 계산이 빠르고, 고도로 최적화된 구현에 걸리는 시간이다.[5]

비솔루션 방법을 사용한 추정

Hotz와 Miller의 조건부 선택 확률 방법을 이 설정에 적용할 수 있다.Hotz, Miller, Sanders, Smith는 이 방법의 계산적으로 더 간단한 버전을 제안했고, 버스 엔진 교체 문제에 대한 연구에서 그것을 테스트했다.이 방법은 시뮬레이션을 사용하여 조건부 선택 확률을 추정한 다음 값 함수의 내재적 차이를 배제하는 방식으로 작동한다.[7][8]

참고 항목

참조

  1. ^ & 월핀 2009.
  2. ^ 녹슬어 1987.
  3. ^ Rust, John (2008). "Nested fixed point algorithm documentation manual". Unpublished.
  4. ^ a b c Su, Che-Lin; Judd, Kenneth L. (2012). "Constrained Optimization Approaches to Estimation of Structural Models". Econometrica. 80 (5): 2213–2230. doi:10.3982/ECTA7925. hdl:10419/59626. ISSN 1468-0262.
  5. ^ a b c d Iskhakov, Fedor; Lee, Jinhyuk; Rust, John; Schjerning, Bertel; Seo, Kyoungwon (2016). "Comment on "constrained optimization approaches to estimation of structural models"". Econometrica. 84 (1): 365–370. doi:10.3982/ECTA12605. ISSN 0012-9682.
  6. ^ Hotz, V. Joseph; Miller, Robert A. (1993). "Conditional Choice Probabilities and the Estimation of Dynamic Models". Review of Economic Studies. 60 (3): 497–529. doi:10.2307/2298122. JSTOR 2298122.
  7. ^ 아귀레가비리아 & 미라 2010.
  8. ^ Hotz, V. J.; Miller, R. A.; Sanders, S.; Smith, J. (1994-04-01). "A Simulation Estimator for Dynamic Models of Discrete Choice". The Review of Economic Studies. Oxford University Press (OUP). 61 (2): 265–289. doi:10.2307/2297981. ISSN 0034-6527. JSTOR 2297981. S2CID 55199895.

추가 읽기