해밀턴어(Hamiltonian)는 동적 시스템의 최적 제어 문제를 해결하기 위해 사용되는 함수다.일정 기간에 걸쳐 최적화해야 할 문제의 라그랑지식 표현에 대한 순간적인 증분으로 이해할 수 있다.[1]고전 역학의 해밀턴어에서 영감을 얻었지만, 그의 최대 원리의 일부로 레프 폰트랴긴에 의해 최적의 제어 이론의 해밀턴이 개발되었다.[2][3]폰트랴긴은 최적의 제어 문제를 해결하기 위해 필요한 조건이 해밀턴식 제어장치를 최적화하기 위해 선택되어야 한다는 것을 증명했다.[4]
where denotes a vector of state variables, and 제어 변수의 벡터.Once initial conditions and controls are specified, a solution to the differential equations, called a trajectory,찾을 수 있다.The problem of optimal control is to choose (from some set ) so that maximizes or minimizes a certain objective function between an initial time 및 터미널 t= 서 t 1}은 무한대일 수 있음)특히 각 시점에서 성능지수 I( (), ( t), ) I ( ( t를 최적화하는 것이 목표다.
위와 같은 상태 변수의 운동 방정식에 따라.솔루션 방법에는 해밀턴[2] 제어로 알려진 보조 함수의 정의가 포함된다.
정적 최적화 문제에서 라그랑지아처럼 객관적 함수와 상태 방정식을 결합한 것으로 단지 비용변수로 언급되는 승수 ( ) 이(가) 상수보다는 시간의 함수일 뿐이다.
목표는 최적의 제어 정책 함수 ( t) 을(를) 찾는 것이며, 이를 통해 상태 x ( 의 최적 궤적을 찾는 것인데, Pontryagin의 최대 원리에 의해 해밀턴키안이 된다.
for all
최대치에 대한 1차 필수 조건은 다음과 같다.
which generates the state transition function t
which generates
그 중 후자를 비용 방정식이라고 한다.상태 방정식과 비용 방정식은 해밀턴 동적 시스템(물리학에서 해밀턴 시스템과 유사하지만 해밀턴 시스템과 구별됨)을 기술하는데, 초기 두 점을 포함하는 경계 조건이 있다는 점을 고려할 때 이 해법은 2점 경계 값 문제를 수반한다.시간(상태 변수에 대한 미분 방정식) 및 터미널 시간(비용 변수에 n 미분 방정식, 최종 함수를 지정하지 않는 한 경계 조건은 )= 또는 t 이다.[5] 1)= 0 1}\ {\}(로 무한 시간 지평선.
최대치를 위한 충분한 조건은 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해밀턴식 해협성
여기서 ( ) 이() 최적 컨트롤이고, ( t) 이(가 상태 변수에 대한 최적의 궤적을 산출한다.[6]Alternatively, by a result due to Olvi L. Mangasarian, the necessary conditions are sufficient if the functions and are both concave in 및[7]
여기서 ( ) 는 정적 최적화 문제에서 라그랑주 승수와 비교하지만, 위에서 언급한 바와 같이 지금은 시간의 함수다.레전드르 변환을 진행하면서 오른쪽의 마지막 용어는 다음과 같이 부품별 통합을 사용하여 다시 쓸 수 있다.
라그랑어적 표현으로 대체해서
최적화를 위한 1차 조건을 도출하기 위해서는 용액이 발견되어 라그랑지안이 최대화되었다고 가정한다.그런 다음 ( ) 또는을(를) 변경하면 반드시 Lagrangian 값이 하락해야 한다.으로 L 의 총 파생상품이 준수됨
이 식이 0이 되려면 다음과 같은 최적화 조건이 필요하다.
If both the initial value and terminal value are fixed, i.e. , no conditions on 및{(t 1 ) {\가 필요하다.단자값이 자유롭다면, 흔히 그렇듯이, 를 위해 추가 조건 )= 0 이 필요하다.후자는 고정된 지평선 문제에 대한 횡단성 조건이라고 불린다.[8]
필요한 조건이 해밀턴인에게 위에서 말한 조건과 동일함을 알 수 있다.따라서 해밀턴인은 1차적으로 필요한 조건을 발생시키는 장치로 이해할 수 있다.[9]
(참고: 시간 의 이산 시간 해밀턴은 시간+ 1의 비용 변수를 수반한다는 점에 유의하십시오.[10]과(와) 관련하여 구별할 때 비용 방정식의 오른쪽에+ )가 포함된 용어를 얻으려면 이 작은 세부 사항이 필수적이다.여기서 잘못된 관례를 사용하면 잘못된 결과, 즉 역차 방정식이 아닌 원가 방정식으로 이어질 수 있다.
시간 경과에 따른 해밀턴인의 거동향
폰트랴긴의 최대 원리에서 해밀턴인을 위한 특별한 조건이 도출될 수 있다.[11]최종 시간 1}이 고정되고 해밀턴ian이 시간에 명시적으로 의존하지 않을 때(= ) t 다음
제어 이론의 해밀턴어는 제어 변수 에 대해 시스템의 동역학이 아니라 스칼라 기능을 극단화하기 위한 조건(라그랑어)을 기술한다 통상적으로 정의한 바와 같이 4개의 변수의 함수다.
여기서 은(는) 상태 변수이고 은(는) 우리가 극단화하는 것과 관련된 제어 변수다.
최대값의 관련 조건은
이 정의는 Sussmann과 Willems가 기사에서 제공한 정의와 일치한다.[13](39페이지, 방정식 14 참조).Sussmann과 Willems는 브라키스토크론 문제와 같은 제어 해밀턴이 역학적으로 사용될 수 있는 방법을 보여주지만, 이 접근법에 대한 Carathéodory의 이전 연구는 언급하지 않는다.[14]
현재값 및 현재값 해밀턴어
경제학에서 동적 최적화 문제의 객관적 기능은 종종 기하급수적인 할인을 통해서만 시간에 따라 직접적으로 달라지는데, 그러한 형식을 취한다.
여기서 ( ( ) ,(t )을(를) 순간 효용 함수 또는 펠리시티 함수라고 한다.[15]This allows a redefinition of the Hamiltonian as where
현재 값 해밀턴 H( ) , ( ) , (t ) ,) H과 대조적으로 현재 값 해밀턴이라고 한다.가장 주목할 만한 것은 원가계수 변수가 t)= ( ) mathebf {\로 다시 정의되어 1차 조건이 수정된다는 점이다
제품 규칙에서 바로 따라오는 것.경제적으로 ) 은 자본재 ( t )에 대한 현재 값 그림자 가격을 나타낸다.
최적의 소비 경로 ( ) 을 선택하여 최대화한다(){\ 함수는 특정 시점에 을(를) 소비하는 대표적인 에이전트인 유틸리티를 나타낸다. - e 인수는 할인을 나타낸다.최대화 문제는 유효 근로자 1인당 자본의 시간 진화를 설명하면서 자본 집약도에 대한 다음과 같은 미분 방정식의 적용을 받는다.
여기서 c(t){\displaystyle c(t)}기간은 t소비, k(t){\displaystyle k(t)}기간은 있어 근로자 1인당(k(0과))k0>0{\displaystyle k(0)=k_{0}>0}), f(k(t)){\displaystyle f(k(t))}기간은 있어 생산, n{n\displaystyle}은 인구 증가율, δ{\di.splays\cH}은(는) 자본 감가상각률이며, 에이전트는 미래효용을 >
여기서 ( t) 은 위의 방정식에 따라 진화하는 상태 변수, ( ) 은 제어 변수다.해밀턴인이 되다.
최적성 조건은
transversality 조건 ( ) ( T)= 0 .()= log(을를)로 하면 t 수익률에 대한 첫 번째 최적성 조건을 로그 구분
두 번째 최적 조건 수율에 이 방정식 삽입
이는 케인스-람시 규칙으로 알려져 있으며, 이를 준수할 경우 최대 수명 효용을 보장하는 모든 기간에 소비 조건을 제공한다.
참조
^Ferguson, Brian S.; Lim, G. C. (1998). Introduction to Dynamic Economic Problems. Manchester: Manchester University Press. pp. 166–167. ISBN0-7190-4996-2.
^Seierstad, Atle; Sydsæter, Knut (1987). Optimal Control Theory with Economic Applications. Amsterdam: North-Holland. pp. 107–110. ISBN0-444-87923-4.
^Mangasarian, O. L. (1966). "Sufficient Conditions for the Optimal Control of Nonlinear Systems". SIAM Journal on Control. 4 (1): 139–152. doi:10.1137/0304013.
^Kamien, Morton I.; Schwartz, Nancy L. (1991). Dynamic Optimization : The Calculus of Variances and Optimal Control in Economics and Management (Second ed.). Amsterdam: North-Holland. pp. 126–127. ISBN0-444-01609-0.
Léonard, Daniel; Long, Ngo Van (1992). "The Maximum Principle". Optimal Control Theory and Static Optimization in Economics. New York: Cambridge University Press. pp. 127–168. ISBN0-521-33158-7.
Wulwick, Nancy (1995). "The Hamiltonian Formalism and Optimal Growth Theory". In Rima, I. H. (ed.). Measurement, Quantification, and Economic Analysis. London: Routledge. ISBN978-0-415-08915-9.