대수 리카티 방정식

Algebraic Riccati equation

대수적 Riccati 방정식연속 시간 또는 이산 시간에서의 무한-수평 최적 제어 문제의 맥락에서 발생하는 비선형 방정식의 한 유형이다.

전형적인 대수학 리카티 방정식은 다음 중 하나와 유사하다.

연속 시간 대수 Riccati 방정식(CARE):

또는 이산 시간 대수 Riccati 방정식(DARE):

P 수 없는 n by n 대칭 행렬이고 A, B, Q, R은 알려진 실제 계수 행렬이다.

일반적으로 이 방정식은 많은 해답을 가질 수 있지만, 그러한 해법이 존재한다면, 우리는 일반적으로 고유한 안정화 해법을 얻기를 원한다고 명시되어 있다.

이름의 유래

Riccati라는 이름은 Riccati 미분방정식과의 관계 때문에 이러한 방정식에 붙여졌다.실제로 CARE는 Riccati 미분방정식의 관련 매트릭스의 시간 불변성 솔루션으로 검증된다.DALE에 대해서는, Riccati 차등 방정식의 시간 불변성 해법(불연속 시간 LQR의 맥락에서 Riccati 미분 방정식의 아날로그)에 의해 검증된다.

이산 시간 대수 Riccati 방정식의 컨텍스트

무한대수평적 최적제어 문제에서는 어떤 관심 변수의 가치를 임의로 미래에 대해 관심을 가지며, 미래에 항상 최적으로 행동할 것이라는 것을 알고 지금 당장 최적으로 제어 변수의 값을 선택해야 한다.언제든지 문제 제어 변수의 최적 전류 값은 Riccati 방정식의 해법과 진화하는 상태 변수에 대한 현재 관찰을 사용하여 찾을 수 있다.다중 상태 변수와 다중 제어 변수를 사용하는 경우 Riccati 방정식은 행렬 방정식이 될 것이다.

대수적 Riccati 방정식은 무한수평 시간 변량 선형 변량 조절기 문제(LQR)와 무한수평 시간 변량 선형 변량-가우스 제어 문제(LQG)의 해결책을 결정한다.이것들은 통제 이론의 가장 근본적인 문제들 중 두 가지다.

이산 시간 선형 2차 제어 문제의 일반적인 사양은 최소화하는 것이다.

국가 방정식의 적용을 받는다.

여기서 y는 상태 변수의 n × 1 벡터, u제어 변수의 k × 1 벡터, A는 n × n 상태 전이 행렬, B는 제어 승수의 n × k 행렬, Q(n × n)는 대칭 양의 반확정적 상태 비용 행렬, R(k × k)은 대칭 양의 확정 관리 비용 행렬이다.

시간 내 역방향 유도는 각 시간에 최적의 제어 솔루션을 얻기 위해 사용될 수 있다.[1]

T= Q 따르면

이 문제의 이산 시간 역학 리카티 방정식으로 알려져 있다.T가 무한대로 가는 무한수평 문제와 관련된 P의 정상상태 특성화는 그것이 수렴될 때까지 반복적으로 동적 방정식을 반복함으로써 찾을 수 있다. 그런 다음 P는 동적 방정식에서 시간 첨자를 제거하는 것이 특징이다.

해결책

일반적으로 해결사는 그러한 해결책이 존재하는 경우, 고유한 안정화 솔루션을 찾으려고 노력한다.관련 LQR 시스템을 제어하기 위해 이를 사용하면 폐쇄 루프 시스템이 안정화될 수 있다.

CARE의 경우 컨트롤은

폐쇄 루프 상태 전송 매트릭스는

모든 고유값이 완전히 음의 실제 부분을 가질 경우에만 안정적이다.

DARE의 경우, 제어는

폐쇄 루프 상태 전송 매트릭스는

모든 고유값이 엄격히 복잡한 평면의 단위 원 안에 있는 경우에만 안정적이다.

대수적 Riccati 방정식의 해법은 매트릭스 인자화 또는 Riccati 방정식에 대한 반복을 통해 얻을 수 있다.유한-수평 문제에서 발생하는 동적 Riccati 방정식을 사용해 이산 시간 사례에서 한 가지 유형의 반복을 얻을 수 있다: 후기 유형의 문제에서 매트릭스 값의 각 반복은 최종 시간으로부터 시간의 유한 거리인 각 기간의 최적 선택과 관련되며, 반복이 이루어지는 경우 매트릭스 값의 최적 선택과 관련이 있다.사실상 그것은 최종 기간 이전에, 즉 무한한 지평선이 있을 때 최적 선택에 관련된 특정한 매트릭스로 수렴된다.

더 큰 시스템의 아이젠데 구성을 찾음으로써 해결책을 찾는 것도 가능하다.CARE의 경우 해밀턴 매트릭스를 정의한다.

(가) 해밀턴식이기 때문에 가상 축에 고유값이 없다면 그 고유값의 정확히 절반은 음의 실제 부분을 가진다.이 해당 하위 공간의 를 이루는 n {\displaystyle 행렬을 다음과 같이 블록 매트릭스 표기법으로 나타내는 경우

그때

Riccati 방정식의 해법이며, 나아가 - - T 의 고유값(는) 음의 실제 부분을 Z 의 고유값이다.

DALE의 경우 (를) 변환할 수 없는 경우, 우리는 공통적인 행렬을 정의한다.

(는) 동심원이기 때문에 단위 원에 고유값이 없으면 그 고유값의 정확히 절반은 단위 원 안에 있다.이 해당 하위 공간의 를 이루는 n {\displaystyle 행렬을 다음과 같이 블록 매트릭스 표기법으로 나타내는 경우

여기서 , , 분해[2] 결과

그때

Riccati 방정식의 해결책이며, A - (R + T ) - A의 고유값(는) 원 안에 있는 Z 의 고유값이다.

참고 항목

참조

  1. ^ Chow, Gregory (1975). Analysis and Control of Dynamic Economic Systems. New York: John Wiley & Sons. ISBN 0-471-15616-7.
  2. ^ William Arnold; Alan Laub (1984). "Generalized Eigenproblem Algorithms and Software for Algebraic Riccati Equations".

외부 링크