상태 옵서버

State observer

제어 이론에서 상태 관측자 또는 상태 추정기는 실제 시스템의 입출력 측정으로부터 주어진 실제 시스템의 내부 상태에 대한 추정치를 제공하는 시스템입니다.일반적으로 컴퓨터에 의해 구현되며 많은 실용적인 응용 프로그램의 기초를 제공합니다.

를 들어 상태 피드백을 사용하여 시스템을 안정화하는 등 많은 제어 이론 문제를 해결하기 위해 시스템 상태를 아는 것이 필요합니다.대부분의 경우 시스템의 물리적 상태는 직접 관찰로 판단할 수 없습니다.대신 내부 상태의 간접적인 영향은 시스템 출력을 통해 관찰됩니다.단순한 예는 터널 내 차량의 경우입니다. 차량이 터널을 드나드는 속도와 속도를 직접 관찰할 수 있지만, 터널 내부의 정확한 상태는 추정할 수 있을 뿐입니다.시스템이 관찰 가능한 경우 상태 관찰자를 사용하여 출력 측정에서 시스템 상태를 완전히 재구성할 수 있습니다.

전형적인 관찰자 모형

Luenberger Observer의 블록 다이어그램.옵저버 게인 L의 - y^ { y\{ - { { y 입니다.

선형, 슬라이딩 모드, 고게인, 타우 및 입방형 관찰자는 선형 및 비선형 시스템의 상태 추정에 사용되는 여러 관찰자 구조 중 하나이다.다음 섹션에서는 선형 옵서버 구조에 대해 설명합니다.

디스크리트 타임 케이스

선형, 시간 불변 물리적 이산 시간 시스템의 상태는 다음을 만족하는 것으로 가정한다.

서 k k { x 발전소 상태,u( {u( 입력, { y 출력입니다.이러한 방정식은 발전소의 전류 출력과 미래 상태가 모두 현재 상태와 전류 입력에 의해서만 결정된다는 것을 나타냅니다(이러한 방정식은 이산 시간 단계로 표현되지만, 연속 시스템에 대해서는 매우 유사한 방정식이 유지됩니다).이 시스템이 관찰 가능한 경우 플랜트의 출력 y를 사용하여 상태 관찰자의 상태를 조정할 수 있습니다.

그 후 물리적 시스템의 관찰자 모델은 일반적으로 위의 방정식에서 도출됩니다.발전소의 투입물과 산출물의 연속적인 측정값을 수신할 때 모델 상태가 발전소의 상태로 수렴되도록 하기 위해 추가 용어를 포함할 수 있다.특히 관측자의 출력은 플랜트의 출력에서 빼서 L(\ L을 곱할 수 있습니다.이 값을 관측자 상태에 대한 방정식에 더해 아래 방정식으로 정의되는 이른바 Luenberger 관찰자를 생성합니다.상태 관찰자의 변수는 일반적으로 x (k) \ ( \ 나타나 물리 시스템이 만족하는 방정식의 변수와 구별됩니다.

관찰자 e ( ) () -x () { e ( k ) →} - ( )} - x ( k )}이 k \ k\ \일 때 관찰자 오류는k-( )를 한다.따라서 이 이산 시간 시스템의 Luenberger 관찰자는 A - C style 단위 원 안에 모든 고유값을 가질 때 점근적으로 안정적입니다.

제어 목적으로 옵서버 시스템의 출력은 게인 K K를 통해 옵서버와 플랜트의 입력으로 피드백됩니다.

관찰자 방정식은 다음과 같습니다.

더 쉽게 말하면

원리로 인해 시스템 전체의 안정성을 않고 K와을 독립적으로 할 수 있습니다.경험적으로 A - C의 극({A - LC으로 A - K의 극({displaystyle - BK보다 10배 빠르게 수렴하도록 선택됩니다.

연속 시간 케이스

이전 예는 이산 시간 LTI 시스템에서 구현된 관찰자를 위한 것입니다.그러나 연속 시간 사례의 경우 프로세스는 유사하다. 즉, 연속 시간 오차 역학이 점근적으로 0으로 수렴되도록 관찰자 L L 선택한다(즉, A- 후르비츠 행렬인 ).

연속 시간 선형 시스템의 경우

서 x , u R , r\ x ^{ \ 、 관찰자는 위에서 설명한 이산 시간 경우와 유사합니다.

{

관찰자 e - { e(는) 방정식을 만족합니다.

( - ) \ { dot {e } = ( A - ) e

A - C\ -LC \ A - L \ L \ L \ displaystyle [ A , ] \ displaystyle [ A C L}의 고유값은 쌍이 관측 가능한 경우 관찰자 게인을 적절히 선택하여 임의로 할 수 있다.특히 Hurwitz로 만들 수 있으므로 는 t t \ \ ( t ) { displaystyle ( t )

피킹 및 기타 관찰자 방법

옵서버의 L(\L)이 높으면 선형 Luenberger 옵서버는 시스템 상태로 매우 빠르게 수렴합니다.그러나 관찰자 이득이 높으면 초기 추정기 오류가 엄청나게 클 수 있는 피크 현상이 발생한다(즉,[1] 사용하기에 비현실적이거나 안전하지 않음).그 결과, 피킹 현상 없이 빠르게 수렴하는 비선형 고이득 관찰자 방법을 이용할 수 있다.예를 들어 슬라이딩 모드 제어는 측정 오차가 있는 경우에도 한 추정 상태의 오차를 유한 시간 내에 0으로 만드는 옵서버를 설계하기 위해 사용할 수 있으며, 다른 상태는 피크가 가라앉은 후 Luenberger 옵서버의 오차와 동일하게 동작하는 오차를 가진다.또한 슬라이딩 모드 관찰자는 Kalman [2][3]필터와 유사한 매력적인 소음 복원 특성을 가지고 있다.또 다른 접근방식은 다중 옵서버를 적용하여 과도현상을 크게 개선하고 옵서버 오버슈트를 줄이는 것입니다.멀티 옵서버는 고게인 옵서버를 적용할 [4]수 있는 모든 시스템에 적용할 수 있습니다.

비선형 시스템에 대한 상태 관찰자

높은 게인, 슬라이딩 모드 및 확장된 관찰자는 비선형 시스템의 가장 일반적인 관찰자입니다.비선형 시스템에 대한 슬라이딩 모드 관찰자의 적용을 설명하기 위해 먼저 비입력 비선형 시스템을 고려합니다.

서 x R \ x \ \ {} ^ { } 。또한 다음과 같은 측정 가능한 y R\ y \ \ { 있다고 가정합니다.

관찰자를 설계하기 위한 몇 가지 근사하지 않은 접근법이 있다.아래에 제시된 두 관찰자는 시스템에 입력이 있는 경우에도 적용됩니다.그것은,

선형화 가능한 오류 역학

Krener와 Isidori[5], Krener와 Responsek의[6] 제안 중 하나는 새로운 변수 시스템에서 읽히는 선형화 변환(즉, 피드백 선형화에 사용되는 것과 같은 미분형) (x) \ z = \ )가 존재하는 상황에서 적용될 수 있다.

다음으로 Luenberger 옵서버는 다음과 같이 설계됩니다.

^ z + () - ( - ) { \{} + \ () \( { \ { } - \ )} 。

변환 e - { e 대한 관측자 오차는 기존의 선형 경우와 동일한 방정식을 만족한다.

( - ) \ { dot {e } = ( A - ) e

Gauthier, Hammouri, Othman[7],[8] Hammouri 및 Kinnaert와 같이 z (x) \ z= \ x )이 있으면 시스템이 변형될 수 있습니다.

그러면 관찰자는 다음과 같이 설계된다.

서 L { L 시간에 따라 달라지는 관찰자 이득입니다.

Ciccarella, Dalla Mora 및 Germani는[9] 비선형 변환의 필요성을 배제하고 규칙성에 대한 단순한 가정만을 사용하여 추정 상태의 전역 점근 수렴을 증명하여 보다 고급적이고 일반적인 결과를 얻었다.

슬라이딩 모드 옵서버

위의 선형 사례에 대해 논의한 바와 같이, Luenberger 관측자에 존재하는 피킹 현상은 슬라이딩 모드 관측자의 사용을 정당화한다.슬라이딩 모드 옵서버는 비선형 고게인 피드백을 사용하여 추정 출력과 측정된 출력 사이에 차이가 없는 하이퍼서페이스로 추정 상태를 유도합니다.관측자에 사용되는 비선형 이득은 일반적으로 추정된 측정 출력 오류의 신호(즉, sgn)와 같이 스케일링된 스위칭 함수로 구현됩니다.따라서 이 높은 게인 피드백에 의해 옵서버의 벡터장은 예측된 출력이 측정 출력과 정확히 일치하는 곡선을 따라 옵서버 궤적이 미끄러지도록 접혀 있다.따라서 시스템이 출력에서 관찰 가능한 경우 옵서버 상태는 모두 실제 시스템 상태로 구동됩니다.또한 에러 부호를 사용하여 슬라이딩 모드 옵서버를 구동함으로써 옵저버 궤적은 많은 형태의 노이즈에 둔감해진다.따라서 일부 슬라이딩 모드 관찰자는 칼만 필터와 유사하지만 구현이 [2][3]더 간단한 매력적인 특성을 가지고 있다.

Drakunov에 [10]의해 제안되었듯이, 슬라이딩 모드 옵서버는 비선형 시스템의 클래스를 위해 설계될 수도 있습니다.이러한 관찰자는 원래 변수 x {x 작성될 수 있으며 다음과 같은 형식이 있습니다.

여기서:

  • ( ) \ 벡터는 스칼라 부호 함수n \ n 으로 확장합니다.그것은,
    벡터 n\ z \ \ { } ^ { }
  • H { H에는 출력 h { h 반복 Lie 도함수가 있습니다.특히,
    h(\ 벡터 f(즉 시스템의 x x 궤적을 출력 h(\ h i Lie 도함수입니다th.시스템에 입력이 없거나 n의 상대도가 있는 특수한 경우 H H y) { y)= 및 n - { 도함수의 집합입니다.이 관찰자가 잘 정의되려면야코비안 선형화 H)의 역( { H해야하므로 변환 H(x) { H(x 국소 미분 동형이 됩니다.
  • M ( x)({ M {x 다음과 같습니다.
    여기서 각 {,, { i \ , 2 style , \ > {\ m { ( { \ { } } > suit suit suit suit suit suit suit suit where where where where where where where where where where where where where where where where\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\
  • 옵서버 ( t V 다음과 같습니다.
    서 sgn ( ) { } ( { \ { cdot } )는 스칼라에 대해 정의된 일반 시그널 함수이며 { ... { \ {\\} 슬라이딩 모드에서 불연속 함수의 "일치 연산자"를 나타냅니다.

그 아이디어는 다음과 같이 간단히 설명할 수 있다.슬라이딩 모드 원리에 따르면 슬라이딩 모드가 시작되면 ( ) - (x^(){ {sgn { 등가 제어값으로 대체해야 합니다( 참조).실제로는 저속 컴포넌트가 동등한 값과 동일한 고주파수로 전환(채터)합니다.적절한 로우패스 필터를 적용하여 에서 고주파 컴포넌트를 제거하면 추정 시스템 상태에 대한 자세한 정보를 포함하는 동등한 컨트롤 값을 얻을 수 있습니다.위에서 설명한 관찰자는 이 방법을 여러 번 사용하여 유한 시간 내에 비선형 시스템의 상태를 이상적으로 구합니다.

수정된 관찰 오류는 변환된 e () - ( ) { e ( ) - H ( { \ { } )} 。특히,

그래서

그래서:

  1. 1( (x ( m {1 ( { \ { } )\ h _} ( x ( t )인 한, 에러 다이내믹스의 첫 행 e (x ) - ( x ) style {} 시간 내에 1 0 {\1}=0} 슬라이딩 모드로 진입하기에 충분한 조건을 충족합니다.
  2. 1 { e {1} =} 서페이스를 따라 하는 ) { ( ) ( 1 ) { } ( t ) = \ {_ { { \ hat { } \ }\ { { sgn} ( e_ { { text } ( x ) () - 2 ( ) ( \ _ {) - { { \ hat {x } = h{ ( \ { } = _ {2}= h _ { 2 3) 。 ( 3 )( ) - m ( ) 2) { _ {3 ( { \ { x )-} {x}})\{sgn}(2})\}}}}})\ = 2 .
  3. i { _ { i } =} surface에 따라 하는 i+ ( ) { ... v _ {+ ( t ) \ { \ { } } h+ (x Isplaystyle m_ᆲ({\hat{x}})\geq h_ᆳ(x(t))}, 오류의 역동성을(나는 1+){\displaystyle(i+1)}을 열, ei+ 1)나는 + 2()^)− 나는 + 1()^)sgn⁡(ei1+){\displaystyle{\dot{e}}_ᆶ=h_ᆷ({\hat{x}})-m_ᆸ({\hat{x}})\operatorname{sgn}(e_{i+1})}, hm번째에 들어갈 것 ˙.e 에 e + 1 0 { { i + 1 } = 0} 슬라이딩 모드.

따라서 충분히 큰 이득을 위해 모든 관찰자의 추정 상태는 유한 시간 내에 실제 상태에 도달한다.실제로 증가시키면 각 함수를 확실하게 제한할 수 있는 한 원하는 유한시간 내에 컨버전스가 가능합니다.따라서 맵 : n {\ H^{^{ 미분형상(즉, 그 제이콥 선형화가 반전 가능)이라는 요건은 추정된 출력의 수렴을 의미한다고 주장한다.즉, 요건은 관측 가능성 조건입니다.

입력이 있는 시스템의 슬라이딩 모드 옵서버의 경우, 관측 오차가 입력과 독립하기 위해서는 추가 조건이 필요하다.예를 들면,

시간에 의존하지 않습니다.관찰자는 다음과 같습니다.

멀티 옵서버

멀티 옵서버는 다수의 모델이 동시에 동작하는 고이득 옵서버 구조를 싱글 옵서버에서 멀티 옵서버로 확장합니다.여기에는 두 개의 계층이 있습니다. 첫 번째 계층은 서로 다른 추정 상태를 가진 여러 개의 고이득 관찰자로 구성되며 두 번째 계층 관찰자의 중요도 가중치를 결정합니다.이 알고리즘은 구현이 간단하며 차별화 [4]등의 위험한 작업이 포함되지 않습니다.다중 모델의 개념은 적응 [11]제어에서 정보를 얻기 위해 이전에 적용되었습니다.

고게인 옵서버의 수가 n+ n)이라고 가정하면,

서 k , + k)은 관찰자 색인입니다.첫 번째 레이어 옵서버는 같은 L(\ L 구성되지만 초기 k ( 와는 다릅니다.두 번째 레이어에서는 k 부터 k () {)}...+ {\ k 관찰자를 하나로 결합하여 단일 상태 벡터 추정

kR {\ \ _ 중량 계수입니다.이러한 요인은 두 번째 계층에서 추정치를 제공하고 관측 과정을 개선하기 위해 변경됩니다.

라고 가정해 보자

그리고.

여기서 k n× {\ \^{}은 k h {kth} 옵서버 ( t) { 1 하는 벡터입니다.

일부 변환은 선형 회귀 문제로 귀결됩니다.

이 공식은 k ( _할 수 있습니다.다양체를 구성하려면: \ m : \ {^ { } { n }\ { R ^ { } ) \ _ 측정 가능한 신호에 의존하여 계산할 수 있습니다우선 관찰자 오류에서 (t) \ _ { 현상을 제거하는 것입니다.

+ k ( )k ( e { \ \_ { k_ {

n 도함수 k ^)- t에 대해 n(\ _ 하여 정의된 m 리드를 (\ displaystyle { kt

t 0 { { d } 0 은 일정 시간 상수입니다.k ( \ _{ 릴레이는 k ( displaystyle _ 그 통합에 모두 있으므로 제어 시스템에서 쉽게 사용할 수 있습니다. k () { _ 추정법칙에 의해 규정되어 있으므로 다지관 측정이 가능함을 증명한다. 번째 ( t) k +1 { \ n } {\ _ { () 추정치로서 도입되었다.매핑 오류는 다음과 같이 지정됩니다.

서 e (t ) R × , ^k ( )R { e \ } ( )\\ {{ \{ } \ in \{ R . ( ) t ) {\}(t)= 식에서 x {(를) 계산할 수 있게 되어 다지관의 특성으로 인해 피킹 현상이 감소한다.작성된 매핑은 추정 프로세스에 많은 유연성을 제공합니다.두 번째 레이어의x (t ){x( 값을 하여 x {x[4]를 계산할 수도 있습니다.

경계 관찰자

경계[12] 또는 간격[13][14] 관측자는 상태의 두 가지 추정치를 동시에 제공하는 관측자 클래스를 구성합니다. 하나는 상태의 실제 값에 대한 상한을 제공하는 반면 다른 하나는 하한을 제공합니다.그러면 상태의 실제 값은 항상 이 두 추정치 안에 있는 것으로 알려져 있습니다.

이러한 한계는 추정의 정확성을 매번 알 수 있기 때문에 실제 [15][16]적용에서 매우 중요합니다.

만약 나는{L\displaystyle}제대로 선택된 수학적으로, 두 Luenberger 관측통들은,: 상한 경우^ U(k){\displaystyle{\hat{)}}_ᆱ(k)}(는 e(k을 보장한다)))^ U(k)−)(k){\displaystyle e(k)={\hat{)}}_{U}(한[17], 예를 들어, 긍정적인 시스템 속성을 사용하여 사용될 수 있다.k=-x( k kand \ k \ \일 때 (\ display style k )및 하한 x ^ ( \ { (e( ^ L ( style { (k)\style ex L (k했을 때)로 수렴합니다즉, x x( )( x입니다.

「 」를 참조해 주세요.

레퍼런스

인라인 레퍼런스
  1. ^ Khalil, H.K. (2002), Nonlinear Systems (3rd ed.), Upper Saddle River, NJ: Prentice Hall, ISBN 978-0-13-067389-3
  2. ^ a b Utkin, Vadim; Guldner, Jürgen; Shi, Jingxin (1999), Sliding Mode Control in Electromechanical Systems, Philadelphia, PA: Taylor & Francis, Inc., ISBN 978-0-7484-0116-1
  3. ^ a b Drakunov, S.V. (1983), "An adaptive quasioptimal filter with discontinuous parameters", Automation and Remote Control, 44 (9): 1167–1175
  4. ^ a b c Bernat, J.; Stepien, S. (2015), "Multi modelling as new estimation schema for High Gain Observers", International Journal of Control, 88 (6): 1209–1222, Bibcode:2015IJC....88.1209B, doi:10.1080/00207179.2014.1000380, S2CID 8599596
  5. ^ Krener, A.J.; Isidori, Alberto (1983), "Linearization by output injection and nonlinear observers", System and Control Letters, 3: 47–52, doi:10.1016/0167-6911(83)90037-3
  6. ^ Krener, A.J.; Respondek, W. (1985), "Nonlinear observers with linearizable error dynamics", SIAM Journal on Control and Optimization, 23 (2): 197–216, doi:10.1137/0323016
  7. ^ Gauthier, J.P.; Hammouri, H.; Othman, S. (1992), "A simple observer for nonlinear systems applications to bioreactors", IEEE Transactions on Automatic Control, 37 (6): 875–880, doi:10.1109/9.256352
  8. ^ Hammouri, H.; Kinnaert, M. (1996), "A New Procedure for Time-Varying Linearization up to Output Injection", System and Control Letters, 28 (3): 151–157, doi:10.1016/0167-6911(96)00022-9
  9. ^ Ciccarella, G.; Dalla Mora, M.; Germani, A. (1993), "A Luenberger-like observer for nonlinear systems", International Journal of Control, 57 (3): 537–556, doi:10.1080/00207179308934406
  10. ^ Drakunov, S.V. (1992), "Sliding-Mode Observers Based on Equivalent Control Method", Proceedings of the 31st IEEE Conference on Decision and Control (CDC) (Tucson, Arizona, December 16–18): 2368–2370, doi:10.1109/CDC.1992.371368, ISBN 978-0-7803-0872-5, S2CID 120072463
  11. ^ Narendra, K.S.; Han, Z. (August 2012). "A new approach to adaptive control using multiple models". International Journal of Adaptive Control and Signal Processing. 26 (8): 778–799. doi:10.1002/acs.2269. ISSN 1099-1115. S2CID 60482210.
  12. ^ Combastel, C. (2003). "A state bounding observer based on zonotopes" (PDF). 2003 European Control Conference (ECC). pp. 2589–2594. doi:10.23919/ECC.2003.7085991. ISBN 978-3-9524173-7-9. S2CID 13790057.
  13. ^ Rami, M. Ait; Cheng, C. H.; De Prada, C. (2008). "Tight robust interval observers: An LP approach" (PDF). 2008 47th IEEE Conference on Decision and Control. pp. 2967–2972. doi:10.1109/CDC.2008.4739280. ISBN 978-1-4244-3123-6. S2CID 288928.
  14. ^ Efimov, D.; Raïssi, T. (2016). "Design of interval observers for uncertain dynamical systems". Automation and Remote Control. 77 (2): 191–225. doi:10.1134/S0005117916020016. S2CID 49322177.
  15. ^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf[베어 URL PDF]
  16. ^ Hadj-Sadok, M.Z.; Gouzé, J.L. (2001). "Estimation of uncertain models of activated sludge processes with interval observers". Journal of Process Control. 11 (3): 299–310. doi:10.1016/S0959-1524(99)00074-8.
  17. ^ Rami, Mustapha Ait; Tadeo, Fernando; Helmke, Uwe (2011). "Positive observers for linear positive systems, and their implications". International Journal of Control. 84 (4): 716–725. Bibcode:2011IJC....84..716A. doi:10.1080/00207179.2011.573000. S2CID 21211012.
일반 참고 자료

외부 링크