무향 변환
Unscented transform무향 변환(UT)은 주어진 비선형 변환을 유한한 통계 집합의 관점에서만 특성화되는 확률 분포에 적용한 결과를 추정하는 데 사용되는 수학적 함수입니다.무향 변환의 가장 일반적인 용도는 칼만 필터의 비선형 확장 맥락에서 평균 및 공분산 추정치의 비선형 투영입니다.그것의 창조자 제프리 울만은 "무향"이 "울만 필터"[1]로 언급되는 것을 피하기 위해 채택한 임의의 이름이라고 설명했지만, 다른 사람들은 "무향"이 "냄새가 나는"을 완곡하게 표현하기 위해 의도된 "향기"와 대조된다고 지적했습니다.
배경
많은 필터링 및 제어 방법은 평균 벡터 및 관련 오차 공분산 행렬의 형태로 시스템 상태의 추정치를 나타냅니다.예를 들어, 관심 있는 물체의 추정된 2차원 위치는 평균 위치 벡터 [x, y]{displaystyle [x,y]로 표현될 수 있으며, x{displaystyle x}의 분산, y{displaystyle y}의 분산, 둘 사이의 교차 공분산을 제공하는 2x2 공분산 행렬의 형태로 주어진다.공분산이 0이면 불확실성이나 오류가 없으며 개체의 위치가 평균 벡터로 지정된 것과 정확히 같다는 것을 의미합니다.
평균 및 공분산 표현은 기본적이지만 알려지지 않은 확률 분포의 처음 두 모멘트만 제공합니다.움직이는 물체의 경우, 알려지지 않은 확률 분포는 주어진 시간에 물체의 위치의 불확실성을 나타낼 수 있습니다.불확실성의 평균 및 공분산 표현은 임의의 선형 T{ T를 평균 m m 및 M M에 로 적용할 수 있기 때문에 수학적으로 편리합니다.이 선형성 특성은 첫 번째 원시 모멘트(평균)와 두 번째 중심 모멘트(공분산)를 초과하는 모멘트를 유지하지 않으므로 비선형 변환에서 발생하는 평균과 공분산은 모든 모멘트에 따라 달라지며 처음 두 개만 제공되기 때문에 일반적으로 결정할 수 없습니다.
공분산 행렬은 종종 평균과 관련된 예상 제곱 오차로 간주되지만 실제로 행렬은 실제 제곱 오차의 상한으로 유지됩니다.구체적으로, 평균 및공분산 ,M) {displaystyle M)}는 공분산 M({ M이 m{ m과 관련된 실제 제곱 오차 이상이 되도록 보수적으로 유지됩니다.수학적으로 이것은 M M에서 예상 제곱 오차(일반적으로 알려지지 않음)를 뺀 결과가 반확정 또는 양확정 행렬임을 의미합니다.보수적인 공분산 추정치를 유지하는 이유는 공분산이 과소평가되면 대부분의 필터링 및 제어 알고리즘이 분산되는 경향이 있기 때문입니다.이는 공분산이 지나치게 작으면 불확실성이 줄어들고 필터가 평균의 정확도에서 정당화되는 것보다 더 많은 가중치(신뢰)를 배치하게 되기 때문입니다.
위의 예로 돌아가서 공분산이 0인 경우 임의의 비선형 f에 따라 이동한 후 객체의 위치를 결정하는 것은 사소한 일입니다. (x, y) { f : 함수를 평균 벡터에 적용합니다.공분산이 0이 아닌 경우 변환된 평균은 일반적으로 f) { f)}와 않으며 이전 평균과 공분산만으로 변환된 확률 분포의 평균을 결정할 수도 없습니다.이러한 불확실성을 고려할 때 비선형 변환 평균과 공분산은 근사화될 수 있습니다.가장 초기의 근사치는 비선형 함수를 선형화하고 주어진 평균과 공분산에 결과 야코비안 행렬을 적용하는 것이었습니다.이는 확장 칼만 필터(EKF)의 기초이며, 많은 상황에서 좋지 않은 결과를 내는 것으로 알려져 있었지만, 수십 년 동안 실질적인 대안이 없었습니다.
향기 없는 변신의 동기
1994년 제프리 울만은 EKF가 시스템 상태의 비선형 함수와 부분 분포 정보(평균 및 공분산 추정치 형태)를 취하지만 부정확하게 알려진 확률 분포가 아닌 알려진 함수에 근사치를 적용한다고 언급했습니다.그는 근사 확률 분포에 적용되는 정확한 비선형 함수를 사용하는 것이 더 나은 접근법이라고 제안했습니다.이 접근법의 동기는 무향 변환이라는 용어가 처음 [3]정의된 박사 논문에 제시되어 있습니다.
다음과 같은 직관을 고려해 보십시오.모수 수가 고정되어 있으면 임의의 비선형 함수/변환을 근사화하는 것보다 주어진 분포를 근사화하는 것이 더 쉬울 것입니다.이 직관에 따라, 목표는 평균 및 공분산 정보를 캡처하는 동시에 임의의 비선형 방정식 집합을 통해 정보의 직접 전파를 허용하는 매개 변수화를 찾는 것입니다.이는 이산 근사의 각 점이 직접 변환될 수 있는 동일한 첫 번째 및 두 번째(그리고 가능하면 더 높은) 모멘트를 갖는 이산 분포를 생성하여 달성할 수 있습니다.변환된 앙상블의 평균과 공분산은 원래 분포의 비선형 변환 추정치로 계산할 수 있습니다.더 일반적으로, 알려지지 않은 분포의 알려진 통계 세트를 포착하기 위해 계산된, 주어진 비선형 변환을 점의 이산 분포에 적용하는 것을 무향 변환이라고 합니다.
즉, 주어진 평균 및 공분산 정보는 시그마 포인트라고 하는 일련의 점으로 정확하게 인코딩될 수 있으며, 이산 확률 분포의 요소로 취급되는 경우 주어진 평균 및 공분산과 동일한 평균 및 공분산을 갖습니다.이 분포는 각 점에 비선형 함수를 적용하여 정확하게 전파될 수 있습니다.변환된 점 집합의 평균 및 공분산은 원하는 변환된 추정치를 나타냅니다.이 접근 방식의 주요 이점은 비선형 함수를 선형 함수로 대체하는 EKF와 달리 비선형 함수가 완전히 활용된다는 것입니다.선형화의 필요성을 없애면 추정 품질의 향상과 무관한 이점도 얻을 수 있습니다.한 가지 즉각적인 이점은 UT가 주어진 함수에 적용될 수 있는 반면 미분할 수 없는 함수에는 선형화가 불가능할 수 있다는 것입니다.실용적인 장점은 UT가 선형화된 야코비안 행렬을 도출하고 구현할 필요를 피하기 때문에 구현이 더 쉬울 수 있다는 것입니다.
시그마 점
무향 변환을 계산하려면 먼저 시그마 포인트 세트를 선택해야 합니다.울만의 중요한 연구 이후, 많은 다른 시그마 포인트 세트가 문헌에서 제안되었습니다.이러한 변형에 대한 철저한 검토는 메네가스 외 [4]연구진의 연구에서 찾을 수 있습니다.일반적으로n + \ n + 1 포인트는 n \n [3]차원에서 주어진 평균과 공분산을 이산형 분포를 정의하는 데 필요하고 충분합니다.
표준 시그마 포인트 세트는 원래 울만이 제안한 대칭 세트입니다.2차원 원점 중심의 정삼각형의 꼭짓점을 생각해 보십시오.
위의 점들의 집합은 [ ] {\right{T식별 행렬)를 을 할수 있습니다.임의의 2차원 평균과 공분산 (x, X ) {\displaystyle (x, X)}이 주어지면, 각 점에 X의 행렬 제곱근을 곱하고 x {\displaystyle x}를 더하면 원하는 시그마 점을 얻을 수 있다항등식 행렬의 행을 구성하는 점들과 점들은 점들의 집합의 평균을 계산하고, 각 점들로부터 평균을 빼서 결과 집합이 0의 평균을 갖도록 합니다.그런 다음 점들의 영점 집합의 공분산을 계산하고 집합의 공분산이 동일하도록 각 점에 역으로 적용합니다.
Uhlmann은 역행렬을 계산하지 않고도± X\{와 벡터의 열에서 2n + 1 시그마 포인트의 세트를 편리하게 생성할 수 있음을 보여주었습니다.이는 계산적으로 효율적이며 점들이 대칭 분포를 형성하기 때문에 상태 추정치의 기본 분포가 알려져 있거나 [3]대칭이라고 가정할 수 있을 때마다 세 번째 중심 모멘트(왜곡)를 캡처합니다.그는 또한 음의 가중치를 포함한 가중치가 집합의 통계량에 영향을 미치는 데 사용될 수 있다는 것을 보여주었습니다.줄리에는 또한 임의 분포의 세 번째 모멘트(왜곡)와 대칭 [5][6]분포의 네 번째 모멘트(첨자)를 포착하기 위해 시그마 점을 생성하는 기술을 개발하고 검토했습니다.
예
무향 변환은 알려지지 않은 분포의 부분적 특성화에 주어진 함수를 적용하기 위해 정의되지만, 가장 일반적인 사용은 평균과 공분산만 제공되는 경우입니다.일반적인 예로는 데카르트 좌표계에서 [5]극좌표계로의 변환이 있습니다.
2차원 평균 및 공분산 추정치() {가 다음과 같이 데카르트 좌표로 주어진다고 가정합니다.
그리고 극좌표로의 변환 함수 ) [] {\ f는 다음과 같습니다.
(위에 주어진) 표준 심플렉스 시그마 포인트 각각에 [ 1 {{ M.{bmatrix에서 m{m을 더하면 다음을 얻을 수 있습니다.
위의 각 점에 변환 f) {\ f를 적용하면 다음을 얻을 수 있습니다.
이 세 변환점의 평균, = + 는 극좌표에서의 평균에 대한 UT 추정치입니다.
공분산의 UT 추정치는 다음과 같습니다.
여기서 합의 각 제곱 항은 벡터 외부 곱입니다.이것은 다음을 제공합니다.
이는 선형화된 평균 및 공분산과 비교할 수 있습니다.
이 경우 UT와 선형화된 추정치 사이의 절대적인 차이는 상대적으로 작지만, 필터링 애플리케이션에서 작은 오류의 누적 효과는 추정치의 회복 불가능한 차이로 이어질 수 있습니다.공분산이 과소평가되면 필터가 평균의 정확도를 지나치게 신뢰하게 되므로 오차의 효과가 악화됩니다.위의 예에서 선형화된 공분산 추정치가 UT 추정치보다 작음을 알 수 있으며, 선형화로 인해 평균의 실제 오차가 과소평가되었을 가능성이 높습니다.
이 예에서는 원래 추정치와 관련된 실제 확률 분포와 비선형 변환 적용 후 분포의 평균 및 공분산의 형태로 UT의 절대 정확도와 선형화된 추정치를 결정할 수 있는 방법이 없습니다(예:분석적 또는 수치적 통합을 통해 결정됨)이러한 분석은 기본 분포에 대한 가우스성을 가정하여 좌표 변환에 대해 수행되었으며, UT 추정치는 [7][8]선형화에서 얻은 추정치보다 훨씬 더 정확한 경향이 있습니다.
경험적 분석에 따르면 기본 분포가 [8]가우스일 때 n n 시그마 의 최소 심플렉스 세트의 사용은{ 포인트의 세트의 사용보다 훨씬 덜 정확합니다.이는 ( {\ M과 (와) 관련된 기본 분포가 대칭인 경우 위 예제에서 심플렉스 세트를 사용하는 것이 최선의 선택이 아님을 나타냅니다.기본 분포가 대칭적이지 않더라도 심플렉스 집합의 비대칭이 실제 분포의 비대칭과 일치하지 않기 때문에 심플렉스 집합은 여전히 대칭 집합보다 정확하지 않을 가능성이 있습니다.
예제로 돌아가서 시그마 포인트의 최소 대칭 집합은 공분산 M [ {\ M=에서 얻을 수 있습니다는 단순히 평균 로서, m [ 스타일 m [, 7.6 + 및 (M ) / = [. {6} 스타일b\b\matrix}.
이 구성은 위의 4개 시그마 포인트의 평균과 공분산이() {\임을 보장하며, 이는 직접 검증 가능합니다.비선형 f) {\ f를 각 시그마 포인트에 적용하면 다음을 얻을 수 있습니다.
이 네 개의 변환된 시그마 포인트의 평균, i= m {\ 는 극좌표에서의 평균에 대한 UT 추정치입니다.
공분산의 UT 추정치는 다음과 같습니다.
여기서 합의 각 제곱 항은 벡터 외부 곱입니다.이것은 다음을 제공합니다.
UT 추정치와 선형화된 평균 추정치 간의 차이는 변환의 비선형성 효과에 대한 측도를 제공합니다.예를 들어, 변환이 선형인 경우 UT와 선형화된 추정치는 동일합니다.이를 통해 평균의 실제 오차를 과소평가하지 않도록 UT 공분산에 이 차이의 제곱을 추가할 수 있습니다.이 방법은 평균의 정확도를 향상시키지는 않지만 공분산이 [3]과소평가될 가능성을 줄임으로써 시간이 지남에 따라 필터의 정확도를 크게 향상시킬 수 있습니다.
무향 변환의 최적성
울만은 그렇지 않으면 알려지지 않은 확률 분포의 평균과 공분산만 주어진다면, 처음 두 모멘트가 동일한 가능한 기본 분포의 무한한 수가 있기 때문에 변환 문제가 잘못 정의되어 있다는 것에 주목했습니다.기본 분포의 특성에 대한 선험적 정보나 가정이 없으면 변환된 평균과 공분산을 계산하는 데 사용되는 분포를 선택하는 것이 다른 분포와 마찬가지로 합리적입니다.즉, 시그마 점 집합에 의해 제공되는 것보다 우수한 주어진 평균과 공분산을 갖는 분포의 선택권이 없으므로 무향 변환은 사소한 것으로 최적입니다.
이러한 최적성에 대한 일반적인 진술은 물론 선형화와 비교하여 UT의 성능에 대한 정량적 진술을 하는 데 유용하지 않다. 결과적으로 그와 줄리에 및 다른 사람들은 분포의 특성 및/또는 비선형 변환 함수의 형태에 대한 다양한 가정 하에 분석을 수행했다.예를 들어, 선형화에 필수적인 함수가 미분 가능한 경우 이러한 분석은 무향 변환의 [7][8]예상 및 경험적으로 확증된 우수성을 검증합니다.
적용들
무향 변환은 무향 칼만 필터(UKF)로 알려진 칼만 필터의 비선형 일반화를 개발하는 데 사용될 수 있습니다.이 필터는 수중,[9] 지상 및 항공 항법,[10] [11]우주선을 포함한 많은 비선형 필터링 및 제어 응용 분야에서 EKF를 대체했습니다.무향 변환은 또한 리만-슈틸트제스 최적 [12]제어를 위한 계산 프레임워크로 사용되었습니다.이 계산적 접근법은 무향료 최적 [13]제어로 알려져 있습니다.
무향 칼만 필터
Uhlmann과 Simon Julier는 Kalman 필터(UKF)에서 무향 변환을 사용하면 다양한 [15][5][7]응용 분야에서 EKF에 비해 상당한 성능 향상을 제공한다는 것을 보여주는 여러 논문을 발표했습니다.줄리에와 울만은 추정된 분포 [15][7]정보를 캡처하기 위해 음의 가중치를 사용한 UKF의 맥락에서 특정 매개 변수화된 형태의 무향 변환을 사용한 논문을 발표했습니다.UT의 그 형태는 원래 공식(원래 울만이 제안한 대칭 집합)이 겪지 않는 다양한 수치 오류에 취약합니다.Julier는 음의 가중치를 사용하지 않고 또한 그러한 [16]문제의 대상이 되지 않는 매개 변수화된 형태를 후속적으로 설명했습니다.
참고 항목
레퍼런스
- ^ "First-Hand:The Unscented Transform - Engineering and Technology History Wiki".
- ^ "What is a Kalman filter and why is there an unscented version?".
- ^ a b c d Uhlmann, Jeffrey (1995). Dynamic Map Building and Localization: New Theoretical Foundations (Ph.D. thesis). University of Oxford.
- ^ Menegaz, Henrique M. T.; João, Y. Ishihara; Borges, Geovany A.; Vargas, Alessandro N. (16 February 2015). "A Systematization of the Unscented Kalman Filter Theory". IEEE Transactions on Automatic Control. 60 (10): 2583–2598. doi:10.1109/TAC.2015.2404511. hdl:20.500.11824/251. S2CID 12606055.
- ^ a b c Julier, S.; J. Uhlmann (1997). "Consistent Debiased Method for Converting Between Polar and Cartesian Coordinate Systems". Proceedings of the 1997 SPIE Conference on Acquisition, Tracking, and Pointing. Vol. 3086. SPIE.
- ^ Julier, Simon (1998). "A Skewed Approach to Filtering". The Proceedings of the 12th Intl. Symp. On Aerospace/Defense Sensing, Simulation and Controls. Vol. 3373. SPIE.
- ^ a b c d Julier, Simon; Uhlmann, Jeffrey (2000). "A New Method for the Nonlinear Transformation of Means and Covariances in Nonlinear Filters". IEEE Transactions on Automatic Control. 45 (3): 477–482. doi:10.1109/9.847726.
- ^ a b c Zhang, W.; M. Liu; Z. Zhao (2009). "Accuracy Analysis of Unscented Transformation of Several Sampling Strategies". Proc. of the 10th Intl. Conf. on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing. ACIS.
- ^ Wu, L.; J. Ma; J. Tian (2010). "Self-Adaptive Unscented Kalman Filtering for Underwater Gravity Aided Navigation". Proc. of IEEE/ION Plans.
- ^ El-Sheimy, N; Shin, EH; Niu, X (2006). "Kalman Filter Face-Off: Extended vs. Unscented Kalman Filters for Integrated GPS and MEMS Inertial". Inside GNSS: Engineering Solutions for the Global Navigation Satellite System Community. 1 (2).
- ^ Crassidis, J.; Markley, F. (2003). "Unscented Filtering for Spacecraft Attitude Estimation". Journal of Guidance, Control, and Dynamics. 26 (4): 536–542. Bibcode:2003JGCD...26..536C. doi:10.2514/2.5102.
- ^ Ross, I. Michael; Proulx, Ronald J.; Karpenko, Mark; Gong, Qi (July 2015). "Riemann–Stieltjes Optimal Control Problems for Uncertain Dynamic Systems". Journal of Guidance, Control, and Dynamics. 38 (7): 1251–1263. Bibcode:2015JGCD...38.1251R. doi:10.2514/1.G000505. S2CID 121424228.
- ^ I. M. Ross, R. J. Proulx 및 M. Karpenko, "우주 비행을 위한 향기 없는 최적 제어", 제24회 우주 비행 역학 국제 심포지엄(ISSFD), 2014년 5월 5일 ~ 9일, 로렐, MD. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpenko.pdf
- ^ Ross, I. Michael; Proulx, Ronald J.; Karpenko, Mark (July 2015). "Unscented guidance". 2015 American Control Conference (ACC). pp. 5605–5610. doi:10.1109/ACC.2015.7172217. ISBN 978-1-4799-8684-2. S2CID 28136418.
- ^ a b Julier, S.; J. Uhlmann (1997). "New Extension of the Kalman Filter to Nonlinear Systems". Proceedings of the 1997 SPIE Conference on Signal Processing, Sensor Fusion, and Target Recognition. Vol. 3068.
- ^ Julier, Simon (2002). "The Scaled Unscented Transformation". Proceedings of the American Control Conference. Vol. 6. IEEE.