행렬을 행렬에 매핑하는 기능
수학 에서, 모든 분석 함수 는 복잡한 항목이 있는 정사각형 행렬 을 같은 크기의 정사각형 행렬에 매핑하는 행렬 함수 를 정의하는 데 사용될 수 있다.
이것 은 선형 미분방정식 의 시스템의 폐쇄형 해법에 포함되는 행렬 의 지수화를 정의하는 데 사용된다.
스칼라 함수를 행렬 함수로 확장 정사각형 매트릭스 기능으로 실제 함수를 들어올리는 여러 가지 기법이 있어 흥미로운 특성이 유지된다.다음의 모든 기법은 동일한 매트릭스 함수를 산출하지만, 함수가 정의된 도메인은 다를 수 있다.
파워 시리즈 분석 기능 f 가 Taylor 확장성 을 가지는 경우
f ( x ) = c 0 + c 1 x + c 2 x 2 + ⋯ {\displaystyle f(x)=c_{0}+c_{1 }x+c_{2}x^{2}+\cdots } 그런 다음 매트릭스 함수 A f f ( A ) {\displaystyle A\mapsto f(A)} 를 제곱 행렬 로 대체하여 정의할 수 있다. 파워는 매트릭스 파워 가 되고, 추가는 매트릭스 합이 되며, 계수별 곱은 스칼라 곱이 된다. If the series converges for x < r {\displaystyle x <r} , then the corresponding matrix series converges for matrices A such that ‖ A ‖ < r {\displaystyle \ A\ <r} for some matrix norm that satisfies ‖ A B ‖ ≤ ‖ A ‖ B ‖ {\displaystyle \ AB\ \leq \ A\ \, B\ } .
대각선 가능 행렬 정사각형 행렬 A 는 대각선이 가능한 것으로, D = P - 1 A P {\displaystyle D=P^{-1}\,A\,P} 와 같은 변위성 행렬 P가 있으면 D는 대각 행렬 , 즉 D 는 형상을 가진다.
D = [ d 1 ⋯ 0 ⋮ ⋱ ⋮ 0 ⋯ d n ] . {\displaystyle D={\begin{bmatrix}d_{1}&\cdots &0\\\\vdots &\dd}\nd{bmatrix}}. } A = P D P - 1 , {\displaystyle A=P\,D\,P^{1},} 를 설정하는 것은 당연하다.
f ( A ) = P [ f ( d 1 ) ⋯ 0 ⋮ ⋱ ⋮ 0 ⋯ f ( d n ) ] P − 1 . {\displaystyle f(A)=P\,{\begin{bmatrix}f(d_{1})&\cdots &0\\\vdots &\\0&\cdots &f(d_{n}}\end{bmatrix},P^{-1}. } 매트릭스 f (A) 가 P 의 특정 선택에 의존하지 않음을 확인할 수 있다.
예 를 들어, for ( A ) = ( A - 1 ) ! {\displaystyle \Gamma (A)=(A-1)!} 을(를) 찾고 있다고 가정해 보십시오.
A = [ 1 3 2 1 ] . {\displaystyle A={\begin{bmatrix}1&3\\2&1\end{bmatrix}. } 가지고 있다
A = P [ 1 − 6 0 0 1 + 6 ] P − 1 , {\displaystyle A=P{\begin{bmatrix}1-{\sqrt{6}&0\\0&1+{\sqrt{6}\end{bmatrix}P^{-1},} 을 위해
P = [ 1 / 2 1 / 2 − 1 6 1 6 ] . {\displaystyle P={\begin{bmatrix}1/2&1/2\\-{\frac {1}{\sqrt{6}}&{\sqrt{1}{6}}\nd{bmatrix}.} 공식의 적용 후 단순 산출
Γ ( A ) = [ 1 / 2 1 / 2 − 1 6 1 6 ] ⋅ [ Γ ( 1 − 6 ) 0 0 Γ ( 1 + 6 ) ] ⋅ [ 1 − 6 / 2 1 6 / 2 ] ≈ [ 2.8114 0.4080 0.2720 2.8114 ] . {\displaystyle \Gamma (A)={\begin{bmatrix}1/2&1/2\\-{\frac {1}{\sqrt {6}}}&{\frac {1}{\sqrt {6}}}\end{bmatrix}}\cdot {\begin{bmatrix}\Gamma (1-{\sqrt {6}})&0\\0&\Gamma (1+{\sqrt {6}})\end{bmatrix}}\cdot {\begin{bmatrix}1&-{\sqrt {6}}/2\\1&{\sqrt {6}}/2\end{bmatrix}}\approx {\begin{bmatrix}2.8114&0.4080\\0. 2720&2.8114\end{bmatrix}}.} 마찬가지로,
A 4 = [ 1 / 2 1 / 2 − 1 6 1 6 ] ⋅ [ ( 1 − 6 ) 4 0 0 ( 1 + 6 ) 4 ] ⋅ [ 1 − 6 / 2 1 6 / 2 ] = [ 73 84 56 73 ] . {\displaystyle A^{4}={\begin{bmatrix}1/2&1/2\\-{\frac {1}{\sqrt {6}}}&{\frac {1}{\sqrt {6}}}\end{bmatrix}}\cdot {\begin{bmatrix}(1-{\sqrt {6}})^{4}&0\\0&(1+{\sqrt {6}})^{4}\end{bmatrix}}\cdot {\begin{bmatrix}1&-{\sqrt {6}}/2\\1&{\sqrt {6}}/2\end{bmatrix}}={\begin{bmatrix}73&84\\56&73\end{bmatrix}}~.} 요르단 분해 모든 복잡한 행렬은 대각선이 가능하든 그렇지 않든 간에 요르단 정규 형식 A = P J - 1 {\ displaystyle A=P\,J\,P^{-1 } 를 가지며, 여기서 매트릭스 J 는 요르단 블록 으로 구성된다. 다음 블록을 개별적으로 고려하여 파워 시리즈를 Jordan 블록에 적용하십시오.
f ( [ λ 1 0 ⋯ 0 0 λ 1 ⋮ ⋮ 0 0 ⋱ ⋱ ⋮ ⋮ ⋯ ⋱ λ 1 0 ⋯ ⋯ 0 λ ] ) = [ f ( λ ) 0 ! f ′ ( λ ) 1 ! f ″ ( λ ) 2 ! ⋯ f ( n ) ( λ ) n ! 0 f ( λ ) 0 ! f ′ ( λ ) 1 ! ⋮ f ( n − 1 ) ( λ ) ( n − 1 ) ! 0 0 ⋱ ⋱ ⋮ ⋮ ⋯ ⋱ f ( λ ) 0 ! f ′ ( λ ) 1 ! 0 ⋯ ⋯ 0 f ( λ ) 0 ! ] . {\displaystyle f\left({\begin{bmatrix}\lambda &1&0&\cdots &0\\0&\lambda &1&\vdots &\vdots \\0&0&\ddots &\ddots &\vdots \\\vdots &\cdots &\ddots &\lambda &1\\0&\cdots &\cdots &0&\lambda \end{bmatrix}}\right)={\begin{bmatrix}{\frac {f(\lambda )}{0! }}}{{\frac {f'(\lambda )}{1! }}}{{\frac {f"(\\da )}{2! }}}&\cdots &{\frac {f^{(n)}(\flada )}{n! }}}\\0&{\frac {f(\lambda )}{0! }}}{{\frac {f'(\lambda )}{1! }}}&\vdots &{\frac {f^{(n-1)}(\flada )}{{(n-1)! }}\\0�&\ddots &\vdots &\\vdots &\cdots &\ddots &{\frac {f(\f(\lambda )}{0! }}}{{\frac {f'(\lambda )}{1! }}\\0&\cdots &\cdots &0&{\frac {f(\fla )}{0! }}}\end{bmatrix}. } 이 정의는 직렬의 수렴 반지름보다 작은 스펙트럼 반경 을 가진 행렬 집합 이상으로 행렬 기능의 영역을 확장하는데 사용할 수 있다. 분단된 차이 에도 연관성이 있다는 점에 유의하십시오.
관련 개념은 요르단-체발리 분해인데, 이 분해는 행렬을 대각선이 가능한 부분과 영점 부분의 합으로 표현한다.
에르미트 행렬 은둔자 행렬 은 모든 실제 고유값을 가지며 스펙트럼 정리 에 따라 항상 단일 행렬 P에 의해 대각선화할 수 있다.이 경우 요르단 정의는 자연스럽다. 더욱이 이 정의는 실제 기능에 대해 표준 불평등을 확장할 수 있도록 허용한다.
If f ( a ) ≤ g ( a ) {\displaystyle f(a)\leq g(a)} for all eigenvalues of A {\displaystyle A} , then f ( A ) ⪯ g ( A ) {\displaystyle f(A)\preceq g(A)} . (As a convention, X ⪯ Y ⇔ Y − X {\displaystyle X\preceq Y\Leftrightarrow Y-X} is a positive-semidefinite matrix .) 그 증거는 정의에서 직접 따온 것이다.
코시 적분 복잡한 분석 에서 나온 Cauchy의 적분식은 또한 스칼라 함수를 매트릭스 함수에 일반화하는 데 사용될 수 있다.Cauchy의 통합 공식에 따르면, 집합 D { C {\displaystyle \mathb {C} 에 정의된 분석 함수 f는 다음과 같다.
f ( x ) = 1 2 π i ∮ C f ( z ) z − x d z , {\displaystyle f(x)={\frac {1}{2\pi i}\}\point _{C}\! {\frac {f(z)}{z-x}\,\mathrm {d}z~,} 여기서 C 는 x를 둘러싸는 도메인 D 내의 닫힌 단순 곡선이다.
이제 x 를 행렬 A 로 대체하고 A 의 모든 고유값 을 둘러싸는 D 내 의 경로 C 를 고려한다. 이를 달성할 수 있는 한 가지 가능성은 C 가 임의 행렬 규범 ‖•‖에 대해 ‖A ‖보다 큰 반경 을 가진 원점 주위의 원이 되게 하는 것이다. 그런 다음 f (A ) 는 다음에 의해 정의될 수 있다.
f ( A ) = 1 2 π i ∮ C f ( z ) ( z I − A ) − 1 d z . {\displaystyle f(A)={\frac {1}{2\pi i}\point _{C}f(z)\좌측(zI-A\오른쪽)^{-1}\mathrm {d}z~.} 이 적분은 이 경우 기하급수적으로 수렴 되는 트라페지움 규칙 을 사용하여 쉽게 숫자로 평가할 수 있다. 즉, 결과의 정밀도 는 노드 수를 2배로 늘렸을 때 배가 된다는 것이다. 통상적인 경우에는 실베스터의 공식 에 의해 우회된다.
무한 행렬로 볼 수 있는 바나흐 공간 의 경계 선형 연산자 에게 적용된 이 아이디어는 홀로모르픽 기능 미적분학 을 이끈다.
매트릭스 섭동 위의 테일러 파워 시리즈는 스칼라 x {\displaystyle x} 을 (를) 매트릭스로 교체할 수 있다. This is not true in general when expanding in terms of A ( η ) = A + η B {\displaystyle A(\eta )=A+\eta B} about η = 0 {\displaystyle \eta =0} unless [ A , B ] = 0 {\displaystyle [A,B]=0} . A counterexample is f ( x ) = x 3 {\displaystyle f(x)=x^{3}} , which has a finite length Taylor series. 우리는 이것을 두 가지 방법으로 계산한다.
f ( A + η B ) = ( A + η B ) 3 = A 3 + η ( A 2 B + A B A + B A 2 ) + η 2 ( A B 2 + B A B + B 2 A ) + η 3 B 3 {\displaystyle f(A+\eta B)=(A+\eta B)^{3}=A^{3}+\eta(A^{2}B+) ABA+BA^{2}+\eta ^{2}(AB^{2}+B) AB+B^{2}A)+\eta^{3}B^{3}}}{3}}} f ( + η b ) {\displaystyle f(a+\eta b)} 에 대해 스칼라 테일러 확장을 사용하고 마지막에 스칼라를 행렬로 교체하는 방법: f ( a + η b ) = f ( a ) + f ′ ( a ) η b 1 ! + f ″ ( a ) ( η b ) 2 2 ! + f ‴ ( a ) ( η b ) 3 3 ! = a 3 + 3 a 2 ( η b ) + 3 a ( η b ) 2 + ( η b ) 3 → A 3 = + 3 A 2 ( η B ) + 3 A ( η B ) 2 + ( η B ) 3 {\displaystyle {\eta}f(a+\eta b)&=f(a)+f'(a){\frac {\eta b}{1! }}}+f'(a){\frac {(\eta b)^{2}}{2! }}}+f'(a){\frac {(\eta b)^{3}{3}{3! }}\\[.5em]&=a^{3}+3a^{2}(\eta b)+3a(\eta b)^{2}+(\eta b)^{3}\[.5em]&\to{3}=+3 A^{2}(\eta B)+3A(\eta B)^{2}+(\eta B)^{3}\ended}}}} 스칼라 표현식은 매트릭스 표현식이 아닌 동안 동일성을 가정하므로 [A , B ] = 0 {\displaystyle [A,B]=0} 이(가) 아니면 직접 동일시할 수 없다. 일부 f (x )의 경우 스칼라 테일러 시리즈와 동일한 방법을 사용하여 처리할 수 있다. For example, f ( x ) = 1 x {\textstyle f(x)={\frac {1}{x}}} . If A − 1 {\displaystyle A^{-1}} exists then f ( A + η B ) = f ( I + η A − 1 B ) f ( A ) {\displaystyle f(A+\eta B)=f(\mathbb {I} +\eta A^{-1}B)f(A)} . The expansion of the first term then follows the power series given above,
f ( I + η A − 1 B ) = I − η A − 1 B + ( − η A − 1 B ) 2 + ⋯ = ∑ n = 0 ∞ ( − η A − 1 B ) n {\displaystyle f(\mathbb {I} +\eta A^{-1}B)=\mathbb {I} -\eta A^{-1}B+(-\eta A^{-1}B)^{2}+\cdots =\sum _{n=0}^{\infty }(-\eta A^{-1}B)^{n}} 그런 다음 전력 시리즈의 수렴 기준을 적용하여 , A - 1 B ‖ {\displaystyle \Vert \eta A^{-1}B\Vert } 이(가) 적절한 매트릭스 규범 하에서 충분히 작아야 한다 . 두 행렬이 통근하는 방식으로 다시 작성할 수 없는 더 일반적인 문제에 대해서는 라이프니즈 규칙을 반복적으로 적용하여 생산된 매트릭스 제품의 순서를 추적해야 한다.
2×2 행렬의 임의 함수 2×2 매트릭스 A의 임의 함수 f(A) 는 실베스터의 공식 을 다음과 같이 단순화한다.
f ( A ) = f ( λ + ) + f ( λ − ) 2 I + A − ( t r ( A ) 2 ) I ( t r ( A ) 2 ) 2 − A f ( λ + ) − f ( λ − ) 2 , {\displaystyle f(A)={\frac {f(\lambda _{+})+f(\lambda _{-}}{2}}I+{\prac {A-\좌({\frac {tr(A)}{\2}}\우)\우) I}{{\sqrt {\frac {tr(A)}{2}}\오른쪽)^{2}-{2}- A}{}{\frac {f(\lambda _{+}-f(\lambda _{-}}}}},},} 여기서 λ ± {\ displaystyle \lambda _{\pm }} 은 (는) 특성 방정식의 고유값인 A-λI =0이며 다음과 같이 주어진다.
λ ± = t r ( A ) 2 ± ( t r ( A ) 2 ) 2 − A . {\displaystyle \lambda _{\pm }={\frac {tr(A)}{2}}:00\pm {\sqrt {\\좌({\frac {tr(A)}{2}}\우)^{2}- A}}. } 예 행렬 함수 클래스 Using the semidefinite ordering ( X ⪯ Y ⇔ Y − X {\displaystyle X\preceq Y\Leftrightarrow Y-X} is positive-semidefinite and X ≺ Y ⇔ Y − X {\displaystyle X\prec Y\Leftrightarrow Y-X} is positive definite ), some of the classes of scalar functions can be extended to matrix functions of Hermitian matrices .[2]
오퍼레이터 모노톤 함수 f 는 f 의 영역에 스펙트럼 이 있는 모든 자기 적응형 매트릭스 A , H 에 대해 0 ≺ A ⪯ H ⪯ f ( A ) ⪯ f ⪯ f { f { f { f ( A ) \ displaystystyle 0\preceq H\Rightarrow f(A)\preceq f(H)} 인 경우에만 연산자 모노톤이라고 불린다. 이것은 스칼라 케이스의 단조함수 와 유사하다.
오목/콘벡스 연산자 함수 f 는 만약의 경우에 한해서만 연산자 오목이라 불린다.
τ f ( A ) + ( 1 − τ ) f ( H ) ⪯ f ( τ A + ( 1 − τ ) H ) \displaystyle \tau f(A)+(1-\tau)f(H)\preceq f\left(\tau A+(1-\tau)) H\right)} f 와 τ 의 영역에 스펙트럼이 있는 모든 자기 적응 행렬 A,H 에 대해 [0 , 1 ] {\displaystyle \tau \in [0,1]}. 이 정의는 오목한 스칼라 함수 와 유사하다.연산자 볼록함수는 위의 정의에서 ⪯ {\displaystyle \preceq } 을(를) ⪰ {\displaystyle \succeq }( 으)로 전환하여 정의할 수 있다.
예 행렬 로그는 연산자 모노톤과 연산자 오목형이다. 행렬 사각형은 연산자 볼록이다. 매트릭스 지수란 이것들 중 어느 것도 아니다. 뢰너 정리 는 개방 된 간격의 함수가 상부 및 하부 복합 하프 평면에 대한 해석적 확장을 가지고 있어 상부 하프 평면이 자신에게 매핑되는 경우에만 연산자 단조라고 명시하고 있다.[2]
참고 항목 메모들 ^ Higham, Nick (2020-12-15). "What Is the Matrix Sign Function?" . Nick Higham . Retrieved 2020-12-27 . ^ a b Bhatia, R. (1997). Matrix Analysis . Graduate Texts in Mathematics. Vol. 169. Springer.
참조