행렬 미적분학

수학에서 행렬 미적분은 다변량 미적분학, 특히 행렬의 공간에 걸쳐서 다변량 미적분학을 행하는 데 특화된 표기법이다. 그것은 많은 변수와 관련된 단일함수 및/또는 단일 변수와 관련된 다변량 함수의 다양한 부분파생상품을 단일 실체로 취급할 수 있는 벡터 및 행렬로 수집한다. 이것은 다변량 함수의 최대 또는 최소의 발견과 미분 방정식의 시스템 해결과 같은 운영을 크게 단순화한다. 여기서 사용하는 표기법은 일반적으로 통계와 공학에서 사용되며, 텐서지수 표기법은 물리학에 선호된다.

두 개의 경쟁적인 공칭적 관행이 행렬 미적분학 분야를 두 개의 개별 그룹으로 나누었다. 두 집단은 벡터를 컬럼 벡터로서, 또는 행 벡터로서, 스칼라의 파생물을 작성하느냐로 구별할 수 있다. 이 두 규약은 벡터를 행렬(행 벡터 대신 행렬)과 결합할 때 열 벡터로 취급해야 한다는 일반적인 가정이 성립된 경우에도 가능하다. 단일 규약은 일반적으로 행렬 미적분학을 사용하는 단일 분야(예: 계량학, 통계학, 추정 이론 및 기계 학습)에서 어느 정도 표준화될 수 있다. 그러나 주어진 분야 내에서 조차도 경쟁적인 관습을 사용하여 서로 다른 작가들을 찾을 수 있다. 두 그룹의 저자들은 종종 그들의 특정한 관습이 표준인 것처럼 쓴다. 양립할 수 있는 메모가 사용되었는지 세심하게 검증하지 않고 서로 다른 저자의 결과를 결합할 때 심각한 실수가 발생할 수 있다. 이 두 규약에 대한 정의와 그것들 간의 비교는 배치 규약 섹션에 수집된다.

범위

행렬 미적분은 독립 변수의 각 성분에 대해 종속 변수의 각 성분의 파생상품을 수집하기 위해 행렬과 벡터를 사용하는 여러 다른 공식을 말한다. 일반적으로 독립 변수는 스칼라, 벡터 또는 행렬이 될 수 있지만 종속 변수는 이들 중 하나일 수도 있다. 각각의 다른 상황은 더 넓은 의미의 용어를 사용하여 다른 규칙 집합, 즉 별도의 미적분학으로 이어질 것이다. 매트릭스 표기법은 많은 파생상품을 체계적으로 수집하는 편리한 방법의 역할을 한다.

첫 번째 예로서 벡터 미적분학의 구배를 고려한다. $f$ $f(x_{1},x_{2},x_{3})$ , $f(x_{1},x_{2},x_{3})$ $f(x_{1},x_{2},x_{3})$ , $f(x_{1},x_{2},x_{3})$ $3$ 의 세 독립 변수의 스칼라 함수의 경우 $,$ $벡터 방정식에 의해 그라데이션$ 이 주어진다 $f(x_{1},x_{2},x_{3})$

\nabla f={\frac {\partial f}{\partial x_{1}}}{\hat {x}}_{1}+{\frac {\partial f}{\partial x_{2}}}{\hat {x}}_{2}+{\frac {\partial f}{\partial x_{3}}}{\hat {x}}_{3}

,

where ${\hat {x}}_{i}$ represents a unit vector in the $x_{i}$ direction for $1\leq i\leq 3$ . This type of generalized derivative can be seen as the derivative of a scalar, f, with respect to a vector, $\mathbf {x}$ , and its 결과는 벡터 형태로 쉽게 수집될 수 있다.

\nabla f={\frac {\partial f}{\partial \mathbf {x} }}={\begin{bmatrix}{\frac {\partial f}{\partial x_{1}}}&{\frac {\partial f}{\partial x_{2}}}&{\frac {\partial f}{\partial x_{3}}}\\\end{bmatrix}}^{\textsf {T}}.

더 복잡한 예로는 구배 행렬로 알려진 행렬에 대한 스칼라 함수의 파생 모델이 포함되며, 이는 결과 행렬의 해당 위치에 있는 각 행렬 요소에 대한 파생 모델을 수집한다. 이 경우 스칼라는 행렬에 있는 각 독립 변수의 함수여야 한다. 또 다른 예로, m 독립 변수의 종속 변수 또는 함수의 n-벡터가 있다면 독립 벡터에 대한 종속 벡터의 파생을 고려할 수 있다. 결과는 가능한 모든 파생상품 조합으로 구성된 m×n 행렬로 수집될 수 있다.

스칼라, 벡터, 매트릭스를 이용한 가능성은 총 9가지다. 각 독립 변수 및 종속 변수에서 더 많은 수의 성분을 고려할 때 매우 많은 수의 가능성을 가질 수 있다는 점에 유의하십시오. 매트릭스 형태로 가장 깔끔하게 정리할 수 있는 6가지 파생상품은 다음 표에 정리되어 있다.^[1]

매트릭스 파생상품의 종류
종류들	스칼라	벡터	매트릭스
스칼라	${\frac {\property y}{\put x}$	${\frac {\reason \mathbf {y}{\reason x}}$	${\frac {\partial \mathbf {Y}{\partial x}$
벡터	${\frac {\frac y}{\reason \mathbf{x}}}$	${\frac {\reason \mathbf {y}{}{\reason \mathbf {x}}}$
매트릭스	${\frac {\partial y}{\partial \mathbf {X}}}$

여기서 우리는 벡터와 스칼라가 각각 하나의 열과 하나의 열을 가진 행렬에 불과하다는 것을 인식하면서, 가장 일반적인 의미로 "매트릭스"라는 용어를 사용해 왔다. 게다가, 우리는 굵은 글씨로 벡터를 표시했고 행렬에 굵은 대문자를 표시했다. 이 표기법은 전체적으로 사용된다.

또한 행렬에 관한 벡터의 파생 모델이나 표에 있는 다른 미충전 셀에 대해서도 이야기할 수 있다는 점에 유의하십시오. 그러나 이러한 파생상품은 가장 자연스럽게 2등급 이상의 텐서(tensor)로 구성되기 때문에 매트릭스에 깔끔하게 들어가지 않는다. 다음 세 절에서 우리는 이러한 각 파생상품을 정의하고 수학의 다른 분야와 연관시킬 것이다. 자세한 표는 레이아웃 규칙 섹션을 참조하십시오.

기타파생상품과의 관계

매트릭스 파생상품은 계산을 위해 부분파생상품을 추적하기 위한 편리한 표기법이다. Frechet 파생상품은 벡터에 관한 파생상품을 취하기 위한 기능분석 설정의 표준 방법이다. 행렬의 행렬 함수가 Fréchet이 다를 경우, 두 파생상품은 공지의 번역에 동의할 것이다. 일반적으로 부분파생상품의 경우와 마찬가지로, 일부 공식은 근사치 선형 매핑으로서 파생상품의 존재보다 약한 분석 조건에서 확장될 수 있다.

우사게스

매트릭스 미적분은 최적 확률적 추정기를 도출하는 데 사용되며, 종종 라그랑주 곱셈기의 사용을 포함한다. 여기에는 다음 사항의 파생이 포함된다.

표기법

다음 단원에 제시된 벡터 및 행렬 파생상품은 단일 변수를 사용하여 다수의 변수를 나타내는 행렬 표기법을 최대한 활용한다. 다음에 이어지는 내용에서 우리는 스칼라, 벡터, 행렬을 서체로 구별할 것이다. 우리는 M(n,m)이 n행과 m기둥을 가진 실제 n×m 행렬의 공간을 나타내도록 할 것이다. 이러한 행렬은 A, X, Y 등 굵게 표시된 대문자로 표시된다. M(n,1)의 요소, 즉 열 벡터는 대담한 소문자로 표시된다: a, x, y 등. M(1,1)의 원소는 스칼라로, 소문자 이탤릭체 활자(a, t, x 등)로 표시된다. X는^T 전치 행렬을, tr(X)는 트레이스, det(X) 또는 X는 결정 요인이다. 달리 명시되지 않은 한 모든 기능은 차별성 등급 C로¹ 가정한다. 일반적으로 알파벳의 전반부 문자(a, b, c, ...)는 상수를 나타내기 위해, 후반부 문자(t, x, y, ...)는 변수를 나타내기 위해 사용된다.

참고: 위에서 언급한 바와 같이 벡터 및 매트릭스에서 부분파생상품 시스템을 배치하기 위한 경쟁적인 명제는 존재하며, 아직 표준이 등장하지 않는 것으로 보인다. 다음 두 개의 도입부에서는 논의를 지나치게 복잡하게 하지 않기 위해 단순히 편의를 위해 분자 배치 규칙을 사용한다. 다음 섹션에서는 레이아웃 규칙에 대해 자세히 설명한다. 다음을 실현하는 것이 중요하다.

"숫자 배치"와 "거부자 배치"라는 용어를 사용했음에도 불구하고, 실제로 두 가지 이상의 공칭적 선택이 관련되어 있다. 그 이유는 스칼라별, 벡터별, 벡터별, 벡터별, 스칼라별, 스칼라별 파생상품에 대해서는 분자 대 분모(또는 어떤 상황에서는 분자 대 혼합)의 선택이 독립적으로 이루어질 수 있고, 다수의 저자가 다양한 방법으로 그들의 레이아웃 선택을 혼합하고 일치시킬 수 있기 때문이다.
아래의 도입부에서 분자 레이아웃을 선택했다고 해서 이것이 "올바른" 또는 "상당한" 선택임을 의미하는 것은 아니다. 다양한 배치 유형에는 장단점이 있다. 심각한 실수는 서로 다른 레이아웃으로 작성된 수식을 부주의하게 결합하여 발생할 수 있으며, 한 레이아웃에서 다른 레이아웃으로 변환하는 것은 오류를 방지하기 위한 주의가 필요하다. 결과적으로, 기존 공식으로 작업할 때 최선의 정책은 모든 상황에서 동일한 레이아웃을 사용하려고 시도하기보다는 어떤 레이아웃이 사용되는지 식별하고 그것과 일관성을 유지하는 것일 수 있다.

대안

아인슈타인 종합 규약을 사용한 텐서 지수 표기법은 한 번에 한 요소만 쓰는 것을 제외하면 행렬 미적분학과 매우 유사하다. 임의로 높은 순위 텐서를 쉽게 조작할 수 있는 장점이 있는 반면, 2개 이상의 순위 텐서는 행렬 표기법으로는 상당히 다루기 어렵다. 이곳의 모든 작업은 단변량 행렬 표기법을 사용하지 않고도 이 표기법으로 할 수 있다. 그러나 추정 이론과 응용 수학의 다른 영역에서의 많은 문제들은 너무 많은 지표를 만들어 그 영역들에서 행렬 미적분학을 선호하면서 적절히 추적하지 못하게 할 것이다. 또한 아인슈타인 표기법은 대표적인 원소 표기법 대안으로 여기에 제시된 정체성을 입증하는 데 매우 유용할 수 있는데(분화 섹션 참조) 명시적 합계가 옮겨질 때 번거로워질 수 있다. 행렬은 순위 2의 텐서(tensor)로 간주될 수 있다는 점에 유의하십시오.

벡터가 있는 파생상품

벡터는 하나의 열만 있는 행렬이기 때문에 가장 단순한 행렬 파생상품은 벡터 파생상품이다.

여기서 개발된 표기법은 유클리드 공간 R과ⁿ 함께 n-벡터의 공간 M(n,1)을 식별함으로써 벡터 미적분의 통상적인 작동을 수용할 수 있으며, 스칼라 M(1,1)은 R로 식별된다. 벡터 미적분학의 해당 개념은 각 하위섹션의 끝에 표시된다.

참고: 이 절의 논의는 교육학적 목적을 위한 분자 배치 규칙을 가정한다. 어떤 작가들은 다른 관습을 사용한다. 레이아웃 규약에 대한 섹션에서는 이 문제에 대해 더 자세히 설명한다. 더 아래에 제시된 ID는 모든 공통 배치 규칙과 함께 사용할 수 있는 형태로 제시된다.

벡터 바이 스칼라

벡터 $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ = $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ [ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {y} ={\begin{bmatrix}y_{1}&y_{2}&\cdots &y_{m}\end{bmatrix}}^{\mathsf {T}}$ ${\$ }\end{bmatrix}}^{\ $mathsf{T$ 스칼라 x로 표기한다.

{\frac {\partial \mathbf {y} }{\partial x}}={\begin{bmatrix}{\frac {\partial y_{1}}{\partial x}}\\{\frac {\partial y_{2}}{\partial x}}\\\vdots \\{\frac {\partial y_{m}}{\partial x}}\\\end{bmatrix}}.

벡터 미적분학에서 스칼라 x에 관한 벡터 y의 파생은 벡터 y의 접선 벡터, ${\frac {\partial \mathbf {y} }{\partial x}}$ ${\frac {\partial \mathbf {y} }{\partial x}}$ ${\frac {\partial \mathbf {y} }{\partial x}}$ ${\frac {\partial \mathbf {y} }{\partial x}}$ ${\$ x ${\frac {\partial \mathbf {y} }{\partial x}}$ 여기서 y: R¹ → R에^m 주목하십시오.

예시 간단한 예로는 위치 벡터의 접선 벡터(시간의 함수로 간주)인 유클리드 공간의 속도 벡터를 들 수 있다. 또한 가속도는 속도의 접선 벡터다.

스칼라 바이 벡터

벡터 $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ = $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ [ 1 $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ x $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ $\mathbf {x} ={\begin{bmatrix}x_{1}&x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf {T}}$ T ${\$ mathsf ${T$ 의 스칼라 는 숫자로 표기된다.

{\frac {\partial y}{\partial \mathbf {x} }}={\begin{bmatrix}{\frac {\partial y}{\partial x_{1}}}&{\frac {\partial y}{\partial x_{2}}}&\cdots &{\frac {\partial y}{\partial x_{n}}}\end{bmatrix}}.

벡터 미적분학에서 공간 Rⁿ(독립 좌표가 x의 성분인 경우)에서 스칼라장 f의 구배는 벡터에 의해 스칼라 파생물이 전치되는 것이다.

\nabla f={\begin{bmatrix}{\frac {\partial f}{\partial x_{1}}}\\\vdots \\{\frac {\partial f}{\partial x_{n}}}\end{bmatrix}}=\left({\frac {\partial f}{\partial \mathbf {x} }}\right)^{\mathsf {T}}

예를 들어 물리학에서 전기장은 전위의 음 벡터 그라데이션이다.

단위 벡터 u(이 경우 기둥 벡터로 표현됨)의 방향에서 스페이스 벡터 x의 스칼라 함수 f(x)의 방향 파생은 다음과 같은 구배를 사용하여 정의된다.

\mathbf {u}{}{f}(\mathbf {x} )=\mathbf(\mathbf {x})\cdot \mathbf {u}}}

Using the notation just defined for the derivative of a scalar with respect to a vector we can re-write the directional derivative as $\nabla _{\mathbf {u} }f={\frac {\partial f}{\partial \mathbf {x} }}\mathbf {u} .$ This type of notation will be nice when proving product rules and chain r스칼라 파생상품에 대해 우리가 익숙한 것과 비슷하게 보이는 정강이뼈

벡터 바이 벡터

앞의 두 경우 각각은 크기 1의 벡터를 적절히 사용하여 벡터에 관한 벡터의 파생상품의 적용으로 간주할 수 있다. 이와 유사하게 매트릭스를 포함하는 파생상품은 벡터를 포함하는 파생상품으로 감소할 것이다.

입력 벡터, x)[x1x2⋯ xn]에 대한 벡터 함수의 도함수(요소들이 기능 벡터)y=[y 1y2⋯는 ym]T{\displaystyle \mathbf{y}={\begin{bmatrix}y_{1}&, y_{2}&, \cdots &, y_{m}\end{bmatrix}}^{\mathsf{T}}},. T{\dis $Playstyle \mathbf {x} ={\begin{bmatrix}x_{1}x_{2}&\cdots &x_{n}\end{bmatrix}}^{\mathsf{T$ 는 분자 레이아웃 표기법으로 표기된다.

{\displaystyle{\frac{\partial \mathbf{y}}{\partial \mathbf{)}}}={\begin{bmatrix}{\frac{\partial y_{1}}{\partial x_{1}}}&{\frac{\partial y_{1}}{\partial x_{2}}}&\cdots &,{\frac{\partial y_{1}}{\partial x_{n}}}\\{\frac{\partial y_{2}}{\partial x_{1}}}&{\frac{\partial y_{2}}{\partial x_{2}}}&\cdots &,{\frac{\partial Y_{2}}{\partial x_{n}}}\\\vdots &\vdots &\vdots &\vdots \\\frac {\frac}{\nm}{\preased y_{1}{m}}&#prac {\preased y_{m}}}\preas y_{n}}}}\{bmatrix}}}.}

벡터 미적분학에서, 공간을 나타내는 성분이 있는 벡터 x에 대한 벡터 함수 y의 파생물은 푸시포워드(또는 미분) 또는 제이콥 매트릭스라고 알려져 있다.

The pushforward along a vector function f with respect to vector v in Rⁿ is given by $d\,\mathbf {f} (\mathbf {v} )={\frac {\partial \mathbf {f} }{\partial \mathbf {v} }}d\,\mathbf {v} .$

행렬이 있는 파생상품

행렬이 있는 파생상품에는 같은 크기의 행렬로 정리할 수 있는 두 가지 유형이 있다. 이것들은 스칼라에 의한 행렬의 파생물이고, 매트릭스에 의한 스칼라의 파생물이다. 이는 응용 수학의 많은 영역에서 발견되는 문제를 최소화하는 데 유용할 수 있으며 벡터에 대한 아날로그 뒤에 접선 행렬과 구배 행렬이라는 이름을 각각 채택했다.

참고: 이 절의 논의는 교육학적 목적을 위한 분자 배치 규칙을 가정한다. 어떤 작가들은 다른 관습을 사용한다. 레이아웃 규약에 대한 섹션에서는 이 문제에 대해 더 자세히 설명한다. 더 아래에 제시된 ID는 모든 공통 배치 규칙과 함께 사용할 수 있는 형태로 제시된다.

매트릭스 바이 스칼라

스칼라 x에 의한 행렬 함수 Y의 파생형은 접선 행렬로 알려져 있으며 (숫자 레이아웃 표기법)에 의해 주어진다.

{\displaystyle{\frac{\partial \mathbf{Y}}{x\partial}}={\begin{bmatrix}{\frac{\partial y_{11}}{x\partial}}&{\frac{\partial y_{12}}{x\partial}}&\cdots,{\frac{\partial y_{1n}}{x\partial}}\\{\frac{\partial y_{21}}{x\partial}}&{\frac{\partial y_{22}}{x\partial}}&\cdots &,{\frac{\partial y_{2n}}{x\partial}}\\\vdot &.s&\vdots, \ddots & &, \vdots\\{\frac {\frac y_{m1}:{\frac x}}{\frac {\frac y_{m2}}:{\frac y_{mn}}}{\frac y_}}{bmatrix}}}}}.}

스칼라 바이 매트릭스

X 행렬과 관련하여 독립 변수의 p×q 행렬 X의 스칼라 y 함수의 파생형은 (숫자 레이아웃 표기법)에 의해 주어진다.

{\displaystyle{\frac{\partial y}{\partial \mathbf{X}}}={\begin{bmatrix}{\frac{이\partial}{\partial x_{11}}}&{\frac{이\partial}{\partial x_{21}}}&\cdots &,{\frac{이\partial}{\partial x_{p1}}}\\{\frac{이\partial}{\partial x_{12}}}&{\frac{이\partial}{\partial x_{22}}}&\cdots &,{\frac{이\partial}{\partial x_{p2}}}\\\vdot.s&\vdots, \ddots & &, \vdots\\{\frac {\frac}{\preason x_{1q}}&#{\fract y}{\preason x_{2q}}\cdots &{\preason y}{\fract x_{pq}}}\end{bmatrix}}}}.}

행렬의 스칼라 함수의 중요한 예는 행렬의 추적과 결정 인자를 포함한다.

벡터 미적분학을 가진 아날로그에서 이 파생상품은 종종 다음과 같이 쓰여진다.

\nabla _{\mathbf {X}}y(\mathbf {X})={\frac {\partial y(\mathbf {X})}{\partial \mathbf {X}}}}}}

또한 벡터 미적분학을 가진 아날로그에서 행렬 Y의 방향으로 행렬 X의 스칼라 f(X)의 방향 파생은 다음과 같이 주어진다.

\nabla _{\mathbf {Y} }f=\operatorname {tr} \left({\frac {\partial f}{\partial \mathbf {X}}}}}}}\mathbf {Y} \right)

특히 추정 이론, 특히 현장에서 매우 중요한 Kalman 필터 알고리즘의 파생에서 추정 이론의 최소화 문제에 많은 용도를 찾아내는 것이 그라데이션 매트릭스다.

기타매트릭스파생상품

고려되지 않은 세 가지 유형의 파생상품은 벡터별, 매트릭스별, 매트릭스별 파생상품이다. 이것들은 널리 고려되지 않고 표기법도 널리 합의되지 않았다.

배치 규칙

이 절에서는 매트릭스 미적분을 이용하는 다양한 분야에서 사용되는 공칭 규약 간의 유사성과 차이점에 대해 논의한다. 대체로 두 가지 일관된 규약이 있지만, 일부 저자들은 아래에서 논의되는 형태로 두 규약을 혼합하는 것이 편리하다고 생각한다. 이 섹션 이후에 방정식은 두 경쟁 양식에 각각 나열된다.

근본적인 문제는 벡터에 ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}$ 벡터의 파생상품, 즉 ∂ ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}$ y ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}$ ${\$ { $y}{}{\partial \mathbf {x}}}}}$ 이 ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}$ 가) 종종 두 가지 경쟁적인 방법으로 쓰여진다는 것이다. 분자 y가 m 크기이고 분모 x가 n 크기인 경우 결과는 m×n 행렬 또는 n×m 행렬, 즉 y의 원소가 열에 배열되어 있고 x의 원소가 행에 배열되어 있거나 그 반대의 경우도 가능하다. 이는 다음과 같은 가능성을 초래한다.

분자 배치, 즉 y와 x^T(즉, x에 대해 반론적으로)에 따라 배치한다. 이것은 때때로 자코비안 공식으로 알려져 있다. 이는 앞의 예에서 m×n 레이아웃에 해당한다.
분모 배치, 즉 y와^T x에 따라 배치(즉, 반대 방향으로 y에 배치) 이것은 때때로 헤시안 공식으로 알려져 있다. 일부 저자는 이 레이아웃을 Jacobian(숫자 레이아웃)과 구별하여 그라데이션이라고 부르는데, 이것이 전치되는 것이다. (단, 그라데이션은 일반적으로 레이아웃에 관계 ${\frac {\partial y}{\partial \mathbf {x} }},$ 없이 ${\frac {\partial y}{\partial \mathbf {x} }},$ y ${\frac {\partial y}{\partial \mathbf {x} }},$ ${\frac {\partial y}{\partial \mathbf {x} }},$ , ${\displaystyle {\frac {\partial$ y $}{\partial \mathbf{x}}}}}})$ 를 의미한다. 이는 앞의 예에서 n×m 레이아웃에 해당한다.
세 번째 가능성은 때때로 파생상품을 ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} '}},$ ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} '}},$ x ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} '}},$ , ${\displaystyle$ {\ $frac {\partial \mathbf {y}{{\partial \mathbf {x} '}},}($ 즉, 파생상품은 x의 전치현황과 관련하여 취함)로 작성하고 분자 배치를 따르는 것이다. 이를 통해 행렬이 분자와 분모 모두에 따라 배열된다고 주장할 수 있다. 실제로 이것은 분자 배치와 동일한 결과를 산출한다.

그라데이션 y ${\frac {\partial y}{\partial \mathbf {x} }}$ y ${\frac {\partial y}{\partial \mathbf {x} }}$ x ${\$ y $}{\partial \mathbf$ { $x}}}}$ 과 $\frac{\partial y}{\partial \mathbf{x}}$ (와) 반대의 경우 ${\frac {\partial \mathbf {y} }{\partial x}},$ y ${\frac {\partial \mathbf {y} }{\partial x}},$ ${\frac {\partial \mathbf {y} }{\partial x}},$ , ${\partial$ \frac ${\partial \mathbf {y}{\partial x}}}}}}}$ 을(으) 처리할 때도 동일한 ${\frac {\partial \mathbf {y} }{\partial x}},$ 문제가 있다. 일관성을 유지하기 위해서는 다음 중 하나를 해야 한다.

If we choose numerator layout for ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }},$ we should lay out the gradient ${\frac {\partial y}{\partial \mathbf {x} }}$ as a row vector, and ${\displaystyle {\frac {\partial \mathbf {y} }{\parti$ $al$ x $}}$ 을 $\frac{\partial \mathbf{y}}{\partial x}$ (를) 열 벡터로.
If we choose denominator layout for ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }},$ we should lay out the gradient ${\frac {\partial y}{\partial \mathbf {x} }}$ as a column vector, and ${\displaystyle {\frac {\partial \mathbf {y} }{\$ $행$ 벡터로 부분 ${\frac {\partial \mathbf {y} }{\partial x}}$ x $}}.$
위의 세 번째 ${\frac {\partial y}{\partial \mathbf {x} '}}$ 에서는 ${\frac {\partial y}{\partial \mathbf {x} '}}$ ${\frac {\partial y}{\partial \mathbf {x} '}}$ ${\frac {\partial y}{\partial \mathbf {x} '}}$ x ${\frac {\partial y}{\partial \mathbf {x} '}}$ ${\$ y $}{\partial y}{\partial$ y $}}$ 및 ${\frac {\partial y}{\partial \mathbf {x} '}}$ ${\frac {\partial \mathbf {y} }{\partial x}},$ ${\frac {\partial \mathbf {y} }{\partial x}},$ $\$ ${,$ {\ $prac {\partial \mathbf {y}{\partial$ x $}},$ 분자 레이아웃을 쓰고 있다 ${\frac {\partial \mathbf {y} }{\partial x}},$ .

모든 수학 교과서와 논문이 이 점에서 일관되는 것은 아니다. 즉, 동일한 책이나 종이 안에서 때때로 다른 맥락에서 다른 관습들이 사용된다. 예를 들어, 일부에서는 구배(column vectors)에 대해 분모 레이아웃을 선택하지만, 벡터별 파생 모델 ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}.$ ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}.$ ${\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}.$ . ${\frac {\partial \mathbf {y}{\partial \mathbf {x}}}}}}}$ 에 대한 분자 레이아웃을 선택한다. $}$

반면 일관된 굴 때scalar-by-matrix 파생 상품에 관해서 마찬가지로, y}}}과matrix-by-scalar 파생 상품)Y∂ ∂∂ X{\displaystyle{\frac{\partial y}{\partial \mathbf{X}∂,{\displaystyle{\frac{\partial \mathbf{Y}}{x\partial}},}그 일관된 분자 설계 Y, XT최상급에 따르면,를 나열.oMinator 레이아웃은 Y와^T X에 따라 배치된다. 그러나 실제로는 ${\frac {\partial \mathbf {Y} }{\partial x}},$ ${\frac {\partial \mathbf {Y} }{\partial x}},$ ${\frac {\partial \mathbf {Y} }{\partial x}},$ x ${\frac {\partial \mathbf {Y} }{\partial x}},$ , ${\displaystyle {\frac {\partial \partial$ \ $mathbf {$ Y}{\ $partial$ x $}}}$ 에 대한 분모 레이아웃을 따르고 결과를 ${\frac {\partial \mathbf {Y} }{\partial x}},$ Y에^T 따라 배열하는 것은 스칼라 공식에 해당되지 않는 추악한 공식을 만들기 때문에 거의 보이지 않는다. 그 결과, 다음과 같은 레이아웃을 흔히 찾을 수 있다.

${\frac {\partial y}{\partial \mathbf {X} }}$ 된 분자 레이아웃, X에^T $∂$ Y ${\frac {\partial \mathbf {Y} }{\partial x}}$ ${\frac {\partial \mathbf {Y} }{\partial x}}$ ${\$ $\$ $mathbf$ {Y}{\ $partial y}{\$ partial $\mathbf {X}}}}}}$ 을(를) 배치한다.
${\frac {\partial y}{\partial \mathbf {X} }}$ 레이아웃, X에 따라 ${\frac {\partial \mathbf {Y} }{\partial x}}$ $∂$ ${\frac {\partial y}{\partial \mathbf {X} }}$ $∂$ x ${\$ $\mathbf$ ${\frac {\partial \mathbf {Y} }{\partial x}}$ { $Y$ $}{\$ $partial$ x $}}}을($ 를) 배치함.
${\frac {\partial y}{\partial \mathbf {X} '}},$ 된 분자 레이아웃과 동일한 결과를 가진 ${\frac {\partial y}{\partial \mathbf {X} '}},$ notation y ${\frac {\partial y}{\partial \mathbf {X} '}},$ ${\frac {\partial y}{\partial \mathbf {X} '}},$ ${\frac {\partial y}{\partial \mathbf {X} '}},$ , ${\displaystyle {\frac {\partial y}{\partial \mathbf {X}'}}}을($ 를) 사용하십시오.

In the following formulas, we handle the five possible combinations ${\displaystyle {\frac {\partial y}{\partial \mathbf {x} }},{\frac {\partial \mathbf {y} }{\partial x}},{\frac {\partial \mathbf {y} }{\partial \mathbf {x} }},{\frac {\partial y}{\partial \mathbf {$ $X}{}}}$ 과 $\frac{\partial y}{\partial \mathbf{x}}, \frac{\partial \mathbf{y}}{\partial x}, \frac{\partial \mathbf{y}}{\partial \mathbf{x}}, \frac{\partial y}{\partial \mathbf{X}}$ (와) ${\frac {\partial \mathbf {Y} }{\partial x}}$ ${\frac {\partial \mathbf {Y} }{\partial x}}$ ${\frac {\partial \mathbf {Y} }{\partial x}}$ ${\frac {\partial \mathbf {Y} }{\partial x}}$ ${\$ x $}}$ 은(는) 별도로 ${\frac {\partial \mathbf {Y} }{\partial x}}$ . 중간 벡터나 매트릭스를 수반하는 스칼라별 파생상품의 사례도 취급한다.(예를 들어, 다차원 파라메트릭 곡선이 스칼라 변수에 의해 정의되고, 그 다음에 곡선을 모수화하는 스칼라에 대해 곡선의 스칼라 함수의 파생상품이 취해진다면 발생할 수 있다.) 다양한 조합 각각에 대해 분모 레이아웃이 거의 발생하지 않는 위의 경우를 제외하고 분모 레이아웃과 분모 레이아웃 결과를 제공한다. 이해가 되는 행렬을 포함하는 경우, 우리는 분자 배열과 혼합 배치 결과를 제공한다. 위에서 언급한 바와 같이, 벡터와 행렬 분모가 전치 표기법으로 쓰여진 경우는 전치 없이 쓰여진 분모가 있는 분자 배치와 동일하다.

다양한 저자가 다양한 유형의 파생상품에 대해 분자와 분모 레이아웃의 다른 조합을 사용하며, 저자가 모든 유형에 대해 분자나 분모 레이아웃을 일관되게 사용한다는 보장은 없다는 점을 명심해야 한다. 아래 공식을 출처에서 인용한 공식과 일치시켜 특정 유형의 파생상품에 사용되는 레이아웃을 결정하되, 다른 유형의 파생상품이 반드시 동일한 종류의 레이아웃을 따른다고 가정하지 않도록 주의하십시오.

골재의 최대 또는 최소값을 찾기 위해 골재(벡터 또는 행렬) 분모가 있는 파생상품을 취할 때 분자 레이아웃을 사용하면 골재와 관련하여 전치된 결과가 나온다는 점을 유념해야 한다. 예를 들어, 행렬 미적분을 사용하여 다변량 정규 분포의 최대우도 추정치를 찾으려고 할 때, 도메인이 k×1 열 벡터인 경우, 분자 레이아웃을 사용한 결과는 1×k 열 벡터 형태가 된다. 따라서 결과를 끝에서 전치하거나 분모 레이아웃(또는 혼합 레이아웃)을 사용해야 한다.

다양한 종류의 Aggregate를 다른 종류의 Aggregate와 차별화한 결과
		스칼라 y		열 벡터 y(크기 m×1)		매트릭스 Y(크기 m×n)
		표기법	유형	표기법	유형	표기법	유형
스칼라 x	분자	${\frac {\property y}{\put x}$	스칼라	${\frac {\reason \mathbf {y}{\reason x}}$	크기-m 열 벡터	${\frac {\partial \mathbf {Y}{\partial x}$	m×n 행렬
스칼라 x	분모	${\frac {\property y}{\put x}$	스칼라	${\frac {\reason \mathbf {y}{\reason x}}$	크기-m 행 벡터	${\frac {\partial \mathbf {Y}{\partial x}$
열 벡터 x (n×1)	분자	${\frac {\frac y}{\reason \mathbf{x}}}$	N행 벡터 크기	${\frac {\reason \mathbf {y}{}{\reason \mathbf {x}}}$	m×n 행렬	${\frac {\partial \mathbf {Y}{{\partial \mathbf {x}}}$
열 벡터 x (n×1)	분모	${\frac {\frac y}{\reason \mathbf{x}}}$	크기-n 열 벡터	${\frac {\reason \mathbf {y}{}{\reason \mathbf {x}}}$	n×m 매트릭스	${\frac {\partial \mathbf {Y}{{\partial \mathbf {x}}}$
매트릭스 X (크기 p×q)	분자	${\frac {\partial y}{\partial \mathbf {X}}}$	q×p 행렬	${\frac {\partial \mathbf {y}{{\partial \mathbf {X}}}$		${\frac {\partial \mathbf {Y}{{\partial \mathbf {X}}}$
매트릭스 X (크기 p×q)	분모	${\frac {\partial y}{\partial \mathbf {X}}}$	p×q 행렬	${\frac {\partial \mathbf {y}{{\partial \mathbf {X}}}$		${\frac {\partial \mathbf {Y}{{\partial \mathbf {X}}}$

분자-레이아웃과 분모-레이아웃 표기법 사이를 전환할 때 작동 결과가 전치된다.

분자-레이아웃 표기법

분자-레이아웃 표기법을 사용하여 다음 사항을 확인하십시오.^[1]

{\begin{aligned}{\frac {\partial y}{\partial \mathbf {x} }}&={\begin{bmatrix}{\frac {\partial y}{\partial x_{1}}}&{\frac {\partial y}{\partial x_{2}}}&\cdots &{\frac {\partial y}{\partial x_{n}}}\end{bmatrix}}.\\{\frac {\partial \mathbf {y} }{\partial x}}&={\begin{bmatrix}{\frac {\partial y_{1}}{\partial x}}\\{\frac {\partial y_{2}}{\partial x}}\\\vdots \\{\frac {\partial y_{m}}{\partial x}}\\\end{bmatrix}}.\\{\frac{\partial \mathbf{y}}{\partial \mathbf{)}}}&={\begin{bmatrix}{\frac{\partial y_{1}}{\partial x_{1}}}&{\frac{\partial y_{1}}{\partial x_{2}}}&\cdots &,{\frac{\partial y_{1}}{\partial x_{n}}}\\{\frac{\partial y_{2}}{\partial x_{1}}}&{\frac{\partial y_{2}}{\partial x_{2}}}&\cdots &,{\frac{\partial y_{2}}{\p.artial x_{n}}}\\\vdots, \vdo &ts &\ddots \\\ddots \{\frac {\frac}{\properties x_{1}:{m}{\pract y_{n1}}{\propert x_{2}}}\cdots &{\fract y_{\m}}}\end{bmatrix}}}}.\\{\frac{이\partial}{\partial \mathbf{X}}}&={\begin{bmatrix}{\frac{이\partial}{\partial x_{11}}}&{\frac{이\partial}{\partial x_{21}}}&\cdots,{\frac{이\partial}{\partial x_{p1}}}\\{\frac{이\partial}{\partial x_{12}}}및 &,{\frac{이\partial}{\partial x_{22}}}&\cdots,{\frac{이\partial}{\partial x_{p2}}}\\\vdots &, \ &.vdots, \ddots &, \vdots{\frac \\{&\cHB y}{\cHB x_{1q}}&{\frac {\preason x_{2q}}&\cdots &{\preason y}{\preason x_{pq}}}\end{bmatrix}}}.\end{정렬}}

다음 정의는 분자-레이아웃 표기법으로만 제공된다.

{\displaystyle{\begin{정렬}{\frac{\partial \mathbf{Y}}{x\partial}}&={\begin{bmatrix}{\frac{\partial y_{11}}{x\partial}}&{\frac{\partial y_{12}}{x\partial}}&\cdots &,{\frac{\partial y_{1n}}{x\partial}}\\{\frac{\partial y_{21}}{x\partial}}&{\frac{\partial y_{22}}{x\partial}}&\cdots &,{\frac{\partial y_{2n}.}{x\partial}}\\\vdots, \vdo &ts &\ddots &\vdots \\\frac {\frac y_{m1}{\frac}{\property y_{m2}}:{\frac y_{mn}}}}{\frac y_{mn}}\end{bmatrix}}}.\\d\mathbf {X} &={\begin{bmatrix}dx_{11}&dx_{12}&\cdots &dx_{1n}\\dx_{21}&dx_{22}&\cdots &dx_{2n}\\\vdots &\vdots &\ddots &\vdots \\dx_{m1}&dx_{m2}&\cdots &dx_{mn}\\\end{bmatrix}}.\end{정렬}}}

분모-레이아웃 표기법

분모-레이아웃 표기법을 사용하여 다음 사항을 확인하십시오.^[2]

{\begin{aligned}{\frac {\partial y}{\partial \mathbf {x} }}&={\begin{bmatrix}{\frac {\partial y}{\partial x_{1}}}\\{\frac {\partial y}{\partial x_{2}}}\\\vdots \\{\frac {\partial y}{\partial x_{n}}}\\\end{bmatrix}}.\\frac {\frac {\mathbf {y}{\mathbf {}{\matrix}{\frac {\frac {\frac y_{1}{1}{\frased x&}}{\frac {\cd}}{\frasm\{bmatrix}}}}}}}.\\{\frac{\partial \mathbf{y}}{\partial \mathbf{)}}}&={\begin{bmatrix}{\frac{\partial y_{1}}{\partial x_{1}}}&{\frac{\partial y_{2}}{\partial x_{1}}}&\cdots &,{\frac{\partial y_{m}}{\partial x_{1}}}\\{\frac{\partial y_{1}}{\partial x_{2}}}&{\frac{\partial y_{2}}{\partial x_{2}}}&\cdots &,{\frac{\partial y_{m}}{\p.artial x_{2}}}\\\vdots, \vdo &ts &\ddots \\\ddots \{\frac {\frac}{\n1}{\prac x_{n}}&{\pract y_{n}}}{\propert x_{n}}}}\cdots&{\frac x_{\n}\end{bmatrix}}}.\\{\frac{이\partial}{\partial \mathbf{X}}}&={\begin{bmatrix}{\frac{이\partial}{\partial x_{11}}}&{\frac{이\partial}{\partial x_{12}}}&\cdots,{\frac{이\partial}{\partial x_{1q}}}\\{\frac{이\partial}{\partial x_{21}}}및 &,{\frac{이\partial}{\partial x_{22}}}&\cdots,{\frac{이\partial}{\partial x_{2q}}}\\\vdots &, \ &.vdots, \ddots &, \vdots{\frac \\{&\cHB y}{\cHB x_{p1}}&{\frac {\p1}{\p1}{\p1}}\cdots &{\fract y}{\pq}}}\end{bmatrix}}}.\end{정렬}}

정체성

위에서 언급한 바와 같이 일반적으로 분자-레이아웃과 분모-레이아웃 표기법 사이를 전환할 때 운용 결과가 전치된다.

아래의 모든 ID를 이해할 수 있도록 가장 중요한 규칙인 체인 규칙, 제품 규칙 및 합계 규칙을 기억하십시오. 합계는 보편적으로 적용되며, 매트릭스 제품은 서로 상통하지 않기 때문에 매트릭스 제품의 순서가 유지된다면 아래 대부분의 경우에 제품 규칙이 적용된다. 체인 규칙은 일부 경우에 적용되지만 불행히도 매트릭스별 파생상품이나 스칼라 바이 매트릭스 파생상품에는 적용되지 않는다(후자의 경우, 매트릭스에 적용된 추적 연산자를 대부분 포함한다). 후자의 경우, 제품 규칙도 직접적으로 적용할 수 없지만, 이와 동등한 것은 차등적 정체성을 이용하여 조금 더 많은 작업을 할 수 있다.

다음 ID는 다음과 같은 규약을 채택한다.

스칼라, a, b, c, d 및 e는 x, x, x 또는 X 중 하나의 함수로서, 스칼라, u, v
벡터, a, b, c, d 및 e는 x, x 또는 X의 함수 중 하나이며, 벡터, u 및 v는 x, x 또는 X의 함수 중 하나이다.
행렬, A, B, C, D, E는 일정하며 행렬, U, V는 x, x 또는 X 중 하나의 함수다.

벡터별 ID

이는 벡터별 분화에 적용되는 모든 연산이 단순히 분자나 분모의 적절한 벡터를 스칼라에 환원함으로써 벡터별 또는 스칼라별 분화에 직접 적용되기 때문에 먼저 제시된다.

ID: 벡터 바이 벡터

{\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}

y

{\frac {\partial \mathbf {y} }{\partial \mathbf {x} }}

x

{\

조건	표현	분자 레이아웃(예: y 및 x 기준^T)	분모 레이아웃(예^T: y 및 x)
a는 x의 함수가 아니다.	${\frac {\mathbf {a}{\reason \mathbf {x}}}}$	$\mathbf {0}$
	${\frac {\mathbf {x}{\reason \mathbf {x}}}{\reason \mathbf {x}}}}$	$\mathbf {I}$
A는 x의 함수가 아니다.	${\frac {\partial \mathbf {A} \mathbf {x}{\partial \mathbf {x}}}}}$	$\mathbf {A}$	$\mathbf {A}^{\top }$
A는 x의 함수가 아니다.	${\frac {\partial \mathbf {x} ^{\top }\mathbf {A}{\partial \mathbf {x}}}}}}}$	$\mathbf {A}^{\top }$	$\mathbf {A}$
a는 x의 함수가 아니다. u = u(x)	${\frac {\reason a\mathbf {u}}{\reason\,\mathbf {x}}}=$	$a{\frac {\mathbf {u}{}{\mathbf {x}}}$
v = v(x), a는 x의 함수가 아니다.	${\frac {\reason v\mathbf {a}{}{\reason \mathbf {x}}}}$	$\mathbf {a} {\frac {\frac v}{\reason \mathbf {x}}$	${\frac {\preason v}{\\mathbf {x}}}}}\mathbf {a}^{\top }}}$
v = v(x), u = u(x)	${\frac {\reason v\mathbf {u}{}{\reason \mathbf {x}}}}$	$v{\frac {\mathbf {u}{}}{\mathbf {x}}{\frac {\mathbf{\mathbf {x}}}}{\mathbf {x}}}}}}}$	$v{\frac {\mathbf {u}{}}{\mathbf {x}}}}{\mathbf {x}}{\mathbf {u}}{\mathbf {u}}} ^{\top }}}}}}$
A는 x의 함수가 아니라, u = u(x)	${\frac {\partial \mathbf {A} \mathbf {u}{\partial \mathbf {x}}}}=$	$\mathbf {A} {\frac {\partial \mathbf {u}{\partial \mathbf {x}}}}$	${\frac {\partial \mathbf {u}{}{\partial \mathbf {x}}}}\mathbf {A}^{\top }}}}}$
u = u(x), v = v(x)	${\frac {\mathbf {u} +\mathbf {v}}}{\mathbf {x}}}}{\mathbf {}}}}$	${\frac {\mathbf {u}{}}{\mathbf {x}}{\frac {\mathbf {v}{\mathbf {x}}}}}}$
u = u(x)	${\frac {\mathbf {g(u)}{}{\mathbf {x}}}=$	${\frac {\mathbf {g(u)}{}{\mathbf {u}}{\frac {\mathbf {u}{\mathbf {x}}}}}}$	${\frac {\mathbf {u}{}}{\mathbf {x}{\frac {\mathbf {g(u)}{\mathbf {u}}}}}$
u = u(x)	${\frac {\mathbf {f(g(u))}{}{\mathbf {x}}}}$	${\displaystyle {\frac {\mathbf {f(g)}{{\mathbf {g}{\frac {g(u)}}{\mathbf {u}}{\mathbf {u}{\mathbf {}{}}}{\mathbf {x}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}{\mathb$	${\displaystyle {\frac {\mathbf {u}{}{\mathbf {x}{\frac {g(으)}{\mathbf {}{\mathbf {u}}}{\mathbf {f(g)}{}\mathbf {g}}}}}}}}}}{\mathbmathbf}}}}}}}}}}}}}}}}}}}}}}{\mathbautbf.$

스칼라별 벡터 ID

근본적인 정체성은 두터운 검은 선 위에 놓여 있다.

ID: 스칼라 바이 벡터

{\frac {\partial y}{\partial \mathbf {x} }}=\nabla _{\mathbf {x} }y

{\frac {\partial y}{\partial \mathbf {x} }}=\nabla _{\mathbf {x} }y

∇ x =

{\frac {\partial y}{\partial \mathbf {x} }}=\nabla _{\mathbf {x} }y

{\frac {\partial y}{\partial \mathbf {x} }}=\nabla _{\mathbf {x} }y

{\frac {\partial y}{\partial \mathbf {x} }}=\nabla _{\mathbf {x} }y

{\displaystyle {\frac {\partial

y

}{\

partial }{\

partial \mathbf{x}}}}}=\nabla _{\mathbf {x}}}y

}y}y

}

조건	표현	분자 레이아웃, 즉, x에^T 의한 결과 행 벡터	분모 레이아웃, 즉, x에 의한 결과 열 벡터
a는 x의 함수가 아니다.	${\frac {\reason a}{\reason \mathbf {x}}}$	$\mathbf {0} ^{\top }$ ^[3]	$\mathbf {0}$ ^[3]
a는 x의 함수가 아니다. u = u(x)	${\frac {\bu}{\reason \mathbf {x}}}$	$a{\frac {\reason u}{\reason \mathbf {x}}$
u = u(x), v = v(x)	${\frac {\preason (u+v)}{\reason \mathbf {x}}}$	${\frac {\frac {\properties u}{\\mathbf {x}}}{\frac {\frac v}{\reason \mathbf {x}}}}}}$
u = u(x), v = v(x)	${\frac {\properties uv}{\reason \mathbf {x}}}$	$u{\frac {\frac}{\\mathbf {x}}}}}+v{\frac {\mathbf {x}}}}$
u = u(x)	${\frac {\properties g(u)}{\redit \mathbf {x}}}}=$	${\frac {\frac(u)}{\frac {\frac}{\frac {\flict u}{\mathbf {x}}}}$
u = u(x)	${\frac {\put f(g(u)}}{\cHB \mathbf {x}}}}$	${\frac {\frac {\frac(g)}{\frac {\frac(u)}{\fract u}{\fract u}{\mathbf {x}}}}}}}}}}$
u = u(x), v = v(x)	${\frac {\u} \cdot \mathbf {v}}{\cdot \mathbf {x}}{\frac {x}}}}{\mathbf {u}{\top }{\mathbf {v}}{\mathbf {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	$\mathbf {u} ^{\top }{\frac {\mathbf {v}{\mathbf{x}}{\mathbf {v}}{\frac {\mathbf {u}{\frac {\mathbf {}}{\mathbf {x}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ numer ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ $∂$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ , ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ v { ${\$ {\ $frac{\mathbf {u}{}}{\frac {x}}},{\frac {\mathbf {v}{\mathbf {x}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}.$	${\frac {\mathbf {u}{}}{\mathbf {x}}}}\mathbf {v} +{\frac {\mathbf {v}{\mathbf {}}{\mathbf {u}}}}}}}}}}}}}}}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ , ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ v ${$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ {\ $displaystyle {\$ frac ${\frac$ {\ $frac {u}}{\mathbf {x}}},{\frac {\mathbf {v}{\mathbf {x}}}}}}}}}}$ 분모 레이아웃 ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$
u = u(x), v = v(x), A는 x의 함수가 아니다.	${\frac {\partial (\mathbf {u} \cdot \mathbf {A} \mathbf {v} )}{\partial \mathbf {x} }}={\frac {\partial \mathbf {u} ^{\top }\mathbf {A} \mathbf {v} }{\partial \mathbf {x} }}=$	$\mathbf {u} ^{\top }\mathbf {A} {\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}+\mathbf {v} ^{\top }\mathbf {A} ^{\top }{\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ numer ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ $∂$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ , ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ v { ${\$ {\ $frac{\mathbf {u}{}}{\frac {x}}},{\frac {\mathbf {v}{\mathbf {x}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}.$	${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}\mathbf {A} \mathbf {v} +{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}\mathbf {A} ^{\top }\mathbf {u}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ , ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ v ${$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$ {\ $displaystyle {\$ frac ${\frac$ {\ $frac {u}}{\mathbf {x}}},{\frac {\mathbf {v}{\mathbf {x}}}}}}}}}}$ 분모 레이아웃 ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }},{\frac {\partial \mathbf {v} }{\partial \mathbf {x} }}$
	${\frac {\preason ^{2}f}{\mathbf {x} \mathbf {x} \mathbf {x} ^{\top }=}}}$	$\mathbf {H}^{\top }$	$\mathbf {H}$ ${\$ 헤시안 행렬^[4]
a는 x의 함수가 아니다.	${\frac {\a} \cdot \mathbf {x}}{\cdot \mathbf {x}}{\cdot \mathbf {a}}{\mathbf {x}}}}}{\mathbf {}}}}}}}}}}}}}}}}$ ${\frac {\mathbf {a}^{\top }\mathbf {x}{\mathbf {x}}{\frac {x}}}}{\mathbf {x}{\mathbf {a}{\mathbf {}}}}}}{\mathbf {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	$\mathbf {a} ^{\top }$	$\mathbf {a}$
A는 x의 함수가 아니다. b는 x의 함수가 아니다.	${\frac {\partial \mathbf {b} ^{\top }\mathbf {A} \mathbf {x}{\partial \mathbf {x}}}}}}}$	$\mathbf {b}^{\top }\mathbf {A}}$	$\mathbf {A}^{\top }\mathbf {b}}$
A는 x의 함수가 아니다.	${\frac {\partial \mathbf {x} ^{\top }\mathbf {A} \mathbf {x}{\partial \mathbf {x}}}}}}$	$\mathbf {x} ^{\top }\왼쪽(\mathbf {A} +\mathbf {A} ^{\top }\오른쪽)$	$\left(\mathbf {A} +\mathbf {A} ^{\top }\오른쪽)\mathbf {x}}$
A는 x의 함수가 아니다. A는 대칭이다	${\frac {\partial \mathbf {x} ^{\top }\mathbf {A} \mathbf {x}{\partial \mathbf {x}}}}}}$	$2\mathbf {x}^{\top }\mathbf {A}}$	$2\mathbf {A} \mathbf {x}$
A는 x의 함수가 아니다.	${\frac {\partial ^{2}\mathbf {x} ^{\top }\mathbf {A} \mathbf {x}{\partial \mathbf {x} \partial \mathbf {x}^{\top }=}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	$\mathbf {A} +\mathbf {A} ^{\top }$
A는 x의 함수가 아니다. A는 대칭이다	${\frac {\partial ^{2}\mathbf {x} ^{\top }\mathbf {A} \mathbf {x}{\partial \mathbf {x} \partial \mathbf {x}^{\top }=}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	$2\mathbf {A}$
	${\frac {\partial (\mathbf {x} \cdot \mathbf {x} )}{\partial \mathbf {x} }}={\frac {\partial \mathbf {x} ^{\top }\mathbf {x} }{\partial \mathbf {x} }}={\frac {\partial \left\Vert \mathbf {x} \right\Vert ^{2}}{\partial \mathbf {x} }}=$	$2\mathbf {x} ^{\top }$	$2\mathbf {x}$
a는 x의 함수가 아니다. u = u(x)	${\frac {\a}\cdot \mathbf {u}}}{\cdot \mathbf {x}}{\frac {x}}}}{\mathbf {a}{\top }{\mathbf {u}}{\mathbf {}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	$\mathbf {a} ^{\top }{\frac {\mathbf {u}{}{\mathbf {x}}}}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ numer ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\$ {\frac ${\mathbf {u}{}{\mathbf {x}}}}$ 분자 레이아웃에 ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ $∂$ u u u u u u u u?	${\frac {\reason \mathbf {u}{}}{\reason \mathbf {x}}}\mathbf {a}}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ ${\$ {\ $reason \mathbf {u}{}{\reason \mathbf{x}}}}}$ 분모 ${\frac {\partial \mathbf {u} }{\partial \mathbf {x} }}$ 레이아웃
a, b는 x의 기능이 아니다.	${\frac{\\textbf {a}^{\\textbf{x}}{\textbf{x}^{\textbf{b}}{\textbf {x}}}}}{\textbf {x}}}=}$	${\textbf{x}^{\top }\left\textbf {b}^{\textbf {b}+{\textbf {a}}{\textbf{a}^{\top }\오른쪽)}}$	$\left\textbf {a}{\textbf {b}^{\textbf {b}+{\textbf {a}^{\top }\오른쪽){\textbf {x}}}}$
A, b, C, D, e는 x의 기능이 아니다.	${\frac {\partial \;({\textbf {A}}{\textbf {x}}+{\textbf {b}})^{\top }{\textbf {C}}({\textbf {D}}{\textbf {x}}+{\textbf {e}})}{\partial \;{\textbf {x}}}}=$	$({\textbf {D}}{\textbf {x}}+{\textbf {e}})^{\top }{\textbf {C}}^{\top }{\textbf {A}}+({\textbf {A}}{\textbf {x}}+{\textbf {b}})^{\top }{\textbf {C}}{\textbf {D}}$	${\textbf {D}}^{\top }{\textbf {C}}^{\top }({\textbf {A}}{\textbf {x}}+{\textbf {b}})+{\textbf {A}}^{\top }{\textbf {C}}({\textbf {D}}{\textbf {x}}+{\textbf {e}})$
a는 x의 함수가 아니다.	${\frac {\reason \\mathbf {x} -\mathbf {a} \{}{\reason \\\mathbf {x}}}}=$	${\frac {(\mathbf {x} -\mathbf {a} )^{\}{{\\\\mathbf {a} \}}}$	${\frac {x} -\mathbf {a}{}{\mathbf {x} -\mathbf {a} \}}$

벡터 바이 스칼라 아이덴티티

ID: 벡터 바이 스칼라(Vector by scalar)

{\frac {\partial \mathbf {y} }{\partial x}}

{\frac {\partial \mathbf {y} }{\partial x}}

{\frac {\partial \mathbf {y} }{\partial x}}

x

{\

조건	표현	분자 레이아웃(예: y) 결과는 열 벡터	분모 레이아웃, 즉 y에^T 의한 결과는 행 벡터
a는 x의 함수가 아니다.	${\frac {\mathbf {a}{\property x}=$	$\mathbf {0}$ ^[3]
a는 x의 함수가 아니다. u = u(x)	${\frac {\reason a\mathbf {u}{}{\reason x}=$	$a{\frac {\reason \mathbf {u}{}{\reason x}$
A는 x의 함수가 아니라, u = u(x)	${\frac {\partial \mathbf {A} \mathbf {u}{\partial x}=$	$\mathbf {A} {\frac {\partial \mathbf {u}{\partial x}}$	${\frac {\partial \mathbf {u}{\partial x}}\mathbf {A}^{\top }}}$
u = u(x)	${\frac {\mathbf {u} ^{\top }{\property x}=$	${\displaystyle \left\frac {u}{\\mathbf {}{\mathbf }}}{\mathbf x}\오른쪽)$
u = u(x), v = v(x)	${\frac {\mathbf {u} +\mathbf {v}}}{\mathbf x}=$	${\frac {\mathbf {u}{\\mathbf {u}}{\mathbf}{\frac}{\mathbf {v}}}}$
u = u(x), v = v(x)	${\frac {\mathbf {u} ^{\top }\mathbf {v}}}{\mathbf x}=$	${\displaystyle \left\frac {u}}{\mathbf {}{\mathbf {v} +\mathbf {u} ^\\\frac {\frac {\mathbf {v}{\mathbf}{\mathbf}}}}{\mathb}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}?$	${\frac {\mathbf {u}{\mathbf {u}}{\mathbf {v} +\mathbf {u} ^{\top }\mathbf {}\mathbf {}{\mathbf {v}}\right}^{\mathb}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$
u = u(x)	${\frac {\mathbf {g(u)}{{\mathbf {g(u)}}}$	${\frac {\mathbf {g(u)}{}{\mathbf {u}}{\frac {\mathbf {u}{\mathbf {}{\mathbf x}}}}}}}$	${\frac {\mathbf {u}{\mathbf {u}{\mathbf {g(u)}{\mathbf {u}}}}$
u = u(x)	${\frac {\mathbf {g(u)}{{\mathbf {g(u)}}}$	일관된 행렬 레이아웃을 가정한다. 아래를 참조하십시오.
u = u(x)	${\frac {\mathbf {f(g(u))}{}{\mathbf {f(g(u)}}}$	${\frac {\mathbf {f(g)}{{\mathbf {g}{\mathbf {g(u)}}{\mathbf {u}}{\mathbf {}{\mathbf {}{}{\mathbf}{}}}}}{\mathb(으)}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	${\frac {\mathbf {u}{\mathbf{g}}{\mathbf {g(으)}{\mathbf {u}}{\mathbf{\mathbf {f(g)}{\mathbf {g}}}}}}}}}}}{\mathbmathbf {g}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$
u = u(x)	${\frac {\mathbf {f(g(u))}{}{\mathbf {f(g(u)}}}$	일관된 행렬 레이아웃을 가정한다. 아래를 참조하십시오.
U = U(x), v = v(x)	${\frac {\partial(\mathbf {U} \time \mathbf {v} ){\partial x}=$	${\displaystyle {\frac {\partial \mathbf {U}{\partial x}}{\partial x}\time \mathbf {v} +\mathbf {U} \time {\frac {\partial \mathbf {v}{\partial x}}}}}}}}}}}}}}}}}}}}}?$	${\displaystyle \mathbf{v}^{\top}\times}{x\partial}}\times\mathbf{U}^{\top}}\left({\frac{\partial \mathbf{U}}{\partial x}}\right)+{\frac{\partial \mathbf{v}.$

메모:그 공식들 vector-by-vector 파생 상품과 관련된(u)∂ 너{\displaystyle{\frac{\partial \mathbf{g(u)}}{\partial \mathbf{너}}}}과∂ f(g)∂ g{\displaystyle{\frac{\partial \mathbf{f(g)}}{\partial \mathbf{g}}}}(출력 값 매트릭스다)은 매트릭스 consis되고 있다고 가정하 g∂.장막 벡터의 배치도로, 즉 numerator-layout 행렬 때numerator-layout 벡터와 부사장 반대로, 그렇지 않으면 vector-by-vector 파생 상품 바꿔 놓다.

스칼라별 매트릭스 ID

유의 매트릭스의 matrix-valued 기능에 적용되는 스칼라 곱 규칙과 연쇄 법칙의 정확한 등가물 존재하지 않는다. 하지만, 이런 종류의 제품 규칙은 미분 형식에(아래 참조)고, 이건 방법은 추적 기능이 추적 기능과, 즉 순환 치환 흑백 반전 흑백 뒤집기로 결합과 관련된 아래의 정체성의 많은 파생시키는 데:적용되나.

{\displaystyle{\begin{정렬}\operatorname{tr}(\mathbf{A})&,=\operatorname{tr}\left(\mathbf{A^{\top}}\right)\.\\operatorname{tr}(\mathbf{에이비 시디})&,=\operatorname{tr}(\mathbf{BCDA})=\operatorname{tr}(\mathbf{CDAB})=\operatorname{tr}(\mathbf{DABC})\end{정렬}}}.

예를 들어,∂tr⁡( 에이는 엑스 BX⊤ C)∂ X:{\displaystyle{\frac{\partial \operatorname{tr}(\mathbf{AXBX^{\top}C})}{\partial \mathbf{X}}}:}를 계산하기 위해.

{\begin{aligned}d\operatorname {tr} (\mathbf {AXBX^{\top }C} )&=d\operatorname {tr} \left(\mathbf {CAXBX^{\top }} \right)=\operatorname {tr} \left(d\left(\mathbf {CAXBX^{\top }} \right)\right)\\&=\operatorname {tr} \left(\mathbf {CAX}d(\mathbf {BX^{\top }) \d(\mathbf {CAX} )\mathbf {BX^{\top }\right)\\\\\&=\operatorname {tr} \left(\mathbf {CAX}d\\mathbf {BX^{\top }\right)+\opername {tr} \reft(d)(\mathbf {CAX})\mathbf {B^{BX^{p}\}\}\op \}\right)\right)\right)\right)\&=\operatorname {tr} \left(\mathbf {CAXB}d\mathbf {X^{\}\top \right)+\opername {tr} \reft} \\\mathbf {CA}(d\mathbf {X})\mathbf {B^{{{{{{}\rig}\rig}\rig}\right)\coperght)\coperght)\coperght)\\\\cHT}\\&=\operatorname {tr} \왼쪽(\mathbf {CAXB})(d\mathbf {X}^{\top }\right)+\operatorname {tr}(\mathbf {CA}\ref(d\mathbf {X})\mathbf {B^{B}\op}\rig}\right)\cop}\coperght)\\\cHT}\\\cH00\cHIP)\\&=\operatorname {tr} \left(\left(\mathbf {CAXB} (d\mathbf {X} )^{\top }\right)^{\top }\right)+\operatorname {tr} \left(\mathbf {CA} (d\mathbf {X} )\mathbf {BX^{\top }} \right)\\&=\operatorname {tr} \left((d\mathbf {X} )\mathbf {B^{\top }X^{\top }A^{\top }C^{\top }} \right)+\operatorname {tr} \left(\mathbf {CA} (d\mathbf {X} )\mathbf {BX^{\top }} \right)\\&=\operatorname {tr} \left(\mathbf {B^{\top }X^{\top }A^{\top }C^{\top }} (d\mathbf {X} )\right)+\operatorname {tr} \left(\mathbf {BX^{\top }} \mathbf {CA} (d\mathbf {X} )\right)\\&=\operatorname {tr} \left(\mathbf {B^{\top }X^{}}A^{\top }}}+\c^{BX^{\top }}}}}} \mathbf {CA} \right}d\mathbf {X}{X}{oped}}}}}}}}}}}}}}}}}}}}}}}}정렬}}}}}}}}}}}}}}}}}}}}}}}}}}}

그러므로

{\frac {\partial \operatorname {tr} \left(\mathbf {AXBX^{\top }C} \right)}{\partial \mathbf {X} }}=\mathbf {CAXB} +\mathbf {A^{\top }C^{\top }} \mathbf {XB^{\top }} .

(마지막 단계는 차등에서 파생 모델로 변환 섹션을 참조하십시오.)

ID: 스칼라 바이 매트릭스(scalar by matrix) rix y

{\frac {\partial y}{\partial \mathbf {X} }}

{\frac {\partial y}{\partial \mathbf {X} }}

{\

y

}{\partial \mathbf {X}}}}

조건	표현	분자 레이아웃(예^T: X 기준)	분모 배치, 즉 X에 의한 배치
a는 X의 함수가 아니다.	${\frac {\partial a}{\partial \mathbf {X}}}$	$\mathbf {0} ^{\top }$ ^[5]	$\mathbf {0}$ ^[5]
a는 X의 함수가 아니다, u = u(X)	${\frac {\partial au}{\partial \mathbf {X}}}$	$a{\frac {\partial u}{\partial \mathbf{X}}}$
u = u(X), v = v(X)	${\frac {\partial(u+v)}{\partial \mathbf {X}}}$	${\frac {\partial u}{\partial \mathbf{X}}}{\partial v}{\partial \mathbf {X}}}}$
u = u(X), v = v(X)	${\frac {\partial uv}{\partial \mathbf {X}}}$	$u{\frac {\partial v}{\partial \mathbf {X}}}}}+v{\frac {\partial u}{\partial \mathbf {X}}}}}}}$
u = u(X)	${\frac {\partial g(u)}{\partial \mathbf {X}}}$	${\frac {\partial g(u)}{\partial u}{\partial u}{\partial u}{\partial \mathbf{X}}}}}}$
u = u(X)	${\frac {\put f(g(u)}{\partial \mathbf {X}}}}$	${\displaystyle {\frac {\partial f(g)}{\partial g}{\frac {\partial g(u)}{\partial u}{\partial u}{\partial u}{\partial \mathbf {X}}}}}}}}}}}}}}}}}}}}}}}}}"$
U = U(X)	^[4] ${\frac {\partial g(\mathbf {U})}{\partial X_{ij}}=$	$\operatorname {tr} \좌({\frac {\partial g(\mathbf {U} )}{\partial \mathbf {U}}{\partial X_{ij}}\오른쪽)$	$\operatorname {tr} \좌({\frac({\partial g(\mathbf {U} )}{\partial \mathbf {}}}}^{\partial \mathbf {U}{}}{\partial X_{ij}}\오른쪽)}}}}}$
U = U(X)	^[4] ${\frac {\partial g(\mathbf {U})}{\partial X_{ij}}=$	두 형식 모두 ${\frac {\partial \mathbf {U} }{\partial X_{ij}}},$ ${\frac {\partial \mathbf {U} }{\partial X_{ij}}},$ ${\frac {\partial \mathbf {U} }{\partial X_{ij}}},$ X ${\frac {\partial \mathbf {U} }{\partial X_{ij}}},$ ${\frac {\partial \mathbf {U} }{\partial X_{ij}}},$ , ${\frac {\partial \mathbf {U}{\partial X_{ij}}}}$ 에 대한 분자 레이아웃을 가정한다. 즉, X에 대한 분모 레이아웃이 사용되는 경우 혼합 레이아웃.
a와 b는 X의 기능이 아니다.	${\frac {\partial \mathbf {a}^{\top }\mathbf {X} \mathbf {b}{\partial \mathbf {X}}}}}}$	$\mathbf {b} \mathbf {a} ^{\top }$	$\mathbf {a} \mathbf {b} ^{\top }$
a와 b는 X의 기능이 아니다.	${\frac {\partial \mathbf {a}^{\top }\mathbf {X}^{\top }\mathbf {b}{\partial \mathbf {X}}}}}}}}}$	$\mathbf {a} \mathbf {b} ^{\top }$	$\mathbf {b} \mathbf {a} ^{\top }$
a, b, C는 X의 기능이 아니다.	${\frac {\x} \mathbf {a} +\mathbf {b}^{\top }\mathbf {C}(\mathbf {a} +\mathbf {b} )}{\partial \mathbf {X}}}}}}}}}}}$	$\왼쪽(\mathbf {C} +\mathbf {C} ^{\top }\오른쪽)(\mathbf {X} \mathbf {a} +\mathbf {b} ^{\top }^{\op ^{\}}}}}}}}}}}}}}}}}}:{\top }}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	${\displaystyle \왼쪽(\mathbf {C} +\mathbf {C} ^{\top }\right)(\mathbf {a} +\mathbf {b} )\mathbf {a} ^{\top })$
a, b, C는 X의 기능이 아니다.	${\frac {\mathbf {X}\mathbf {a}^{\top }\mathbf {C}(\mathbf {X} \mathbf {b} ){\partial \mathbf {X}}}}}}}}}}}}}}}}$	$\left(\mathbf {C} \mathbf {X} \mathbf {a}^{\top }+\mathbf {C} ^{\mathbf {a} \mathbf {b} \mathbf {b}^{{{\top }\}}}}}}}}}}}}}^}}}}}}}}}}}}}}}}^}}}}}}}}}}}}}}}}}}}}}}$	$\mathbf {C} \mathbf {X} \mathbf {b} \mathbf {a} ^{\top }+\mathbf {C} ^{\top }\mathbf {a} \mathbf {b} ^{\top }}}$
	${\frac {\partial \operatorname {tr}(\mathbf {X} ){\partial \mathbf {X}}}}$	$\mathbf {I}$
U = U(X), V = V(X)	${\frac {\partial \operatorname {tr}(\mathbf {U} +\mathbf {V}){\partial \mathbf {X}}}}}$	${\frac {\partial \operatorname {tr}(\mathbf {U} )}{\partial \mathbf {X}}{\partial \mathbf {V}}{\partial \mathbf {X}}}}}}}}}}}}}}}}}}}}$
a는 X의 함수가 아니다. U = U(X)	${\frac {\partial \operatorname {tr}(a\mathbf {U} ){\partial \mathbf {X}}}}$	$a{\frac {\partial \operatorname {tr}(\mathbf {U})}{\partial \mathbf {X}}}$
g(X)는 스칼라 계수를 가진 모든 다항식 또는 무한 다항식 시리즈(예^X: 신(X), 코스(X), ln(X) 등으로 정의되는 매트릭스 함수로서, g(x)는 등가 스칼라 함수, g(x)는 그 파생 함수, g((x)는 해당 매트릭스 함수다.	${\frac {\partial \operatorname {tr}(\mathbf {g(X)})}{\partial \mathbf {X}}}}$	$\mathbf {g} '(\mathbf {X} )$	$\left(\mathbf {g} '(\mathbf {X} )\right)^{\top }}}$
A는 X의 함수가 아니다.	^[6] ${\frac {\partial \operatorname {tr}(\mathbf {AX})}{\partial \mathbf {X}}{\partial \mathbf {XA}}}}}}}$	$\mathbf {A}$	$\mathbf {A}^{\top }$
A는 X의 함수가 아니다.	^[4] ${\frac {\partial \operatorname {tr} \left(\mathbf {AX^{\top }} \right)}{\partial \mathbf {X} }}={\frac {\partial \operatorname {tr} \left(\mathbf {X^{\top }A} \right)}{\partial \mathbf {X} }}=$	$\mathbf {A}^{\top }$	$\mathbf {A}$
A는 X의 함수가 아니다.	^[4] ${\frac {\partial \operatorname {tr} \left(\mathbf {X^{\top }AX} \right)}{\partial \mathbf {X}}}}}}$	$\mathbf {X} ^{\top }\왼쪽(\mathbf {A} +\mathbf {A} ^{\top }\오른쪽)$	$\left(\mathbf {A} +\mathbf {A} ^{\top }\오른쪽)\mathbf {X}$
A는 X의 함수가 아니다.	^[4] ${\frac {\partial \operatorname {tr}(\mathbf {X^{-1}A}){\partial \mathbf {X}}}}}$	$-\mathbf {X} ^{-1}\mathbf {A} \mathbf {X} ^{-1$	$-\좌(\mathbf {X} ^{-1}\오른쪽)^{\top }\mathbf {A}^{\top }\좌(\mathbf {X}^{-1}\우)^{\top }}}}}^{\}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$
A, B는 X의 기능이 아니다.	${\frac {\partial \operatorname {tr}(\mathbf {AXB} )}{\partial \mathbf {X}}}{\partial \mathbf {BAX}}}}}}}$	$\mathbf {BA}$	$\mathbf {A^{\top }B^{\top }}}}$
A, B, C는 X의 기능이 아니다.	${\frac {\partial \operatorname {tr} \left(\mathbf {AXBX^{\top }C} \right){\partial \mathbf {X}}}}}}$	$\mathbf {BX^{\top }CA} +\mathbf {B^{\top }X^{}\top }A^{}\top }C^{\top }}}}}}}}}}}}$	$\mathbf {A^{\top }C^{}XB^{\top }} +\mathbf {CAXB}}$
n은 양의 정수다.	^[4] ${\frac {\partial \operatorname {tr} \left(\mathbf {X} ^{n}\right)}{\partial \mathbf {X}}}}}}$	$n\mathbf {X} ^{n-1$	$n\left(\mathbf {X}) ^{n-1}\오른쪽)^{\top }}}$
A는 X의 함수가 아니다. n은 양의 정수다.	^[4] ${\frac {\partial \operatorname {tr} \left(\mathbf {A} \mathbf {X} ^{n}\right)}{\partial \mathbf {X}}}}}}}}}$	$\sum \{i=0}^{n-1}\mathbf {X} ^{i}\mathbf {A} \mathbf {X} ^{n-i-1$	$\sum \{i=0}^{n-1}\왼쪽(\mathbf {X}^{i}\mathbf {A}\mathbf {X} \mathbf {X}^{n-i-1}\오른쪽)^{\top }}}}}}$
	^[4] ${\frac {\partial \operatorname {tr} \left(e^{\mathbf {X} }\오른쪽){\partial \mathbf {X}}}}{}}}}$	$e^{\mathbf{X}}}}$	$\left(e^{\mathbf {X} }\오른쪽)^{\top }}}}}$
	^[4] ${\frac {\partial \operatorname {tr}(\sin(\mathbf {X} )}{\partial \mathbf {X}}}}}$	$\cos(\mathbf {X} )$	${\displaystyle(\cos(\mathbf {X} )^{\top }}}$
	^[7] ${\frac {\partial \mathbf {X}{{\partial \mathbf {X}}}}$	$\operatorname {cofactor}(X)^{\top }= \mathbf {X} \mathbf {X} ^{-1$	$\operatorname {cofactor}(X)= \mathbf {X} \left(\mathbf {X} ^{-1}\오른쪽)^{\top }}}}}}}$
a는 X의 함수가 아니다.	^[4] ${\frac {\partial \ln a\mathbf {X}{\partial \mathbf {X}}}$ ^[8]	$\mathbf {X} ^{-1$	$\left(\mathbf {X} ^{-1}\오른쪽)^{\top }}}$
A, B는 X의 기능이 아니다.	^[4] ${\frac {\partial \mathbf {AXB}{}{\partial \mathbf {X}}}}}$	$\mathbf {AXB} \mathbf {X} ^{-1$	$\mathbf {AXB} \left(\mathbf {X}) ^{-1}\오른쪽)^{\top }}}$
n은 양의 정수다.	^[4] ${\frac {\partial \왼쪽 \mathbf {X} ^{n}\오른쪽 }{\partial \mathbf {X}}}}}}$	$n\왼쪽 \mathbf {X} ^{n}\오른쪽 \mathbf {X} ^{-1$	$n\\left \mathbf {X} ^{n}\오른쪽 \left(\mathbf {X} ^{-1}\right)^{\top }}}}}$
(사이비 분석 참조)	^[4] ${\frac {\partial \ln \left \mathbf {X} ^{\top }\mathbf {X} \right{\partial \mathbf {X}}}}}}$	$2\mathbf {X}^{+}$	$2\왼쪽(\mathbf {X}^{+}\오른쪽)^{\top }}}$
(사이비 분석 참조)	^[4] ${\frac {\partial \ln \left \mathbf {X} ^{\top }\mathbf {X} \right{\partial \mathbf {X}{+}}=$	$-2\mathbf {X}$	$-2\mathbf {X}^{\top }}$
A는 X의 함수가 아니다. X는 정사각형이고 변환할 수 없다.	${\frac {\partial \왼쪽 \mathbf {X^{\top }} \mathbf {A} \mathbf {X} \partial \mathbf {X}}}}}}}}$	$2\ft \mathbf {X^{\top } \mathbf {A} \mathbf {X} \right \mathbf {1}{X^{\top }} \right \mathbf {X} \mathbf {X}{X} ^-1} ^-1}{1}{{1}{{{1}{1}}}}}}}}}}}} ^-1$	$2\ft \mathbf {X^{\top } \mathbf {A} \mathbf {X} \오른쪽 \ref(\mathbf {X} ^{-1}\오른쪽)^{\top }}}}}$
A는 X의 함수가 아니다. X는 제곱이 아니라, A는 대칭이다	${\frac {\partial \왼쪽 \mathbf {X^{\top }} \mathbf {A} \mathbf {X} \partial \mathbf {X}}}}}}}}$	$2\ft \mathbf {X^{\top }\mathbf {A} \mathbf {X^{\top }A^{}}{{\opp}}}^{-1}\mathbf {X^{}\top }}}}}}}}}}mathbf{{{{}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}$	$2\ft \mathbf {X^{\top } \mathbf {AX} \right \mathbf {AX} \mathbf {AX} \reft(\mathbf {X^{\top }AX} \AX}오른쪽)^{-11$
A는 X의 함수가 아니다. X는 제곱이 아니라, A는 비대칭이다	${\frac {\partial \mathbf {X^{\top }} \mathbf {A} \mathbf {X}{\partial \mathbf {X}}}}}}}$	${\begin{aligned}\left \mathbf {X^{\top }} \mathbf {A} \mathbf {X} \right {\Big (}&\left(\mathbf {X^{\top }AX} \right)^{-1}\mathbf {X^{\top }A} +{}\\&\left(\mathbf {X^{\top }A^{\top }X} \right)^{-1}\mathbf {X^{\top }A^{\top }} {\Big )}\end{aligned}}$	${\begin{aligned}\left \mathbf {X^{\top }} \mathbf {A} \mathbf {X} \right {\Big (}&\mathbf {AX} \left(\mathbf {X^{\top }AX} \right)^{-1}+{}\\&\mathbf {A^{\top }X} \left(\mathbf {X^{\top }A^{\top }X} \right)^{-1}{\Big )}\end{aligned}}$

매트릭스 바이 스칼라 ID

ID: 매트릭스 바이 스칼라(Matrix by Scalar)

{\frac {\partial \mathbf {Y} }{\partial x}}

Y

{\frac {\partial \mathbf {Y} }{\partial x}}

x

{\

\partial \

mathbf {Y}{\partial

x

}}}}}}

조건	표현	분자 레이아웃(예: Y)
U = U(x)	${\frac {\partial a\mathbf {U}{\partial x}=$	$a{\frac {\partial \mathbf {U}{\partial x}$
A, B는 x의 기능이 아니다. U = U(x)	${\frac {\partial \mathbf {AUB}{{\partial x}=$	$\mathbf {A} {\frac {\partial \mathbf {U}{\partial x}\mathbf {B}}$
U = U(x), V = V(x)	${\frac {\partial(\mathbf {U} +\mathbf {V})}{\partial x}=$	${\frac {\partial \mathbf {U}}{\partial x}+{\prac {\partial \mathbf {V}{\partial x}}}}$
U = U(x), V = V(x)	${\frac {\partial(\mathbf {U} \mathbf {V})}{\partial x}=$	$\mathbf{U} {\frac {V}{\partial x}+{\partial \mathbf {U}{\partial x}}\mathbf {V}}}}$
U = U(x), V = V(x)	${\frac {\partial(\mathbf {U}\mathbf {V})}{\partial x}=$	$\mathbf {U} \frac {\partial \mathbf {V}{\partial x}+{\partial \mathbf {U}{\partial x}\otimes \mathbf {V}}}}}}}}}$
U = U(x), V = V(x)	${\frac {\partial(\mathbf {U} \circircule \mathbf {V}}}{\partial x}=}$	$\mathbf {U} \circule {\frac {\partial x}{\partial x}+{\partial \mathbf {U}{\partial x}\circathbf {V}}}}$
U = U(x)	${\frac {\partial \mathbf {U}^{-1}{\partial x}=$	$-\mathbf {U} ^{-1}{\frac {\partial \mathbf {U}{\partial x}\mathbf {U} ^{-1$
U = U(x,y)	${\frac {\partial ^{2}\mathbf {U}^{-1}{\partial x\partial y}=$	$\mathbf {U} ^{-1}\left({\frac {\partial \mathbf {U} }{\partial x}}\mathbf {U} ^{-1}{\frac {\partial \mathbf {U} }{\partial y}}-{\frac {\partial ^{2}\mathbf {U} }{\partial x\partial y}}+{\frac {\partial \mathbf {U} }{\partial y}}\mathbf {U} ^{-1}{\frac {\partial \mathbf {U} }{\partial x}}\right)\mathbf {U} ^{-1}$
A는 x의 함수가 아니며, g(X)는 스칼라 계수를 가진 모든 다항식 또는 무한 다항식 시리즈(예^X: sin(X), cos(X), ln(X) 등으로 정의된 모든 매트릭스 함수, g(x)는 등가 스칼라 함수, g(x)는 그 파생 함수, g((x)는 해당 매트릭스 함수다.	${\frac {\partial \,\mathbf {A}(x\mathbf {A})}{\partial x}=$	$\mathbf {A} \mathbf {g}(x\mathbf {A})=\mathbf {A}$
A는 x의 함수가 아니다.	${\frac {\partial e^{x\mathbf {A}}}{\partial x}=$	$\mathbf {A} e^{x\mathbf {A}=e^{x\mathbf {A}\mathbf {A}}$

자세한 내용은 지수 지도의 파생 모델을 참조하십시오.

스칼라별 신원

벡터가 포함된 경우

ID: 스칼라 바이 스칼라(벡터 포함)
조건	표현	임의의 레이아웃(도트 제품이 행 대 열 레이아웃을 무시한다고 가정함)
u = u(x)	${\frac {\mathbf {u}}{\mathbf {u}}}$	${\frac {\mathbf {u}}{\\mathbf {u}}}{\mathbf {u}}}{\mathbf {u}}}}$
u = u(x), v = v(x)	${\frac {\mathbf {u} \cdot \mathbf {v}}{\mathbf x}=$	$\mathbf {u} \cdot {\frac {\mathbf {v}{\\frac {}{\preason x}}}{\preason x}\cdot \mathbf {v}}}}$

행렬이 포함된 경우

ID: 스칼라 바이 스칼라, 행렬 포함^[4]

조건	표현	일관된 분자 레이아웃, 즉, Y와 X로^T	혼합 레이아웃, 즉, Y와 X로
U = U(x)	${\frac {\partial \mathbf {U}{\partial x}=$	$\mathbf {U} \operatorname {tr} \left(\mathbf {U} ^{-1}{\frac {\partial \mathbf {U}{\partial x}\오른쪽)}$
U = U(x)	${\frac {\partial \ln \mathbf {U}{\partial x}=$	$\operatorname {tr} \left(\mathbf {U} ^{-1}{\frac {\partial x}\right)$
U = U(x)	${\frac {\partial ^{2} \mathbf {U}{{\partial x^{2}}=$	$\mathbf {U} \left[\operatorname {tr} \left(\mathbf {U} ^{-1}{\frac {\partial ^{2}\mathbf {U} }{\partial x^{2}}}\right)+\operatorname {tr} ^{2}\left(\mathbf {U} ^{-1}{\frac {\partial \mathbf {U} }{\partial x}}\right)-\operatorname {tr} \left(\left(\mathbf {U} ^{-1}{\frac {\partial \mathbf {U} }{\partial x}}\right)^{2}\right)\right]$
U = U(x)	${\frac {\partial g(\mathbf {U})}{\partial x}=$	$\operatorname {tr} \좌({\frac {\partial g(\mathbf {U} )}{\partial \mathbf {U}}{\partial x}\오른쪽)}{\partbfrac {$	$\operatorname {tr} \좌({\frac({\partial g(\mathbf {U} )}{\partial \mathbf{}}}}^{\partial \frac {U}{\partial x}}}}}}}}$
A는 x의 함수가 아니며, g(X)는 스칼라 계수가 있는 모든 다항식 또는 무한 다항식 계열(예^X: sin(X), cos(X), ln(X) 등으로 정의된 매트릭스 함수, g(x)는 등가 스칼라 함수, g(x)는 그 파생 함수, g g(X)는 해당 매트릭스 함수다.	${\frac {\partial \operatorname {tr}(\mathbf {g}(x\mathbf {A} )}{\partial x}=$	$\operatorname {tr} \left(\mathbf {A} \mathbf {g} '(x\mathbf {A} )\right)$
A는 x의 함수가 아니다.	${\frac {\partial \operatorname {tr} \left(e^{x\mathbf {A}}\오른쪽){\partial x}=$	$\operatorname {tr} \left(\mathbf {A} e^{x\mathbf {A} }\오른쪽)$

차등 형식의 ID

종종 차등 형태로 작업한 다음 다시 일반 파생상품으로 전환하는 것이 더 쉽다. 이는 분자 레이아웃을 사용하는 경우에만 잘 작동한다. 이 규칙에서 "a"는 스칼라다.

차등 ID: 행렬을^[1]^[4] 포함하는 스칼라

조건	표현	결과(숫자 레이아웃)
	$d(\operatorname {tr}(\mathbf {X} )=$	$\operatorname {tr}(d\mathbf {X})$
	$d( \mathbf {X} )=$	$\mathbf {X} \operatorname {tr} \left(\mathbf {X}) \{-1d\mathbf {X} \right)\operatorname {tr}(\mathbf {x}dj})(\mathbf {X})$
	$d(\ln \mathbf {X} )=$	$\operatorname {tr} \left(\mathbf {X}) ^{-1d\mathbf {X} \right)$

차등 ID: 매트릭스^[1]^[4]^[9]

조건	표현	결과(숫자 레이아웃)
A는 X의 함수가 아니다.	$d(\mathbf {A} )=$	$0$
a는 X의 함수가 아니다.	$d(a\mathbf {X} )=$	${\style a\,d\mathbf {X}}$
	$d(\mathbf {X} +\mathbf {Y} )=$	$d\mathbf {X} +d\mathbf {Y}$
	$d(\mathbf {X} \mathbf {Y} )=$	${\displaystyle(d\mathbf {X} )\mathbf {Y} +\mathbf {X}(d\mathbf {X}$
(Kronecker 제품	$d(\mathbf {X} \otimes \mathbf {Y} )=$	${\d\mathbf {X}\otimes \mathbf {Y} +\mathbf {X} \otimes (d\mathbf {Y} )}$
(하다마드 제품)	$d(\mathbf {X} \circule \mathbf {Y} )=$	${\d\mathbf {X}\circle \mathbf {Y} +\mathbf {X} \circle (d\mathbf {Y} )}$
	$d\left(\mathbf {X}) ^{\top }\오른쪽)=$	${\displaystyle(d\mathbf {X} )^{\top }}$
	$d\left(\mathbf {X}) ^{-1}\오른쪽)=$	$-\mathbf {X} ^{-1}\왼쪽(d\mathbf {X} \right)\mathbf {X} ^{-1$
(이중게이트 트랜스포즈)	$d\left(\mathbf {X} ^{\rm {H}\오른쪽)=$	${\displaystyle(d\mathbf {X} )^{\rm {H}}$
n은 양의 정수다.	$d\left(\mathbf {X}) ^{n}\오른쪽)=$	$\sum _{i=0}^{n-1}\mathbf {X}^{i}(d\mathbf {X})\mathbf {X}^{n-i-1$
	$d\left(e^{\mathbf {X} }\오른쪽)=$	$\int _{0}^{1}e^{a\mathbf {X} {X}}}(d\mathbf {X}) e^{(1-a)\mathbf {X}da$
$\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ = $\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ $\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ $\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ i ${\$ 은 $\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ (는) 대각선으로 가능함 $\mathbf {P} _{i}\mathbf {P} _{j}=\delta_{ij}\mathbf {P} _{i}}}$ f는 모든 고유값 $\lambda _{i}$ i ${\$ 에서 구별 가능	$d\left(f(\mathbf {X})\오른쪽)=$	$\sum _{ij}\mathbf {P} _{i}(d\mathbf {X} )\mathbf {P} _{j}{\begin{cases}f'(\lambda _{i})&\lambda _{i}=\lambda _{j}\\{\frac {f(\lambda _{i})-f(\lambda _{j})}{\lambda _{i}-\lambda _{j}}}&\lambda _{i}\neq \lambda _{j}\end{cases}}$

In the last row, $\delta _{ij}$ is the Kronecker delta and $(\mathbf {P} _{k})_{ij}=(\mathbf {Q} )_{ik}(\mathbf {Q} ^{-1})_{kj}$ is the set of orthogonal projection operators that project onto the k-th eigenvector of X. Q is the matrix of eigenvectors of $\mathbf {X} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}$ , and $(\mathbf {\Lambda } )_{ii}=\lambda _{i}$ are the eigenvalues. The matrix function $f(\mathbf {X} )$ is defined in terms of the scalar function $f(x)$ for diagonalizable matrices by $f(\mathbf {X} )=\sum _{i}f(\lambda _{i})\mathbf {P} _{i}$ where $\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ $\mathbf {X} =\sum _{i}\lambda _{i}\mathbf {P} _{i}$ with $\mathbf {P} _{i}\mathbf {P} _{j}=\delta _{ij}\mathbf {P} _{i}$ .

정상적인 파생형식으로 변환하려면 먼저 다음 표준형식 중 하나로 변환한 후 다음 ID를 사용하십시오.

차등형에서 파생형식으로의^[1] 전환

표준 미분형	등가파생형식
$dy=a\,dx}$	${\frac {dy}{dx}=a$
$dy=\mathbf {a}^{\\top }d\mathbf {x}$	${\frac {dy}{d\mathbf {x}}}}}}}=\mathbf {a}^{\top }}}$
$dy=\operatorname {tr}(\mathbf {A} \,d\mathbf {X})$	${\frac {dy}{d\mathbf {X}}}}}}}=\mathbf {A}$
$d\mathbf {y} =\mathbf {a} \,dx$	${\frac {d\mathbf {y}}{dx}=\mathbf {a}$
$d\mathbf {y} =\mathbf {A} \,d\mathbf {x}$	${\dapplaystyle {\frac {d\mathbf {y}}{d\mathbf {x}}}=\mathbf {A}}$
$d\mathbf {Y} =\mathbf {A} \,dx$	${\frac {d\mathbf {Y}}{dx}=\mathbf {A}$

적용들

특히 다변량 분포, 특히 다변량 정규 분포 및 기타 타원 분포의 통계 분석에 행렬 미적분학이 통계에 사용된다.^[10]^[11]^[12]

예를 들어 다중 설명 변수의 경우에 대한 일반적인 최소 제곱법 공식을 계산하기 위해 회귀 분석에 사용된다.

참고 항목

메모들

^ ^a ^b ^c ^d ^e Thomas P., Minka (December 28, 2000). "Old and New Matrix Algebra Useful for Statistics". MIT Media Lab note (1997; revised 12/00). Retrieved 5 February 2016.
^ Felippa, Carlos A. "Appendix D, Linear Algebra: Determinants, Inverses, Rank" (PDF). ASEN 5007: Introduction To Finite Element Methods. Boulder, Colorado: University of Colorado. Retrieved 5 February 2016. 벡터 및 매트릭스 파생상품의 헤시안(Jacobian로 변환) 정의를 사용한다.
^ ^a ^b ^c 여기서 $\mathbf {0}$ ${\$ 는) 0의 모든 크기 n의 열 벡터를 가리키며 $\mathbf {0}$ , 여기서 n은 x의 길이입니다.
^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ ^o ^p ^q 피터슨 Kaare 브란트, 피더슨, 마이클 Syskind.매트릭스 Cookbook이라는 요리 책(PDF).22010년 3월에 원래에서 Archived.2월 5일 2016년 Retrieved.이 책은∂는 y에}}.}Y즉에 의해∂ Y∂에 엇갈린 배열,),{\displaystyle{\frac{\partial \mathbf{Y}}{x\partial}},}X∂ X.{\displaystyle{\frac{\partial y}{\partial \mathbf{X}을 사용한다.
^ ^a ^b 여기서 $\mathbf {0}$ ${\$ 는) X와 같은 모양의 0의 모든 행렬을 가리킨다 $\mathbf {0}$ .
^ Duchi, John C. "Properties of the Trace and Matrix Derivatives" (PDF). Stanford University. Retrieved 5 February 2016.
^ 자세한 내용은 파생에 대한 결정 요인#분석을 참조하십시오.
^ 상수 a는 결과에서 사라진다. 이것은 의도적인 것이다. 대체적으로.
${\frac {d\ln au}{dx}}={\frac {1}{au}}{\frac {d(au)}{dx}}={\frac {1}{au}}a{\frac {du}{dx}}={\frac {1}{u}}{\frac {du}{dx}}={\frac {d\ln u}{dx}}.$
또는, 또한
${\dplaystyle {\d\ln au}{dx}={\frac {d(\ln a+\ln u)}{dx}={\frac {d\ln u}{dx}={\frac {d\ln u}{dx}}.}$
^ Giles, Michael B. (2008). "An extended collection of matrix derivative results for forward and reverse mode algorithmic differentiation" (PDF). S2CID 17431500. Archived from the original (PDF) on 2020-02-27. Cite 저널은 필요로 한다. journal= (도움말)
^ 팡앤장(1990년)
^ 팬앤팡(2007)
^ 콜로 & 폰 로젠 (2005)

참조

Fang, Kai-Tai; Zhang, Yao-Ting (1990). Generalized multivariate analysis. Science Press (Beijing) and Springer-Verlag (Berlin). ISBN 3540176519. 9783540176510.
Kollo, Tõnu; von Rosen, Dietrich (2005). Advanced multivariate statistics with matrices. Dordrecht: Springer. ISBN 978-1-4020-3418-3.
Pan, Jianxin; Fang, Kaitai (2007). Growth curve models and statistical diagnostics. Beijing: Science Press. ISBN 9780387950532.

추가 읽기

Lax, Peter D. (2007). "9. Calculus of Vector- and Matrix-Valued Functions". Linear algebra and its applications (2nd ed.). Hoboken, N.J.: Wiley-Interscience. ISBN 978-0-471-75156-4.
이 위키백과 기사는 이 기사에서 비판한 버전에서 거의 완전히 수정되었다는 점에 유의하십시오Magnus, Jan R. (October 2010). "On the concept of matrix derivative". Journal of Multivariate Analysis. 101 (9): 2200–2206. doi:10.1016/j.jmva.2010.05.005..
Magnus, Jan R. (1999). Matrix differential calculus with applications in statistics and econometrics. Neudecker, Heinz. (Rev. ed.). New York: John Wiley. ISBN 0-471-98632-1. OCLC 40467399.
Abadir, Karim M., 1964- (2005). Matrix algebra. Magnus, Jan R. Cambridge: Cambridge University Press. ISBN 978-0-511-64796-3. OCLC 569411497.CS1 maint: 여러 이름: 작성자 목록(링크)

외부 링크

소프트웨어

매트릭스 미적분표현을 상징적으로 평가하는 웹사이트 MatrixCalculus.org
NCAlgebra, 일부 매트릭스 미적분 기능을 갖춘 오픈 소스 Mathematica 패키지

정보

매트릭스 레퍼런스 매뉴얼, 마이크 브룩스, 임페리얼 칼리지 런던.
매트릭스 차별화(및 다른 것), Randal J. Barnes, 토목 공학 학부, 미네소타 대학교.
매트릭스 미적분학 참고사항, 폴 L. 노스캐롤라이나 주립대학의 패클러.
매트릭스 미적분학(슬라이드 프리젠테이션), 장 르 에든버러 대학교
벡터 및 매트릭스 분화(계량학 컨텍스트에서 매트릭스 분화에 대한 주석), 하이노 분 닐슨(Heino Bohn Nielsen.
Munich Personal RePEC Archive의 차별화 행렬(매트릭스 차별화에 대한 참고 사항), Pawel Koval에 대한 참고 사항.
벡터/매트릭스 미적분 행렬 분화에 대한 추가 참고 사항.
매트릭스 아이덴티티(매트릭스 차별화에 대한 참고 사항), 샘 로위스.

[minka-1] Thomas P., Minka (December 28, 2000). "Old and New Matrix Algebra Useful for Statistics". MIT Media Lab note (1997; revised 12/00). Retrieved 5 February 2016.

[2] Felippa, Carlos A. "Appendix D, Linear Algebra: Determinants, Inverses, Rank" (PDF). ASEN 5007: Introduction To Finite Element Methods. Boulder, Colorado: University of Colorado. Retrieved 5 February 2016. 벡터 및 매트릭스 파생상품의 헤시안(Jacobian로 변환) 정의를 사용한다.

[zerovec-3] 여기서 $\mathbf {0}$ ${\$ 는) 0의 모든 크기 n의 열 벡터를 가리키며 $\mathbf {0}$ , 여기서 n은 x의 길이입니다.

[matrix-cookbook-4] ^ ^a ^b ^c ^d ^e ^f ^g ^h ⁱ ^j ^k ^l ^m ⁿ ^o ^p ^q 피터슨 Kaare 브란트, 피더슨, 마이클 Syskind.매트릭스 Cookbook이라는 요리 책(PDF).22010년 3월에 원래에서 Archived.2월 5일 2016년 Retrieved.이 책은∂는 y에}}.}Y즉에 의해∂ Y∂에 엇갈린 배열,),{\displaystyle{\frac{\partial \mathbf{Y}}{x\partial}},}X∂ X.{\displaystyle{\frac{\partial y}{\partial \mathbf{X}을 사용한다.

[zeromatrix-5] 여기서 $\mathbf {0}$ ${\$ 는) X와 같은 모양의 0의 모든 행렬을 가리킨다 $\mathbf {0}$ .

[6] Duchi, John C. "Properties of the Trace and Matrix Derivatives" (PDF). Stanford University. Retrieved 5 February 2016.

[7] 자세한 내용은 파생에 대한 결정 요인#분석을 참조하십시오.

[8] 상수 a는 결과에서 사라진다. 이것은 의도적인 것이다. 대체적으로.
${\frac {d\ln au}{dx}}={\frac {1}{au}}{\frac {d(au)}{dx}}={\frac {1}{au}}a{\frac {du}{dx}}={\frac {1}{u}}{\frac {du}{dx}}={\frac {d\ln u}{dx}}.$
또는, 또한
${\dplaystyle {\d\ln au}{dx}={\frac {d(\ln a+\ln u)}{dx}={\frac {d\ln u}{dx}={\frac {d\ln u}{dx}}.}$

[9] Giles, Michael B. (2008). "An extended collection of matrix derivative results for forward and reverse mode algorithmic differentiation" (PDF). S2CID 17431500. Archived from the original (PDF) on 2020-02-27. Cite 저널은 필요로 한다. journal= (도움말)

[10] 팡앤장(1990년)

[11] 팬앤팡(2007)

[12] 콜로 & 폰 로젠 (2005)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

v t 미적분학.
프레살쿨루스	이항 정리 오목함수 연속함수 요인 유한차이 자유 변수 및 경계 변수 함수의 그래프 선형함수 라디안 롤의 정리 세컨트 경사 접선
한계	불확정형 함수의 한계 단측한도 수열의 한계 근사순번 (ε, Δ)-한계의 정의
미분학	파생상품 미분 미분방정식 미분 연산자 평균값 정리 표기법 라이프니츠의 표기법 뉴턴의 표기법 차별화 규칙 직선성 힘 합계 체인 L'Hepital's girls 제품 라이프니츠 장군의 통치 지수 기타 기법 암묵적 분화 역함수 규칙 및 분화 로그 유도화 관련금리 정지점 제1차 파생상품시험 2차파생성시험 극값정리 맥시마와 미니마 추가 애플리케이션 뉴턴의 방법 테일러의 정리
적분 미적분학	해독제 호 길이 기본 속성 집적 상수 미적분학의 기본 정리 통합 기호 아래 차별화 부품별 통합 대체에 의한 통합 삼각 측량 오일러 위어스트라스 적분 부분분수 2차 적분 사다리꼴 법칙 볼륨 와셔법 셸 방식
벡터 미적분학	파생상품 컬 방향파생상품 발산 그라데이션 라플라시안 기본 정리 라인 통합 그린스 스톡스 가우스
다변량 미적분학	발산정리 기하학 헤시안 행렬 야코비안 행렬과 결정인자 라그랑주 승수 라인 적분 매트릭스 다중 적분 부분파생상품 표면 적분 부피 적분 고급 주제 미분형식 외부파생상품 일반화 스톡스의 정리 텐서 미적분학
시퀀스 및 시리즈	산술-기하 시퀀스 계열의 종류 교대로 이항체 푸리에 기하학 조화 무한 힘 마클로린 테일러 텔레스코핑 수렴 시험 아벨의 교대계열 코시 응결 직접 비교 디리클레트 적분 한계비교 비율 뿌리 용어
특수 기능 와 숫자	베르누이 수 e (계속 상수) 지수함수 자연 로그 스털링의 근사치
미적분학의 역사	적정성 브룩 테일러 콜린 매클라우린 대수 일반성 고트프리트 빌헬름 라이프니즈 최소값 소수점 미적분학 아이작 뉴턴 플럭시온 연속성의 법칙 레온하르트 오일러 플럭션의 방법 기계식 이론의 방법
목록	차별화 규칙 지수함수의 통합 목록 쌍곡선 함수의 통합 목록 역 쌍곡선 함수의 통합 목록 역삼각계 함수의 통합 목록 비합리적인 기능의 통합 목록 로그 함수의 통합 목록 합리적인 기능의 통합 목록 삼각함수의 통합 목록 세컨트 큐방트 한계 목록 통합 목록
기타 항목	미분 기하학 곡면성 곡선의 표면의 오일러-마클라우린 공식 가브리엘 혼 통합 비 22/7이 π을 초과한다는 증거 레지오몬타누스의 각도 최대화 문제 스타인메츠 고체

Search