연쇄 규칙

Chain rule

미적분학에서, 연쇄 법칙은 fg의 도함수 fg의 도함수 f와 g의 도함수에 대한 도함수나타내는 공식이다.좀 더 정확히 말하면, = g {h g x마다h ( ( ) { h)= 라면, 체인 규칙은 Lagrange 표기법으로 다음과 같습니다.

또는 동등하게

연쇄 법칙은 라이프니츠의 표기법으로도 표현될 수 있다.변수 z가 변수 x에 따라 달라지는 변수 y에 따라 달라지는 경우(, y와 z는 종속 변수임), z중간 변수 y를 통해 x에 따라 달라집니다.이 경우 체인 규칙은 다음과 같이 표시됩니다.

그리고.

파생상품을 평가해야 하는 시점을 나타내는 데 사용됩니다.

통합에서 체인 규칙에 대응하는 것은 대체 규칙입니다.

직관적인 설명

직감적으로 체인규칙은 y에 상대적인 z의 순간 변화율과 x상대적인 y의 순간 변화율을 알면 두 변화율의 곱으로 x상대적인 z의 순간 변화율을 계산할 수 있다고 기술한다.

George F.의 표현대로. Simmons: "자동차가 자전거보다 두 배 빨리 달리고 자전거가 걷는 사람보다 네 배 더 빠르다면, 자동차는 그 사람보다 2×[1]4=8배 더 빨리 이동합니다."

이 예와 체인 규칙의 관계는 다음과 같습니다.z, y x를 각각 자동차, 자전거 및 보행자의 (가변한) 위치로 합니다.자동차와 자전거의 상대 위치 2. }{dy} d x. \ \ { } { } 4. 따라서 자동차와 보행자의 상대적인 위치 변화율은

위치 변화율은 속도의 비율이며, 속도는 시간에 대한 위치의 도함수이다. 즉,

또는 동등하게

체인 룰의 적용이기도 합니다.

역사

쇠사슬 법칙은 고트프리드 빌헬름 라이프니츠에 의해 처음 사용된 것으로 보인다.이것을 + + c 의 도함수를 계산하기 위해 제곱근 함수와 a+ + z 2({2})의 합성으로서1676년 회고록(계산 오류)에서 처음 언급했다체인 규칙의 일반적인 표기법은 라이프니츠에 의한 것입니다.[2]기욤 드 호피탈은 그의 무한 분석에서 사슬 규칙을 암묵적으로 사용했다.Leibniz의 발견 후 100년 넘게 쓰여졌음에도 불구하고, 사슬 법칙은 Leonhard Oiler의 분석 책에는 나타나지 않습니다.

진술

체인 규칙의 가장 단순한 형태는 하나의 실제 변수의 실제 값 함수에 대한 것입니다.g가 점 c에서 미분 가능한 함수(즉, 미분 g((c)존재)이고 f가 g(c)에서 미분 가능한 함수인 경우, fg g f g c에서 미분 가능하며, 도함수는[3] 다음과 같다.

그 규칙은 때때로 다음과 같이 축약된다.

y = f(u) u = g(x)경우, 이 축약 형식은 라이프니츠 표기법으로 다음과 같이 작성됩니다.

파생상품을 평가하는 지점도 명시적으로 언급할 수 있다.

추론을 더하면 ( f ( - f n ){ } ( f { \ circ } f_}\ \ circ ( _ { \ }) 。즉시 입력으로 임대할 수 있으며, 복합 함수도 연쇄 규칙의 반복 적용으로 구분할 수 있다. 여기서 파생 함수는 (라이브니즈의 표기법에서) 다음과 같다.

적용들

3개 이상의 기능을 가진 복합 재료

체인 규칙은 세 개 이상의 함수로 구성된 복합 재료에 적용할 수 있습니다.두 개 이상의 함수로 이루어진 복합체의 도함수를 구하려면 f, g, h의 복합체(순서대로)가 f와 gµh의 복합체라는 점에 유의해야 한다.연쇄 규칙은 f g g h h의 도함수를 계산하기 위해서는 f의 도함수와 g h h의 도함수를 계산하는 것으로 충분하다고 명시한다.f의 도함수는 직접 계산할 수 있고, g can h의 도함수는 체인규칙을 다시 적용하여 계산할 수 있다.

구체성을 위해 함수를 고려합니다.

이는 다음 3가지 함수의 복합으로 분해할 수 있습니다.

파생상품은 다음과 같습니다.

연쇄 규칙은 x = a 지점에서 합성물의 도함수는 다음과 같이 명시한다.

라이프니츠의 표기법은 다음과 같다.

줄여서 말하면

따라서 미분 함수는 다음과 같습니다.

이 도함수를 계산하는 또 다른 방법은 복합함수 f g g h h를 f g gh의 복합함수로 보는 것이다.이러한 방식으로 체인 규칙을 적용하면 다음과 같은 결과를 얻을 수 있습니다.

이것은 위에서 계산한 것과 동일합니다.이는 (fg) h h = f ∘ (g h h)이기 때문에 예상되어야 한다.

경우에 따라서는 2 f - 1 n n \ 2}\ 의 임의의 긴 을 구별할 필요가 있습니다이 경우 정의하십시오.

서 f. a , . . . . . . a } . (x ) {display , . . . . . b ( x ) } ( < b ) 。그러면 체인 규칙이 다음 형식을 취합니다.

또는 라그랑주 표기법에서는

몫법칙

체인 규칙을 사용하여 잘 알려진 차별화 규칙을 도출할 수 있습니다.예를 들어, 몫규칙은 연쇄규칙과 곱규칙의 결과이다.f(x)/g(x)를 f(x) · 1/g(x)로 적는다.먼저 제품 규칙을 적용합니다.

1/g(x)의 도함수를 계산하려면 g와 역함수, 즉 x를 1/x 보내는 함수의 합성이라는 점에 주목하십시오.역함수의 도함수는 / 입니다 체인 규칙을 적용하면 마지막 식은 다음과 같습니다.

이것은 지수 법칙의 일반적인 공식입니다.

역함수의 도함수

y = g(x)역함수있다고 가정합니다.x = f(y)되도록 역함수 f라고 합니다.g의 도함수 측면에서 f의 도함수에 대한 공식이 있다.이를 확인하려면 f와 g가 공식을 만족한다는 에 유의하십시오.

f ( x)({x)})와 x는 같기 때문에 도함수는 같아야 합니다.x의 도함수는 값이 1인 상수 함수이며 f () { f 도함수는 체인 규칙에 의해 결정됩니다.그 때문에, 다음과 같은 것이 있습니다.

f'를 독립 변수 y의 함수로 표현하기 위해 x가 나타나는 모든 위치에 f f 합니다.그러면 f'에 대해 풀 수 있습니다.

예를 들어, 함수 g(x) = ex 생각해 보십시오. 이 함수는 f(y) = ln y입니다.g((x) = e이기x 때문에, 위의 공식은 다음과 같이 말한다.

이 공식은 g가 미분가능하고 그 역f도 미분가능할 마다 참이다.이 수식은 이러한 조건 중 하나가 참이 아닐 때 실패할 수 있습니다.예를 들어, g(x) = x라고3 가정합니다. 역수는 f(y) = y이며1/3, 0에서는 미분할 수 없습니다.위의 공식을 사용하여 f의 도함수를 0으로 계산하면 1/g′(0)을 평가해야 합니다.f(0) = 0 gθ(0) = 0이므로 정의되지 않은 1/0을 평가해야 합니다.따라서 이 경우 공식은 실패합니다.f는 0에서 미분할 수 없기 때문에 이것은 놀라운 일이 아니다.

상위 파생상품

파디 브루노의 공식은 사슬 규칙을 더 높은 파생상품으로 일반화한다.y = f(u) u = g(x)라고 가정하면, 처음 몇 개의 도함수는 다음과 같다.

증명서

첫 번째 증명

연쇄 규칙의 한 가지 증거는 복합 함수 f µg의 도함수를 정의함으로써 시작된다. 여기서 우리는 x가 a에 가까워질 때 f µg대한 차이 지수한계를 취한다.

현재g( ) \ ( x ) \ ! }가 a 근처x에 대해g ( )\ g ( )와 않다고 가정합니다.그러면 이전 식은 다음 두 요인의 곱과 같습니다.

gg가 a 근처에서 진동하는 , a에 아무리 가까이 접근해도 g(x) = g(a)가 항상 더 가까운 x가 존재할 수 있습니다.예를 들어, 이러한 현상은 x = 0대해 g(x) = 0에 대해 정의된 연속 함수 g에 대해 a = 0 근처에서 발생하며, 그렇지 않으면 g(x) = sin(1/x)2 의해 정의된다.이러한 현상이 발생할 때마다 위의 식은 0으로 나누기 때문에 정의되지 않습니다.이 문제를 해결하려면 다음과 같이 Q(\ Q 도입합니다.

f µg차분 지수는 항상 다음과 같다는 것을 나타냅니다.

g(x)가 g(a)와 같지 않을 때는 g(x) - g(a)의 인자가 취소되기 때문에 이는 명확합니다.g(x)가 g(a)와 같으면 f(g(x)는 f(g(a))와 같기 때문에 f g g의 차분 상수는 0이고, 위의 곱은 f((g(a) 곱하기 0이기 때문에 0이다.따라서 위의 곱은 항상 차분 비율과 같으며 a에 f µg도함수가 존재함을 보여주고 그 값을 결정하기 위해서는 위의 곱의 a에 대한 x의 한계치가 존재함을 보여주고 그 값을 결정하면 된다.

이렇게 하려면 요인의 한계가 있는 경우 제품의 한계가 존재함을 기억하십시오.이 경우 이 두 요인의 곱한계는 요인 한계의 곱과 같습니다. 요인은 Q(g(x)와 (g(x) - g(a) / (x - a)입니다.후자는 a에서의 g에 대한 차이 지수이며, g는 a에서 미분 가능하기 때문에, x의 한계치는 a가 되는 경향이 있고 ga(a)와 같다.

Q(g(x)대해서는 f가 있는 이면 Q가 정의되어 있다는 점에 주의해 주십시오.또한 f는 가정에 의해 g(a)에서 미분 가능하므로 도함수의 정의에 의해 g(a)에서 Q가 연속적이다.함수 g는 a에서 미분 가능하기 때문에 a에서 연속적이며, 따라서 Qµg a에서 연속적입니다.따라서 x가 a에 도달하는 경우의 제한은 존재하며 Q(g(a))같습니다.Q(g(a)는 fµ(g(a))입니다.

이는 두 요인의 한계가 존재하며 각각 f((g(a)와 g((a)같다는 것을 보여준다.따라서 a에서 f µg의 도함수는 존재하며 fµ(g(a)g((a)같다.

세컨드 프루프

연쇄 규칙을 증명하는 또 다른 방법은 도함수에 의해 결정되는 선형 근사치의 오차를 측정하는 것입니다.이 증명은 여러 변수로 일반화된다는 장점이 있습니다.그것은 한 점에서 미분성의 다음과 같은 동등한 정의에 의존한다: 함수 g는 실수 g((a)와 h가 0이 되는 경향이 있는 함수 θ(h)가 존재하는 경우 a에서 미분할 수 있다.

여기서 왼쪽은 a에서의 g a+h에서의 g 값의 진정한 차이를 나타내며, 오른쪽은 도함수에 오차항을 더한 근사치를 나타냅니다.

연쇄규칙의 상황에서는 g가 a에서 미분 가능한 것으로 가정되기 때문에 이러한 함수 θ가 존재한다.다시 가정하면, g(a)에서 f에 대해서도 유사한 함수가 존재한다.이 함수를 ,라고 부르면

위의 정의는 k가 0인 경향이 있는 처럼 θ(k)가 0인 경향이 있다고 가정하더라도 θ(0)에 어떠한 제약도 가하지 않는다.θ(0) = 0으로 설정하면 θ는 0으로 연속됩니다.

이 정리를 증명하기 위해서는 h가 0인 경향이 있기 때문 f(g(a + h) - f(g(a))의 차이를 연구해야 한다.첫 번째 단계는 a에서 g의 미분성 정의를 사용하여 g(a + h)를 대체하는 것이다.

다음 단계는 g(a)에서 f의 미분성의 정의를 사용하는 것이다.여기에는 일부 k에 대해 f(g(a) + k) 형식의 항이 필요합니다.위의 식에서, 정확한 k는 h에 따라 변화한다. k = ga(a) h + h(h) h로 설정하고h, 오른쪽은 f(g(ah) + k) - f(g(a)가 된다.파생상품의 정의를 적용하면 다음을 얻을 수 있다.

h가 0이 되는 경향이 있는 이 식의 동작을 조사하려면 k를 확장합니다h.용어를 다시 정리하면 오른쪽은 다음과 같이 됩니다.

hh 0이 되는 경향이 있기 때문에 첫 번째 두 괄호로 묶인 항은 h가 0이 되는 경향이 있습니다.첫 번째 증명에서와 같은 정리를 한계곱에 적용하면 세 번째 괄호항도 0이 된다.상기 식은 차분 f(g(a + h) - f(g(a))와 같으므로, f δg의 정의에 의해 a에서 미분 가능하며, 그 도함수는 (g(a) (a)이다.

첫 번째 증명에서 Q의 역할은 이 증명에서 in에 의해 수행된다.이들은 다음 방정식으로 관련지어집니다.

g(a)에서 Q를 정의할 필요는 0에서 θ를 정의할 필요성과 유사합니다.

세 번째 증명

Constantin Carathéodory의 함수의 차별화성에 대한 대체 정의를 사용하여 체인 [4]규칙에 대한 우아한 증거를 제공할 수 있습니다.

이 정의 하에서 함수 f는 함수 q가 a에서 연속적이고 f(x) - f(a) = q(x)(a)되는 a 지점에서 미분할 수 있다.이러한 함수는 기껏해야 하나이며, f가 a에서 미분가능하다면 f δ(a) = q(a)이다.

연쇄규칙의 가정과 미분 가능한 함수와 연속함수의 구성이 연속적이라는 사실을 고려할 때, 우리는 g(a)에서 연속적인 함수 q와 a에서 연속적인 함수 r이 존재한다는 것을 알고 있다.

그리고.

그러므로,

그러나 h(x) = q(g(x)r(x)의해 주어진 함수는 a에서 연속적이며, 우리는 이것에 대해 a를 얻는다.

많은 변수의 연속적으로 미분 가능한(벡터-) 함수에도 유사한 접근방식이 적용됩니다.이 인수분해 방법은 또한 도함수가 립시츠 연속, 쾰더 연속이어야 할 때 더 강력한 형태의 미분성에 대한 통합 접근법을 가능하게 한다.미분 자체는 적절한 함수 클래스로 일반화되는 다항식 잔여 정리(작은 베주 정리 또는 인자 [citation needed]정리)로 볼 수 있다.

무한소수를 통한 증명

y (x) { y x () {x , 무한소수 t0 { \ t\ 0}을 선택하면 대응하는 ( t + - tyle ( tyle가 계산됩니다 y x 따라서

표준 부품을 적용하다

그게 연쇄 규칙이에요

다변수 케이스

체인 규칙을 다변수 함수로 일반화하는 것은 다소 기술적이다.다만, 폼의 기능의 경우는, 기입이 간단합니다.

이 경우는 단일 변수의 함수 연구에서 자주 발생하므로 별도로 설명할 필요가 있습니다.

f(g1(x), ..., gk(x)경우

폼의 함수에 대한 체인 규칙 작성용

f(g1(x), ..., gk(x),

k개의 인수와 관련하여 f의 부분 도함수가 필요하다.부분 도함수에 대한 일반적인 표기법에는 함수의 인수에 대한 이름이 포함됩니다.이러한 인수는 위의 공식에서 명명되지 않기 때문에, 다음과 같이 나타내는 것이 더 간단하고 명확합니다.

f의 ih 논리에 대한 부분 도함수

z에서 이 도함수의 값.

이 표기법에서는 체인 규칙은 다음과 같습니다.

예: 산술 연산

함수 f가 덧셈인 경우, 즉

1 { f{ textstyle } f { v} { d_{\f}1 frac { timeout frac }따라서, 연쇄 법칙은

곱셈의 경우

f D_ f u {u입니다.따라서,

지수화의 경우

조금 더 복잡합니다.

그리고 v ln {\^{u}

따라서

통칙

일반적인 경우 사슬 규칙을 작성하는 가장 간단한 방법은 단일 공식에서 모든 방향 도함수를 포착하는 선형 변환인 총 도함수를 사용하는 것입니다.미분 가능한 함수 f : Rm Rk g : Rn RmRn 점 a를 고려한다.Da g는 a에서의 g의 총도함수이고, Dg(a) f는 g(a)에서의 f의 총도함수이다.이 두 도함수는 각각 선형 변환n R → RmRm R이므로k 합성할 수 있다.총 파생상품에 대한 연쇄 규칙은 복합상품이 다음에서 fµg의 총 파생상품이라는 것이다.

줄여서 말하면

고차원 연쇄 규칙은 [5]위에 제시된 두 번째 증명과 유사한 기술을 사용하여 입증될 수 있다.

총 도함수는 선형 변환이므로 공식에 나타나는 함수를 행렬로 다시 쓸 수 있습니다.전체 도함수에 해당하는 행렬을 야코비 행렬이라고 하며, 두 도함수의 합성은 야코비 행렬의 곱에 해당한다.따라서 이 관점에서 체인 규칙은 다음과 같습니다.

줄여서 말하면

즉, 복합 함수의 야코비안은 구성된 함수의 야코비안의 산물이다(적절한 지점에서 평가).

고차원 연쇄 법칙은 1차원 연쇄 법칙의 일반화이다.k, m, n이 1이므로 f : RR, g : RR이면 fg의 야코비 행렬은 1 × 1이다. 구체적으로는 다음과 같다.

f g g의 야코비안은 이 1 × 1 행렬의 곱이므로, 1차원 사슬 규칙에서 예상한 대로 f((g(a)gg((a)이다.선형 변환 언어에서 D(g)는a 벡터의 배율을 g a(a)로 하는 함수이며g(a), D(f)는 f((g(a))의 배율로 벡터의 배율을 조정하는 함수이다.연쇄규칙은 이 두 선형 변환의 합성이 선형 변환a D(f g g)이며, 따라서 벡터를 f((g(a) gg(a)로 스케일링하는 함수라고 한다.

f와 g가 성분 측면에서 y = f(u) = (f(u1k), …, f(u)) 및 u = g(x) = (g(x1m), …, g(x)로 표현될 때 체인 규칙을 작성하는 또 다른 방법이 사용됩니다.이 경우, 야코비안 행렬에 대한 위의 규칙은 일반적으로 다음과 같이 작성됩니다.

전체 파생상품에 대한 연쇄규칙은 부분파생상품에 대한 연쇄규칙을 의미한다.총 도함수가 존재할 때, 야코비안 행렬에 ih 기저 벡터를 곱함으로써 ih 좌표 방향의 편도함수를 구한다는 것을 기억하라.위의 공식에 따라 이 작업을 수행하면 다음과 같은 결과를 얻을 수 있습니다.

야코비안 행렬의 엔트리는 편도함수이므로, 위의 공식을 단순화하여 다음을 얻을 수 있습니다.

보다 개념적으로, 이 규칙i x 방향의 변화가 g에서m g까지 모두1 변할 수 있으며 이러한 변화 중 하나가 f에 영향을 미칠 수 있다는 사실을 표현한다.

k = 1인 특수한 경우, f가 실수치 함수인 경우, 이 공식은 훨씬 더 단순화됩니다.

이것은 도트 상품으로 고쳐 쓸 수 있습니다.u = (g1, …, gm)를 상기하면, 편도함수 u / δxi 벡터이며, 사슬규칙은 다음과 같이 말한다.

u(x, y) = x2 + 2y주어졌을 때, 여기서 x(r, t) = r sin(t)y(r, t2) = sin(t)는 체인 규칙을 사용하여 uu / rr uu / tt의 값을 구한다.

그리고.

다변수 함수의 상위 파생 모델

단변수 함수의 고차 도함수에 대한 Fa di Bruno의 공식은 다변수 경우를 일반화한다.y = f(u)가 위와 같이 u = g(x)의 함수라면, f µ g의 두 번째 도함수는 다음과 같다.

추가 일반화

미적분의 모든 확장에는 연쇄 법칙이 있다.대부분의 경우 공식은 동일하지만 공식의 의미는 크게 다를 수 있습니다.

하나의 일반화는 다양성에 대한 것이다.이 경우, 연쇄규칙은 f g g도함수가 f의 도함수와 g의 도함수의 합성물이라는 사실을 나타낸다.이 정리는 위에 주어진 고차원 사슬 법칙의 직접적인 결과이며, 정확히 같은 공식을 가지고 있다.

체인 규칙은 바나흐 공간의 프레셰 파생 모델에도 유효합니다.이전과 [6]같은 공식입니다.이 사례와 앞의 사례는 바나흐 다양체에 대한 동시 일반화를 인정한다.

미분 대수에서, 도함수는 켈러 미분의 모듈들의 형태론으로 해석된다.f(r)의 외부 미분인 d(f(r)에 원소 dr을 보내는 켈러 미분 Df : δR δS 형태소를 교환환 f : R → S의 고리 동형성에 의해 결정한다.공식 D(f µg) = Df µ Dg는 이 문맥에서도 성립한다.

이러한 예제의 공통적인 특징은 도함수가 함수의 일부라는 개념의 표현이라는 것이다.펑터는 공간 및 그 사이의 기능에 대한 연산입니다.이것은 각 공간에 새로운 공간을 연결하고 두 공간 사이에 각 기능에 대응하는 새로운 기능은 대응하는 새로운 공간 사이에 있습니다.위의 각 경우 펑터는 각 공간을 접선 번들로 보내고 각 함수를 해당 파생 함수로 보냅니다.예를 들어 다지관 케이스에서 도함수는 C-매니폴드rr−1(그 접선다발)에, C-함수는r 그 총도함수에 각각 송신한다.복합파생상품의 파생상품은 파생상품의 복합상품이어야 한다는 하나의 요건이 있다.이것은 정확히 D(fg) = Df d Dg의 공식이다.

확률적 미적분에도 연쇄 규칙이 있다.그 중 하나인 이토의 레마는 이토 과정(또는 더 일반적으로 반마티게일) dXt 두 번 미분 가능한 함수 f의 복합체를 표현한다.이토의 법칙에서, 복합 함수의 도함수는 dXt f의 도함수뿐만 아니라 f의 2차 도함수에도 의존한다.2차 도함수에 대한 의존성은 확률적 과정의 0이 아닌 2차 변동의 결과이며, 이는 일반적으로 프로세스가 매우 거칠게 위아래로 움직일 수 있다는 것을 의미한다.이 체인 규칙의 변형은 구성되는 두 함수가 서로 다른 유형이기 때문에 펑터의 예가 아닙니다.

「 」를 참조해 주세요.

  • 자동 미분 – 컴퓨터 프로그램에 의해 지정된 함수의 도함수를 평가하는 기술 - 정확한 수치 도함수를 계산하기 위해 체인 규칙을 많이 사용하는 계산 방법.
  • 미분 규칙 – 미적분 함수의 도함수를 계산하는 규칙이 있는 위키미디어 목록 문서
  • 대체에 의한 통합 – 통합 평가 기술
  • 라이프니츠 적분 규칙 – 적분 부호 공식에서의 미분
  • 제품 규칙 – 제품 파생 제품의 공식
  • 규칙 – 함수 비율의 도함수에 대한 공식
  • 삼중곱의 법칙

레퍼런스

  1. ^ 조지 F. 시몬스, 해석 기하학을 이용한 미적분(1985), 페이지 93.
  2. ^ Rodríguez, Omar Hernández; López Fernández, Jorge M. (2010). "A Semiotic Reflection on the Didactics of the Chain Rule". The Mathematics Enthusiast. 7 (2): 321–332. doi:10.54870/1551-3440.1191. S2CID 29739148. Retrieved 2019-08-04.
  3. ^ Apostol, Tom (1974). Mathematical analysis (2nd ed.). Addison Wesley. Theorem 5.5.
  4. ^ Kuhn, Stephen (1991). "The Derivative á la Carathéodory". The American Mathematical Monthly. 98 (1): 40–44. doi:10.2307/2324035. JSTOR 2324035.
  5. ^ Spivak, Michael (1965). Calculus on Manifolds. Boston: Addison-Wesley. pp. 19–20. ISBN 0-8053-9021-9.
  6. ^ Cheney, Ward (2001). "The Chain Rule and Mean Value Theorems". Analysis for Applied Mathematics. New York: Springer. pp. 121–125. ISBN 0-387-95279-9.

외부 링크