대표자 정리

컴퓨터 과학의 경우, 통계적 학습 이론에서 대표자 정리는 재현 커널 힐버트 공간에 걸쳐 정의된 정규화된 경험적 위험 함수의 $f^{*}$ 미니마이저 $∗{\$ f $^{*}$ 이(가) 에서 평가된 커널 제품의 유한 선형 결합으로 표현될 수 있음을 나타내는 몇 가지 관련 결과 중 하나이다.교육 세트 데이터에 포인트를 입력한다.

형식명세서

다음과 같은 대표자 정리 및 그 증거는 슐코프, 헤르브리치, 스몰라 때문이다.^{[citation needed]}

정리:Consider a positive-definite real-valued kernel $k:{\mathcal {X}}\times {\mathcal {X}}\to \mathbb {R}$ on a non-empty set ${\mathcal {X}}$ with a corresponding reproducing kernel Hilbert space $H_{k}$ . Let there be given

교육 샘플 $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ , $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ ) $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ , … $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ ( $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ n $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ , $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ ) $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ $(x_{1},y_{1}),\dotsc ,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ R ${\$ }, }, }, }, }, }, }, },
$\mathb {R}$ 및 \mathb {R}에 대해 엄격하게 증가하는 실제 값 함수 $g\colon [0,\infty )\to \mathbb {R}$ : $g\colon [0,\infty )\to \mathbb {R}$ [ $g\colon [0,\infty )\to \mathbb {R}$ \ $g\colon [0,\infty )\to \mathbb {R}$ ) $g\colon [0,\infty )\to \mathbb {R}$ → $g\colon [0,\infty )\to \mathbb {R}$ ${\$ to $g\colon [0,\infty )\to \mathbb {R}$ \mathb {R} $g\colon [0,\infty )\to \mathbb {R}$ 및
임의 오류 $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ E $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ : $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ ( $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ ) $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ → $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ { $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ ∞} ${\displaystyle E\colon({\mathcal$ { $X}\time\mathb$ { $R}^{2}^{n}\to \mathb {R}\$ cupto $\lbrace \cup \lbe \$ lblb $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{n}\to \mathbb {R} \cup \lbrace \infty \rbrace$ \ $in$ }, .

$H_{k}$ $H_{k}$ ${\$ 에 대해 다음과 같은 정규화된 경험적 위험 기능을 정의한다 $H_{k}$

f\mapsto E\left(x_{1},y_{1},f(x_{1}), ...,(x_{n},y_{n},f(x_{n})\rig(\lLvert f\rVert \rig).

그런 다음, 경험적 위험을 최소화하는 방법

f^{*}=\operatorname {argmin} _{f\in H_{k}}\left\lbrace E\left((x_{1},y_{1},f(x_{1})),...,(x_{n},y_{n},f(x_{n}))\right)+g\left(\lVert f\rVert \right)\right\rbrace ,\quad (*)

서식의 대표성을 인정하다.

f^{*}(\cdot )=\sum _{i=1}^{n}\cd_k(\cdot ,x_{i}),

여기서 $\alpha _{i}\in \mathbb {R}$ $\alpha _{i}\in \mathbb {R}$ $\alpha _{i}\in \mathbb {R}$ $\alpha _{i}\in \mathbb {R}$ ${\$ 에 $\alpha _{i}\in \mathbb {R}$ $1\leq i\leq n$ $1\leq i\leq n$ $1\leq i\leq n$ $displaystyle 1\leq$ i $\leq n}$ 모두.

증명: 매핑 정의

{\begin{aigned}\varphi \colon {\mathcal {X}&\to H_{k}\\varphi (x)&=k(\cdot ,x)\ended}}}

(따라서 $\varphi (x)=k(\cdot ,x)$ ( $\varphi (x)=k(\cdot ,x)$ ) = k $\varphi (x)=k(\cdot ,x)$ ( $\varphi (x)=k(\cdot ,x)$ , $\varphi (x)=k(\cdot ,x)$ ) $\varphi (x)=k(\cdot ,x)$ {\ $displaystyle \varphi (x)=k(\cdot ,x)}$ 은 그 자체로 ${\mathcal {X}}\to \mathbb {R}$ X → ${\mathcal {X}}\to \mathbb {R}$ {\ $displaystyle$ {\ $mathcal {X$ }\to $\mathb$ {R $}}}}$ 이다 $\varphi (x)=k(\cdot ,x)$ . ${\mathcal {X}}\to \mathbb {R}$ $k$ $k$ 은 $k$ (는) 재생성 커널이므로,

\varphi (x')=k(x'),x)=\langle \varphi(x'),\varphi(x)\angle ,

여기서 $\langle \cdot ,\cdot \rangle$ ⋅, ⋅, $\langle \cdot ,\cdot \rangle$ \, $\langle \cdot ,\cdot \rangle$ \ $displaystyle \langle \cdot,\cdot \rangle }}$ 은(는) $H_{k}$ H k {\ $displaystyle H_{$ k}}}}에 있는 내제품이다 $\langle \cdot ,\cdot \rangle$ $H_{k}$

Given any $x_{1},...,x_{n}$ , one can use orthogonal projection to decompose any $f\in H_{k}$ into a sum of two functions, one lying in ${\displaystyle \operatorname {span} \left\lbrace \varphi (x_{1}),...,\varp$ $hi (x_{n})\right\rbrace }$ , 그리고 다른 하나는 직교 보어에 있다.

f=\sum _{i=1}^{n}\reason _{i}\varphi(x_{i})+v,

여기서 $\langle v,\varphi (x_{i})\rangle =0$ $\langle v,\varphi (x_{i})\rangle =0$ , $\langle v,\varphi (x_{i})\rangle =0$ ( x $\langle v,\varphi (x_{i})\rangle =0$ ) $\langle v,\varphi (x_{i})\rangle =0$ = $\langle v,\varphi (x_{i})\rangle =0$ $\langle v,\varphi (x_{i})\angle =0$ 모든 $i$ ${\displaystyle$ i $}$ 에 대한 $\langle v,\varphi (x_{i})\rangle =0$ $i$

위의 직교 분해와 재현 특성을 함께 보면 어떤 교육 $x_{j}$ $x_{j}$ j ${\$ 에든 $f$ f $f$ 을(를) 적용하면 결과가 $x_{j}$ 나온다는 것을 알 수 있다.

f(x_{j})=\left\langle \sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})+v,\varphi (x_{j})\right\rangle =\sum _{i=1}^{n}\alpha _{i}\langle \varphi (x_{i}),\varphi (x_{j})\rangle ,

우리가 관찰하는 것은 $v$ $v$ 과(와) 무관하다 $v$ 따라서 오류 $E$ 함수 $E$ 의 값 $(*)$ 은 v {\ $displaystyle v}$ 과 $($ 와) 무관하다 $v$ 두 번째 용어(정규화 용어)의 경우,v {\ $displaysty v}$ 은 $v$ $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ i = $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ )와 $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ 직교직교직교직교)이기 때문에 $플레이스타일 \sum _{i=1$ }^{n $}\filename _{i$ }\i}\{ $i}\i}\varphi$ ( $x_{$ i}) 및 g ${\$ displaystyle g $}$ 은 $\sum _{i=1}^{n}\alpha _{i}\varphi (x_{i})$ $g$ (는) 완전히 단조롭다.

{\begin}g\왼쪽(\lVert f\rVert \right)&=g\n(\lVert \sum _{i=1}^{n}\alpha _{i}\i}+v\rVert \right)\\\\\\\&=g\왼쪽({\sqrt {\lVert \sum _{i=1}^{n}\알파 _{i}\varphi(x_{i})\rVert ^{2}+\lVert v\rVert ^{2}}}\오른쪽)\\&\geq g\left(\lVert \sum _{i=1}^{n}\알파 _{i}\varphi(x_{i})\rVert \right.\end{정렬}}

따라서 $v=0$ = $v=0$ $v=0$ 을(를) 설정해도 첫 번째 기간(*)에는 영향을 미치지 $v=0$ 않는 반면 두 번째 기간은 엄격히 감소한다.따라서 (*)의 $f^{*}$ 모든 미니마이저 $f^{*}$ $f^{*}$ ${\$ 는 $v=0$ = $v=0$ ${\displaystyle v=0},$ 즉 형식이어야 한다 $v=0$

f^{*}(\cdot )=\sum _{i=1}{n}\sum _{i}\varphi(x_{i})=\sum _{i=1}^{n}\i}k(\cdot ,x_{i}),}}}

원하는 결과야

일반화

위에서 언급된 정리는 집합적으로 "대표자 정리"라고 언급되는 결과 집단의 특별한 예다. 여기서 우리는 몇 가지 그러한 것을 설명한다.

대표자 정리의 첫 번째 진술은 키멜도르프와 와바에 의한 것이었다.

{\reasoned}E\left((x_{1},y_{1},f(x_{1})),...,(x_{n},y_{n},f(x_{n}))\right)&={\frac {1}{n}}\sum _{i=1}^{n}(f(x_{i})-y_{i})^{2},\\g(\lVert f\rVert )&=\lambda \lVert f\rVert ^{2}\end{aligned}}

$\lambda >0$ > $\lambda >0$ ${\displaystyle \lambda >0}.$ 슐코프, 헤르브리치, 스몰라(Smola)는 제곱 손실 비용의 가정을 완화하고 정규화기를 힐베르트 공간 표준의 $g(\cdot )$ 엄격히 단조롭게 증가하는 함수 $g(\cdot )$ ( $g(\cdot )$ ) ${\displaysty g(\cdot$ )가 되도록 허용함으로써 이 결과를 일반화했다.

보정되지 않은 상계항목을 추가하여 정규화된 경험적 위험 기능을 증강함으로써 더 일반화할 수 있다.예를 들어 슐코프, 헤르브리치, 스몰라 등도 최소화를 고려한다.

{\tilde {f}}^{*}=\operatorname {argmin} \left\lbrace E\left((x_{1},y_{1},{\tilde {f}}(x_{1})),...,(x_{n},y_{n},{\tilde {f}}(x_{n}))\right)+g\left(\lVert f\rVert \right)\mid {\tilde {f}}=f+h\in H_{k}\oplus \operatorname {span} \lbrace \psi _{p}\mid 1\leq p\leq M\rbrace \right\rbrace ,\quad (\dagger )

i.e., we consider functions of the form ${\tilde {f}}=f+h$ , where $f\in H_{k}$ and $h$ is an unpenalized function lying in the span of a finite set of real-valued functions ${\displaystyle \lbrace \psi _{p}\co$ $lon {\mathcal {X}}\to \mathbb {R} \mid 1\leq p\leq M\rbrace }$ . Under the assumption that the $n\times M$ matrix $\left(\psi _{p}(x_{i})\right)_{ip}$ has rank $M$ , they show that the minimizer ${\displaystyle {\tilde$ ${f}^{*}$ in ${\tilde {f}}^{*}$ $(\dagger )$ ( ) ${\displaystyle (\$ displaystyle (\ $displaystyle )}$ 에서 양식의 표현을 승인함 $(\dagger )$

{\tilde{f}^{*}(\cdot )=\sum _{i=1}{n}\alpha _{i}k(\cdot ,x_{i}++_{p=1}^{p}\p}\psi(\cdot )

여기서 $\alpha _{i},\beta _{p}\in \mathbb {R}$ $\alpha _{i},\beta _{p}\in \mathbb {R}$ , $\alpha _{i},\beta _{p}\in \mathbb {R}$ $\alpha _{i},\beta _{p}\in \mathbb {R}$ $\alpha _{i},\beta _{p}\in \mathbb {R}$ $\alpha _{i},\beta _{p}\in \mathbb {R}$ ${\$ _ ${i$ },\beta $_{p}\in$ \mathb { $R} 및$ $\beta _{p}$ $\beta _{p}$ ${\$ 는 모두 고유하게 결정된다 $\beta _{p}$ .

대표자 정리가 존재하는 조건은 아르기리우, 미첼리, 폰틸에 의해 조사되었는데, 그는 다음과 같은 사실을 증명하였다.

정리:Let ${\mathcal {X}}$ be a nonempty set, $k$ a positive-definite real-valued kernel on ${\mathcal {X}}\times {\mathcal {X}}$ with corresponding reproducing kernel Hilbert space $H_{k}$ , and let ${\displaystyle$ $R\colon H_{k}\to \mathb {R}은($ 는) 서로 다른 정규화 함수가 된다 $R\colon H_{k}\to \mathbb {R}$ .Then given a training sample $(x_{1},y_{1}),...,(x_{n},y_{n})\in {\mathcal {X}}\times \mathbb {R}$ and an arbitrary error function ${\displaystyle E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{m}\to \mat$ $hbb {R} \cup \lbrace \infort$ \ $rbrace$ $E\colon ({\mathcal {X}}\times \mathbb {R} ^{2})^{m}\to \mathbb {R} \cup \lbrace \infty \rbrace$ 미니마이저

f^{*}=\operatorname {argmin} _{f\in H_{k}}\left\lbrace E\left((x_{1},y_{1},f(x_{1})),...,(x_{n},y_{n},f(x_{n}))\right)+R(f)\right\rbrace \quad (\ddagger )

정규화된 경험적 위험의 형태적 표현을 허용한다.

f^{*}(\cdot )=\sum _{i=1}^{n}\cd_k(\cdot ,x_{i}),

where $\alpha _{i}\in \mathbb {R}$ for all $1\leq i\leq n$ , if and only if there exists a nondecreasing function $h\colon [0,\infty )\to \mathbb {R}$ for which

[\displaystyle R(f)=h(\lVert f\rVert).}

효과적으로, 이 결과는 상이한 정규화 정규화 $R(\cdot )$ R ( $R(\cdot )$ risk ) $(\ddagger )$ $displaystyle R(\cdot )}$ 에 필요하고도 충분한 조건을 제공하며, 이 조건에서는 $R(\cdot )$ 해당 정규화된 경험적 위험 최소화 $(\dadager )$ 이(가)가 대표자 정리를 하게 된다 $(\ddagger )$ $R(\cdot )$ 특히, 이는 광범위한 종류의 정규화된 위험 최소화(Kimeldorf와 Wahba가 원래 고려했던 것보다 훨씬 더 광범위함)가 대표자의 정리를 가지고 있음을 보여준다.

적용들

대표자 이론은 규칙화된 경험적 위험 최소화 문제 $){\displaystyle (\ddager )}}$ 를 극적으로 단순화하기 때문에 실제적인 관점에서 유용하다 $(\ddagger )$ 가장 흥미로운 응용 분야에서는 최소화를 $H_{k}$ 위한 검색 $H_{k}$ $H_{k}$ k $H_{k}$ {\ $displaystyle H_{k}}}}}$ 이(가)의 무한 차원 하위 공간이 될 것이다. $L^{2}({\mathcal {X}})$ $L^{2}({\mathcal {X}})$ ( $L^{2}({\mathcal {X}})$ ) ${\displaystyle L^{2}({\mathcal {X$ 따라서 검색(서면)은 유한메모리 및 유한정밀 컴퓨터에 대한 구현을 인정하지 않는다.이와는 대조적으로, 대표자 정리에 의해 $f^{*}(\cdot )$ $f^{*}(\cdot )$ 되는 f $f^{*}(\cdot )$ ( $f^{*}(\cdot )$ $){\displaystyle f^{*}(\cdot )$ 의 표현은 계수 $\alpha =(\alpha _{1},...,\alpha _{n})\in \mathbb {R} ^{n}$ ( $\alpha =(\alpha _{1},...,\alpha _{n})\in \mathbb {R} ^{n}$ 1, $\alpha =(\alpha _{1},...,\alpha _{n})\in \mathbb {R} ^{n}$ . $\alpha =(\alpha _{1},...,\alpha _{n})\in \mathbb {R} ^{n}$ , $\alpha =(\alpha _{1},...,\alpha _{n})\in \mathbb {R} ^{n}$ n )의 $\alpha =(\alpha _{1},...,\alpha _{n})\in \mathbb {R} ^{n}$ 최적 $n$ ${\$ $n}$ -차원 $n$ 벡터 탐색으로 원래의 ( $무한$ 차원) 최소화 문제를 감소시킨다. $ha =(\alpha _{1},...,\alpha _{n})\in \mathb {R}$ ^{ $n$ $\alpha$ $\alpha$ 은(는) 표준 함수 최소화 알고리즘을 적용하여 얻을 수 있다 $\alpha$ .따라서 대표자의 이론은 일반적인 기계 학습 문제를 실제 컴퓨터에서 실제로 구현할 수 있는 알고리즘으로 줄일 수 있는 이론적 근거를 제공한다.

다음은 대표자 정리에 의해 존재가 보장되는 미니마이저에 대한 해결방법의 예를 제시한다.이 방법은 모든 양의 확정 $커널$ K $K$ 에 적용되며 복잡한(아마도 무한 치수) 최적화 문제를 숫자로 해결할 수 있는 단순한 선형 시스템으로 변환할 수 있다.

최소 제곱 오차 함수를 사용한다고 가정하십시오.

E[(x_{1},y_{1},f(x_{1}),\dots ,(x_{n},y_{n},f(x_{n})]:=\sum _{i=1}^{n}(y_{i}-f(x_{i})^{2}

$\lambda >0$ 일부 $g(x)=\lambda x^{2}$ > $\lambda >0$ 0 $g(x)=\lambda x^{2}$ $displaystyle \lambda >0}$ 에 $g(x)=\lambda x^{2}$ 대한 정규화 함수 g ( $x$ ) $g(x)=\lambda x^{2}$ = $g(x)=\lambda x^{2}$ $g(x)=\lambda x^{2}$ ( $x)=\lambda$ x $^{2$ $\lambda >0$ 대표자 정리로는 미니마이저.

f^{*}=\mathrm {argmin} _{f\in {\mathcal {H}}}{\Big \{}E[(x_{1},y_{1},f(x_{1})),\dots ,(x_{n},y_{n},f(x_{n}))]+g(  f  _{\mathcal {H}}){\Big \}}=\mathrm {argmin} _{f\in {\mathcal {H}}}\left\{\sum _{i=1}^{n}(y_{i}-f(x_{i}))^{2}+\lambda   f  _{\mathcal {H}}^{2}\right\}

형태를 갖추다

f^{*}(x)=\sum _{i=1}^{n}\reason _{i}^{}k(x,x_{i})}

일부 $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ = $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ , $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ … , $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ ) $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ $\alpha ^{*}=(\alpha _{1}^{*},\dots ,\alpha _{n}^{*})\in \mathbb {R} ^{n}$ ${\$ 1}^},\ $dots,\alpha _{n}^}}\in \mathb {R} ^{n$ 에 주목

f _{\mathcal{H}^{2}={\big \langle }\sum _{i=1}{n}\alpha _{i}}}k(\cdot,x_{i}),\sum _{j=1}^{j}k(cdot,x_{j}}}}}}).Big \rangle }_{\mathcal {H}}=\sum _{i=1}^{n}\sum _{j=1}^{n}\alpha _{i}^{*}\alpha _{j}^{*}{\big \langle }k(\cdot ,x_{i}),k(\cdot ,x_{j}){\big \rangle }_{\mathcal {H}}=\sum _{i=1}^{n}\sum _{j=1}^{n}\alpha _{i}^{*}\alpha _{j}^{*}k(x_{i},x_{j}),

우리는 $\alpha ^{*}$ ∗ $\alpha ^{*}$ {\ $displaystyle$ \ ^ $^{*}}}$ 이(가) 형태를 가지고 있음을 $\alpha ^{*}$ 알 수 있다.

\alpha ^{*}=\mathrm {argmin} _{\alpha \in \mathbb {R} ^{n}}\left\{\sum _{i=1}^{n}\left(y_{i}-\sum _{j=1}^{n}\alpha _{j}k(x_{i},x_{j})\right)^{2}+\lambda   f  _{\mathcal {H}}^{2}\right\}=\mathrm {argmin} _{\alpha \in \mathbb {R} ^{n}}\left\{  y-A\alpha   ^{2}+\lambda \alpha ^{\intercal }A\alpha \right\}.

여기서 $A_{ij}=k(x_{i},x_{j})$ $A_{ij}=k(x_{i},x_{j})$ $A_{ij}=k(x_{i},x_{j})$ = $A_{ij}=k(x_{i},x_{j})$ x $A_{ij}=k(x_{i},x_{j})$ , $A_{ij}=k(x_{i},x_{j})$ $A_{ij}=k(x_{i},x_{j})$ ) ${\displaystyle A_{ij}=k(x_{i},x_{j})$ $y=(y_{1},\dots ,y_{n})$ y $y=(y_{1},\dots ,y_{n})$ = $y=(y_{1},\dots ,y_{n})$ $y=(y_{1},\dots ,y_{n})$ , $y=(y_{1},\dots ,y_{n})$ , $y=(y_{1},\dots ,y_{n})$ , $y=(y_{1},\dots ,y_{n})$ $y=(y_{1},\dots ,y_{n})$ ) ${\displaysty y=(y_{1},\dots ,y_{n$ 이것은 다음과 같이 고려되고 단순화될 수 있다.

\alpha ^{*}=\mathrm {argmin} _{\alpha \in \mathb {R}{n}\{\ntercal }}(A^{\intercal }}A+\lambda A)\alpha -2\{{ntercalpha }}}.

$A^{\intercal }A+\lambda A$ $A^{\intercal }A+\lambda A$ $A^{\intercal }A+\lambda A$ + $A^{\intercal }A+\lambda A$ $A^{\intercal }A+\lambda A$ ${\displaystyle A^{\intercal }}A+\lambda$ A $}$ 이 $A^{\intercal }A+\lambda A$ (가) 양적으로 확실하므로, 이 표현에 대한 하나의 글로벌 미니마는 실제로 존재한다.Let $F(\alpha )=\alpha ^{\intercal }(A^{\intercal }A+\lambda A)\alpha -2\alpha ^{\intercal }Ay$ and note that $F$ is convex.그러면 $\alpha ^{*}$ ,{\ $displaystyle \alpha^{*}}$ 글로벌 미니마인 $\alpha ^{*}$ , $\nabla _{\alpha }F=0$ $\nabla _{\alpha }F=0$ = $\nabla _{\alpha }F=0$ 0 $\nabla _{\alpha }F=0$ {\ $displaystyle \nabla$ _{\ $alpha }F=$ 0}}을 설정하여 해결할 수 있다 $\nabla _{\alpha }F=0$ 모든 양의 한정된 수식은 되돌릴 수 없다는 것을 상기하면 우리는 알 수 있다.

\nabla _{\alpha }F=2(A^{\intercal }A+\lambda A)\alpha ^{*-2Ay=0\Longrigharrow \alpha \^{*}=(A^{}\intercalpha+\lambda)^{-1}A,},}}}}}}}}}

선형 해결 방법을 통해 미니마이저를 찾을 수 있다.

참고 항목

참조

Argyriou, Andreas; Micchelli, Charles A.; Pontil, Massimiliano (2009). "When Is There a Representer Theorem? Vector Versus Matrix Regularizers". Journal of Machine Learning Research. 10 (Dec): 2507–2529.
Cucker, Felipe; Smale, Steve (2002). "On the Mathematical Foundations of Learning". Bulletin of the American Mathematical Society. 39 (1): 1–49. doi:10.1090/S0273-0979-01-00923-5. MR 1864085.
Kimeldorf, George S.; Wahba, Grace (1970). "A correspondence between Bayesian estimation on stochastic processes and smoothing by splines". The Annals of Mathematical Statistics. 41 (2): 495–502. doi:10.1214/aoms/1177697089.
Schölkopf, Bernhard; Herbrich, Ralf; Smola, Alex J. (2001). A Generalized Representer Theorem. Computational Learning Theory. Lecture Notes in Computer Science. Vol. 2111. pp. 416–426. CiteSeerX 10.1.1.42.8617. doi:10.1007/3-540-44581-1_27. ISBN 978-3-540-42343-0.

Search

대표자 정리

네임스페이스

더

목차

형식명세서

일반화

적용들

참고 항목

참조