대표자 정리

Representer theorem

컴퓨터 과학의 경우, 통계적 학습 이론에서 대표자 정리재현 커널 힐버트 공간에 걸쳐 정의된 정규화된 경험적 위험 함수 미니마이저 f이(가) 에서 평가된 커널 제품의 유한 선형 결합으로 표현될 수 있음을 나타내는 몇 가지 관련 결과 중 하나이다.교육 세트 데이터에 포인트를 입력한다.

형식명세서

다음과 같은 대표자 정리 및 그 증거는 슐코프, 헤르브리치, 스몰라 때문이다.[citation needed]

정리:Consider a positive-definite real-valued kernel on a non-empty set with a corresponding reproducing kernel Hilbert space . Let there be given

  • 교육 샘플 , ), …( n, ) R }, }, }, }, }, }, }, },
  • 및 \mathb {R}에 대해 엄격하게 증가하는 실제 값 함수 :[ \) to\mathb {R}
  • 임의 오류 E:( ) {∞} { {cupto lblb\ }, .

에 대해 다음과 같은 정규화된 경험적 위험 기능을 정의한다

그런 다음, 경험적 위험을 최소화하는 방법

서식의 대표성을 인정하다.

여기서 i모두.

증명: 매핑 정의

(따라서 () = k( , ){\은 그 자체로 X → {\{\}\to {R이다. (는) 재생성 커널이므로,

여기서 ⋅, ⋅,\,\은(는)H k {\k}}}}에 있는 내제품이다

Given any , one can use orthogonal projection to decompose any into a sum of two functions, one lying in , 그리고 다른 하나는 직교 보어에 있다.

여기서 ,( x ) = 모든 i에 대한

위의 직교 분해와 재현 특성을 함께 보면 어떤 교육 j 에든 f 을(를) 적용하면 결과가 나온다는 것을 알 수 있다.

우리가 관찰하는 것은 과(와) 무관하다 따라서 오류 함수 의 값은 v {\와) 무관하다 두 번째 용어(정규화 용어)의 경우,v {\ i = )와직교직교직교직교)이기 때문에}^{n}\i}\{(i}) 및 g displaystyle g(는) 완전히 단조롭다.

따라서 = 을(를) 설정해도 첫 번째 기간(*)에는 영향을 미치지 않는 반면 두 번째 기간은 엄격히 감소한다.따라서 (*)의 모든 미니마이저 = 즉 형식이어야 한다

원하는 결과야

일반화

위에서 언급된 정리는 집합적으로 "대표자 정리"라고 언급되는 결과 집단의 특별한 예다. 여기서 우리는 몇 가지 그러한 것을 설명한다.

대표자 정리의 첫 번째 진술은 키멜도르프와 와바에 의한 것이었다.

> 슐코프, 헤르브리치, 스몰라(Smola)는 제곱 손실 비용의 가정을 완화하고 정규화기를 힐베르트 공간 표준의 엄격히 단조롭게 증가하는 함수 () )가 되도록 허용함으로써 이 결과를 일반화했다.

보정되지 않은 상계항목을 추가하여 정규화된 경험적 위험 기능을 증강함으로써 더 일반화할 수 있다.예를 들어 슐코프, 헤르브리치, 스몰라 등도 최소화를 고려한다.

i.e., we consider functions of the form , where and is an unpenalized function lying in the span of a finite set of real-valued functions . Under the assumption that the matrix has rank , they show that the minimizer in( )displaystyle (\에서 양식의 표현을 승인함

여기서 , _},\beta \mathb { 는 모두 고유하게 결정된다.

대표자 정리가 존재하는 조건은 아르기리우, 미첼리, 폰틸에 의해 조사되었는데, 그는 다음과 같은 사실을 증명하였다.

정리:Let be a nonempty set, a positive-definite real-valued kernel on with corresponding reproducing kernel Hilbert space , and let 는) 서로 다른 정규화 함수가 된다.Then given a training sample and an arbitrary error function \ 미니마이저

정규화된 경험적 위험의 형태적 표현을 허용한다.

where for all , if and only if there exists a nondecreasing function for which

효과적으로, 이 결과는 상이한 정규화 정규화 R (risk ) 에 필요하고도 충분한 조건을 제공하며, 이 조건에서는 해당 정규화된 경험적 위험 최소화 이(가)가 대표자 정리를 하게 된다특히, 이는 광범위한 종류의 정규화된 위험 최소화(Kimeldorf와 Wahba가 원래 고려했던 것보다 훨씬 더 광범위함)가 대표자의 정리를 가지고 있음을 보여준다.

적용들

대표자 이론은 규칙화된 경험적 위험 최소화 문제를 극적으로 단순화하기 때문에 실제적인 관점에서 유용하다 가장 흥미로운 응용 분야에서는 최소화를 위한 검색 k{\이(가)의 무한 차원 하위 공간이 될 것이다. ( ) 따라서 검색(서면)은 유한메모리 및 유한정밀 컴퓨터에 대한 구현을 인정하지 않는다.이와는 대조적으로, 대표자 정리에 의해 되는 f ( 의 표현은 계수 ( 1,., n )의최적 -차원 벡터 탐색으로 원래의 ( 차원) 최소화 문제를 감소시킨다.^{ 은(는) 표준 함수 최소화 알고리즘을 적용하여 얻을 수 있다.따라서 대표자의 이론은 일반적인 기계 학습 문제를 실제 컴퓨터에서 실제로 구현할 수 있는 알고리즘으로 줄일 수 있는 이론적 근거를 제공한다.

다음은 대표자 정리에 의해 존재가 보장되는 미니마이저에 대한 해결방법의 예를 제시한다.이 방법은 모든 양의 확정 K 에 적용되며 복잡한(아마도 무한 치수) 최적화 문제를 숫자로 해결할 수 있는 단순한 선형 시스템으로 변환할 수 있다.

최소 제곱 오차 함수를 사용한다고 가정하십시오.

일부 >0 대한 정규화 함수 g ( )= ( x 대표자 정리로는 미니마이저.

형태를 갖추다

일부 = ,… , ) 1}^},\에 주목

우리는 {\\ ^ 이(가) 형태를 가지고 있음을 알 수 있다.


여기서 = x , ) y= ,,, ) 이것은 다음과 같이 고려되고 단순화될 수 있다.


+ A(가) 양적으로 확실하므로, 이 표현에 대한 하나의 글로벌 미니마는 실제로 존재한다.Let and note that is convex.그러면 ,{\ 글로벌 미니마인, =0{\_{\0}}을 설정하여 해결할 수 있다 모든 양의 한정된 수식은 되돌릴 수 없다는 것을 상기하면 우리는 알 수 있다.

선형 해결 방법을 통해 미니마이저를 찾을 수 있다.

참고 항목

참조

  • Argyriou, Andreas; Micchelli, Charles A.; Pontil, Massimiliano (2009). "When Is There a Representer Theorem? Vector Versus Matrix Regularizers". Journal of Machine Learning Research. 10 (Dec): 2507–2529.
  • Cucker, Felipe; Smale, Steve (2002). "On the Mathematical Foundations of Learning". Bulletin of the American Mathematical Society. 39 (1): 1–49. doi:10.1090/S0273-0979-01-00923-5. MR 1864085.
  • Kimeldorf, George S.; Wahba, Grace (1970). "A correspondence between Bayesian estimation on stochastic processes and smoothing by splines". The Annals of Mathematical Statistics. 41 (2): 495–502. doi:10.1214/aoms/1177697089.
  • Schölkopf, Bernhard; Herbrich, Ralf; Smola, Alex J. (2001). A Generalized Representer Theorem. Computational Learning Theory. Lecture Notes in Computer Science. Vol. 2111. pp. 416–426. CiteSeerX 10.1.1.42.8617. doi:10.1007/3-540-44581-1_27. ISBN 978-3-540-42343-0.