순차 최소 최적화

순차 최소 최적화
클래스	지원 벡터 머신 교육을 위한 최적화 알고리즘
최악의 경우 공연	O(n)

순차적 최소 최적화(SMO)는 SVM(Support-Vector Machine) 훈련 중에 발생하는 2차 프로그래밍(QP) 문제를 해결하기 위한 알고리즘이다.그것은 1998년 마이크로소프트 리서치에서 존 플랫에 의해 발명되었다.^[1]SMO는 교육 지원 벡터 기계에 널리 사용되며 인기 있는 LIBSVM 툴에 의해 구현된다.^[2]^[3]1998년 SMO 알고리즘의 출시는 SVM 교육에 대해 이전에 사용 가능했던 방법이 훨씬 더 복잡하고 값비싼 제3자 QP 해결사가 필요했기 때문에 SVM 커뮤니티에 많은 흥분을 불러일으켰다.^[4]

최적화 문제

데이터 집합(x₁, y₁), ..., (x_n, y_n)의 이진 분류 문제를 고려하십시오. 여기서 x는_i 입력 벡터이고 y_i ∈{-1, +1}는 이에 해당하는 이진 레이블이다.소프트 마진 지지 벡터 머신은 2차 프로그래밍 문제를 해결하여 훈련하는데, 다음과 같이 이중 형태로 표현된다.

\max _{\alpha }\sum _{i=1}^{n}\alpha _{i}-{\frac {1}{2}}\sum _{i=1}^{n}\sum _{j=1}^{n}y_{i}y_{j}K(x_{i},x_{j})\alpha _{i}\alpha _{j},

대상:

0\leq \alpha _{i}\leq C,\quad {\mbox{ for }}i=1,2,\ldots,n,

\sum _{i=1}^{n}y_{i}\reason _{i}=0

여기서 C는 SVM 하이퍼 파라미터, K(x_i, x)는_j 사용자가 제공하는 커널 함수, $\alpha _{i}$ $\alpha _{i}$ ${\$ 변수는 $\alpha _{i}$ 라그랑주 승수다.

알고리즘.

SMO는 위에서 설명한 최적화 문제를 해결하기 위한 반복 알고리즘이다.SMO는 이 문제를 가능한 가장 작은 하위 문제들로 세분화하여 분석적으로 해결한다.라그랑주 승수 $\alpha _{i}$ ${\$ 를 포함하는 선형 평등 제약 때문에 가능한 가장 작은 문제는 그러한 승수 두 개를 포함한다 $\alpha _{i}$ 그런 다음 두 $\alpha _{1}$ 의 $α$ 1 {\ $displaystyle \alpha$ $\alpha _{2}$ { $\alpha _{2}$ } 및 $\alpha _{2}$ 2 {\ $displaystyle \alpha _{$ 2}}개의 경우 제약조건은 다음과 같이 감소한다 $\alpha _{2}$

0\leq \alpha _{1},\alpha _{2}\leq C,

y_{1}\properties _{1}+y_{2}\properties _{2}=k,

그리고 이러한 감소된 문제는 분석적으로 해결될 수 있다: 최소 1차원 2차원의 함수를 찾아야 한다. $k$ $[\displaystyle k}$ 은 $k$ (는) 각 반복에 고정된 평등 제약 조건의 나머지 항에 대한 합계의 음수다.

알고리즘은 다음과 같이 진행된다.

최적화 문제에 대한 KKT(Karush-Kuhn-Tucker) 조건을 위반하는 $\alpha _{1}$ 라그랑주 승수 $\alpha _{1}$ $\alpha _{1}$ ${\$ }를 찾으십시오.
두 번째 승수 $\alpha _{2}$ 2 ${\$ }를 선택하고 $\alpha _{2}$ 쌍 $(\alpha _{1},\alpha _{2})$ $(\alpha _{1},\alpha _{2})$ , $(\alpha _{1},\alpha _{2})$ 2 $){\displaystyle (\alpha _{1},\alpha _{2})$ 을 최적화하십시오 $(\alpha _{1},\alpha _{2})$
수렴될 때까지 1단계와 2단계를 반복하십시오.

모든 라그랑주 승수가 (사용자 정의 공차 내에서) KKT 조건을 만족하면 문제가 해결되었다.이 알고리즘은 수렴이 보장되지만, 융합 속도를 가속화하기 위해 경험적 접근법을 사용하여 승수 쌍을 선택한다. $\alpha _{i}$ $\alpha _{i}$ ${\$ 및 $\alpha _{i}$ $\alpha _{j}$ j ${\$ 에 대해 n $n(n-1)/2$ ( $n(n-1)/2$ - $n(n-1)/2$ ) $n(n-1)/2$ / $n(n-1)/2$ ${\displaystyle n(n-1)/$ 2}이 $($ 가 $n(n-1)/2$ ) 가능한 선택 사항이 있으므로 이는 대용량 데이터 세트에 매우 중요하다 $\alpha _{j}$

참고 항목

커널 퍼셉트론

참조

^ ^a ^b ^c ^d ^e Platt, John (1998). "Sequential Minimal Optimization: A Fast Algorithm for Training Support Vector Machines" (PDF). CiteSeerX 10.1.1.43.4376.
^ Chang, Chih-Chung; Lin, Chih-Jen (2011). "LIBSVM: A library for support vector machines". ACM Transactions on Intelligent Systems and Technology. 2 (3). doi:10.1145/1961189.1961199. S2CID 961425.
^ Zanni, Luca (2006). "Parallel Software for Training Large Scale Support Vector Machines on Multiprocessor Systems" (PDF).
^ Rifkin, Ryan (2002). Everything Old is New Again: a Fresh Look at Historical Approaches in Machine Learning (Ph.D. Thesis). Massachusetts Institute of Technology. p. 18. hdl:1721.1/17549.
^ Boser, B. E.; Guyon, I. M.; Vapnik, V. N. (1992). "A training algorithm for optimal margin classifiers". Proceedings of the fifth annual workshop on Computational learning theory - COLT '92. p. 144. CiteSeerX 10.1.1.21.3818. doi:10.1145/130385.130401. ISBN 978-0897914970. S2CID 207165665.
^ Osuna, E.; Freund, R.; Girosi, F. (1997). "An improved training algorithm for support vector machines". Neural Networks for Signal Processing [1997] VII. Proceedings of the 1997 IEEE Workshop. pp. 276–285. CiteSeerX 10.1.1.392.7405. doi:10.1109/NNSP.1997.622408. ISBN 978-0-7803-4256-9. S2CID 5667586.

[Platt-1] Platt, John (1998). "Sequential Minimal Optimization: A Fast Algorithm for Training Support Vector Machines" (PDF). CiteSeerX 10.1.1.43.4376.

[2] Chang, Chih-Chung; Lin, Chih-Jen (2011). "LIBSVM: A library for support vector machines". ACM Transactions on Intelligent Systems and Technology. 2 (3). doi:10.1145/1961189.1961199. S2CID 961425.

[3] Zanni, Luca (2006). "Parallel Software for Training Large Scale Support Vector Machines on Multiprocessor Systems" (PDF).

[4] Rifkin, Ryan (2002). Everything Old is New Again: a Fresh Look at Historical Approaches in Machine Learning (Ph.D. Thesis). Massachusetts Institute of Technology. p. 18. hdl:1721.1/17549.

[ReferenceA-5] Boser, B. E.; Guyon, I. M.; Vapnik, V. N. (1992). "A training algorithm for optimal margin classifiers". Proceedings of the fifth annual workshop on Computational learning theory - COLT '92. p. 144. CiteSeerX 10.1.1.21.3818. doi:10.1145/130385.130401. ISBN 978-0897914970. S2CID 207165665.

[6] Osuna, E.; Freund, R.; Girosi, F. (1997). "An improved training algorithm for support vector machines". Neural Networks for Signal Processing [1997] VII. Proceedings of the 1997 IEEE Workshop. pp. 276–285. CiteSeerX 10.1.1.392.7405. doi:10.1109/NNSP.1997.622408. ISBN 978-0-7803-4256-9. S2CID 5667586.

[1]

[2]

[3]

[4]

[5]

[6]

Search

순차 최소 최적화

네임스페이스

더

목차

최적화 문제

알고리즘.

관련 작업

참고 항목

참조