낮은 순위 근사치

Low-rank approximation

수학에서 낮은 순위 근사치비용 함수가 주어진 행렬(데이터)과 근사 행렬(최적화 변수) 사이의 적합성을 측정하는 최소화 문제로 근사 행렬이 순위를 줄였다는 제약이 따른다.이 문제는 수학적 모델링과 데이터 압축에 사용된다.순위 제약조건은 데이터에 적합한 모형의 복잡성에 대한 제약조건과 관련이 있다.응용 프로그램의 경우, 종종 순위 제약 조건과 별개로 근사 행렬에 다른 제약 조건이 있다. 예를 들어, 비부정성행클 구조.

낮은 순위 근사치는 다음과 밀접한 관련이 있다.

주어진

  • 사양 S: R n n
  • 구조 매개변수 벡터 p
  • 표준
  • 원하는 r r

적용들

기본 하위 순위 근사 문제

프로베니우스 표준에 의해 측정된 적합성에 대한 구조화되지 않은 문제, 즉,

데이터 행렬의 단수 분해에 대한 분석 솔루션을 가지고 있다.그 결과를 매트릭스 근사 보조정리 또는 에카르트-라고 한다.영-미르스키 정리.[4] 내버려두다

be the singular value decomposition of and partition , , and as follows:

where is , is , and is . Then the rank- matrix, obtained from the truncated singular v해열 분해

이다

미니마이저 은(는) if + _{{r인 경우에만 고유하다

에카르트 증명서-영-미르스키 정리(스펙트럼 노멀용)

n n을(를) m{\ m n을(를) 가진 실제(직사각형) 행렬로 두십시오

is the singular value decomposition of . Recall that and are orthogonal matrices, and is an diagonal matrix with entries ,\cdma 0

우리는 ‖2 2{\로 표시된 스펙트럼 에서 A{\A}에 대한 최고의 k{\} 근사치가 에 의해 주어졌다고 주장한다

여기서 V 의 i 열을 나타낸다

첫째, 우리가 가지고 있는 것이

Therefore, we need to show that if where and have columns then .

열이 있으므로 즉, k +1 {\1} 열의 비선형 선형 결합이 있어야 한다.

such that . Without loss of generality, we can scale so that or (equivalently) .그러므로

그 결과는 위의 불평등 양쪽의 제곱근을 취함으로써 나타난다.

에카르트 증명서-영-미르스키 정리(프로베니우스 노르말용)

n n을(를) m{\ m n을(를) 가진 실제(직사각형) 행렬로 두십시오

{\단수분해 입니다

우리는프로베니우스 A 최고 등급 의 근사치가 에 의해 주어졌다고 주장한다.

여기서 V 의 i 열을 나타낸다

첫째, 우리가 가지고 있는 것이

가) k {\displaystyle X}과(와) Y {\ Y}이(가)k {\ k 열로 되어 있는 Bk = k를 표시해야 한다.

By the triangle inequality with the spectral norm, if then . Suppose and respectively d위에서 설명한 SVD 방법으로 순위 근사치를 A에 부여한다.그런 다음 의 i , 1 }

Since , when and we conclude that for

그러므로

필요에 따라

가중치가 낮은 하위 순위 근사 문제

프로베니우스 표준 가중치는 균일하게 근사 오차 - D 의 모든 요소. 오류 분포에 대한 사전 지식은 가중 저위 근사 문제를 고려함으로써 고려할 수 있다

여기서 ( ) 은 행렬 A 열을 벡터링하며 {\W}은 주어진 양의(반미)확정 가중 행렬이다.

일반적인 가중 저위 근사치 문제는 단수 값 분해 측면에서 분석 솔루션을 인정하지 않으며, 전지구적으로 최적의 솔루션이 발견된다는 보증을 제공하지 않는 국소 최적화 방법으로 해결된다.

uncorrelated 무게의 경우low-rank 근사 문제 또한 이러한 방법으로 추진될 수 있습니다. 모르기는non-negative 행렬 W{W\displaystyle}과 행렬을 우리는 ∑ 나는, j(거나 책 읽어 나는, j(명확히 설명, j− B나는, j)x2{\displaystyle \sum_{i,j}(W_{i,j}(A_{i,j}-B_{i,j}을 최소화하고 싶은{A\displaystyle}에[5][6].)) 위에 B 최대 r

항목별 낮은 순위 근사 문제

Let . For , the fastest algorithm runs in time,.[7][8]사용된 중요한 아이디어들 중 하나는 의식 없는 서브스페이스 임베딩(OSE)으로 불리며, 그것은 Sarlos에 의해 처음 제안되었다.[9]

= 의 경우 이 항목별 L1 규범은 특이치가 있는 프로베니우스 규범보다 더 견고하다고 알려져 있으며, 노이즈에 대한 가우스 가정이 적용되지 않을 수 있는 모델에 표시된다. - \}를 최소화하는 것이 당연하다[10] = 0 1 의 경우, 몇 가지 검증 가능한 알고리즘이 있다.[11][12]

거리 낮은 순위 근사치 문제

={ 1,… , m P ={ 1, n}\}}}을 임의의 메트릭 공간에서 두 점 집합으로 설정하십시오.Let represent the matrix where . Such distances matrices are commonly computed in software packages and have applications to learning image manifolds, handwriting recognition, and multi-di마그네틱한 전개기술 크기를 줄이기 위해, 그러한 행렬의 낮은 순위 근사치를 연구할 수 있다.[13][14]

분산/스트리밍 낮은 순위 근사치 문제

분배 및 스트리밍 설정에서 낮은 순위 근사치 문제가 다음에서 고려되었다.[15]

순위 제약 조건의 이미지 및 커널 표현

동등성 사용

, 그리고

가중치가 낮은 순위 근사치 문제는 모수 최적화 문제와 동일해진다.

, 그리고

여기서 는 크기 ID 매트릭스 입니다

교대 투영 알고리즘

순위 제약 조건의 이미지 표현은 다른 변수( 또는 L에 대해 비용 함수를 대체하여 최소화하는 파라미터 최적화 방법을 제안한다. 에 대한 동시 최소화는 어려운 바이콘벡스 최적화 문제지만 변수 중 하나에 대한 최소화는 선형 최소 제곱 문제로서 전지구적이고 효율적으로 해결할 수 있다.

결과 최적화 알고리즘(교대 투영이라고 함)은 가중치가 낮은 저위 근사치 문제의 국소 최적 솔루션으로 선형 수렴률과 전역적으로 수렴된다. 또는 L 매개 변수의 시작 값이 제공되어야 한다.사용자 정의 수렴 조건이 충족되면 반복이 중지된다.

가중치가 낮은 저위 근사치를 위한 교차 투영 알고리즘의 Matlab 구현:

function [dh, f] = wlra_ap(d, w, p, tol, maxiter) [m, n] = size(d); r = size(p, 2); f = inf; for i = 2:maxiter  % minimization over L  bp = kron(eye(n), p);  vl = (bp' * w * bp) \ bp' * w * d(:);  l = reshape(vl, r, n);  % minimization over P  bl = kron(l', eye(m));  vp = (bl' * w * bl) \ bl' * w * d(:);  p = reshape(vp, m, r);  % check exit condition = p * l; dd = d - dh; f(i) = dd(:) * w * dd(:); if(f(i - 1) - f(i) < toll, break, end for endf

가변 투영 알고리즘

교대 투영 알고리즘은 이미지 형태로 매개변수화된 낮은 순위 근사치 문제가 P L 에서 이선형이라는 사실을 이용한다 문제의 이선형 특성은 가변 투영이라는 대안적 접근법에서 효과적으로 사용된다.[16]

이미지 양식에서 파라미터로 처리된 가중치가 낮은 순위 근사 문제를 다시 고려하십시오. 변수(선형 최소 제곱 문제)에 대한 최소화는 의 함수로 근사 오차의 닫힌 형태 표현으로 이어진다.

따라서 원래의 문제는 관련하여 f( P 을 최소화하는 비선형 최소 제곱 문제와 동등하다 이러한 목적을 위해 Levenberg-Marquardt 알고리즘을 사용할 수 있다.

가중치가 낮은 하위 순위 근사치를 위한 가변 투영 알고리즘의 Matlab 구현:

함수 [dh, f] = wlra_varpro(d, w, p, toll, maxiter) prob = optimset(); prob.solver = 'lsqnonlin', prob.options = optimset('MaxIter', maxiter', maxiter, '톨Fun', tol); pun, tol); pol).x0 = p; prob.objective = @(p) cost_fun(p, d, w); [p, f ] = lsqnonlin(prob);  [f, vl] = cost_fun(p, d, w);  dh = p * reshape(vl, size(p, 2), size(d, 2)); function [f, vl] = cost_fun(p, d, w) bp = kron(eye(size(d, 2)), p); vl = (bp' * w * bp) \ bp' * w * d(:); f = d(:)' * w * (d(:) - bp * vl);

가변 투영 접근방식은 커널 형태에서 매개변수화된 낮은 순위 근사 문제에도 적용될 수 있다.이 방법은 제거된 변수의 수가 비선형 최소 제곱 최소화 단계에 남아 있는 최적화 변수의 수보다 훨씬 클 때 효과적이다.이러한 문제는 커널 형태로 매개변수화된 시스템 식별에서 발생한다. 여기서 제거된 변수는 근사 궤적이고 나머지 변수는 모델 매개변수다.선형 시간 변화 시스템 맥락에서 제거 단계는 Kalman 평활과 동일하다.

A 변종: 볼록 제한 낮은 순위 근사치

통상적으로 우리는 우리의 새로운 솔루션이 낮은 등급일 뿐만 아니라 적용 요건으로 인한 다른 볼록한 제약을 충족시키기를 원한다.우리의 관심사는 다음과 같을 것이다.

이 문제는 부정확한 (비정상적인 프로그래밍) 완화로부터 좋은 해결책을 복구하는 것을 포함하여, 많은 실제 응용 프로그램을 가지고 있다.만약 추가적인 제약 조건 ) g 0이(가) 모든 원소가 음성이 아니어야 하는 것처럼 선형이라면, 문제를 구조화 낮은 순위 근사라고 한다.[17]더 일반적인 형태는 볼록한 낮은 계급 근사치로 명명된다.

이 문제는 많은 문제를 푸는 데 도움이 된다.다만 볼록한(저위) 제약과 비콘벡스(저위) 제약이 복합적으로 작용해 난항을 겪고 있다.다른 기술 g(≤ 0{\displaystyle g({\widehat{p}})\leq 0}의 다른 깨달음에 근거한다. 그러나 반복 방향 방법(ADMM)볼록 목표 함수와 함께nonconvex 문제를 해결하기 위해 적용할 수 있Multipliers의 따라서 suita 제약 조건과 다른 볼록 constraints,[18]에 개발되었다.ble위 문제를 해결하기 위해.더욱이, 일반적인 비 컨벡스 문제와 달리, ADMM은 그것의 이중 변수가 반복적으로 수렴되는 한 실현 가능한 해결책의 수렴을 보장할 것이다.

참고 항목

참조

  1. ^ I. Markovsky, 체계화된 낮은 등급 근사치와 그 적용, Automatica, Volume 44, 이슈 4, 2008년 4월, 페이지 891–909. doi:10.1016/j.automatica.2007.09.011
  2. ^ I. 마르코프스키, J. C.윌럼스, S. 허펠, B.드 무어, 그리고 R.Pintelon, 시스템 식별 및 모델 축소를 위한 구조화된 총 최소 제곱의 적용.자동 제어에 관한 IEEE Transactions on Automatic Control, Volume 50, Number 10, 2005, 페이지 1490–1500.
  3. ^ I. 마르코프스키, 하위 순위 근사치:알고리즘, 구현, 애플리케이션, Springer, 2012, ISBN978-1-4471-2226-5
  4. ^ C. Eckart, G. Young, 하위 등급의 다른 행렬에 의한 근사치.사이코메트리카, 제1, 1936권, 페이지 211–8. doi:10.1007/BF02288367
  5. ^ Srebro, Nathan; Jaakkola, Tommi (2003). Weighted Low-Rank Approximations (PDF). ICML'03.
  6. ^ Razenshteyn, Ilya; Song, Zhao; Woodruff, David P. (2016). Weighted Low Rank Approximations with Provable Guarantees. STOC '16 Proceedings of the forty-eighth annual ACM symposium on Theory of Computing.
  7. ^ Clarkson, Kenneth L.; Woodruff, David P. (2013). Low Rank Approximation and Regression in Input Sparsity Time. STOC '13 Proceedings of the forty-fifth annual ACM symposium on Theory of Computing. arXiv:1207.6365.
  8. ^ Nelson, Jelani; Nguyen, Huy L. (2013). OSNAP: Faster numerical linear algebra algorithms via sparser subspace embeddings. FOCS '13. arXiv:1211.1002.
  9. ^ Sarlos, Tamas (2006). Improved approximation algorithms for large matrices via random projections. FOCS'06.
  10. ^ Song, Zhao; Woodruff, David P.; Zhong, Peilin (2017). Low Rank Approximation with Entrywise L1-Norm Error. STOC '17 Proceedings of the forty-ninth annual ACM symposium on Theory of Computing. arXiv:1611.00898.
  11. ^ Bringmann, Karl; Kolev, Pavel; Woodruff, David P. (2017). Approximation Algorithms for L0-Low Rank Approximation. NIPS'17. arXiv:1710.11253.
  12. ^ Chierichetti, Flavio; Gollapudi, Sreenivas; Kumar, Ravi; Lattanzi, Silvio; Panigrahy, Rina; Woodruff, David P. (2017). Algorithms for Lp Low-Rank Approximation. ICML'17. arXiv:1705.06730.
  13. ^ Bakshi, Ainesh L.; Woodruff, David P. (2018). Sublinear Time Low-Rank Approximation of Distance Matrices. NeurIPS. arXiv:1809.06986.
  14. ^ Indyk, Piotr; Vakilian, Ali; Wagner, Tal; Woodruff, David P. (2019). Sample-Optimal Low-Rank Approximation of Distance Matrices. COLT.
  15. ^ Boutsidis, Christos; Woodruff, David P.; Zhong, Peilin (2016). Optimal Principal Component Analysis in Distributed and Streaming Models. STOC. arXiv:1504.06729.
  16. ^ G. 골럽과 V.Peryra, 분리 가능한 비선형 최소 제곱: 가변 투영 방법과 그 적용, 물리학 연구소, 역 문제, 제19권, 2003, 페이지 1-26.
  17. ^ Chu, Moody T.; Funderlic, Robert E.; Plemmons, Robert J. (2003). "structured low-rank approximation". Linear Algebra and Its Applications. 366: 157–172. doi:10.1016/S0024-3795(02)00505-0.
  18. ^ "A General System for Heuristic Solution of Convex Problems over Nonconvex Sets" (PDF).
  • M. T. Chu, R. E. Funderlic, R. J. Plemmons, 구조화된 낮은 등급 근사치, 선형 대수 및 그 적용, 제366권, 2003년 6월 1일, 페이지 157–172 doi:10.1016/S0024-3795(02)00505-0

외부 링크