비음수 행렬 인수분해

Non-negative matrix factorization
근사 비음행렬 인수분해를 나타내는 그림: 행렬 V는 두 개의 작은 행렬 W와 H로 표현되며, 곱하면 V가 대략적으로 재구성됩니다.

비음수 행렬[1][2] 인수분해(NMF 또는 NNMF)는 다변량 분석선형 대수학에서 행렬 V를 두 행렬 W와 H인수분해하는 알고리즘의 그룹이며, 세 행렬 모두 음의 요소가 없다는 특성을 가지고 있습니다.이러한 비음수성으로 인해 결과 행렬을 검사하기가 더 쉬워집니다.또, 오디오 스펙트로그램의 처리나 근육 활동등의 애플리케이션에서는, 비부정성은 고려중의 데이터에 고유합니다.이 문제는 일반적으로 정확하게 해결할 수 없기 때문에 일반적으로 수치로 근사됩니다.

NMF는 천문학,[3][4][5] 컴퓨터 비전, 문서 클러스터링,[1] 누락 데이터 변환,[6] 화학 측정학,[9] 오디오 신호 처리, 추천 시스템 [7][8]및 생물 정보학 등의 분야에서 응용 프로그램을 찾습니다.

역사

화학측정학에서 음이 아닌 행렬 인수분해는 "자체 모델링 곡선 분해능"[10]이라는 이름으로 오랜 역사를 가지고 있습니다.이 프레임워크에서 오른쪽 행렬의 벡터는 이산 벡터라기보다는 연속 곡선입니다.또한 1990년대에 핀란드의 한 연구자 그룹에 의해 양의 행렬 [11][12][13]인수분해라는 이름으로 비음수 행렬 인수분해에 대한 초기 연구가 수행되었다.이는 Lee와 Seung이 알고리즘의 특성을 조사하고 두 가지 유형의 [14][15]인수분해를 위한 간단하고 유용한 알고리즘을 발표한 후 비음수 행렬 인수분해로 더 널리 알려지게 되었다.

배경

행렬 V를 행렬 W와 H의 곱으로 하자.

행렬 곱셈은 H의 열에 의해 공급되는 계수를 이용하여 W의 열 벡터의 선형 조합으로서 V의 열 벡터를 계산하는 것으로 실시할 수 있다.즉, V의 열은 다음과 같이 계산할 수 있습니다.

여기i v는 곱 행렬 V의 i번째벡터이고i h는 행렬 H의 i번째 열 벡터이다.

행렬을 곱할 때 인자 행렬의 치수는 곱 행렬의 치수에 비해 상당히 낮을 수 있으며, 이 특성이 NMF의 기초를 형성합니다. NMF는 원래 행렬에 비해 치수가 상당히 줄어든 인자를 생성합니다.예를 들어 V가 m × n 행렬, W m × p 행렬, H p × n 행렬이면 pm과 n 둘 보다 유의하게 작을 수 있다.

다음으로 텍스트 마이닝애플리케이션에 근거한 예를 나타냅니다.

  • 입력 행렬(인수할 행렬)은 단어가 행에 있고 문서가 열에 있는 10000개의 행과 500개의 열이 있는 V라고 합니다.즉, 500개의 문서가 10,000개의 단어로 색인화되어 있습니다.따라서 V의 열 벡터 V는 문서를 나타냅니다.
  • 알고리즘에 10000행과 10열의 특징 행렬 W와 10행과 500열의 계수 행렬 H를 생성하기 위해 10개의 특징을 찾도록 요청했다고 가정합니다.
  • W와 H의 곱은 10000행과 500열의 행렬이며, 입력 행렬 V와 모양이 같으며 인수 분해가 성공했다면 입력 행렬 V에 대한 합리적인 근사치입니다.
  • 위의 행렬 곱셈 처리로부터, 곱셈 행렬 WH의 각 열은 특징 행렬 W의 10개 열 벡터와 계수 행렬 H에 의해 공급되는 계수의 선형 조합이 된다.

이 예의 각 원본 문서는 숨겨진 기능의 작은 세트에서 작성된 것으로 간주할 수 있기 때문에 이 마지막 포인트는 NMF의 기초가 됩니다.NMF는 이러한 기능을 생성합니다.

특징 행렬 W의 각 특징(컬럼 벡터)을 단어 집합으로 구성된 문서 원형으로 생각하면 유용합니다. 여기서 각 단어의 셀 값이 특징에서 단어의 순위를 정의합니다.단어의 셀 값이 높을수록 피쳐에서 단어의 순위가 높아집니다.계수행렬 H 내의 열은 특징에 대한 문서의 순위를 정의하는 셀 값으로 원본 문서를 나타낸다.이제 각 피쳐가 H에 있는 문서 열의 피쳐 셀 값에 따라 가중치가 부여되는 피쳐(W에 있는 컬럼 벡터)의 선형 조합을 통해 입력 매트릭스에서 문서(컬럼 벡터)를 재구성할 수 있습니다.

클러스터링 속성

NMF는 고유한 클러스터링 [16]특성을 가지고 있습니다. 즉, 입력 V ( ,, ){ = (의 열을 자동으로 클러스터링합니다.

보다 구체적으로, V \ \ V{\ 근사치는 Frobenius하여 W {\ W {

- H , \ \ \ V - \ \ { F} 0 . \ displaystyle \0 ,\ 0. } ,

에 직교 구속을 더 가하면(, H T I \ \}= 위의 최소화는 수학적으로 k-ME [16]클러스터링의 최소화와 동등하다.

또한 H {\ H 클러스터 멤버쉽을 부여합니다., kj > i H{kj} > \_{ij의 경우, 입력 v \}가 k .W {\ W 클러스터 중심을 나타냅니다.즉, k {\ k -번째 열은 을 k{\ k -번째 클러스터 중심을 나타냅니다.이 중심체의 표현은 볼록 NMF에 의해 크게 향상될 수 있다.

직교성 조건 H \ \^{T} (는) 명시적으로 부과되지 않고, 직교성이 크게 유지되며, 클러스터링 속성도 유지됩니다.클러스터링은 대부분의 NMF [citation needed]데이터 마이닝 애플리케이션의 주요 목적입니다.

사용하는 오류 함수가 Kullback-Leibler 발산인 경우 NMF는 일반적인 문서 클러스터링 [17]방법인 확률론적 잠재의미분석(PLSA)과 동일합니다.

종류들

근사 비음수 행렬 인수 분해

일반적으로 W의 수와 NMF의 H 행 수를 선택하므로 곱 WH는 V에 대한 근사치가 됩니다.그러면 V의 완전 분해는 음이 아닌 두 행렬 W와 H와 잔차 U에 해당된다: V = WH + U. 잔차 행렬의 원소는 음수이거나 양수일 수 있다.

W와 H가 V보다 작으면 저장 및 조작이 쉬워집니다.V를 더 작은 행렬 W와 H로 인수분해하는 또 다른 이유는 V의 원소를 상당히 적은 데이터로 근사적으로 나타낼 수 있다면 데이터에 잠재된 구조를 추론해야 하기 때문이다.

볼록 비음수 행렬 인수분해

표준 NMF에서는 매트릭스 팩터 W , R ∈ W+m × k ∈ 。즉, W는 그 공간 내의 임의의 것이 될 수 있습니다.볼록 NMF는[18] W의 을 입력 데이터 벡터 ,… , v)의 볼록한 조합으로 제한합니다.{ displaystyle ( _ { , \ ,_ { } }}이것에 의해, W의 데이터 표현 품질이 큰폭으로 향상됩니다.또, 그 결과 생기는 행렬 계수 H는 보다 희박하고 직교하게 된다.

비음수 순위 인수분해

V비음수 순위가 실제 순위와 동일한 경우 V = WH를 비음수 순위 인수분해(NRF)[19][20][21]라고 한다.V의 NRF를 찾는 문제는 존재하는 경우 NP-hard로 [22]알려져 있습니다.

다양한 비용 기능 및 정규화

음이 아닌 행렬 인수 분해에는 여러 가지 유형이 있습니다.다른 유형은 V와 WH 사이의 차이를 측정하기 위해 다른 비용 함수를 사용하고 W 및/또는 H [1]행렬정규화에 의해 발생할 수 있다.

Lee와 Seung에 의해 연구된 두 가지 간단한 발산 함수는 제곱 오차(또는 프로베니우스 노름)와 양의 행렬에 대한 Kullback-Leibler 발산의 확장이다(원래 Kullback-Leibler 발산은 확률 분포에서 정의된다).각 다이버전스는 다른 NMF 알고리즘으로 이어지며, 일반적으로 반복적인 업데이트 규칙을 사용하여 다이버전스를 최소화합니다.

NMF의 제곱 오차 버전의 인수분해 문제는 다음과 같이 나타낼 수 있습니다. V {\ 주어진 경우 함수를 최소화하는 음이 아닌 행렬 W 및 H를 찾으십시오.

또 다른 유형의 영상용 NMF는 총 변동 [23]규범에 기초합니다.

L1 정규화(Akin to Lasso)가 평균 제곱 오류 비용 함수와 함께 NMF에 추가되면, 그 결과 발생하는 문제는 NMF라고도 [26]할 수 있지만, 스파스 부호화 문제와 [24][25]유사하기 때문에 비음성 스파스 부호화라고 불립니다.

온라인 NMF

많은 표준 NMF 알고리즘이 모든 데이터를 함께 분석합니다. 즉, 전체 매트릭스를 처음부터 사용할 수 있습니다.이는 데이터가 너무 많아 메모리에 들어가지 않거나 데이터가 스트리밍 방식으로 제공되는 애플리케이션에서는 만족스럽지 못할 수 있습니다.이러한 용도 중 하나는 권장 시스템에서 협업 필터링을 하기 위한 것입니다.이 시스템에서는 사용자가 많고 권장할 항목이 많을 수 있으며 시스템에 사용자 또는 항목이 하나 추가되었을 때 모든 것을 재계산하는 것은 비효율적입니다.이러한 경우 최적화를 위한 비용 함수는 표준 NMF와 같을 수도 있고 아닐 수도 있지만 알고리즘은 다소 [27][28][29]다를 필요가 있습니다.

알고리즘

W와 H는 몇 가지 방법으로 찾을 수 있습니다.Lee와 Seung의 곱셈 업데이트[15] 규칙은 구현이 단순하기 때문에 인기 있는 방법이었습니다.이 알고리즘은 다음과 같습니다.

초기화: W 및 H는 음이 아닙니다.
그런 다음n\n을 반복 인덱스로 다음을 계산하여 W와 H의 을 업데이트합니다.
그리고.
W와 H가 안정될 까지.

업데이트는 행렬 곱셈이 아닌 요소 단위로 수행됩니다.

H의 곱셈 계수, 즉 W H {\{\ \} {\ { \ { \mathbf} ^{\mathbf} \mathbf} \mathbf {WF} {WF} {WF} {WF} {W}에 주목한다. \ \^{\ \일 때 1의 행렬입니다

최근에는 다른 알고리즘도 개발되고 있습니다.일부 접근법은 이 아닌 최소 제곱을 번갈아 하는 것에 기초한다. 이러한 알고리즘의 각 단계에서 첫 번째 H는 고정되고 W는 음이 아닌 최소 제곱 솔버에 의해 발견되며, 그 다음 W는 고정되고 H는 유사하게 발견된다.일부 NMF 변형은 W[24]H 중 하나를 정규화하기 때문에 W와 H에 대한 해결 절차는 동일하거나[30] 다를 수 있다. 특정 접근법에는 투영 경사 강하법,[30][31] 액티브 세트 방법,[7][32] 최적 경사법 [33][35]블록 주 피벗[34] 방법이 포함된다.

현재의 알고리즘은 비용 함수의 글로벌 최소값이 아닌 로컬 최소값만 찾는다는 점에서 차선책입니다.이 문제가 [36]NP-완전한 것으로 알려진 k-평균 클러스터링 문제를 일반화하는 것으로 나타났기 때문에 입증 가능한 최적 알고리즘은 가까운 미래에 있을 것 같지 않다.그러나 다른 많은 데이터 마이닝 애플리케이션과 마찬가지로 로컬 최소값이 여전히 유용할 수 있습니다.

PCA 및 순차 NMF에 [5]대한 FRV(Fractional Residual Variance) 그림. PCA에 대한 이론적 값은 잔류 고유값의 기여입니다.이에 비해 PCA용 FRV 곡선은 신호가 효과적으로 캡처되지 않는 평탄한 평원에 도달하지만 NMF FRV 곡선은 지속적으로 감소하여 신호 캡처 능력이 향상되었음을 나타냅니다.NMF의 FRV 곡선도 PCA보다 높은 레벨로 수렴되어 NMF의 과적합성이 낮음을 나타냅니다.

시퀀셜 NMF

NMF 성분(W와 H)의 순차적 구성은 [37]천문학에서 NMF와 주요 성분 분석(PCA)을 관련짓기 위해 최초로 사용되었다.PCA 컴포넌트의 기여도는 대응하는 고유값의 크기에 따라 순위가 매겨집니다. NMF의 경우 컴포넌트를 하나씩 (순차적으로) 구성했을 때 경험적으로 순위를 매길 수 있습니다. 즉, (+ 1){(번째 컴포넌트를의 컴포넌트로 학습할 수 있습니다.

순차적 NMF 성분의 기여는 고유값의 그래프를 사용하여 PCA의 응용 프로그램인 카르후넨-로브 정리와 비교할 수 있다.PCA를 사용하는 컴포넌트 수의 일반적인 선택은 "elbow" 포인트를 기반으로 합니다.그러면 평탄한 고원의 존재는 PCA가 데이터를 효율적으로 캡처하지 못하고 있음을 나타냅니다.마지막으로 랜덤 노이즈의 포착을 반영한 급격한 저하가 발생하여 과적합 [38][39]상태에 빠집니다.순차 NMF의 경우, 고유값의 플롯은 곡선이 연속적으로 감소하는 부분 잔차 분산 곡선의 플롯에 의해 근사되며, 순차 NMF의 과적합이 덜하다는 것을 나타내는 [5]PCA보다 높은 수준으로 수렴된다.

정확한 NMF

행렬 V에 대한 추가 제약 조건이 유지되면 NMF의 변형에 대한 정확한 솔루션을 기대할 수 있습니다(다항 시간).1981년 캠벨과 풀은 [40]V가 등급과 동일한 등급의 단항 하위 행렬을 포함할 경우 비음수 순위 인수분해를 해결하기 위한 다항식 시간 알고리즘을 제공했다.칼로폴리아스와 갈로풀로스(2012)[41]V가 대칭이고 순위 r의 대각선 주요 하위 행렬을 포함하는 이 문제의 대칭적 대응물을 해결했다.조밀한 경우 알고리즘2 O(rm) 시간으로 실행됩니다.Arora, Ge, Halpern, Mimno, Moitra, Sontag, Wu 및 Zhu(2013)는 인자 중 하나가 분리 가능성 [42]조건을 충족하는 경우에 작동하는 정확한 NMF에 대한 다항식 시간 알고리즘을 제공한다.

다른 기술과의 관계

Learning of objects by non-negative matrix factorization에서 Lee와[43] Seung은 주로 이미지의 부품 기반 분해를 위한 NMF를 제안했다.NMF를 벡터 양자화 주성분 분석과 비교하고, 세 가지 기술이 인수분해로 작성될 수 있지만, 서로 다른 제약 조건을 구현하여 서로 다른 결과를 도출한다는 것을 보여준다.

확률론적 그래픽 모델로서의 NMF: 가시 단위(V)는 가중치 W를 통해 숨겨진 단위(H)에 연결되므로, V는 평균 a \ _의 확률 분포에서 생성된다.[14]: 5

NMF의 일부 유형은 "다항식 PCA"[44]라고 불리는 보다 일반적인 확률론적 모델의 인스턴스인 것으로 나중에 밝혀졌다.Kullback-Leibler 분산을 최소화하여 NMF를 얻을 경우, 실제로는 최대우도 추정에 의해 훈련되는 다항식 PCA의 또 다른 인스턴스인 확률적 잠재 의미 분석과 [45]동등하다.이 방법은 텍스트 데이터를 분석하고 클러스터링하는 데 일반적으로 사용되며 잠복 클래스 모델과도 관련이 있습니다.

최소 제곱 목표를 갖는 NMF는 K-평균 군집 분석의 완화된 형태에 해당합니다. 행렬 요인 W에는 군집 중심이 포함되어 있고 H에는 군집 구성 [16][46]지표가 포함되어 있습니다.이를 통해 데이터 클러스터링에 NMF를 사용하기 위한 이론적 기반이 제공됩니다.그러나 k-평균은 중심체에 비음성을 강요하지 않으므로, 가장 가까운 유사점은 사실 "반NMF"[18]이다.

NMF는 관찰된 랜덤 변수의 레이어와 숨겨진 랜덤 [47]변수의 레이어를 가진 2층 지향 그래픽 모델로 볼 수 있습니다.

NMF는 행렬을 넘어 임의의 [48][49][50]차수의 텐서까지 확장됩니다.이 확장은 예를 들어 PARAFAC 모델에 대한 음이 아닌 것으로 볼 수 있다.

NMF의 다른 확장 기능으로는 여러 데이터 매트릭스와 텐서의 공동 인수 분해가 있는데, 여기에는 일부 요인이 공유된다.이러한 모델은 센서 융합 및 관계형 [51]학습에 유용합니다.

NMF는 Support Vector Machine(SVM; 지원 벡터 머신)과 마찬가지로 Non-egative 2차 프로그래밍(NQP)의 인스턴스입니다.단, SVM과 NMF는 NQP보다 밀접하게 관련되어 있기 때문에 두 가지 방법 중 하나를 위해 개발된 솔루션알고리즘을 양쪽 [52]도메인의 문제에 직접 적용할 수 있습니다.

고유성

인수분해는 고유하지 않습니다. 행렬과 그 역행렬을 사용하여 다음과 같이 두 인수분해 행렬을 변환할 수 있습니다.[53]

2개의 새로운 W ~ B{\}}}=WB} ~ - H(\ =\^{- 음수가 아닌 인수 분해의 또 다른 매개변수를 형성한다.

W~ \ H~ {\ 비음수성은 적어도 B가 음이 아닌 단항 행렬인 경우에 적용된다.이 간단한 경우 스케일링과 치환에 해당합니다.

희소성 제약에 의해 [54]NMF의 비고유성에 대한 제어가 강화됩니다.

적용들

천문학

천문학에서 NMF는 천체물리 신호가 음이 아니라는 점에서 차원 축소를 위한 유망한 방법이다.NMF는 천체공통특성의 연구와[5] 천체관측 후처리의 방법으로 분광관측과[3][4] 직접영상관측에 적용되어 왔다.Blanton & Roweis(2007)[4]에 의한 분광 관측의 발전은 천체 관측의 불확실성을 고려하며, 이후 Zhu([37]2016)에 의해 개선되며, 결측 데이터도 고려되고 병렬 연산이 가능하다.이후 Ren et al.[5] (2018)에 의해 외계행성을 검출하는 방법 중 하나로 직접 이미징 분야에 채택되었으며, 특히 별 주위 원반의 직접 이미징을 위한 방법 중 하나이다.

Ren et al.(2018)[5]은 NMF 성분이 순차적으로 구성될 때(즉, 하나씩) 안정성을 증명할 수 있으며, 이는 NMF 모델링 프로세스의 선형성을 가능하게 한다. 선형성 특성은 별 빛과 외부 행성과 별 주위 원반에서 산란된 빛을 분리하는 데 사용된다.

직접적인 영상에서는 10⁵에서 10¹⁰에 전형적인 대비가 밝은 주변 한번도 조명한 다양한 통계적 방법에서하는 외계 행성과 별의 주위를 도는 디스크가 앞으로 모델링adopte야 하지만 외계 행성이나 별의 주위를 도는 디스크로부터 나오는 빛을 보통, over-fitted adopted,[55][56][38]고 있는지 나타냅니다.d회복하기진성 [57][39]플럭스순방향 모델링은 현재 점 [39]선원에 최적화되어 있지만, 확장된 선원, 특히 별 주위 원반과 같은 불규칙한 형태의 구조에는 최적화되어 있지 않다.이러한 상황에서 NMF는 NMF 모델링 계수의 비음성 및 희소성 측면에서 과적합성이 낮기 때문에 생성된 모델에서 계산 집약적인 데이터 재축소가 아닌 몇 가지 스케일링 [5]계수를 사용하여 전방 모델링을 수행할 수 있습니다.

data 귀속

통계에서 결측 데이터를 귀속시키기 위해 NMF는 결측 데이터를 [6]0으로 처리하지 않고 비용 함수를 최소화하면서 결측 데이터를 가져올 수 있습니다.이를 통해 [6]통계에서 데이터 변환에 대해 수학적으로 입증된 방법이 됩니다.Ren et al.(2020)[6]은 먼저 결측 데이터가 비용 함수에서 무시된다는 것을 증명하고 결측 데이터의 영향이 2차 효과만큼 작을 수 있다는 것을 증명함으로써 그러한 접근법을 천문학 분야에 연구하고 적용했다.이들의 작업은 2차원 매트릭스에 초점을 맞추고 있으며, 특히 수학적인 도출, 시뮬레이션된 데이터 귀속 및 온스카이 데이터에 대한 응용이 포함됩니다.

NMF를 사용한 데이터 귀속 절차는 두 단계로 구성됩니다.첫째, NMF 성분이 알려진 경우, Ren et al.(2020)은 데이터 귀속("연구에서 목표 모델링") 중 누락된 데이터의 영향이 2차 효과임을 입증했다.둘째, NMF 구성요소가 불분명한 경우, 저자들은 구성요소 구축 중 누락된 데이터의 영향이 1차에서 2차 효과라는 것을 증명했다.

NMF 컴포넌트를 취득하는 방법에 따라 위의 전자의 스텝은 독립적일 수도 있고 후자의 스텝에 의존할 수도 있습니다.또한 NMF 구성 요소를 더 많이 사용할수록 귀속 품질이 향상될 수 있습니다.[6] 그림은 렌 외 연구진(2020)의 그림 4를 참조하십시오.

텍스트 마이닝

NMF는 텍스트마이닝 어플리케이션에 사용할 수 있습니다.이 프로세스에서 문서항 행렬은 문서 집합에서 다양한 용어(일반적으로 가중치 있는 단어 빈도 정보)의 가중치를 사용하여 구성된다.이 행렬은 항-특징 행렬과 특징-문서 행렬에 포함됩니다.기능은 문서의 내용에서 파생되며 기능-문서 매트릭스는 관련 문서의 데이터 클러스터를 설명합니다.

한 특정 애플리케이션은 PubMed[58]작은 과학적 추상 부분 집합에 계층형 NMF를 사용했습니다.또 다른 연구 그룹은 65,033개의 메시지와 91,133개의 용어가 포함된 Enron 이메일[59] 데이터 세트의 일부를 50개의 [60]클러스터로 클러스터링했습니다.NMF는 인용 데이터에도 적용되었으며, [61]한 예는 영어 위키피디아에서 발신되는 과학 인용을 기반으로 영어 위키피디아 기사 및 과학 저널을 클러스터링했다.

Arora, Ge, Halpern, Mimno, Moitra, Sontag, Wu 및 Zhu(2013)는 NMF를 사용하여 주제 모델을 학습하기 위한 다항식 시간 알고리즘을 제공했다.알고리즘에서는 토픽 행렬이 [42]이러한 설정에서 흔히 볼 수 있는 분리 가능성 조건을 충족한다고 가정합니다.

Hassani, Iranmanesh 및 Mansouri(2019)는 NMF를 사용하여 작동하는 용어 문서 행렬에 대한 특징 응집 방법을 제안했다.이 알고리즘은 용어 문서 행렬을 텍스트 클러스터링에 [62]적합한 더 작은 행렬로 줄입니다.

스펙트럼 데이터 분석

NMF는 스펙트럼 데이터 분석에도 사용된다. 그러한 용도 중 하나는 우주 물체 및 [63]파편 분류에 사용된다.

확장 가능한 인터넷 거리 예측

NMF는 스케일러블인터넷디스턴스(라운드 트립 시간) 예측에 적용됩니다.N개의{\ N호스트가 네트워크의 경우 NMF를 사용하여 O O 측정만 N 엔드 투 엔드 링크의 를 예측할 수 있습니다.이러한 방식은 인터넷 거리 예측 서비스(IDES)[64]에서 처음 도입되었습니다.그 후, 완전 분산형 어프로치로서 Phoenix 네트워크 좌표계를[65] 제안한다.무게 개념을 도입하여 전체적인 예측 정확도를 높입니다.

비정상 음성 노이즈 제거

음성 노이즈 제거는 오디오 신호 처리에서 오랫동안 지속되어 온 문제입니다.노이즈가 정지해 있는 경우는, 노이즈 해소를 위한 알고리즘이 많이 있습니다.예를 들어, Wiener 필터는 가우스 노이즈를 가감하는 데 적합합니다.그러나 소음이 비정상인 경우 비정상 소음의 통계 정보를 추정하기 어렵기 때문에 기존의 노이즈 제거 알고리즘은 대개 성능이 떨어진다.슈미트 [66]NMF를 사용하여 비정상 소음 하에서 음성 노이즈 제거를 수행하며, 이는 기존의 통계적 접근법과는 완전히 다르다.핵심 아이디어는 깨끗한 음성 신호는 음성 사전에 의해 드물게 표시될 수 있지만 비정상 노이즈는 그럴 수 없다는 것이다.마찬가지로 비정상 소음도 소음 사전으로 드물게 나타낼 수 있지만 음성은 그럴 수 없다.

NMF 노이즈 제거 알고리즘은 다음과 같습니다.음성용 사전과 소음용 사전 두 권을 오프라인에서 교육해야 한다.일단 잡음이 있는 음성이 주어지면, 우리는 먼저 단시간-푸리에-변환의 크기를 계산한다.둘째, NMF를 통해 두 부분으로 나누어 한쪽은 음성사전에서 희박하게, 다른 한쪽은 노이즈사전에서 희박하게 나타낼 수 있다.세 번째, 음성사전으로 표현되는 부분은 클린 스피치 추정 부분일 것입니다.

집단 유전학

희박한 NMF는 모집단 유전학에서 개별 혼합물 계수를 추정하거나 모집단 샘플에서 개인의 유전자 클러스터를 검출하거나 표본 게놈에서 유전자 혼합물을 평가하는 데 사용됩니다.인간 유전자 클러스터링에서 NMF 알고리즘은 컴퓨터 프로그램 STRUCTURE와 유사한 추정치를 제공하지만 알고리즘은 계산적으로 더 효율적이며 대규모 모집단 게놈 데이터 세트를 [67]분석할 수 있다.

생물정보학

NMF는 유전자 발현DNA 메틸화 데이터를 클러스터링하고 클러스터 [25][68][69][70]중 가장 대표적인 유전자를 찾기 위해 생체정보학에서 성공적으로 적용되었다.암 돌연변이의 분석에서 그것은 많은 암에서 발생하며 아마도 [71]뚜렷한 원인을 가지고 있는 돌연변이의 일반적인 패턴을 식별하는 데 사용되어 왔다.NMF 기술은 세포 유형, 질병 하위 유형, 모집단 계층화, 조직 구성 및 종양 [72]복제와 같은 변이의 원천을 식별할 수 있습니다.

NMF의 특정 변종, 즉 Non-Negative Matrix Tri-Factorization(NMTF)[73][74] 승인된 약물에 대한 새로운 단백질 표적 및 치료적 징후를 예측하고 시너지 항암제 [75]쌍을 추론하기 위해 약물 용도 변경 작업에 사용되어 왔다.

핵 이미징

이 분야에서는 인자 분석이라고도 불리는 NMF는 SPECT PET 동적 의료 이미징의 영상 시퀀스를 분석하는 데 1980년대부터[76] 사용되어 왔다.NMF의 고유하지 않은 문제는 희소성 [77]제약 조건을 사용하여 해결되었습니다.[78] [79]

현재의 연구

현재(2010년 이후) 비음수 행렬 인수분해 연구는 다음을 포함하지만 이에 국한되지 않는다.

  1. 알고리즘: 요인의 전역 최소값과 요인 [80]초기화를 검색합니다.
  2. 확장성: 웹 스케일 데이터 마이닝에서 흔히 볼 수 있는 백만 개 이상의 행렬을 인수 분해하는 방법. 예를 들어 분산 비음성 행렬 인수 분해(DNMF),[81] 확장 가능한 비음성 행렬 인수 분해(Scalable Non-egative Matrix Factorization), 분산 확률적 특이값 분해([83]DNMF)[82]를 참조하십시오.
  3. 온라인: 새로운 데이터가 들어왔을 때 인수분석을 갱신하는 방법(예: 온라인 CNSC[84] 참조)
  4. 집합적(공동) 인수분해: 다중 뷰 학습(예: 다중 뷰 클러스터링)을 위해 여러 개의 상호 관련 매트릭스를 인수분해합니다. "CoNMF[85] 및 MultiNMF[86]" 참조
  5. Cohen과 Rothblum 1993의 문제: 유리 행렬이 항상 합리적이고 최소 내부 차원의 NMF를 가지고 있는지 여부.최근 이 문제는 부정적인 [87]답변이 나오고 있다.

「 」를 참조해 주세요.

소스 및 외부 링크

메모들

  1. ^ a b c Suvrit Sra; Inderjit S. Dhillon (2006). Generalized Nonnegative Matrix Approximations with Bregman Divergences (PDF). Advances in Neural Information Processing Systems 18. Advances in Neural Information Processing Systems. ISBN 978-0-262-23253-1. Wikidata Q77685465.
  2. ^ Tandon, Rashish; Sra, Suvrit (September 13, 2010). Sparse nonnegative matrix approximation: new formulations and algorithms (PDF) (Report). Max Planck Institute for Biological Cybernetics. Technical Report No. 193.
  3. ^ a b Berné, O.; Joblin, C.; Deville, Y.; Smith, J. D.; Rapacioli, M.; Bernard, J. P.; Thomas, J.; Reach, W.; Abergel, A. (2007-07-01). "Analysis of the emission of very small dust particles from Spitzer spectro-imagery data using blind signal separation methods". Astronomy & Astrophysics. 469 (2): 575–586. doi:10.1051/0004-6361:20066282. ISSN 0004-6361.
  4. ^ a b c Blanton, Michael R.; Roweis, Sam (2007). "K-corrections and filter transformations in the ultraviolet, optical, and near infrared". The Astronomical Journal. 133 (2): 734–754. arXiv:astro-ph/0606170. Bibcode:2007AJ....133..734B. doi:10.1086/510127. S2CID 18561804.
  5. ^ a b c d e f g Ren, Bin; Pueyo, Laurent; Zhu, Guangtun B.; Duchêne, Gaspard (2018). "Non-negative Matrix Factorization: Robust Extraction of Extended Structures". The Astrophysical Journal. 852 (2): 104. arXiv:1712.10317. Bibcode:2018ApJ...852..104R. doi:10.3847/1538-4357/aaa1f2. S2CID 3966513.
  6. ^ a b c d e Ren, Bin; Pueyo, Laurent; Chen, Christine; Choquet, Elodie; Debes, John H; Duechene, Gaspard; Menard, Francois; Perrin, Marshall D. (2020). "Using Data Imputation for Signal Separation in High Contrast Imaging". The Astrophysical Journal. 892 (2): 74. arXiv:2001.00563. Bibcode:2020ApJ...892...74R. doi:10.3847/1538-4357/ab7024. S2CID 209531731.
  7. ^ a b Rainer Gemulla; Erik Nijkamp; Peter J. Haas; Yannis Sismanis (2011). Large-scale matrix factorization with distributed stochastic gradient descent. Proc. ACM SIGKDD Int'l Conf. on Knowledge discovery and data mining. pp. 69–77.
  8. ^ Yang Bao; et al. (2014). TopicMF: Simultaneously Exploiting Ratings and Reviews for Recommendation. AAAI.
  9. ^ Ben Murrell; et al. (2011). "Non-Negative Matrix Factorization for Learning Alignment-Specific Models of Protein Evolution". PLOS ONE. 6 (12): e28898. Bibcode:2011PLoSO...628898M. doi:10.1371/journal.pone.0028898. PMC 3245233. PMID 22216138.
  10. ^ William H. Lawton; Edward A. Sylvestre (1971). "Self modeling curve resolution". Technometrics. 13 (3): 617–633. doi:10.2307/1267173. JSTOR 1267173.
  11. ^ Pentti Paatero; Unto Tapper; Pasi Aalto; Markku Kulmala (1991). "Matrix factorization methods for analysing diffusion battery data". Journal of Aerosol Science. 22: S273–S276. doi:10.1016/S0021-8502(05)80089-8. ISSN 0021-8502. Wikidata Q58065673.
  12. ^ Pentti Paatero; Unto Tapper (June 1994). "Positive matrix factorization: A non-negative factor model with optimal utilization of error estimates of data values". Environmetrics. 5 (2): 111–126. doi:10.1002/ENV.3170050203. ISSN 1180-4009. Wikidata Q29308406.
  13. ^ Pia Anttila; Pentti Paatero; Unto Tapper; Olli Järvinen (1995). "Source identification of bulk wet deposition in Finland by positive matrix factorization". Atmospheric Environment. 29 (14): 1705–1718. Bibcode:1995AtmEn..29.1705A. doi:10.1016/1352-2310(94)00367-T.
  14. ^ a b Daniel D. Lee & H. Sebastian Seung (1999). "Learning the parts of objects by non-negative matrix factorization". Nature. 401 (6755): 788–791. Bibcode:1999Natur.401..788L. doi:10.1038/44565. PMID 10548103. S2CID 4428232.
  15. ^ a b Daniel D. Lee & H. Sebastian Seung (2001). Algorithms for Non-negative Matrix Factorization (PDF). Advances in Neural Information Processing Systems 13: Proceedings of the 2000 Conference. MIT Press. pp. 556–562.
  16. ^ a b c C. 딩, X.그, H.D. Simon (2005)."비음성 매트릭스 인수분해와 스펙트럼 군집의 등가성에 대하여"SIAM 국제 회의.데이터 마이닝, 페이지 606-610.2005년 5월
  17. ^ Ding C, Li Y, Peng W (2008). "On the equivalence between non-negative matrix factorization and probabilistic latent semantic indexing" (PDF). Computational Statistics & Data Analysis. 52 (8): 3913–3927. doi:10.1016/j.csda.2008.01.011. Archived from the original (PDF) on 2016-03-04.
  18. ^ a b C Ding, T Li, MI Jordan, 볼록 및 반음성 매트릭스 인수분해, 패턴 분석 및 머신 인텔리전스에 관한 IEEE 트랜잭션, 32, 45-55, 2010
  19. ^ Berman, A.; R.J. Plemmons (1974). "Inverses of nonnegative matrices". Linear and Multilinear Algebra. 2 (2): 161–172. doi:10.1080/03081087408817055.
  20. ^ A. Berman; R.J. Plemmons (1994). Nonnegative matrices in the Mathematical Sciences. Philadelphia: SIAM.
  21. ^ Thomas, L.B. (1974). "Problem 73-14, Rank factorization of nonnegative matrices". SIAM Rev. 16 (3): 393–394. doi:10.1137/1016064.
  22. ^ Vavasis, S.A. (2009). "On the complexity of nonnegative matrix factorization". SIAM J. Optim. 20 (3): 1364–1377. arXiv:0708.4149. doi:10.1137/070709967. S2CID 7150400.
  23. ^ Zhang, T.; Fang, B.; Liu, W.; Tang, Y. Y.; He, G.; Wen, J. (2008). "Total variation norm-based nonnegative matrix factorization for identifying discriminant representation of image patterns". Neurocomputing. 71 (10–12): 1824–1831. doi:10.1016/j.neucom.2008.01.022.
  24. ^ a b Hoyer, Patrik O. (2002). Non-negative sparse coding. Proc. IEEE Workshop on Neural Networks for Signal Processing. arXiv:cs/0202009.
  25. ^ a b Leo Taslaman & Björn Nilsson (2012). "A framework for regularized non-negative matrix factorization, with application to the analysis of gene expression data". PLOS One. 7 (11): e46331. Bibcode:2012PLoSO...746331T. doi:10.1371/journal.pone.0046331. PMC 3487913. PMID 23133590.
  26. ^ Hsieh, C. J.; Dhillon, I. S. (2011). Fast coordinate descent methods with variable selection for non-negative matrix factorization (PDF). Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD '11. p. 1064. doi:10.1145/2020408.2020577. ISBN 9781450308137.
  27. ^ http://www.ijcai.org/papers07/Papers/IJCAI07-432.pdf[베어 URL PDF]
  28. ^ Fung, Yik-Hing; Li, Chun-Hung; Cheung, William K. (2 November 2007). Online Discussion Participation Prediction Using Non-negative Matrix Factorization. Wi-Iatw '07. IEEE Computer Society. pp. 284–287. ISBN 9780769530284 – via dl.acm.org.
  29. ^ Naiyang Guan; Dacheng Tao; Zhigang Luo & Bo Yuan (July 2012). "Online Nonnegative Matrix Factorization With Robust Stochastic Approximation". IEEE Transactions on Neural Networks and Learning Systems. 23 (7): 1087–1099. doi:10.1109/TNNLS.2012.2197827. PMID 24807135. S2CID 8755408.
  30. ^ a b Lin, Chih-Jen (2007). "Projected Gradient Methods for Nonnegative Matrix Factorization" (PDF). Neural Computation. 19 (10): 2756–2779. CiteSeerX 10.1.1.308.9135. doi:10.1162/neco.2007.19.10.2756. PMID 17716011. S2CID 2295736.
  31. ^ Lin, Chih-Jen (2007). "On the Convergence of Multiplicative Update Algorithms for Nonnegative Matrix Factorization". IEEE Transactions on Neural Networks. 18 (6): 1589–1596. CiteSeerX 10.1.1.407.318. doi:10.1109/TNN.2007.895831. S2CID 2183630.
  32. ^ Hyunsoo Kim & Haesun Park (2008). "Nonnegative Matrix Factorization Based on Alternating Nonnegativity Constrained Least Squares and Active Set Method" (PDF). SIAM Journal on Matrix Analysis and Applications. 30 (2): 713–730. CiteSeerX 10.1.1.70.3485. doi:10.1137/07069239x.
  33. ^ Naiyang Guan; Dacheng Tao; Zhigang Luo; Bo Yuan (June 2012). "NeNMF: An Optimal Gradient Method for Nonnegative Matrix Factorization". IEEE Transactions on Signal Processing. 60 (6): 2882–2898. Bibcode:2012ITSP...60.2882G. doi:10.1109/TSP.2012.2190406. S2CID 8143231.
  34. ^ Jingu Kim & Haesun Park (2011). "Fast Nonnegative Matrix Factorization: An Active-set-like Method and Comparisons". SIAM Journal on Scientific Computing. 58 (6): 3261–3281. CiteSeerX 10.1.1.419.798. doi:10.1137/110821172.
  35. ^ Jingu Kim; Yunlong He & Haesun Park (2013). "Algorithms for nonnegative matrix and tensor factorizations: A unified view based on block coordinate descent framework" (PDF). Journal of Global Optimization. 33 (2): 285–319. doi:10.1007/s10898-013-0035-4. S2CID 11197117.
  36. ^ Ding, C.; He, X. & Simon, H.D. (2005). "On the equivalence of nonnegative matrix factorization and spectral clustering". Proc. SIAM Data Mining Conf. Vol. 4. pp. 606–610. doi:10.1137/1.9781611972757.70. ISBN 978-0-89871-593-4.
  37. ^ a b Zhu, Guangtun B. (2016-12-19). "Nonnegative Matrix Factorization (NMF) with Heteroscedastic Uncertainties and Missing data". arXiv:1612.06037 [astro-ph.IM].
  38. ^ a b Soummer, Rémi; Pueyo, Laurent; Larkin, James (2012). "Detection and Characterization of Exoplanets and Disks Using Projections on Karhunen-Loève Eigenimages". The Astrophysical Journal Letters. 755 (2): L28. arXiv:1207.4197. Bibcode:2012ApJ...755L..28S. doi:10.1088/2041-8205/755/2/L28. S2CID 51088743.
  39. ^ a b c Pueyo, Laurent (2016). "Detection and Characterization of Exoplanets using Projections on Karhunen Loeve Eigenimages: Forward Modeling". The Astrophysical Journal. 824 (2): 117. arXiv:1604.06097. Bibcode:2016ApJ...824..117P. doi:10.3847/0004-637X/824/2/117. S2CID 118349503.
  40. ^ Campbell, S.L.; G.D. Poole (1981). "Computing nonnegative rank factorizations". Linear Algebra Appl. 35: 175–182. doi:10.1016/0024-3795(81)90272-x.
  41. ^ Kalofolias, V.; Gallopoulos, E. (2012). "Computing symmetric nonnegative rank factorizations" (PDF). Linear Algebra Appl. 436 (2): 421–435. doi:10.1016/j.laa.2011.03.016.
  42. ^ a b Arora, Sanjeev; Ge, Rong; Halpern, Yoni; Mimno, David; Moitra, Ankur; Sontag, David; Wu, Yichen; Zhu, Michael (2013). A practical algorithm for topic modeling with provable guarantees. Proceedings of the 30th International Conference on Machine Learning. arXiv:1212.4777. Bibcode:2012arXiv1212.4777A.
  43. ^ Lee, Daniel D.; Sebastian, Seung, H. (1999). "Learning the parts of objects by non-negative matrix factorization" (PDF). Nature. 401 (6755): 788–791. Bibcode:1999Natur.401..788L. doi:10.1038/44565. PMID 10548103. S2CID 4428232.
  44. ^ Wray Buntine (2002). Variational Extensions to EM and Multinomial PCA (PDF). Proc. European Conference on Machine Learning (ECML-02). LNAI. Vol. 2430. pp. 23–34.
  45. ^ Eric Gaussier & Cyril Goutte (2005). Relation between PLSA and NMF and Implications (PDF). Proc. 28th international ACM SIGIR conference on Research and development in information retrieval (SIGIR-05). pp. 601–602. Archived from the original (PDF) on 2007-09-28. Retrieved 2007-01-29.
  46. ^ Ron Zass와 Amnon Shashua(2005)."하드확률적 클러스터링에 대한 통일적 접근법"2005년 10월 중국 베이징 국제컴퓨터비전회의(ICCV)
  47. ^ Max Welling; et al. (2004). Exponential Family Harmoniums with an Application to Information Retrieval. NIPS.
  48. ^ Pentti Paatero (1999). "The Multilinear Engine: A Table-Driven, Least Squares Program for Solving Multilinear Problems, including the n-Way Parallel Factor Analysis Model". Journal of Computational and Graphical Statistics. 8 (4): 854–888. doi:10.2307/1390831. JSTOR 1390831.
  49. ^ Max Welling & Markus Weber (2001). "Positive Tensor Factorization". Pattern Recognition Letters. 22 (12): 1255–1261. Bibcode:2001PaReL..22.1255W. CiteSeerX 10.1.1.21.24. doi:10.1016/S0167-8655(01)00070-8.
  50. ^ Jingu Kim & Haesun Park (2012). Fast Nonnegative Tensor Factorization with an Active-set-like Method (PDF). High-Performance Scientific Computing: Algorithms and Applications. Springer. pp. 311–326.
  51. ^ Kenan Yilmaz; A. Taylan Cemgil & Umut Simsekli (2011). Generalized Coupled Tensor Factorization (PDF). NIPS.
  52. ^ Vamsi K. Potluru; Sergey M. Plis; Morten Morup; Vince D. Calhoun & Terran Lane (2009). Efficient Multiplicative updates for Support Vector Machines. Proceedings of the 2009 SIAM Conference on Data Mining (SDM). pp. 1218–1229.
  53. ^ Wei Xu; Xin Liu & Yihong Gong (2003). Document clustering based on non-negative matrix factorization. Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval. New York: Association for Computing Machinery. pp. 267–273.
  54. ^ Eggert, J.; Korner, E. (2004). "Sparse coding and NMF". 2004 IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541). Vol. 4. pp. 2529–2533. doi:10.1109/IJCNN.2004.1381036. ISBN 978-0-7803-8359-3. S2CID 17923083.
  55. ^ Lafrenière, David; Maroid, Christian; Doyon, René; Barman, Travis (2009). "HST/NICMOS Detection of HR 8799 b in 1998". The Astrophysical Journal Letters. 694 (2): L148. arXiv:0902.3247. Bibcode:2009ApJ...694L.148L. doi:10.1088/0004-637X/694/2/L148. S2CID 7332750.
  56. ^ Amara, Adam; Quanz, Sascha P. (2012). "PYNPOINT: an image processing package for finding exoplanets". Monthly Notices of the Royal Astronomical Society. 427 (2): 948. arXiv:1207.6637. Bibcode:2012MNRAS.427..948A. doi:10.1111/j.1365-2966.2012.21918.x. S2CID 119200505.
  57. ^ Wahhaj, Zahed; Cieza, Lucas A.; Mawet, Dimitri; Yang, Bin; Canovas, Hector; de Boer, Jozua; Casassus, Simon; Ménard, François; Schreiber, Matthias R.; Liu, Michael C.; Biller, Beth A.; Nielsen, Eric L.; Hayward, Thomas L. (2015). "Improving signal-to-noise in the direct imaging of exoplanets and circumstellar disks with MLOCI". Astronomy & Astrophysics. 581 (24): A24. arXiv:1502.03092. Bibcode:2015A&A...581A..24W. doi:10.1051/0004-6361/201525837. S2CID 20174209.
  58. ^ Nielsen, Finn Årup; Balslev, Daniela; Hansen, Lars Kai (2005). "Mining the posterior cingulate: segregation between memory and pain components" (PDF). NeuroImage. 27 (3): 520–522. doi:10.1016/j.neuroimage.2005.04.034. PMID 15946864. S2CID 18509039.
  59. ^ Cohen, William (2005-04-04). "Enron Email Dataset". Retrieved 2008-08-26.
  60. ^ Berry, Michael W.; Browne, Murray (2005). "Email Surveillance Using Non-negative Matrix Factorization". Computational and Mathematical Organization Theory. 11 (3): 249–264. doi:10.1007/s10588-005-5380-5. S2CID 16249147.
  61. ^ Nielsen, Finn Årup (2008). Clustering of scientific citations in Wikipedia. Wikimania. arXiv:0805.1154.
  62. ^ Hassani, Ali; Iranmanesh, Amir; Mansouri, Najme (2019-11-12). "Text Mining using Nonnegative Matrix Factorization and Latent Semantic Analysis". arXiv:1911.04705 [cs.LG].
  63. ^ Berry, Michael W.; Browne, Murray; Langville, Amy N.; Paucac, V. Paul; Plemmonsc, Robert J. (15 September 2007). "Algorithms and Applications for Approximate Nonnegative Matrix Factorization". Computational Statistics & Data Analysis. 52 (1): 155–173. doi:10.1016/j.csda.2006.11.006.
  64. ^ Yun Mao; Lawrence Saul & Jonathan M. Smith (2006). "IDES: An Internet Distance Estimation Service for Large Networks". IEEE Journal on Selected Areas in Communications. 24 (12): 2273–2284. CiteSeerX 10.1.1.136.3837. doi:10.1109/JSAC.2006.884026. S2CID 12931155.
  65. ^ Yang Chen; Xiao Wang; Cong Shi; et al. (2011). "Phoenix: A Weight-based Network Coordinate System Using Matrix Factorization" (PDF). IEEE Transactions on Network and Service Management. 8 (4): 334–347. CiteSeerX 10.1.1.300.2851. doi:10.1109/tnsm.2011.110911.100079. S2CID 8079061. Archived from the original (PDF) on 2011-11-14.
  66. ^ 슈미트, M.N., J. Larsen, F.T. Xiao. (2007)"비음성 희박 부호화를 이용한 풍절음 감소", 신호 처리를 위한 기계 학습, IEEE 워크숍, 431–436
  67. ^ Frichot E, Mathieu F, Trouillon T, Bouchard G, Francois O (2014). "Fast and efficient estimation of individual ancestry coefficients". Genetics. 196 (4): 973–983. doi:10.1534/genetics.113.160572. PMC 3982712. PMID 24496008.
  68. ^ Devarajan, K. (2008). "Nonnegative Matrix Factorization: An Analytical and Interpretive Tool in Computational Biology". PLOS Computational Biology. 4 (7): e1000029. Bibcode:2008PLSCB...4E0029D. doi:10.1371/journal.pcbi.1000029. PMC 2447881. PMID 18654623.
  69. ^ Hyunsoo Kim & Haesun Park (2007). "Sparse non-negative matrix factorizations via alternating non-negativity-constrained least squares for microarray data analysis". Bioinformatics. 23 (12): 1495–1502. doi:10.1093/bioinformatics/btm134. PMID 17483501.
  70. ^ Schwalbe, E. (2013). "DNA methylation profiling of medulloblastoma allows robust sub-classification and improved outcome prediction using formalin-fixed biopsies". Acta Neuropathologica. 125 (3): 359–371. doi:10.1007/s00401-012-1077-2. PMC 4313078. PMID 23291781.
  71. ^ Alexandrov, Ludmil B.; Nik-Zainal, Serena; Wedge, David C.; Campbell, Peter J.; Stratton, Michael R. (2013-01-31). "Deciphering signatures of mutational processes operative in human cancer". Cell Reports. 3 (1): 246–259. doi:10.1016/j.celrep.2012.12.008. ISSN 2211-1247. PMC 3588146. PMID 23318258.
  72. ^ Stein-O’Brien, Genevieve L.; Arora, Raman; Culhane, Aedin C.; Favorov, Alexander V.; Garmire, Lana X.; Greene, Casey S.; Goff, Loyal A.; Li, Yifeng; Ngom, Aloune; Ochs, Michael F.; Xu, Yanxun (2018-10-01). "Enter the Matrix: Factorization Uncovers Knowledge from Omics". Trends in Genetics. 34 (10): 790–805. doi:10.1016/j.tig.2018.07.003. ISSN 0168-9525. PMC 6309559. PMID 30143323.
  73. ^ Ding; Li; Peng; Park (2006). "Orthogonal nonnegative matrix t-factorizations for clustering". Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining: 126–135. doi:10.1145/1150402.1150420. ISBN 1595933395. S2CID 165018.
  74. ^ Ceddia; Pinoli; Ceri; Masseroli (2020). "Matrix factorization-based technique for drug repurposing predictions". IEEE Journal of Biomedical and Health Informatics. 24 (11): 3162–3172. doi:10.1109/JBHI.2020.2991763. PMID 32365039. S2CID 218504587.
  75. ^ Pinoli; Ceddia; Ceri; Masseroli (2021). "Predicting drug synergism by means of non-negative matrix tri-factorization". IEEE/ACM Transactions on Computational Biology and Bioinformatics. PP: 1. doi:10.1109/TCBB.2021.3091814. PMID 34166199. S2CID 235634059.
  76. ^ DiPaola; Bazin; Aubry; Aurengo; Cavailloles; Herry; Kahn (1982). "Handling of dynamic sequences in nuclear medicine". IEEE Trans Nucl Sci. 29 (4): 1310–21. Bibcode:1982ITNS...29.1310D. doi:10.1109/tns.1982.4332188. S2CID 37186516.
  77. ^ Sitek; Gullberg; Huesman (2002). "Correction for ambiguous solutions in factor analysis using a penalized least squares objective". IEEE Trans Med Imaging. 21 (3): 216–25. doi:10.1109/42.996340. PMID 11989846. S2CID 6553527.
  78. ^ Boutchko; Mitra; Baker; Jagust; Gullberg (2015). "Clustering Initiated Factor Analysis (CIFA) Application for Tissue Classification in Dynamic Brain PET". Journal of Cerebral Blood Flow and Metabolism. 35 (7): 1104–11. doi:10.1038/jcbfm.2015.69. PMC 4640278. PMID 25899294.
  79. ^ Abdalah; Boutchko; Mitra; Gullberg (2015). "Reconstruction of 4-D Dynamic SPECT Images From Inconsistent Projections Using a Spline Initialized FADS Algorithm (SIFADS)". IEEE Trans Med Imaging. 34 (1): 216–18. doi:10.1109/TMI.2014.2352033. PMID 25167546. S2CID 11060831.
  80. ^ C. Boutsidis & E. Gallopoulos (2008). "SVD based initialization: A head start for nonnegative matrix factorization". Pattern Recognition. 41 (4): 1350–1362. Bibcode:2008PatRe..41.1350B. CiteSeerX 10.1.1.137.8281. doi:10.1016/j.patcog.2007.09.010.
  81. ^ Chao Liu; Hung-chih Yang; Jinliang Fan; Li-Wei He & Yi-Min Wang (2010). "Distributed Nonnegative Matrix Factorization for Web-Scale Dyadic Data Analysis on MapReduce" (PDF). Proceedings of the 19th International World Wide Web Conference.
  82. ^ Jiangtao Yin; Lixin Gao & Zhongfei (Mark) Zhang (2014). "Scalable Nonnegative Matrix Factorization with Block-wise Updates" (PDF). Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases.
  83. ^ "Apache Mahout". mahout.apache.org. Retrieved 2019-12-14.
  84. ^ Dong Wang; Ravichander Vipperla; Nick Evans; Thomas Fang Zheng (2013). "Online Non-Negative Convolutive Pattern Learning for Speech Signals" (PDF). IEEE Transactions on Signal Processing. 61 (1): 44–56. Bibcode:2013ITSP...61...44W. CiteSeerX 10.1.1.707.7348. doi:10.1109/tsp.2012.2222381. S2CID 12530378. Archived from the original (PDF) on 2015-04-19. Retrieved 2015-04-19.
  85. ^ Xiangnan He; Min-Yen Kan; Peichu Xie & Xiao Chen (2014). "Comment-based Multi-View Clustering of Web 2.0 Items" (PDF). Proceedings of the 23rd International World Wide Web Conference. Archived from the original (PDF) on 2015-04-02. Retrieved 2015-03-22.
  86. ^ Jialu Liu; Chi Wang; Jing Gao & Jiawei Han (2013). Multi-View Clustering via Joint Nonnegative Matrix Factorization (PDF). Proceedings of SIAM Data Mining Conference. pp. 252–260. CiteSeerX 10.1.1.301.1771. doi:10.1137/1.9781611972832.28. ISBN 978-1-61197-262-7.
  87. ^ Chistikov, Dmitry; Kiefer, Stefan; Marušić, Ines; Shirmohammadi, Mahsa; Worrell, James (2016-05-22). "Nonnegative Matrix Factorization Requires Irrationality". arXiv:1605.06848 [cs.CC].

다른이들