비음수 행렬 인수분해
Non-negative matrix factorization시리즈의 일부 |
기계 학습 및 데이터 마이닝 |
---|
![]() |
비음수 행렬[1][2] 인수분해(NMF 또는 NNMF)는 다변량 분석 및 선형 대수학에서 행렬 V를 두 행렬 W와 H로 인수분해하는 알고리즘의 그룹이며, 세 행렬 모두 음의 요소가 없다는 특성을 가지고 있습니다.이러한 비음수성으로 인해 결과 행렬을 검사하기가 더 쉬워집니다.또, 오디오 스펙트로그램의 처리나 근육 활동등의 애플리케이션에서는, 비부정성은 고려중의 데이터에 고유합니다.이 문제는 일반적으로 정확하게 해결할 수 없기 때문에 일반적으로 수치로 근사됩니다.
NMF는 천문학,[3][4][5] 컴퓨터 비전, 문서 클러스터링,[1] 누락 데이터 변환,[6] 화학 측정학,[9] 오디오 신호 처리, 추천 시스템 [7][8]및 생물 정보학 등의 분야에서 응용 프로그램을 찾습니다.
역사
화학측정학에서 음이 아닌 행렬 인수분해는 "자체 모델링 곡선 분해능"[10]이라는 이름으로 오랜 역사를 가지고 있습니다.이 프레임워크에서 오른쪽 행렬의 벡터는 이산 벡터라기보다는 연속 곡선입니다.또한 1990년대에 핀란드의 한 연구자 그룹에 의해 양의 행렬 [11][12][13]인수분해라는 이름으로 비음수 행렬 인수분해에 대한 초기 연구가 수행되었다.이는 Lee와 Seung이 알고리즘의 특성을 조사하고 두 가지 유형의 [14][15]인수분해를 위한 간단하고 유용한 알고리즘을 발표한 후 비음수 행렬 인수분해로 더 널리 알려지게 되었다.
배경
행렬 V를 행렬 W와 H의 곱으로 하자.
행렬 곱셈은 H의 열에 의해 공급되는 계수를 이용하여 W의 열 벡터의 선형 조합으로서 V의 열 벡터를 계산하는 것으로 실시할 수 있다.즉, V의 각 열은 다음과 같이 계산할 수 있습니다.
여기서i v는 곱 행렬 V의 i번째 열 벡터이고i h는 행렬 H의 i번째 열 벡터이다.
행렬을 곱할 때 인자 행렬의 치수는 곱 행렬의 치수에 비해 상당히 낮을 수 있으며, 이 특성이 NMF의 기초를 형성합니다. NMF는 원래 행렬에 비해 치수가 상당히 줄어든 인자를 생성합니다.예를 들어 V가 m × n 행렬, W가 m × p 행렬, H가 p × n 행렬이면 p는 m과 n 둘 다보다 유의하게 작을 수 있다.
다음으로 텍스트 마이닝애플리케이션에 근거한 예를 나타냅니다.
- 입력 행렬(인수할 행렬)은 단어가 행에 있고 문서가 열에 있는 10000개의 행과 500개의 열이 있는 V라고 합니다.즉, 500개의 문서가 10,000개의 단어로 색인화되어 있습니다.따라서 V의 열 벡터 V는 문서를 나타냅니다.
- 알고리즘에 10000행과 10열의 특징 행렬 W와 10행과 500열의 계수 행렬 H를 생성하기 위해 10개의 특징을 찾도록 요청했다고 가정합니다.
- W와 H의 곱은 10000행과 500열의 행렬이며, 입력 행렬 V와 모양이 같으며 인수 분해가 성공했다면 입력 행렬 V에 대한 합리적인 근사치입니다.
- 위의 행렬 곱셈 처리로부터, 곱셈 행렬 WH의 각 열은 특징 행렬 W의 10개 열 벡터와 계수 행렬 H에 의해 공급되는 계수의 선형 조합이 된다.
이 예의 각 원본 문서는 숨겨진 기능의 작은 세트에서 작성된 것으로 간주할 수 있기 때문에 이 마지막 포인트는 NMF의 기초가 됩니다.NMF는 이러한 기능을 생성합니다.
특징 행렬 W의 각 특징(컬럼 벡터)을 단어 집합으로 구성된 문서 원형으로 생각하면 유용합니다. 여기서 각 단어의 셀 값이 특징에서 단어의 순위를 정의합니다.단어의 셀 값이 높을수록 피쳐에서 단어의 순위가 높아집니다.계수행렬 H 내의 열은 특징에 대한 문서의 순위를 정의하는 셀 값으로 원본 문서를 나타낸다.이제 각 피쳐가 H에 있는 문서 열의 피쳐 셀 값에 따라 가중치가 부여되는 피쳐(W에 있는 컬럼 벡터)의 선형 조합을 통해 입력 매트릭스에서 문서(컬럼 벡터)를 재구성할 수 있습니다.
클러스터링 속성
NMF는 고유한 클러스터링 [16]특성을 가지고 있습니다. 즉, 입력 V ( ,…, ){ = (의 열을 자동으로 클러스터링합니다.
보다 구체적으로, V \ \에 V{\의 근사치는 Frobenius를 하여 W {\ W 및 {
- H , \ \ \ V - \ \ { F} 0 . \ displaystyle \0 ,\ 0. } ,
에 직교 구속을 더 가하면(, H T I \ \}= 위의 최소화는 수학적으로 k-ME [16]클러스터링의 최소화와 동등하다.
또한 된H {\ H는 클러스터 멤버쉽을 부여합니다., kj > i H{kj} > \_{ij의 경우, 이는 입력 v \}가 k에 을 .된W {\ W는 클러스터 중심을 나타냅니다.즉, k {\ k -번째 열은 을 k{\ k -번째 클러스터 중심을 나타냅니다.이 중심체의 표현은 볼록 NMF에 의해 크게 향상될 수 있다.
직교성 조건 H \ \^{T} 은 (는) 명시적으로 부과되지 않고, 직교성이 크게 유지되며, 클러스터링 속성도 유지됩니다.클러스터링은 대부분의 NMF [citation needed]데이터 마이닝 애플리케이션의 주요 목적입니다.
사용하는 오류 함수가 Kullback-Leibler 발산인 경우 NMF는 일반적인 문서 클러스터링 [17]방법인 확률론적 잠재의미분석(PLSA)과 동일합니다.
종류들
근사 비음수 행렬 인수 분해
일반적으로 W의 열 수와 NMF의 H 행 수를 선택하므로 곱 WH는 V에 대한 근사치가 됩니다.그러면 V의 완전 분해는 음이 아닌 두 행렬 W와 H와 잔차 U에 해당된다: V = WH + U. 잔차 행렬의 원소는 음수이거나 양수일 수 있다.
W와 H가 V보다 작으면 저장 및 조작이 쉬워집니다.V를 더 작은 행렬 W와 H로 인수분해하는 또 다른 이유는 V의 원소를 상당히 적은 데이터로 근사적으로 나타낼 수 있다면 데이터에 잠재된 구조를 추론해야 하기 때문이다.
볼록 비음수 행렬 인수분해
표준 NMF에서는 매트릭스 팩터 W , R ∈ W+m × k ∈ 。즉, W는 그 공간 내의 임의의 것이 될 수 있습니다.볼록 NMF는[18] W의 열을 입력 데이터 벡터 ,… , v)의 볼록한 조합으로 제한합니다.{ displaystyle ( _ { , \ ,_ { } }}이것에 의해, W의 데이터 표현 품질이 큰폭으로 향상됩니다.또, 그 결과 생기는 행렬 계수 H는 보다 희박하고 직교하게 된다.
비음수 순위 인수분해
V의 비음수 순위가 실제 순위와 동일한 경우 V = WH를 비음수 순위 인수분해(NRF)[19][20][21]라고 한다.V의 NRF를 찾는 문제는 존재하는 경우 NP-hard로 [22]알려져 있습니다.
다양한 비용 기능 및 정규화
음이 아닌 행렬 인수 분해에는 여러 가지 유형이 있습니다.다른 유형은 V와 WH 사이의 차이를 측정하기 위해 다른 비용 함수를 사용하고 W 및/또는 H [1]행렬의 정규화에 의해 발생할 수 있다.
Lee와 Seung에 의해 연구된 두 가지 간단한 발산 함수는 제곱 오차(또는 프로베니우스 노름)와 양의 행렬에 대한 Kullback-Leibler 발산의 확장이다(원래 Kullback-Leibler 발산은 확률 분포에서 정의된다).각 다이버전스는 다른 NMF 알고리즘으로 이어지며, 일반적으로 반복적인 업데이트 규칙을 사용하여 다이버전스를 최소화합니다.
NMF의 제곱 오차 버전의 인수분해 문제는 다음과 같이 나타낼 수 있습니다. V {\이 주어진 경우 함수를 최소화하는 음이 아닌 행렬 W 및 H를 찾으십시오.
또 다른 유형의 영상용 NMF는 총 변동 [23]규범에 기초합니다.
L1 정규화(Akin to Lasso)가 평균 제곱 오류 비용 함수와 함께 NMF에 추가되면, 그 결과 발생하는 문제는 NMF라고도 [26]할 수 있지만, 스파스 부호화 문제와 [24][25]유사하기 때문에 비음성 스파스 부호화라고 불립니다.
온라인 NMF
많은 표준 NMF 알고리즘이 모든 데이터를 함께 분석합니다. 즉, 전체 매트릭스를 처음부터 사용할 수 있습니다.이는 데이터가 너무 많아 메모리에 들어가지 않거나 데이터가 스트리밍 방식으로 제공되는 애플리케이션에서는 만족스럽지 못할 수 있습니다.이러한 용도 중 하나는 권장 시스템에서 협업 필터링을 하기 위한 것입니다.이 시스템에서는 사용자가 많고 권장할 항목이 많을 수 있으며 시스템에 사용자 또는 항목이 하나 추가되었을 때 모든 것을 재계산하는 것은 비효율적입니다.이러한 경우 최적화를 위한 비용 함수는 표준 NMF와 같을 수도 있고 아닐 수도 있지만 알고리즘은 다소 [27][28][29]다를 필요가 있습니다.
알고리즘
W와 H는 몇 가지 방법으로 찾을 수 있습니다.Lee와 Seung의 곱셈 업데이트[15] 규칙은 구현이 단순하기 때문에 인기 있는 방법이었습니다.이 알고리즘은 다음과 같습니다.
- 초기화: W 및 H는 음이 아닙니다.
- 그런 다음n\n을 반복 인덱스로 다음을 계산하여 W와 H의 값을 업데이트합니다.
- 그리고.
- W와 H가 안정될 때까지.
업데이트는 행렬 곱셈이 아닌 요소 단위로 수행됩니다.
와 H의 곱셈 계수, 즉 W H {\{\ \} {\ { \ { \mathbf} ^{\mathbf} \mathbf} \mathbf {WF} {WF} {WF} {WF} {W}에 주목한다. \ \^{\ 항은 \일 때 1의 행렬입니다
최근에는 다른 알고리즘도 개발되고 있습니다.일부 접근법은 음이 아닌 최소 제곱을 번갈아 하는 것에 기초한다. 이러한 알고리즘의 각 단계에서 첫 번째 H는 고정되고 W는 음이 아닌 최소 제곱 솔버에 의해 발견되며, 그 다음 W는 고정되고 H는 유사하게 발견된다.일부 NMF 변형은 W와 [24]H 중 하나를 정규화하기 때문에 W와 H에 대한 해결 절차는 동일하거나[30] 다를 수 있다. 특정 접근법에는 투영 경사 강하법,[30][31] 액티브 세트 방법,[7][32] 최적 경사법 [33]및 [35]블록 주 피벗[34] 방법이 포함된다.
현재의 알고리즘은 비용 함수의 글로벌 최소값이 아닌 로컬 최소값만 찾는다는 점에서 차선책입니다.이 문제가 [36]NP-완전한 것으로 알려진 k-평균 클러스터링 문제를 일반화하는 것으로 나타났기 때문에 입증 가능한 최적 알고리즘은 가까운 미래에 있을 것 같지 않다.그러나 다른 많은 데이터 마이닝 애플리케이션과 마찬가지로 로컬 최소값이 여전히 유용할 수 있습니다.

시퀀셜 NMF
NMF 성분(W와 H)의 순차적 구성은 [37]천문학에서 NMF와 주요 성분 분석(PCA)을 관련짓기 위해 최초로 사용되었다.PCA 컴포넌트의 기여도는 대응하는 고유값의 크기에 따라 순위가 매겨집니다. NMF의 경우 컴포넌트를 하나씩 (순차적으로) 구성했을 때 경험적으로 순위를 매길 수 있습니다. 즉, (+ 1){(번째 컴포넌트를첫 의 컴포넌트로 학습할 수 있습니다.
순차적 NMF 성분의 기여는 고유값의 그래프를 사용하여 PCA의 응용 프로그램인 카르후넨-로브 정리와 비교할 수 있다.PCA를 사용하는 컴포넌트 수의 일반적인 선택은 "elbow" 포인트를 기반으로 합니다.그러면 평탄한 고원의 존재는 PCA가 데이터를 효율적으로 캡처하지 못하고 있음을 나타냅니다.마지막으로 랜덤 노이즈의 포착을 반영한 급격한 저하가 발생하여 과적합 [38][39]상태에 빠집니다.순차 NMF의 경우, 고유값의 플롯은 곡선이 연속적으로 감소하는 부분 잔차 분산 곡선의 플롯에 의해 근사되며, 순차 NMF의 과적합이 덜하다는 것을 나타내는 [5]PCA보다 높은 수준으로 수렴된다.
정확한 NMF
행렬 V에 대한 추가 제약 조건이 유지되면 NMF의 변형에 대한 정확한 솔루션을 기대할 수 있습니다(다항 시간).1981년 캠벨과 풀은 [40]V가 등급과 동일한 등급의 단항 하위 행렬을 포함할 경우 비음수 순위 인수분해를 해결하기 위한 다항식 시간 알고리즘을 제공했다.칼로폴리아스와 갈로풀로스(2012)[41]는 V가 대칭이고 순위 r의 대각선 주요 하위 행렬을 포함하는 이 문제의 대칭적 대응물을 해결했다.조밀한 경우 알고리즘은2 O(rm) 시간으로 실행됩니다.Arora, Ge, Halpern, Mimno, Moitra, Sontag, Wu 및 Zhu(2013)는 인자 중 하나가 분리 가능성 [42]조건을 충족하는 경우에 작동하는 정확한 NMF에 대한 다항식 시간 알고리즘을 제공한다.
다른 기술과의 관계
Learning of objects by non-negative matrix factorization에서 Lee와[43] Seung은 주로 이미지의 부품 기반 분해를 위한 NMF를 제안했다.NMF를 벡터 양자화 및 주성분 분석과 비교하고, 세 가지 기술이 인수분해로 작성될 수 있지만, 서로 다른 제약 조건을 구현하여 서로 다른 결과를 도출한다는 것을 보여준다.
NMF의 일부 유형은 "다항식 PCA"[44]라고 불리는 보다 일반적인 확률론적 모델의 인스턴스인 것으로 나중에 밝혀졌다.Kullback-Leibler 분산을 최소화하여 NMF를 얻을 경우, 실제로는 최대우도 추정에 의해 훈련되는 다항식 PCA의 또 다른 인스턴스인 확률적 잠재 의미 분석과 [45]동등하다.이 방법은 텍스트 데이터를 분석하고 클러스터링하는 데 일반적으로 사용되며 잠복 클래스 모델과도 관련이 있습니다.
최소 제곱 목표를 갖는 NMF는 K-평균 군집 분석의 완화된 형태에 해당합니다. 행렬 요인 W에는 군집 중심이 포함되어 있고 H에는 군집 구성 [16][46]지표가 포함되어 있습니다.이를 통해 데이터 클러스터링에 NMF를 사용하기 위한 이론적 기반이 제공됩니다.그러나 k-평균은 중심체에 비음성을 강요하지 않으므로, 가장 가까운 유사점은 사실 "반NMF"[18]이다.
NMF는 관찰된 랜덤 변수의 레이어와 숨겨진 랜덤 [47]변수의 레이어를 가진 2층 지향 그래픽 모델로 볼 수 있습니다.
NMF는 행렬을 넘어 임의의 [48][49][50]차수의 텐서까지 확장됩니다.이 확장은 예를 들어 PARAFAC 모델에 대한 음이 아닌 것으로 볼 수 있다.
NMF의 다른 확장 기능으로는 여러 데이터 매트릭스와 텐서의 공동 인수 분해가 있는데, 여기에는 일부 요인이 공유된다.이러한 모델은 센서 융합 및 관계형 [51]학습에 유용합니다.
NMF는 Support Vector Machine(SVM; 지원 벡터 머신)과 마찬가지로 Non-egative 2차 프로그래밍(NQP)의 인스턴스입니다.단, SVM과 NMF는 NQP보다 밀접하게 관련되어 있기 때문에 두 가지 방법 중 하나를 위해 개발된 솔루션알고리즘을 양쪽 [52]도메인의 문제에 직접 적용할 수 있습니다.
고유성
인수분해는 고유하지 않습니다. 행렬과 그 역행렬을 사용하여 다음과 같이 두 인수분해 행렬을 변환할 수 있습니다.[53]
2개의 새로운 W ~ B{\}}}=WB} 및 ~ - H(\ =\^{-는 음수가 아닌 인수 분해의 또 다른 매개변수를 형성한다.
W~ \ H~ {\의 비음수성은 적어도 B가 음이 아닌 단항 행렬인 경우에 적용된다.이 간단한 경우 스케일링과 치환에 해당합니다.
희소성 제약에 의해 [54]NMF의 비고유성에 대한 제어가 강화됩니다.
적용들
천문학
천문학에서 NMF는 천체물리 신호가 음이 아니라는 점에서 차원 축소를 위한 유망한 방법이다.NMF는 천체공통특성의 연구와[5] 천체관측 후처리의 방법으로 분광관측과[3][4] 직접영상관측에 적용되어 왔다.Blanton & Roweis(2007)[4]에 의한 분광 관측의 발전은 천체 관측의 불확실성을 고려하며, 이후 Zhu([37]2016)에 의해 개선되며, 결측 데이터도 고려되고 병렬 연산이 가능하다.이후 Ren et al.[5] (2018)에 의해 외계행성을 검출하는 방법 중 하나로 직접 이미징 분야에 채택되었으며, 특히 별 주위 원반의 직접 이미징을 위한 방법 중 하나이다.
Ren et al.(2018)[5]은 NMF 성분이 순차적으로 구성될 때(즉, 하나씩) 안정성을 증명할 수 있으며, 이는 NMF 모델링 프로세스의 선형성을 가능하게 한다. 선형성 특성은 별 빛과 외부 행성과 별 주위 원반에서 산란된 빛을 분리하는 데 사용된다.
직접적인 영상에서는 10⁵에서 10¹⁰에 전형적인 대비가 밝은 주변 한번도 조명한 다양한 통계적 방법에서하는 외계 행성과 별의 주위를 도는 디스크가 앞으로 모델링adopte야 하지만 외계 행성이나 별의 주위를 도는 디스크로부터 나오는 빛을 보통, over-fitted adopted,[55][56][38]고 있는지 나타냅니다.d회복하기진성 [57][39]플럭스순방향 모델링은 현재 점 [39]선원에 최적화되어 있지만, 확장된 선원, 특히 별 주위 원반과 같은 불규칙한 형태의 구조에는 최적화되어 있지 않다.이러한 상황에서 NMF는 NMF 모델링 계수의 비음성 및 희소성 측면에서 과적합성이 낮기 때문에 생성된 모델에서 계산 집약적인 데이터 재축소가 아닌 몇 가지 스케일링 [5]계수를 사용하여 전방 모델링을 수행할 수 있습니다.
data 귀속
통계에서 결측 데이터를 귀속시키기 위해 NMF는 결측 데이터를 [6]0으로 처리하지 않고 비용 함수를 최소화하면서 결측 데이터를 가져올 수 있습니다.이를 통해 [6]통계에서 데이터 변환에 대해 수학적으로 입증된 방법이 됩니다.Ren et al.(2020)[6]은 먼저 결측 데이터가 비용 함수에서 무시된다는 것을 증명하고 결측 데이터의 영향이 2차 효과만큼 작을 수 있다는 것을 증명함으로써 그러한 접근법을 천문학 분야에 연구하고 적용했다.이들의 작업은 2차원 매트릭스에 초점을 맞추고 있으며, 특히 수학적인 도출, 시뮬레이션된 데이터 귀속 및 온스카이 데이터에 대한 응용이 포함됩니다.
NMF를 사용한 데이터 귀속 절차는 두 단계로 구성됩니다.첫째, NMF 성분이 알려진 경우, Ren et al.(2020)은 데이터 귀속("연구에서 목표 모델링") 중 누락된 데이터의 영향이 2차 효과임을 입증했다.둘째, NMF 구성요소가 불분명한 경우, 저자들은 구성요소 구축 중 누락된 데이터의 영향이 1차에서 2차 효과라는 것을 증명했다.
NMF 컴포넌트를 취득하는 방법에 따라 위의 전자의 스텝은 독립적일 수도 있고 후자의 스텝에 의존할 수도 있습니다.또한 NMF 구성 요소를 더 많이 사용할수록 귀속 품질이 향상될 수 있습니다.[6] 그림은 렌 외 연구진(2020)의 그림 4를 참조하십시오.
텍스트 마이닝
NMF는 텍스트마이닝 어플리케이션에 사용할 수 있습니다.이 프로세스에서 문서항 행렬은 문서 집합에서 다양한 용어(일반적으로 가중치 있는 단어 빈도 정보)의 가중치를 사용하여 구성된다.이 행렬은 항-특징 행렬과 특징-문서 행렬에 포함됩니다.기능은 문서의 내용에서 파생되며 기능-문서 매트릭스는 관련 문서의 데이터 클러스터를 설명합니다.
한 특정 애플리케이션은 PubMed의 [58]작은 과학적 추상 부분 집합에 계층형 NMF를 사용했습니다.또 다른 연구 그룹은 65,033개의 메시지와 91,133개의 용어가 포함된 Enron 이메일[59] 데이터 세트의 일부를 50개의 [60]클러스터로 클러스터링했습니다.NMF는 인용 데이터에도 적용되었으며, [61]한 예는 영어 위키피디아에서 발신되는 과학 인용을 기반으로 영어 위키피디아 기사 및 과학 저널을 클러스터링했다.
Arora, Ge, Halpern, Mimno, Moitra, Sontag, Wu 및 Zhu(2013)는 NMF를 사용하여 주제 모델을 학습하기 위한 다항식 시간 알고리즘을 제공했다.알고리즘에서는 토픽 행렬이 [42]이러한 설정에서 흔히 볼 수 있는 분리 가능성 조건을 충족한다고 가정합니다.
Hassani, Iranmanesh 및 Mansouri(2019)는 NMF를 사용하여 작동하는 용어 문서 행렬에 대한 특징 응집 방법을 제안했다.이 알고리즘은 용어 문서 행렬을 텍스트 클러스터링에 [62]적합한 더 작은 행렬로 줄입니다.
스펙트럼 데이터 분석
NMF는 스펙트럼 데이터 분석에도 사용된다. 그러한 용도 중 하나는 우주 물체 및 [63]파편 분류에 사용된다.
확장 가능한 인터넷 거리 예측
NMF는 스케일러블인터넷디스턴스(라운드 트립 시간) 예측에 적용됩니다.N개의{\ N호스트가 네트워크의 경우 NMF를 사용하여 O O 측정만 한 후 N 엔드 투 엔드 링크의 를 예측할 수 있습니다.이러한 방식은 인터넷 거리 예측 서비스(IDES)[64]에서 처음 도입되었습니다.그 후, 완전 분산형 어프로치로서 Phoenix 네트워크 좌표계를[65] 제안한다.무게 개념을 도입하여 전체적인 예측 정확도를 높입니다.
비정상 음성 노이즈 제거
음성 노이즈 제거는 오디오 신호 처리에서 오랫동안 지속되어 온 문제입니다.노이즈가 정지해 있는 경우는, 노이즈 해소를 위한 알고리즘이 많이 있습니다.예를 들어, Wiener 필터는 가우스 노이즈를 가감하는 데 적합합니다.그러나 소음이 비정상인 경우 비정상 소음의 통계 정보를 추정하기 어렵기 때문에 기존의 노이즈 제거 알고리즘은 대개 성능이 떨어진다.슈미트 [66]등NMF를 사용하여 비정상 소음 하에서 음성 노이즈 제거를 수행하며, 이는 기존의 통계적 접근법과는 완전히 다르다.핵심 아이디어는 깨끗한 음성 신호는 음성 사전에 의해 드물게 표시될 수 있지만 비정상 노이즈는 그럴 수 없다는 것이다.마찬가지로 비정상 소음도 소음 사전으로 드물게 나타낼 수 있지만 음성은 그럴 수 없다.
NMF 노이즈 제거 알고리즘은 다음과 같습니다.음성용 사전과 소음용 사전 두 권을 오프라인에서 교육해야 한다.일단 잡음이 있는 음성이 주어지면, 우리는 먼저 단시간-푸리에-변환의 크기를 계산한다.둘째, NMF를 통해 두 부분으로 나누어 한쪽은 음성사전에서 희박하게, 다른 한쪽은 노이즈사전에서 희박하게 나타낼 수 있다.세 번째, 음성사전으로 표현되는 부분은 클린 스피치 추정 부분일 것입니다.
집단 유전학
희박한 NMF는 모집단 유전학에서 개별 혼합물 계수를 추정하거나 모집단 샘플에서 개인의 유전자 클러스터를 검출하거나 표본 게놈에서 유전자 혼합물을 평가하는 데 사용됩니다.인간 유전자 클러스터링에서 NMF 알고리즘은 컴퓨터 프로그램 STRUCTURE와 유사한 추정치를 제공하지만 알고리즘은 계산적으로 더 효율적이며 대규모 모집단 게놈 데이터 세트를 [67]분석할 수 있다.
생물정보학
NMF는 유전자 발현과 DNA 메틸화 데이터를 클러스터링하고 클러스터 [25][68][69][70]중 가장 대표적인 유전자를 찾기 위해 생체정보학에서 성공적으로 적용되었다.암 돌연변이의 분석에서 그것은 많은 암에서 발생하며 아마도 [71]뚜렷한 원인을 가지고 있는 돌연변이의 일반적인 패턴을 식별하는 데 사용되어 왔다.NMF 기술은 세포 유형, 질병 하위 유형, 모집단 계층화, 조직 구성 및 종양 [72]복제와 같은 변이의 원천을 식별할 수 있습니다.
NMF의 특정 변종, 즉 Non-Negative Matrix Tri-Factorization(NMTF)[73]은[74] 승인된 약물에 대한 새로운 단백질 표적 및 치료적 징후를 예측하고 시너지 항암제 [75]쌍을 추론하기 위해 약물 용도 변경 작업에 사용되어 왔다.
핵 이미징
이 분야에서는 인자 분석이라고도 불리는 NMF는 SPECT 및 PET 동적 의료 이미징의 영상 시퀀스를 분석하는 데 1980년대부터[76] 사용되어 왔다.NMF의 고유하지 않은 문제는 희소성 [77]제약 조건을 사용하여 해결되었습니다.[78] [79]
현재의 연구
현재(2010년 이후) 비음수 행렬 인수분해 연구는 다음을 포함하지만 이에 국한되지 않는다.
- 알고리즘: 요인의 전역 최소값과 요인 [80]초기화를 검색합니다.
- 확장성: 웹 스케일 데이터 마이닝에서 흔히 볼 수 있는 백만 개 이상의 행렬을 인수 분해하는 방법. 예를 들어 분산 비음성 행렬 인수 분해(DNMF),[81] 확장 가능한 비음성 행렬 인수 분해(Scalable Non-egative Matrix Factorization), 분산 확률적 특이값 분해([83]DNMF)[82]를 참조하십시오.
- 온라인: 새로운 데이터가 들어왔을 때 인수분석을 갱신하는 방법(예: 온라인 CNSC[84] 참조)
- 집합적(공동) 인수분해: 다중 뷰 학습(예: 다중 뷰 클러스터링)을 위해 여러 개의 상호 관련 매트릭스를 인수분해합니다. "CoNMF[85] 및 MultiNMF[86]" 참조
- Cohen과 Rothblum 1993의 문제: 유리 행렬이 항상 합리적이고 최소 내부 차원의 NMF를 가지고 있는지 여부.최근 이 문제는 부정적인 [87]답변이 나오고 있다.
「 」를 참조해 주세요.
소스 및 외부 링크
메모들
- ^ a b c Suvrit Sra; Inderjit S. Dhillon (2006). Generalized Nonnegative Matrix Approximations with Bregman Divergences (PDF). Advances in Neural Information Processing Systems 18. Advances in Neural Information Processing Systems. ISBN 978-0-262-23253-1. Wikidata Q77685465.
- ^ Tandon, Rashish; Sra, Suvrit (September 13, 2010). Sparse nonnegative matrix approximation: new formulations and algorithms (PDF) (Report). Max Planck Institute for Biological Cybernetics. Technical Report No. 193.
- ^ a b Berné, O.; Joblin, C.; Deville, Y.; Smith, J. D.; Rapacioli, M.; Bernard, J. P.; Thomas, J.; Reach, W.; Abergel, A. (2007-07-01). "Analysis of the emission of very small dust particles from Spitzer spectro-imagery data using blind signal separation methods". Astronomy & Astrophysics. 469 (2): 575–586. doi:10.1051/0004-6361:20066282. ISSN 0004-6361.
- ^ a b c Blanton, Michael R.; Roweis, Sam (2007). "K-corrections and filter transformations in the ultraviolet, optical, and near infrared". The Astronomical Journal. 133 (2): 734–754. arXiv:astro-ph/0606170. Bibcode:2007AJ....133..734B. doi:10.1086/510127. S2CID 18561804.
- ^ a b c d e f g Ren, Bin; Pueyo, Laurent; Zhu, Guangtun B.; Duchêne, Gaspard (2018). "Non-negative Matrix Factorization: Robust Extraction of Extended Structures". The Astrophysical Journal. 852 (2): 104. arXiv:1712.10317. Bibcode:2018ApJ...852..104R. doi:10.3847/1538-4357/aaa1f2. S2CID 3966513.
- ^ a b c d e Ren, Bin; Pueyo, Laurent; Chen, Christine; Choquet, Elodie; Debes, John H; Duechene, Gaspard; Menard, Francois; Perrin, Marshall D. (2020). "Using Data Imputation for Signal Separation in High Contrast Imaging". The Astrophysical Journal. 892 (2): 74. arXiv:2001.00563. Bibcode:2020ApJ...892...74R. doi:10.3847/1538-4357/ab7024. S2CID 209531731.
- ^ a b Rainer Gemulla; Erik Nijkamp; Peter J. Haas; Yannis Sismanis (2011). Large-scale matrix factorization with distributed stochastic gradient descent. Proc. ACM SIGKDD Int'l Conf. on Knowledge discovery and data mining. pp. 69–77.
- ^ Yang Bao; et al. (2014). TopicMF: Simultaneously Exploiting Ratings and Reviews for Recommendation. AAAI.
- ^ Ben Murrell; et al. (2011). "Non-Negative Matrix Factorization for Learning Alignment-Specific Models of Protein Evolution". PLOS ONE. 6 (12): e28898. Bibcode:2011PLoSO...628898M. doi:10.1371/journal.pone.0028898. PMC 3245233. PMID 22216138.
- ^ William H. Lawton; Edward A. Sylvestre (1971). "Self modeling curve resolution". Technometrics. 13 (3): 617–633. doi:10.2307/1267173. JSTOR 1267173.
- ^ Pentti Paatero; Unto Tapper; Pasi Aalto; Markku Kulmala (1991). "Matrix factorization methods for analysing diffusion battery data". Journal of Aerosol Science. 22: S273–S276. doi:10.1016/S0021-8502(05)80089-8. ISSN 0021-8502. Wikidata Q58065673.
- ^ Pentti Paatero; Unto Tapper (June 1994). "Positive matrix factorization: A non-negative factor model with optimal utilization of error estimates of data values". Environmetrics. 5 (2): 111–126. doi:10.1002/ENV.3170050203. ISSN 1180-4009. Wikidata Q29308406.
- ^ Pia Anttila; Pentti Paatero; Unto Tapper; Olli Järvinen (1995). "Source identification of bulk wet deposition in Finland by positive matrix factorization". Atmospheric Environment. 29 (14): 1705–1718. Bibcode:1995AtmEn..29.1705A. doi:10.1016/1352-2310(94)00367-T.
- ^ a b Daniel D. Lee & H. Sebastian Seung (1999). "Learning the parts of objects by non-negative matrix factorization". Nature. 401 (6755): 788–791. Bibcode:1999Natur.401..788L. doi:10.1038/44565. PMID 10548103. S2CID 4428232.
- ^ a b Daniel D. Lee & H. Sebastian Seung (2001). Algorithms for Non-negative Matrix Factorization (PDF). Advances in Neural Information Processing Systems 13: Proceedings of the 2000 Conference. MIT Press. pp. 556–562.
- ^ a b c C. 딩, X.그, H.D. Simon (2005)."비음성 매트릭스 인수분해와 스펙트럼 군집의 등가성에 대하여"SIAM 국제 회의.데이터 마이닝, 페이지 606-610.2005년 5월
- ^ Ding C, Li Y, Peng W (2008). "On the equivalence between non-negative matrix factorization and probabilistic latent semantic indexing" (PDF). Computational Statistics & Data Analysis. 52 (8): 3913–3927. doi:10.1016/j.csda.2008.01.011. Archived from the original (PDF) on 2016-03-04.
- ^ a b C Ding, T Li, MI Jordan, 볼록 및 반음성 매트릭스 인수분해, 패턴 분석 및 머신 인텔리전스에 관한 IEEE 트랜잭션, 32, 45-55, 2010
- ^ Berman, A.; R.J. Plemmons (1974). "Inverses of nonnegative matrices". Linear and Multilinear Algebra. 2 (2): 161–172. doi:10.1080/03081087408817055.
- ^ A. Berman; R.J. Plemmons (1994). Nonnegative matrices in the Mathematical Sciences. Philadelphia: SIAM.
- ^ Thomas, L.B. (1974). "Problem 73-14, Rank factorization of nonnegative matrices". SIAM Rev. 16 (3): 393–394. doi:10.1137/1016064.
- ^ Vavasis, S.A. (2009). "On the complexity of nonnegative matrix factorization". SIAM J. Optim. 20 (3): 1364–1377. arXiv:0708.4149. doi:10.1137/070709967. S2CID 7150400.
- ^ Zhang, T.; Fang, B.; Liu, W.; Tang, Y. Y.; He, G.; Wen, J. (2008). "Total variation norm-based nonnegative matrix factorization for identifying discriminant representation of image patterns". Neurocomputing. 71 (10–12): 1824–1831. doi:10.1016/j.neucom.2008.01.022.
- ^ a b Hoyer, Patrik O. (2002). Non-negative sparse coding. Proc. IEEE Workshop on Neural Networks for Signal Processing. arXiv:cs/0202009.
- ^ a b Leo Taslaman & Björn Nilsson (2012). "A framework for regularized non-negative matrix factorization, with application to the analysis of gene expression data". PLOS One. 7 (11): e46331. Bibcode:2012PLoSO...746331T. doi:10.1371/journal.pone.0046331. PMC 3487913. PMID 23133590.
- ^ Hsieh, C. J.; Dhillon, I. S. (2011). Fast coordinate descent methods with variable selection for non-negative matrix factorization (PDF). Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD '11. p. 1064. doi:10.1145/2020408.2020577. ISBN 9781450308137.
- ^ http://www.ijcai.org/papers07/Papers/IJCAI07-432.pdf[베어 URL PDF]
- ^ Fung, Yik-Hing; Li, Chun-Hung; Cheung, William K. (2 November 2007). Online Discussion Participation Prediction Using Non-negative Matrix Factorization. Wi-Iatw '07. IEEE Computer Society. pp. 284–287. ISBN 9780769530284 – via dl.acm.org.
- ^ Naiyang Guan; Dacheng Tao; Zhigang Luo & Bo Yuan (July 2012). "Online Nonnegative Matrix Factorization With Robust Stochastic Approximation". IEEE Transactions on Neural Networks and Learning Systems. 23 (7): 1087–1099. doi:10.1109/TNNLS.2012.2197827. PMID 24807135. S2CID 8755408.
- ^ a b Lin, Chih-Jen (2007). "Projected Gradient Methods for Nonnegative Matrix Factorization" (PDF). Neural Computation. 19 (10): 2756–2779. CiteSeerX 10.1.1.308.9135. doi:10.1162/neco.2007.19.10.2756. PMID 17716011. S2CID 2295736.
- ^ Lin, Chih-Jen (2007). "On the Convergence of Multiplicative Update Algorithms for Nonnegative Matrix Factorization". IEEE Transactions on Neural Networks. 18 (6): 1589–1596. CiteSeerX 10.1.1.407.318. doi:10.1109/TNN.2007.895831. S2CID 2183630.
- ^ Hyunsoo Kim & Haesun Park (2008). "Nonnegative Matrix Factorization Based on Alternating Nonnegativity Constrained Least Squares and Active Set Method" (PDF). SIAM Journal on Matrix Analysis and Applications. 30 (2): 713–730. CiteSeerX 10.1.1.70.3485. doi:10.1137/07069239x.
- ^ Naiyang Guan; Dacheng Tao; Zhigang Luo; Bo Yuan (June 2012). "NeNMF: An Optimal Gradient Method for Nonnegative Matrix Factorization". IEEE Transactions on Signal Processing. 60 (6): 2882–2898. Bibcode:2012ITSP...60.2882G. doi:10.1109/TSP.2012.2190406. S2CID 8143231.
- ^ Jingu Kim & Haesun Park (2011). "Fast Nonnegative Matrix Factorization: An Active-set-like Method and Comparisons". SIAM Journal on Scientific Computing. 58 (6): 3261–3281. CiteSeerX 10.1.1.419.798. doi:10.1137/110821172.
- ^ Jingu Kim; Yunlong He & Haesun Park (2013). "Algorithms for nonnegative matrix and tensor factorizations: A unified view based on block coordinate descent framework" (PDF). Journal of Global Optimization. 33 (2): 285–319. doi:10.1007/s10898-013-0035-4. S2CID 11197117.
- ^ Ding, C.; He, X. & Simon, H.D. (2005). "On the equivalence of nonnegative matrix factorization and spectral clustering". Proc. SIAM Data Mining Conf. Vol. 4. pp. 606–610. doi:10.1137/1.9781611972757.70. ISBN 978-0-89871-593-4.
- ^ a b Zhu, Guangtun B. (2016-12-19). "Nonnegative Matrix Factorization (NMF) with Heteroscedastic Uncertainties and Missing data". arXiv:1612.06037 [astro-ph.IM].
- ^ a b Soummer, Rémi; Pueyo, Laurent; Larkin, James (2012). "Detection and Characterization of Exoplanets and Disks Using Projections on Karhunen-Loève Eigenimages". The Astrophysical Journal Letters. 755 (2): L28. arXiv:1207.4197. Bibcode:2012ApJ...755L..28S. doi:10.1088/2041-8205/755/2/L28. S2CID 51088743.
- ^ a b c Pueyo, Laurent (2016). "Detection and Characterization of Exoplanets using Projections on Karhunen Loeve Eigenimages: Forward Modeling". The Astrophysical Journal. 824 (2): 117. arXiv:1604.06097. Bibcode:2016ApJ...824..117P. doi:10.3847/0004-637X/824/2/117. S2CID 118349503.
- ^ Campbell, S.L.; G.D. Poole (1981). "Computing nonnegative rank factorizations". Linear Algebra Appl. 35: 175–182. doi:10.1016/0024-3795(81)90272-x.
- ^ Kalofolias, V.; Gallopoulos, E. (2012). "Computing symmetric nonnegative rank factorizations" (PDF). Linear Algebra Appl. 436 (2): 421–435. doi:10.1016/j.laa.2011.03.016.
- ^ a b Arora, Sanjeev; Ge, Rong; Halpern, Yoni; Mimno, David; Moitra, Ankur; Sontag, David; Wu, Yichen; Zhu, Michael (2013). A practical algorithm for topic modeling with provable guarantees. Proceedings of the 30th International Conference on Machine Learning. arXiv:1212.4777. Bibcode:2012arXiv1212.4777A.
- ^ Lee, Daniel D.; Sebastian, Seung, H. (1999). "Learning the parts of objects by non-negative matrix factorization" (PDF). Nature. 401 (6755): 788–791. Bibcode:1999Natur.401..788L. doi:10.1038/44565. PMID 10548103. S2CID 4428232.
- ^ Wray Buntine (2002). Variational Extensions to EM and Multinomial PCA (PDF). Proc. European Conference on Machine Learning (ECML-02). LNAI. Vol. 2430. pp. 23–34.
- ^ Eric Gaussier & Cyril Goutte (2005). Relation between PLSA and NMF and Implications (PDF). Proc. 28th international ACM SIGIR conference on Research and development in information retrieval (SIGIR-05). pp. 601–602. Archived from the original (PDF) on 2007-09-28. Retrieved 2007-01-29.
- ^ Ron Zass와 Amnon Shashua(2005)."하드 및 확률적 클러스터링에 대한 통일적 접근법"2005년 10월 중국 베이징 국제컴퓨터비전회의(ICCV)
- ^ Max Welling; et al. (2004). Exponential Family Harmoniums with an Application to Information Retrieval. NIPS.
- ^ Pentti Paatero (1999). "The Multilinear Engine: A Table-Driven, Least Squares Program for Solving Multilinear Problems, including the n-Way Parallel Factor Analysis Model". Journal of Computational and Graphical Statistics. 8 (4): 854–888. doi:10.2307/1390831. JSTOR 1390831.
- ^ Max Welling & Markus Weber (2001). "Positive Tensor Factorization". Pattern Recognition Letters. 22 (12): 1255–1261. Bibcode:2001PaReL..22.1255W. CiteSeerX 10.1.1.21.24. doi:10.1016/S0167-8655(01)00070-8.
- ^ Jingu Kim & Haesun Park (2012). Fast Nonnegative Tensor Factorization with an Active-set-like Method (PDF). High-Performance Scientific Computing: Algorithms and Applications. Springer. pp. 311–326.
- ^ Kenan Yilmaz; A. Taylan Cemgil & Umut Simsekli (2011). Generalized Coupled Tensor Factorization (PDF). NIPS.
- ^ Vamsi K. Potluru; Sergey M. Plis; Morten Morup; Vince D. Calhoun & Terran Lane (2009). Efficient Multiplicative updates for Support Vector Machines. Proceedings of the 2009 SIAM Conference on Data Mining (SDM). pp. 1218–1229.
- ^ Wei Xu; Xin Liu & Yihong Gong (2003). Document clustering based on non-negative matrix factorization. Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval. New York: Association for Computing Machinery. pp. 267–273.
- ^ Eggert, J.; Korner, E. (2004). "Sparse coding and NMF". 2004 IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541). Vol. 4. pp. 2529–2533. doi:10.1109/IJCNN.2004.1381036. ISBN 978-0-7803-8359-3. S2CID 17923083.
- ^ Lafrenière, David; Maroid, Christian; Doyon, René; Barman, Travis (2009). "HST/NICMOS Detection of HR 8799 b in 1998". The Astrophysical Journal Letters. 694 (2): L148. arXiv:0902.3247. Bibcode:2009ApJ...694L.148L. doi:10.1088/0004-637X/694/2/L148. S2CID 7332750.
- ^ Amara, Adam; Quanz, Sascha P. (2012). "PYNPOINT: an image processing package for finding exoplanets". Monthly Notices of the Royal Astronomical Society. 427 (2): 948. arXiv:1207.6637. Bibcode:2012MNRAS.427..948A. doi:10.1111/j.1365-2966.2012.21918.x. S2CID 119200505.
- ^ Wahhaj, Zahed; Cieza, Lucas A.; Mawet, Dimitri; Yang, Bin; Canovas, Hector; de Boer, Jozua; Casassus, Simon; Ménard, François; Schreiber, Matthias R.; Liu, Michael C.; Biller, Beth A.; Nielsen, Eric L.; Hayward, Thomas L. (2015). "Improving signal-to-noise in the direct imaging of exoplanets and circumstellar disks with MLOCI". Astronomy & Astrophysics. 581 (24): A24. arXiv:1502.03092. Bibcode:2015A&A...581A..24W. doi:10.1051/0004-6361/201525837. S2CID 20174209.
- ^ Nielsen, Finn Årup; Balslev, Daniela; Hansen, Lars Kai (2005). "Mining the posterior cingulate: segregation between memory and pain components" (PDF). NeuroImage. 27 (3): 520–522. doi:10.1016/j.neuroimage.2005.04.034. PMID 15946864. S2CID 18509039.
- ^ Cohen, William (2005-04-04). "Enron Email Dataset". Retrieved 2008-08-26.
- ^ Berry, Michael W.; Browne, Murray (2005). "Email Surveillance Using Non-negative Matrix Factorization". Computational and Mathematical Organization Theory. 11 (3): 249–264. doi:10.1007/s10588-005-5380-5. S2CID 16249147.
- ^ Nielsen, Finn Årup (2008). Clustering of scientific citations in Wikipedia. Wikimania. arXiv:0805.1154.
- ^ Hassani, Ali; Iranmanesh, Amir; Mansouri, Najme (2019-11-12). "Text Mining using Nonnegative Matrix Factorization and Latent Semantic Analysis". arXiv:1911.04705 [cs.LG].
- ^ Berry, Michael W.; Browne, Murray; Langville, Amy N.; Paucac, V. Paul; Plemmonsc, Robert J. (15 September 2007). "Algorithms and Applications for Approximate Nonnegative Matrix Factorization". Computational Statistics & Data Analysis. 52 (1): 155–173. doi:10.1016/j.csda.2006.11.006.
- ^ Yun Mao; Lawrence Saul & Jonathan M. Smith (2006). "IDES: An Internet Distance Estimation Service for Large Networks". IEEE Journal on Selected Areas in Communications. 24 (12): 2273–2284. CiteSeerX 10.1.1.136.3837. doi:10.1109/JSAC.2006.884026. S2CID 12931155.
- ^ Yang Chen; Xiao Wang; Cong Shi; et al. (2011). "Phoenix: A Weight-based Network Coordinate System Using Matrix Factorization" (PDF). IEEE Transactions on Network and Service Management. 8 (4): 334–347. CiteSeerX 10.1.1.300.2851. doi:10.1109/tnsm.2011.110911.100079. S2CID 8079061. Archived from the original (PDF) on 2011-11-14.
- ^ 슈미트, M.N., J. Larsen, F.T. Xiao. (2007)"비음성 희박 부호화를 이용한 풍절음 감소", 신호 처리를 위한 기계 학습, IEEE 워크숍, 431–436
- ^ Frichot E, Mathieu F, Trouillon T, Bouchard G, Francois O (2014). "Fast and efficient estimation of individual ancestry coefficients". Genetics. 196 (4): 973–983. doi:10.1534/genetics.113.160572. PMC 3982712. PMID 24496008.
- ^ Devarajan, K. (2008). "Nonnegative Matrix Factorization: An Analytical and Interpretive Tool in Computational Biology". PLOS Computational Biology. 4 (7): e1000029. Bibcode:2008PLSCB...4E0029D. doi:10.1371/journal.pcbi.1000029. PMC 2447881. PMID 18654623.
- ^ Hyunsoo Kim & Haesun Park (2007). "Sparse non-negative matrix factorizations via alternating non-negativity-constrained least squares for microarray data analysis". Bioinformatics. 23 (12): 1495–1502. doi:10.1093/bioinformatics/btm134. PMID 17483501.
- ^ Schwalbe, E. (2013). "DNA methylation profiling of medulloblastoma allows robust sub-classification and improved outcome prediction using formalin-fixed biopsies". Acta Neuropathologica. 125 (3): 359–371. doi:10.1007/s00401-012-1077-2. PMC 4313078. PMID 23291781.
- ^ Alexandrov, Ludmil B.; Nik-Zainal, Serena; Wedge, David C.; Campbell, Peter J.; Stratton, Michael R. (2013-01-31). "Deciphering signatures of mutational processes operative in human cancer". Cell Reports. 3 (1): 246–259. doi:10.1016/j.celrep.2012.12.008. ISSN 2211-1247. PMC 3588146. PMID 23318258.
- ^ Stein-O’Brien, Genevieve L.; Arora, Raman; Culhane, Aedin C.; Favorov, Alexander V.; Garmire, Lana X.; Greene, Casey S.; Goff, Loyal A.; Li, Yifeng; Ngom, Aloune; Ochs, Michael F.; Xu, Yanxun (2018-10-01). "Enter the Matrix: Factorization Uncovers Knowledge from Omics". Trends in Genetics. 34 (10): 790–805. doi:10.1016/j.tig.2018.07.003. ISSN 0168-9525. PMC 6309559. PMID 30143323.
- ^ Ding; Li; Peng; Park (2006). "Orthogonal nonnegative matrix t-factorizations for clustering". Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining: 126–135. doi:10.1145/1150402.1150420. ISBN 1595933395. S2CID 165018.
- ^ Ceddia; Pinoli; Ceri; Masseroli (2020). "Matrix factorization-based technique for drug repurposing predictions". IEEE Journal of Biomedical and Health Informatics. 24 (11): 3162–3172. doi:10.1109/JBHI.2020.2991763. PMID 32365039. S2CID 218504587.
- ^ Pinoli; Ceddia; Ceri; Masseroli (2021). "Predicting drug synergism by means of non-negative matrix tri-factorization". IEEE/ACM Transactions on Computational Biology and Bioinformatics. PP: 1. doi:10.1109/TCBB.2021.3091814. PMID 34166199. S2CID 235634059.
- ^ DiPaola; Bazin; Aubry; Aurengo; Cavailloles; Herry; Kahn (1982). "Handling of dynamic sequences in nuclear medicine". IEEE Trans Nucl Sci. 29 (4): 1310–21. Bibcode:1982ITNS...29.1310D. doi:10.1109/tns.1982.4332188. S2CID 37186516.
- ^ Sitek; Gullberg; Huesman (2002). "Correction for ambiguous solutions in factor analysis using a penalized least squares objective". IEEE Trans Med Imaging. 21 (3): 216–25. doi:10.1109/42.996340. PMID 11989846. S2CID 6553527.
- ^ Boutchko; Mitra; Baker; Jagust; Gullberg (2015). "Clustering Initiated Factor Analysis (CIFA) Application for Tissue Classification in Dynamic Brain PET". Journal of Cerebral Blood Flow and Metabolism. 35 (7): 1104–11. doi:10.1038/jcbfm.2015.69. PMC 4640278. PMID 25899294.
- ^ Abdalah; Boutchko; Mitra; Gullberg (2015). "Reconstruction of 4-D Dynamic SPECT Images From Inconsistent Projections Using a Spline Initialized FADS Algorithm (SIFADS)". IEEE Trans Med Imaging. 34 (1): 216–18. doi:10.1109/TMI.2014.2352033. PMID 25167546. S2CID 11060831.
- ^ C. Boutsidis & E. Gallopoulos (2008). "SVD based initialization: A head start for nonnegative matrix factorization". Pattern Recognition. 41 (4): 1350–1362. Bibcode:2008PatRe..41.1350B. CiteSeerX 10.1.1.137.8281. doi:10.1016/j.patcog.2007.09.010.
- ^ Chao Liu; Hung-chih Yang; Jinliang Fan; Li-Wei He & Yi-Min Wang (2010). "Distributed Nonnegative Matrix Factorization for Web-Scale Dyadic Data Analysis on MapReduce" (PDF). Proceedings of the 19th International World Wide Web Conference.
- ^ Jiangtao Yin; Lixin Gao & Zhongfei (Mark) Zhang (2014). "Scalable Nonnegative Matrix Factorization with Block-wise Updates" (PDF). Proceedings of the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases.
- ^ "Apache Mahout". mahout.apache.org. Retrieved 2019-12-14.
- ^ Dong Wang; Ravichander Vipperla; Nick Evans; Thomas Fang Zheng (2013). "Online Non-Negative Convolutive Pattern Learning for Speech Signals" (PDF). IEEE Transactions on Signal Processing. 61 (1): 44–56. Bibcode:2013ITSP...61...44W. CiteSeerX 10.1.1.707.7348. doi:10.1109/tsp.2012.2222381. S2CID 12530378. Archived from the original (PDF) on 2015-04-19. Retrieved 2015-04-19.
- ^ Xiangnan He; Min-Yen Kan; Peichu Xie & Xiao Chen (2014). "Comment-based Multi-View Clustering of Web 2.0 Items" (PDF). Proceedings of the 23rd International World Wide Web Conference. Archived from the original (PDF) on 2015-04-02. Retrieved 2015-03-22.
- ^ Jialu Liu; Chi Wang; Jing Gao & Jiawei Han (2013). Multi-View Clustering via Joint Nonnegative Matrix Factorization (PDF). Proceedings of SIAM Data Mining Conference. pp. 252–260. CiteSeerX 10.1.1.301.1771. doi:10.1137/1.9781611972832.28. ISBN 978-1-61197-262-7.
- ^ Chistikov, Dmitry; Kiefer, Stefan; Marušić, Ines; Shirmohammadi, Mahsa; Worrell, James (2016-05-22). "Nonnegative Matrix Factorization Requires Irrationality". arXiv:1605.06848 [cs.CC].
다른이들
- J. Shen; G. W. Israël (1989). "A receptor model using a specific non-negative transformation technique for ambient aerosol". Atmospheric Environment. 23 (10): 2289–2298. Bibcode:1989AtmEn..23.2289S. doi:10.1016/0004-6981(89)90190-X.
- Pentti Paatero (1997). "Least squares formulation of robust non-negative factor analysis". Chemometrics and Intelligent Laboratory Systems. 37 (1): 23–35. doi:10.1016/S0169-7439(96)00044-5.
- Raul Kompass (2007). "A Generalized Divergence Measure for Nonnegative Matrix Factorization". Neural Computation. 19 (3): 780–791. doi:10.1162/neco.2007.19.3.780. PMID 17298233. S2CID 5337451.
- Liu, W.X.; Zheng, N.N. & You, Q.B. (2006). "Nonnegative Matrix Factorization and its applications in pattern recognition". Chinese Science Bulletin. 51 (17–18): 7–18. Bibcode:2006ChSBu..51....7L. doi:10.1007/s11434-005-1109-6. S2CID 15445516.
- Ngoc-Diep Ho; Paul Van Dooren & Vincent Blondel (2008). "Descent Methods for Nonnegative Matrix Factorization". arXiv:0801.3199 [cs.NA].
- Andrzej Cichocki; Rafal Zdunek & Shun-ichi Amari (2008). "Nonnegative Matrix and Tensor Factorization". IEEE Signal Processing Magazine. 25 (1): 142–145. Bibcode:2008ISPM...25R.142C. doi:10.1109/MSP.2008.4408452. S2CID 9997603.
- Cédric Févotte; Nancy Bertin & Jean-Louis Durrieu (2009). "Nonnegative Matrix Factorization with the Itakura-Saito Divergence: With Application to Music Analysis". Neural Computation. 21 (3): 793–830. doi:10.1162/neco.2008.04-08-771. PMID 18785855. S2CID 13208611.
- Ali Taylan Cemgil (2009). "Bayesian Inference for Nonnegative Matrix Factorisation Models". Computational Intelligence and Neuroscience. 2009 (2): 1–17. doi:10.1155/2009/785152. PMC 2688815. PMID 19536273.
- Andrzej Cichocki, Morten Mrup 등:"부정행렬과 텐서인수화에 관한 어드밴스", 힌다위출판사, ISBN 978-9774540455(2008).
- Andrzej Cichocki, Rafal Zdunek, Anh Huy Phan 및 Shun-ichi Amari: "부정행렬과 텐서 인수분해:Applications to Expirative Multi-way Data Analysis and Blind Source Separation", Wiley, ISBN 978-0470746660(2009).
- Andri Mirzal: "클러스터링 및 LSI: 이론과 프로그래밍을 위한 부정 매트릭스 인수분해", LAP LAMBERT 학술 출판, ISBN 978-3844324891 (2011)
- Yong Xiang: "블라인드 소스 분리:종속 컴포넌트 분석", 스프링어, ISBN 978-9812872265(2014).
- 가네쉬 R.Naik(Ed.): "비음수 행렬 인수분해 기법:이론과 응용의 진보", Springer, ISBN 978-3662517000(2016).
- Julian Becker: "Monoural Audio Source Separation을 위한 적응 요소를 사용한 부정 매트릭스 인수분해: 1", Shaker Verlag GmbH, 독일, ISBN 978-3844048148 (2016)
- 젠중첸: "출처 분리 및 기계학습", 학술출판사, ISBN 978-0128177969 (2018).
- 마키노 쇼지(편집): 「오디오 소스 분리」, 스프링어, ISBN 978-3030303033(2019).
- Nicolas Gillis: "Non-negative Matrix Factorization", SIAM, ISBN 978-1-611976-40-3(2020).