랜덤 매핑
Random mapping데이터 분석 시 RM(Random Mapping)은 특징 추출 방식으로 분류되는 고속 차원 축소 방법입니다.RM은 각 원래 벡터에 곱한 랜덤 행렬의 생성으로 구성되며 결과적으로 벡터가 감소합니다.데이터 벡터가 고차원일 경우 원래 데이터 공간에서의 유사성 또는 거리를 반복적으로 계산하는 데이터 분석 또는 패턴 인식 알고리즘을 사용하는 것은 계산상 불가능합니다.따라서 데이터를 클러스터링하기 전에 차원성을 줄여야 합니다.텍스트 마이닝 컨텍스트에서 랜덤 매핑법에 의해 치수성이 저하된 후에 얻을 수 있는 문서 분류 정밀도는 최종 치수성이 충분히 큰 경우(6000점 만점에 100점 정도) 원래의 정밀도와 거의 동등함을 나타낸다.실제로 매핑된 벡터 간의 내적(유사성)이 원래 벡터의 내적(internal product)을 근접하게 따른다는 것을 알 수 있다.
「 」를 참조해 주세요.
레퍼런스
- Kaski, S. 랜덤 매핑에 의한 차원성 감소: 클러스터링을 위한 빠른 유사성 계산.1998년 신경망에 관한 IEEE 국제공동회의, 1998. 페이지 413~418.doi: 10.1109/IJCNN.198.682302
