접미사 트리 클러스터링
Suffix tree clustering접미사 트리 클러스터링(STC)은 접미사 트리를 사용하는 클러스터링을 위한 접근법이다.[1]접미사 트리 클러스터는 주어진 길이의 모든 n-그램이 정해진 단어 문자열에 삽입되는 것을 추적하는 동시에 다른 문자열을 선형 순서로 증분 삽입할 수 있도록 한다.이는 다수의 클러스터를 순차적으로 처리할 수 있다는 장점이 있다.그러나, 잠재적인 단점은 대용량 데이터를 처리할 때 검토해야 하는 가능한 문서의 수를 증가시킨다는 것일 수 있다.접미사 트리 클러스터는 처리되는 데이터의 유형에 따라 자연에서 분해되거나 응집될 수 있다.[2]
참조
- ^ Branson, Steve; Greenberg, Ari. "Clustering Web Search Results Using Suffix Tree Methods, CS276A Final Project" (PDF). www.stanford.edu. Stanford University. Retrieved 2 January 2015.
- ^ Davis, Ernest. "Lecture 4: Clustering". www.cs.nyu.edu. New York University. Retrieved 2 January 2015.