가장 가까운 중심 분류기
Nearest centroid classifier기계 학습에서 가장 가까운 중심 분류기 또는 가장 가까운 프로토타입 분류기는 평균(중심)이 관측치에 가장 가까운 훈련 표본 클래스의 레이블을 관측치에 할당하는 분류 모형입니다.문서를 나타내기 위해 tf*idf 가중치를 포함하는 단어 벡터를 사용하여 텍스트 분류에 적용할 때, 가장 가까운 중심 분류기는 관련성 [1]피드백을 위한 로키오 알고리즘과 유사하기 때문에 로키오 분류기로 알려져 있다.
가장 가까운 중심 분류기의 확장 버전은 의료 영역, 특히 [2]종양의 분류에서 응용 프로그램을 발견했습니다.
알고리즘.
트레이닝
라벨이 붙은 트레이닝 샘플 ( , y ) ... ( , n ) { \ { \ \ { \ vec { x } { } ,{ } } \ class \ y f _ { n }} with \ \ \ \mathmathmathmathmathmath y y y ymath y y y y y \ math sty \ sty \ f { n 。 i∈ x i \ \ { \ \ _ { \} → \ C { \} } } {\ } { x {\ vec } ℓℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ ℓ }} }} }} }} }} }} }} }} }} }} }} }} }} c }}
예측
x {\{에 할당된 클래스는 y^ arg ∈ → - x \ style { hat { y\ \ } } \ {\ el \ \ { c입니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Manning, Christopher; Raghavan, Prabhakar; Schütze, Hinrich (2008). "Vector space classification". Introduction to Information Retrieval. Cambridge University Press.
- ^ Tibshirani, Robert; Hastie, Trevor; Narasimhan, Balasubramanian; Chu, Gilbert (2002). "Diagnosis of multiple cancer types by shrunken centroids of gene expression". Proceedings of the National Academy of Sciences. 99 (10): 6567–6572. doi:10.1073/pnas.082099299. PMC 124443. PMID 12011421.