최소 용장 기능 선택

Minimum redundancy feature selection

최소 용장성 특징 선택은 유전자 및 표현형특성을 정확하게 식별하고 관련성을 좁히기 위한 방법으로 자주 사용되는 알고리즘이며, 일반적으로 관련 특징 선택과의 쌍으로 최소 용장성 최대 관련성(mRMR)으로 설명된다.

패턴 인식기계 학습의 기본 문제 중 하나인 기능 선택은 사용되는 파라미터와 관련된 데이터 서브셋을 식별하며 일반적으로 최대 관련성이라고 합니다.이러한 서브셋은 종종 관련성이 있지만 중복되는 소재를 포함하고 있으며 mRMR은 그러한 중복 서브셋을 제거함으로써 이 문제를 해결하려고 시도한다. mRMR은 암 진단음성 인식과 같은 많은 분야에서 다양한 응용 분야를 가지고 있다.

기능은 다양한 방법으로 선택할 수 있습니다.한 가지 방법은 분류 변수에 가장 강한 상관관계를 갖는 피쳐를 선택하는 것입니다.이를 최대 관련성 선택이라고 합니다.순차 순방향, 역방향 또는 부동 선택과 같은 많은 경험적 알고리즘을 사용할 수 있습니다.

한편, 분류 변수와의 「높은」상관 관계를 유지하면서, 서로 멀리 떨어져 있는 피쳐를 선택할 수 있습니다.mRMR(Minimum Redundancy Maximum Relociation) 선택으로 불리는 이 방식은 최대 관련성 선택보다 더 강력한 것으로 밝혀졌다.

특별한 경우로서, "상관관계"는 변수 간의 통계적 의존성으로 대체될 수 있다.상호 정보를 사용하여 의존성을 정량화할 수 있습니다.이 경우 mRMR은 선택된 특징과 분류 변수 사이의 의존성을 최대화하기 위한 근사치이다.

연구는 중복성 및 관련성 측정에 대해 다른 측정을 시도했다.최근의 연구는 생물의학 [1]영상의 맥락에서 몇 가지 측정을 비교했다.

레퍼런스

  1. ^ Auffarth, B., Lopez, M., Cerquides, J. (2010년)CT 영상의 조직 분류에서 특징 선택을 위한 중복성 및 관련성 측정 비교.데이터 마이닝의 진보.응용 및 이론적 측면. 페이지 248-262.스프링거.http://www.csc.kth.se/~auffarth/publications/redrel.pdf

외부 링크