최소 용장 기능 선택
Minimum redundancy feature selection최소 용장성 특징 선택은 유전자 및 표현형의 특성을 정확하게 식별하고 관련성을 좁히기 위한 방법으로 자주 사용되는 알고리즘이며, 일반적으로 관련 특징 선택과의 쌍으로 최소 용장성 최대 관련성(mRMR)으로 설명된다.
패턴 인식 및 기계 학습의 기본 문제 중 하나인 기능 선택은 사용되는 파라미터와 관련된 데이터 서브셋을 식별하며 일반적으로 최대 관련성이라고 합니다.이러한 서브셋은 종종 관련성이 있지만 중복되는 소재를 포함하고 있으며 mRMR은 그러한 중복 서브셋을 제거함으로써 이 문제를 해결하려고 시도한다. mRMR은 암 진단 및 음성 인식과 같은 많은 분야에서 다양한 응용 분야를 가지고 있다.
기능은 다양한 방법으로 선택할 수 있습니다.한 가지 방법은 분류 변수에 가장 강한 상관관계를 갖는 피쳐를 선택하는 것입니다.이를 최대 관련성 선택이라고 합니다.순차 순방향, 역방향 또는 부동 선택과 같은 많은 경험적 알고리즘을 사용할 수 있습니다.
한편, 분류 변수와의 「높은」상관 관계를 유지하면서, 서로 멀리 떨어져 있는 피쳐를 선택할 수 있습니다.mRMR(Minimum Redundancy Maximum Relociation) 선택으로 불리는 이 방식은 최대 관련성 선택보다 더 강력한 것으로 밝혀졌다.
특별한 경우로서, "상관관계"는 변수 간의 통계적 의존성으로 대체될 수 있다.상호 정보를 사용하여 의존성을 정량화할 수 있습니다.이 경우 mRMR은 선택된 특징과 분류 변수 사이의 의존성을 최대화하기 위한 근사치이다.
연구는 중복성 및 관련성 측정에 대해 다른 측정을 시도했다.최근의 연구는 생물의학 [1]영상의 맥락에서 몇 가지 측정을 비교했다.
레퍼런스
- ^ Auffarth, B., Lopez, M., Cerquides, J. (2010년)CT 영상의 조직 분류에서 특징 선택을 위한 중복성 및 관련성 측정 비교.데이터 마이닝의 진보.응용 및 이론적 측면. 페이지 248-262.스프링거.http://www.csc.kth.se/~auffarth/publications/redrel.pdf
외부 링크
- Peng, H.C., Long, F. 및 Ding, C., "상호 정보에 근거한 기능 선택: 최대 의존성, 최대 관련성 및 최소 용장성의 기준", 패턴 분석 및 기계 인텔리전스에 관한 IEEE 트랜잭션, Vol. 27, No. 8, 페이지 1226–1238, 2005.
- Chris Ding과 Hanchuan Peng, "마이크로 어레이 유전자 발현 데이터에서 최소 용장성 특징 선택"제2회 IEEE 컴퓨터 학회 생물정보학 회의(CSB 2003), 2003년 8월 11일~14일, 미국 캘리포니아주 스탠포드. 페이지 523~529.
- Penglab mRMR