투영추적
Projection pursuit투영 추척(PP)은 다차원 데이터에서 가능한 가장 "관심 있는" 투영을 찾는 것을 포함하는 통계 기법의 한 유형이다.종종 정규 분포에서 더 많이 벗어나는 예측은 더 흥미로운 것으로 간주된다.각 투영이 발견될 때, 그 투영을 따라 구성 요소를 제거함으로써 데이터가 감소되고, 그 과정이 반복되어 새로운 투영을 찾는다; 이것은 일치 추구로 알려진 기법에 동기를 부여한 "구입" 측면이다.[1][2]
투영 추구의 아이디어는 데이터 세트의 구조에 관한 가장 상세한 내용을 드러내는 고차원 공간부터 저차원 공간까지의 투영이나 투영을 위치시키는 것이다.일단 흥미로운 투영법이 발견되면 기존 구조물(클러스터, 표면 등)을 추출해 별도로 분석할 수 있다.
투영 추구는 블라인드 소스 분리에 널리 사용되어 왔기 때문에 독립적인 요소 분석에서 매우 중요하다.투영 추구는 추출된 신호가 가능한 가우스 이외의 신호가 되도록 한 번에 하나의 투영을 추구한다.[3]
역사
투영추구 기법은 원래 크루스칼에 의해 제안되고 실험되었다.[4]관련 아이디어는 스위처(1970) "수리적 분류" pp31–43의 "지구 과학의 컴퓨터 응용 프로그램:지리통계학, 스위처와 라이트(1971) "eocene nummulitids의 수학적 분류," 수학 지질학 pp 297~311.첫 번째 성공적인 구현은 제롬 H. 프리드먼과 존 투키(1974)가 프로젝션 추구를 이름지은 덕분이다.
투영 추구의 원래 목적은 특정한 객관적 기능이나 투영지수를 수치적으로 극대화함으로써 고차원 점 구름의 "흥미로운" 저차원 투영을 기계적으로 선택하기 위한 것이었다.[5]
몇 년 후 프리드먼과 스투에즐은 투영 추구의 이면에 있는 아이디어를 확장하고 투영 추척 회귀(PPR), 투영 추척 분류(PPCE), 투영 추척 밀도 추정(PPDE) 등을 추가했다.
특징
투영 추구의 가장 흥미진진한 특징은 고차원 공간이 대부분 비어 있다는 사실에 기인하는 '차원성의 저주'를 우회할 수 있는 극소수의 다변량 방법 중 하나라는 점이다.또한, 투영 추구는 관련 없는 변수(즉, 잡음 및 정보 부족)를 무시할 수 있다.이는 최소 스패닝 트리, 다차원 스케일링 및 대부분의 클러스터링 기법과 같은 중간점 거리에 기초한 방법에 비해 뚜렷한 장점이다.
고전적인 다변량 분석의 많은 방법들이 투영 추구의 특별한 경우인 것으로 밝혀졌다.예를 들어 주성분 분석과 판별 분석, 요인 분석의 사분위수 및 난맥스 방법이 있다.
프로젝션 추적 방법의 심각한 단점 중 하나는 컴퓨터 시간에 대한 그들의 높은 수요다.
참고 항목
참조
- ^ J. H. Friedman and J. W. Tukey (Sep 1974). "A Projection Pursuit Algorithm for Exploratory Data Analysis" (PDF). IEEE Transactions on Computers. C-23 (9): 881–890. doi:10.1109/T-C.1974.224051. ISSN 0018-9340.
- ^ M. C. Jones and R. Sibson (1987). "What is Projection Pursuit?". Journal of the Royal Statistical Society, Series A. 150 (1): 1–37. doi:10.2307/2981662. JSTOR 2981662.
- ^ 제임스 5세스톤(2004); "독립 구성요소 분석: 자습서 소개", MIT 프레스 캠브리지, 매사추세츠, 런던, ISBN 0-262-69315-1
- ^ Kruskal, JB. 1969; "새로운 "응축 지수"를 최적화하는 선 변환을 찾아 관측치 집합의 구조를 파악하는 데 도움이 되는 실용적인 방법, 다음 중 427-440페이지:Milton, RC, & Nelder, JA(eds), 통계 연산, 뉴욕, 학술 출판사
- ^ P. J. Huber (Jun 1985). "Projection pursuit" (PDF). The Annals of Statistics. 13 (2): 435–475. doi:10.1214/aos/1176349519.