프로크루스테스 분석

Procrustes analysis
프로크루스트는 중첩된다.그림은 두 개의 랜드마크 구성에 적합한 일반적인 프로크루스트의 세 가지 변환 단계를 보여준다. (a) 두 구성을 동일한 크기로 스케일링, (b) 무게중심의 동일한 위치로 전환, (c) 해당 랜드마크 사이의 제곱 거리의 최소 합을 제공하는 방향으로 회전.

통계에서 Procrustes 분석형상 집합의 분포를 분석하는 데 사용되는 통계 형상 분석의 한 형태다.프로크루스테스(그리스어: πρκρούηηηηηηηηηη)란 그리스 신화에 나오는 도적(道적)을 일컫는 말로, 희생자들을 팔다리를 뻗거나 베어서 침상에 맞게 만들었다.null

수학에서:

  • 직교 프로크루스트 문제는 다른 물체에 대한 프로크루스테스 슈퍼임팩트(PS)의 최적 회전 및/또는 반사(즉, 최적 직교 선형 변환)를 알아내는 데 사용할 수 있는 방법이다.
  • det(R) = 1(R이 회전 행렬인 경우)에 따라 제한된 직교 프로크루스트 문제는 다른 물체에 대해 물체의 PS에 대한 최적 회전을 결정하는 데 사용할 수 있는 방법이다(반성이 허용되지 않음).어떤 맥락에서는 이 방법을 카브치 알고리즘이라고 부른다.

형상을 다른 형상과 비교하거나 형상 집합을 임의로 선택한 기준 형상과 비교하는 경우, 3개 이상의 형상을 최적으로 결정된 "평균 형상"에 비교하는 GPA(Generalized Procrustes Analysis, GPA)와는 달리 Procrustes 분석은 고전적 또는 일반적 또는 일반적 으로 더욱 적격인 경우가 있다.null

소개

둘 이상의 물체의 모양을 비교하기 위해서는 먼저 물체가 최적으로 "중첩"되어야 한다.프로크루스트(Procrustes supposition,PS)는 물체를 최적으로 번역, 회전, 균일하게 스케일링하여 수행된다., 공간에서의 배치와 물체의 크기 모두 자유롭게 조정된다.목적은 물체들 사이의 Procrustes 거리라고 불리는 형상 차이의 척도를 최소화함으로써 유사한 배치와 크기를 얻는 것이다.이는 스케일링을 수행하지 않는 부분 PS(즉, 물체의 크기가 보존되는 부분 PS)와는 반대로 풀(full)이라고도 한다.PS가 꽉 찬 후, 물체의 모양이 동일하면 물체가 정확히 일치한다는 점에 유의하십시오.예를 들어, 완전한 PS를 사용하면 서로 다른 반지름을 가진 두 개의 구가 항상 일치할 것이다. 왜냐하면 그들은 정확히 같은 모양을 가지고 있기 때문이다.반대로 부분 PS로 그들은 결코 일치하지 않을 것이다.이는 기하학에서 형상이라는 용어의 엄격한 정의에 의해 형상 분석이 완전한 PS를 사용하여 수행되어야 함을 의미한다.부분 PS에 기반한 통계적 분석은 형태 차이뿐만 아니라 크기 차이에도 민감하기 때문에 순수한 형상 분석이 아니다.풀 PS와 부분 PS 모두 큐브와 구, 또는 오른손과 왼손과 같이 모양이 다른 두 물체를 완벽하게 일치시키지 못할 것이다.null

경우에 따라 전체 PS와 부분 PS 모두 반사를 포함할 수도 있다.예를 들어, 반사는 오른손과 왼손의 성공적인 (완벽한) 중첩을 가능하게 한다.따라서 반사가 가능한 부분 PS는 크기는 보존하지만 번역, 회전, 반사가 가능한 반면 반사가 가능한 전체 PS는 번역, 회전, 스케일링, 반사가 가능하다.null

최적의 번역 및 확장은 훨씬 간단한 조작으로 결정된다(아래 참조).null

일반 프로크루스트 분석

여기서는 한정된 수의 점 k로 구성된 객체를 n차원으로 간주한다.흔히 이러한 점들은 인간의 뼈와 같은 복잡한 물체의 연속적인 표면에서 선택되는데, 이 경우 랜드마크 점이라고 한다.null

물체의 모양은 변환, 회전균일한 스케일링 구성 요소를 제거하여 형성된 동등성 등급의 구성원으로 간주할 수 있다.null

번역

예를 들어, 변환 구성요소는 객체의 모든 점(, 중심)의 평균이 원점에 놓이도록 객체를 번역하여 객체에서 제거할 수 있다.null

수학: 점을 2차원으로 취한다.

, ),( x , 2),, ( k, )}), (.

이 지점의 평균은( 이며, 여기서

Now translate these points so that their mean is translated to the origin , giving the point .

균일 스케일링

마찬가지로, 변환된 원점까지의 RMSD(root mean square distance)가 1이 되도록 객체를 스케일링하여 스케일 구성요소를 제거할 수 있다.이 RMSD는 물체의 규모크기에 대한 통계적 척도다.

점 좌표를 객체의 초기 척도로 나눈 경우 척도가 1이 된다.

- x )/ s( - y" )/ ) ( .

저울을 정의하고 제거하는 다른 방법이 문헌에 사용되기도 한다는 점에 유의하십시오.null

회전

표준 기준 방향이 항상 사용 가능한 것은 아니기 때문에 회전 구성 요소를 제거하는 것은 더 복잡하다.척도와 번역이 제거된 동일한 수의 점으로 구성된 두 객체를 고려하십시오.이 점들을( , 1 ), ) (, , },이 되도록 한다 이러한 객체들 중 하나를 사용하여 참조 방향을 제시할 수 있다.해당 지점 사이의 거리 제곱(SSD) 합계가 최소화되도록 최적의 회전 각도 을(를) 찾을 때까지(최소 제곱 기법의 예) 참조 객체를 고정하고 다른 객체를 원점 주위로 회전시키십시오.null

각도 에 의한 회전은 다음과 같다.

.

여기서 (u,v)는 회전된 점의 좌표다.Taking the derivative of with respect to and solving for when the derivative is zero gives

물체가 3차원일 때 최적 회전은 단순한 각도가 아닌 3 by-3 회전 행렬 R로 나타내며, 이 경우 단수분해R에 대한 최적 값을 찾는 데 사용될 수 있다(det(R) = 1에 따라 제한된 직교 프로크루스트 문제에 대한 해결책 참조).null

형상비교

두 물체의 모양 차이는 위에서 설명한 대로 두 물체를 번역, 스케일링, 최적 회전시켜 '중첩'한 후에야 평가할 수 있다.상기에서 언급한 해당 지점 사이의 SSD의 제곱근을 이러한 형태 차이의 통계적 척도로 사용할 수 있다.

이 척도는 흔히 프로크루스트 거리라고 불린다.Procrustes 거리에 대한 다른 더 복잡한 정의와 "모양 차이"의 다른 척도가 문헌에서 사용되기도 한다는 점에 유의하십시오.null

형상 집합 중첩

우리는 두 가지 모양을 겹치는 방법을 보여주었다.위에서 언급한 기준 방향이 모든 도형에 사용되는 한, 동일한 방법을 3개 이상의 도형 세트를 겹치는 데 적용할 수 있다.그러나 일반화 프로크루스트 분석은 이 목표를 달성하기 위한 더 나은 방법을 제공한다.null

일반화 프로크루스트 분석(GPA)

GPA는 임의로 선택된 모양에 겹치는 대신 개체 집합을 최적으로 겹치는 데 Procrustes 분석 방법을 적용한다.null

일반화 및 일반화 Procrustes 분석은 물체에 대한 기준 방향의 결정에만 차이가 있으며, 전자의 기법에서는 최적으로 결정되며 후자의 기법에서는 임의로 선택된다.스케일링과 번역은 두 기법에 의해 동일한 방식으로 수행된다.두 형상만 비교했을 때 GPA는 일반적인 Procrustes 분석과 동등하다.null

알고리즘 개요는 다음과 같다.

  1. 임의로 참조 모양을 선택(사용 가능한 인스턴스 중에서 선택하여 선택)
  2. 모든 인스턴스를 현재 참조 셰이프에 겹침
  3. 현재 겹쳐진 도형 집합의 평균 도형을 계산하다.
  4. Procrustes 거리가 평균과 기준 형상 사이의 임계값을 초과하는 경우, 기준을 평균 형상으로 설정하고 2 단계로 계속 진행하십시오.

변형

물체의 모양을 나타내는 방법에는 여러 가지가 있다.물체의 모양은 모든 k개의 점 집합(Rkn)을 n차원으로 취하여 모든 번역, 회전, 스매싱의 집합을 인수함으로써 형성된 동등성 등급의 구성원으로 간주할 수 있다.형상의 특정한 표현은 등가 등급의 특정한 표현을 선택함으로써 발견된다.이것은 다양한 차원kn-4를 제공할 것이다.프로크루스트는 특정한 통계적 정당성을 가지고 이것을 하는 한 방법이다.null

북스테인(Bookstein)은 베이스라인(base line)이라 불리는 두 점의 위치를 고정함으로써 형상의 표현을 얻는다.하나는 출발지에서 고정되고 다른 하나는 (1,0)에서 나머지 점은 북스타인 좌표를 형성한다.null

또한 변환성분과 회전성분이 제거된 형태와 스케일을 고려하는 것이 일반적이다.null

형상 분석은 생물학적 데이터에서 예를 들어 턱뼈의 모양을 고려할 때 랜드마크 데이터로 특징지어지는 해부학적 특징의 변화를 식별하기 위해 사용된다.[1]null

David George Kendall에 의한 한 연구는 종종 그것들이 직선으로 배열되었는지 추론하기 위해 돌들을 세운 에 의해 형성된 삼각형들을 조사했다.삼각형의 모양은 구상의 한 점으로 나타낼 수 있으며, 모든 형태의 분포는 구상의 분포를 생각할 수 있다.입석으로부터의 표본 분포를 이론적 분포와 비교하여 직선의 발생이 평균에 못 미친다는 것을 보여주었다.[2]null

참고 항목

참조

  1. ^ "우주모양 탐구" 연구/펜 주 낸시 마리 브라운이 웨이백 기계보관한 2006-09-01
  2. ^ 데이비드 G. 켄달 통계학, 제4권, 제2권(1989년 5월), 페이지 87–99에 의한 "형상의 통계이론 조사"
  • F.L. Bookstein, 랜드마크 데이터를 위한 Morphometric 도구, Cambridge University Press, (1991)
  • J.C. Gower, G.B. Dijksterhuis, Procrustes Publices, Oxford University Press (2004)
  • I.L.Dryden, K.V. Mardia, 통계적 형상 분석, Wiley, Chichester, (1998년)

외부 링크