그랜드 투어(데이터 시각화)

Grand Tour (data visualisation)

그랜드 투어는 1985년 다니엘 아시모프에 의해 개발된 기술로, 애니메이션을 통해 다변량 통계 데이터를 탐색하는 데 사용됩니다.애니메이션 또는 "동영상"은 컴퓨터 화면에 표시되는 서로 다른 방향에서 볼 수 있는 일련의 개별 데이터 보기로 구성되어 있으며, 지속적으로 변화하는 것처럼 보이며 가능한 모든 보기에 점점 더 가까워집니다.이를 통해 데이터에 대한 유용한 정보를 전달하는 패턴을 탐지할 목적으로 이러한 뷰를 인간 또는 컴퓨터 기반으로 평가할 수 있습니다.

이 기술은 많은 박물관 관람객들이 복잡한 추상 조각을 접했을 때 하는 것과 같습니다.그들은 그것을 더 잘 이해하기 위해 그것을 모든 방향에서 보기 위해 그것을 둘러본다.인간의 시각 시스템은 시각 정보를 2차원 망막의 패턴으로 인식한다.따라서 조각을 더 잘 이해하기 위해 주변을 걷는 것은 뇌에 2차원 이미지의 시간적 시퀀스를 만듭니다.

그랜드 투어 시각화에 대한 원래 입력인 다변량 데이터는 일부 고차원 유클리드 공간의 (유한) 점 집합입니다.이러한 세트는 데이터를 수집할 때 자연스럽게 발생합니다.1000명의 인구에 대해 각 사람에게 나이, 키, 체중 및 코털 수를 제공하도록 요청한다고 가정합니다.따라서 인구의 각 구성원에게는 4배씩 순서가 매겨진 숫자들이 있습니다.n차원 유클리드 공간은 모든 순서 n-튜플의 숫자로 정의되기 때문에, 이것은 1000명에 대한 데이터가 4차원 유클리드 공간에서 1000개의 점으로 생각될 수 있다는 것을 의미한다.

그랜드 투어는 투영 데이터의 비교적 단순한 2차원 뷰를 영화의 개별 프레임으로 사용하여 다변량 데이터 세트의 공간 복잡성을 시간적 복잡성으로 변환한다.(이것을 「데이터 뷰」라고 부르기도 합니다).투영은 보통 너무 빨리 변하지 않도록 선택되는데, 이는 데이터 동영상이 인간 관찰자에게 연속적으로 보인다는 것을 의미한다.

그랜드 투어 "방법"은 유클리드 공간의 주어진 차원에 (보통) 2차원 평면에 일련의 투영을 할당하는 알고리즘이다.이를 통해 특정 다변량 데이터 세트를 해당 2차원 평면 시퀀스에 투영하여 컴퓨터 화면에 차례로 표시할 수 있으므로, 그 효과는 데이터에 대한 동영상을 만드는 것입니다.

(데이터가 2면에 투영된 후 컴퓨터 화면에 표시하려면 컴퓨터 화면의 수평방향과 수직방향에 대응하는 2면의 방향을 선택해야 합니다.이것은 보통 사소한 세부 사항입니다.단, 2차원 데이터 뷰의 불필요한 "회전"을 최소화하기 위해 수평 방향과 수직 방향을 선택하는 것이 이상적입니다.)

기술 설명

애니메이션의 각 "뷰"(즉, 프레임)는 (데이터가 존재하는 유클리드 공간p R의) 2차원 부분 공간에 대한 데이터 세트의 직교 투영이다.하위 공간은 R의 모든p 2차원 하위 공간(그래스G(2,p)로 알려진)의 공간에서 시간에 따라 매개변수화된 연속 곡선을 따라 작은 단계를 수행하여 선택된다.이러한 보기를 컴퓨터 화면에 표시하려면 각 보기의 특정 회전 위치(컴퓨터 화면 평면 내)를 선택하여 표시해야 합니다.이것에 의해, 컴퓨터 화면에 표시되는 데이터 포인트의 위치가 계속 변화합니다.Asimov는 G(2,p)의 모든 점에 점점 더 가깝게 하기 위해 이들 서브스페이스(시간 t까지)를 선택할 수 있음을 보여 주었다. 따라서 그랜드 투어 무비가 무한히 실행되도록 허용되면 표시된 서브스페이스의 세트가 G(2,p)[1][2]의 고밀도 서브스페이스에 대응하게 된다.

소프트웨어

  • Tourr R 패키지는 R에서 새로운 Tour 메서드를 작성할 수 있는 측지 보간 및 기저 생성 함수를 구현합니다.

레퍼런스

  1. ^ 아시모프, 다니엘 (1985년)그랜드 투어: 다차원 데이터를 보기 위한 도구입니다.과학통계 컴퓨팅에 관한 SIAM 저널, 6(1), 128~143.
  2. ^ 허, 문율, 김기열.(2002) 그랜드 투어의 수정을 이용한 다차원 데이터의 가시화.응용통계 저널 29.5: 721~728.