평행 좌표
Parallel coordinates병렬 좌표는 고차원 데이터 세트를 시각화하고 분석하는 일반적인 방법이다.
n차원 공간에서 점 집합을 보여주기 위해 배경은 일반적으로 수직이고 동일한 간격으로 평행선 n개로 구성된다.n차원 공간의 점은 평행 축에 정점이 있는 폴리선으로 표현된다. i번째 축의 정점 위치는 점의 i번째 좌표에 해당한다.
이 시각화는 축이 시간의 점에 대응하지 않아 자연적인 순서가 없는 데이터에 적용된다는 점을 제외하면 시계열 시각화와 밀접한 관련이 있다.따라서 서로 다른 축 배치가 관심의 대상이 될 수 있다.
역사
병렬 좌표는 흔히 1885년 필버트 모리스 도카뉴에 의해 발명되었다고 하지만,[1] 이 작품은 책 제목에 "Coordonnées paralléles"라는 단어가 등장하지만, 이 작품은 같은 이름의 시각화 기법과는 아무런 상관이 없다; 이 책은 변환을 조정하는 방법만을 기술하고 있다.그러나 1885년 이전에도 병렬 좌표가 사용되었는데, 예를 들어 헨리 개닛츠 "일반 요약, 상태 순위 표시, 비율별, 1880"[2] 또는 그 후 1898년 헨리 개닛츠 "각 인구조사에서 주 및 지역 순위, 1790-1890"에서 사용되었다.87년 후인 1985년 알프레드 인셀버그에[3] 의해 다시 대중화되었고 1977년부터 좌표계로 체계적으로 발전하였다.항공 교통 관제(1987 - 3 미국 특허), 데이터 마이닝(미국 특허), 컴퓨터 비전(미국 특허), 최적화, 프로세스 제어 등을 위한 충돌 회피 알고리즘에 중요한 응용 프로그램이 있으며, 침입 탐지 등에 더 최근에 적용되었다.
상위 치수
xy 데카르트 좌표계가 있는 평면에서는 병렬 좌표(흔히 약칭 - 좌표 또는 PCP)에 더 많은 치수를 추가하면 더 많은 축을 추가하는 것이 포함된다.병렬 좌표의 값은 높은 차원의 특정 기하학적 특성이 쉽게 볼 수 있는 2D 패턴으로 변형된다는 것이다.예를 들어, n-공간에서 선의 점 집합은 n - 1 지점에서 교차하는 모든 교차점을 병렬 좌표로 한 폴리선 집합으로 변환한다.n = 2의 경우 이는 평행 좌표의 수학적 기초가 유클리드 공간이 아닌 투영적 공간에서 개발된 이유를 지적하는 점선 이중성을 산출한다.선 쌍은 두 개의 좌표가 있는 고유한 지점에서 교차하므로 두 개의 매개변수(또는 두 개의 점)로 지정되는 고유한 선과 일치할 수 있다.이와는 대조적으로, 곡선을 지정하기 위해서는 세 개 이상의 점이 필요하며 또한 한 쌍의 곡선에는 고유한 교차점이 없을 수도 있다.따라서 선 대신 평행 좌표에 곡선을 사용함으로써 점선 이중성은 투영 기하학의 다른 모든 특성, 그리고 (하이퍼)플레인, 곡선, 여러 매끄러운 (하이퍼)서페이스, 근위부, 볼록성 및 최근 비방향성에 해당하는 알려진 좋은 고차원 패턴과 함께 상실된다.[4]n차원 관계를 2차원 패턴으로 매핑하는 것이 목표다.따라서 병렬 좌표는 점 대 점 매핑이 아니라 2D 부분 집합 매핑에 대한 nD 부분 집합이므로 정보의 손실이 없다.참고: nD의 점조차도 2D의 점으로 매핑되지 않고 폴리곤 선(2D의 부분 집합)에 매핑된다.
통계적 고려사항
통계 데이터 시각화에 사용할 때 세 가지 중요한 고려사항이 있다: 축의 순서, 회전 및 스케일링.
축의 순서는 형상을 찾는 데 매우 중요하며, 일반적인 데이터 분석에서는 많은 재순서를 시도할 필요가 있을 것이다.일부 저자들은 명확한 질서를 만들어낼 수 있는 경험적 발견을 주문하는 방법을 생각해냈다.[5]
축의 회전은 평행 좌표에서의 번역이며, 평행 축의 바깥쪽에서 선이 교차하는 경우 회전에 의해 이들 사이에 번역될 수 있다.이것의 가장 간단한 예는 축을 180도 회전시키는 것이다.[6]
그래프는 연속된 변수 쌍의 보간(선형 조합)을 기반으로 하기 때문에 스케일링이 필요하다.[6]따라서 변수는 공통 척도여야 하며, 데이터 준비 프로세스의 일부로 고려해야 할 스케일링 방법은 더 많은 정보를 제공할 수 있다.
스플라인으로 평탄한 평행 좌표도를 구한다.[7]평활도에서는 모든 관측치가 모수선(또는 곡선)으로 매핑되는데, 모수선(또는 곡선)은 평활하고 축에 연속되며 각 평행 축에 직교한다.이 설계는 각 데이터 속성에 대한 정량화 수준을 강조한다.[6]
독서
인셀버그(Inselberg 1997년)는 병렬 조정의 관계 패턴을 시각적으로 읽는 방법에 대해 전면 재검토했다.[8]두 평행축 사이에 있는 대부분의 선들이 서로 어느 정도 평행할 때, 이 두 치수 사이의 긍정적인 관계를 암시한다.X자형의 중첩의 일종으로 선이 교차할 때, 그것은 부정적인 관계다.선들이 랜덤하게 교차하거나 평행할 때, 그것은 특별한 관계가 없음을 보여준다.
제한 사항
병렬 좌표에서 각 축은 최대 두 개의 인접 축(왼쪽 1개, 오른쪽 1개)을 가질 수 있다.d-차원 데이터 세트의 경우, 한 번에 최대 d-1 관계를 표시할 수 있다.시계열 시각화에는 자연스러운 전신과 후계자가 존재하기 때문에, 이 특별한 경우에는 선호되는 배치가 존재한다.그러나 축의 순서가 고유하지 않은 경우에는 축 배열이 양호하다고 판단하기 위해서는 휴리스틱스 및 실험이 필요하다.보다 복잡한 관계를 탐구하기 위해서는 축을 재정렬해야 한다.
축을 3차원 공간으로 배열함으로써(그러나 여전히 네일베드의 못처럼 평행하게), 축은 중심 속성에 둘 이상의 이웃을 원을 그리며 둘 이상의 이웃을 둘 수 있으며, 배열 문제는 (예를 들어 최소 스패닝 트리를 사용함으로써) 쉬워진다.[9]이 시각화의 프로토타입은 데이터 마이닝 소프트웨어 ELKI의 확장으로 이용할 수 있다.그러나 시각화는 선형 순서보다 해석하고 상호작용하기가 더 어렵다.
소프트웨어
병렬 좌표에 관한 논문은 많지만, 데이터베이스를 병렬 좌표 그래픽으로 변환하기 위해 공개적으로 이용할 수 있는 주목할 만한 소프트웨어는 거의 없다.[10]주목할 만한 소프트웨어는 ELKI, GGobi, Mondrian, Orange, ROOT이다.도서관은 프로토비스.js를 포함하며, D3.js는 기본적인 예를 제공한다.D3.Parcoords.js(D3 기반 라이브러리)도 특별히 병렬 좌표 그래픽 생성에 전념하는 것으로 출판되었다.Python 데이터 구조와 분석 라이브러리 Panda는 플로팅 라이브러리 매플롯리브를 사용하여 병렬 좌표 플로팅을 구현한다.[11]
다변량 데이터에 대한 기타 시각화
- 레이더 차트 – 좌표 축이 방사형으로 배열된 시각화
- Andrews 그림 – 병렬 좌표의 푸리에 변환 그래프
참조
- ^ d'Ocagne, Maurice (1885). Coordonnées parallèles et axiales : Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèles. Paris: Gauthier-Villars.
- ^ Gannett, Henry. "General Summary Showing the Rank of States by Ratios 1880".
{{cite journal}}
:Cite 저널은 필요로 한다.journal=
(도움말) - ^ Inselberg, Alfred (1985). "The Plane with Parallel Coordinates". Visual Computer. 1 (4): 69–91. doi:10.1007/BF01898350.
- ^ Inselberg, Alfred (2009). Parallel Coordinates: VISUAL Multidimensional Geometry and its Applications. Springer. ISBN 978-0387215075.
- ^ Yang, Jing; Peng, Wei; Ward, Matthew O.; Rundensteiner, Elke A. (2003). "Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets" (PDF). IEEE Symposium on Information Visualization (INFOVIS 2003): 3–4.
- ^ a b c Moustafa, Rida; Wegman, Edward J. (2006). "Multivariate continuous data – Parallel Coordinates". In Unwin, A.; Theus, M.; Hofmann, H. (eds.). Graphics of Large Datasets: Visualizing a Million. Springer. pp. 143–156. ISBN 978-0387329062.
- ^ Moustafa, Rida; Wegman, Edward J. (2002). "On Some Generalizations of Parallel Coordinate Plots" (PDF). Seeing a Million, A Data Visualization Workshop, Rain Am Lech (Nr.), Germany. Archived from the original (PDF) on 2013-12-24.
- ^ Inselberg, A. (1997), "Multidimensional detective", Information Visualization, 1997. Proceedings., IEEE Symposium on, pp. 100–107, doi:10.1109/INFVIS.1997.636793, ISBN 0-8186-8189-6
- ^ Elke Achtert, Hans-Peter Kriegel, Erich Schubert, Arthur Zimek (2013). "Interactive Data Mining with 3D-Parallel-Coordinate-Trees". Proceedings of the ACM International Conference on Management of Data (SIGMOD). New York City, NY: 1009. doi:10.1145/2463676.2463696. ISBN 9781450320375.
{{cite journal}}
: CS1 maint : 복수이름 : 작성자 목록(링크) - ^ Kosara, Robert (2010). "Parallel Coordinates".
- ^ 판다의 평행 좌표
추가 읽기
- Heinrich, Julian and Weiskopf, Daniel(2013) 평행 좌표 기술 상태, 유로그래픽스 2013 - State of the Art Reports, 페이지 95–116
- 무스타파, 리다(2011) 병렬 좌표 및 병렬 좌표 밀도 그림, Wiley Intergulation Reviews:계산 통계, 제3(2), 페이지 134–148.
- Weidele, Daniel Karl I. (2019) 조건부 병렬 좌표, IEEE 시각화 컨퍼런스(VIS) 2019, 페이지 221–225
외부 링크
- Alfred Inselberg의 홈페이지(Visual Tutorial, History, Selected Publishes and Applications)
- C에 의한 고다변량 데이터 집합의 시각화 방법의 조사Brunsdon, A. S. Fotheringham & M. E. Charlton, 영국 뉴캐슬
- 곡선을 사용하여 평행 좌표 시각화 향상 영국 에든버러 네이피어 대학교의 마틴 그레이엄 & 제시 케네디 웨이백 머신에 보관된 2007-03-15
- 로버트 코사라의 자습서인 평행 좌표
- 조건부 병렬 좌표 – 범주형 값이 확장되어 다른 수준의 병렬 좌표를 나타낼 수 있는 병렬 좌표의 재귀적 변종.