대화형 시각 분석

Interactive visual analysis

Interactive Visual Analysis(Interactive Visual Analysis, IVA)는 크고 복잡한 데이터 집합에서 지식을 추출하기 위해 컴퓨터의 연산 능력과 인간의 지각 및 인지 능력을 결합하는 기법이다.이 기술은 사용자 상호작용과 인간의 시각 시스템에 크게 의존하며 시각적 분석빅데이터의 교차점에 존재한다.그것은 데이터 시각화의 한 분야다.IVA는 데이터 포인트가 많은 고차원 데이터를 분석하는 데 적합한 기법으로 단순 그래프 작성과 비인터랙티브 기법이 정보에 대한 충분한 이해를 제공하지 못한다.[1]

이러한 기법에는 상이한 상관관계를 통해 데이터 집합을 살펴보고 사용자가 흥미를 느끼는 특징을 반복적으로 선택하고 검토하는 것이 포함된다.IVA의 목표는 데이터 집합에서 쉽게 드러나지 않는 지식을 얻는 것이다.여기에는 가설을 생성, 테스트 또는 검증하거나, 단순히 데이터 집합을 탐색하여 서로 다른 변수 간의 상관 관계를 찾는 작업이 포함될 수 있다.

역사

포커스 + 컨텍스트 시각화 및 관련 기술은 1970년대로 거슬러 올라간다.[2]대화형 시각 분석을 위한 이러한 기법을 결합하려는 초기 시도는 2000년에 심장 시뮬레이션을 위한 WEB 시각화 시스템에서 발생한다.심비스는 2003년에 등장했고,[4] 그 이후로 여러 박사 프로젝트들이 이 개념을 탐구해왔는데, 특히 2004년 헬무트 돌리스치,[5] 2011년 요하네스 케헤러, 2013년[6] 졸탄 코니하 등이 그것이다.[7]시각화 커뮤니티에서 사용되는 컴비스는 2008년에 등장했다.[8]

기본 사항

대화형 시각 분석의 목적은 쉽게 드러나지 않는 데이터에서 정보를 발견하는 것이다.목표는 데이터 자체에서 데이터에 포함된 정보로 이동하여 궁극적으로 원시 숫자를 보고 분명하지 않은 지식을 밝혀내는 것이다.

IVA의 가장 기본적인 형태는 데이터 집합의 다른 열을 표시하는 조정된 다중 뷰를 사용하는 것이다.IVA에는 적어도 두 개의 보기가 필요하다.보기는 히스토그램, 산점도 또는 병렬 좌표와 같은 정보 시각화의 일반적인 도구들 중 하나이지만, 이것이 데이터에 적합한 경우 볼륨 렌더링 뷰를 사용하는 것도 가능하다.[6]일반적으로 한 뷰는 데이터 집합의 독립 변수(예: 시간 또는 공간 위치)를 표시하는 반면, 다른 뷰는 서로에 대한 종속 변수(예: 온도, 압력 또는 인구 밀도)를 표시한다.뷰가 연결된 경우 사용자는 한 뷰에서 데이터 포인트를 선택하고 다른 뷰에서 해당 데이터 포인트가 자동으로 강조 표시되도록 할 수 있다.데이터의 고차원적 특성을 직관적으로 탐구할 수 있는 이 기법을 링크와 브러싱이라고 한다.[10][11]

보기 중 하나에서 선택한 것은 이진일 필요는 없다.IVA용 소프트웨어 패키지는 선택에 있어 점진적인 "관심도"를 허용할 수 있으며, 여기서 우리가 낮은 관심도에서 높은 관심도로 이동할 때 데이터 포인트가 점차 강조된다.이것은 정보 검색에 내재된 "초점+콘텍스트" 측면을 허용한다.예를 들어, 자기 공명 영상 데이터 세트에서 종양을 검사할 때, 종양을 둘러싼 조직도 운영자에게 어느 정도 관심이 있을 수 있다.

IVA 루프

인터랙티브 시각 분석은 반복적인 과정이다.데이터를 브러싱한 후, 링크된 뷰를 본 후에 이루어진 발견은 그 과정을 반복하는 출발점으로 사용할 수 있어 정보 드릴다운의 형태로 이어질 수 있다.예를 들어, 연소 엔진의 시뮬레이션에서 얻은 데이터의 분석을 고려해 보십시오.사용자는 온도 분포의 히스토그램을 브러싱하여 한 실린더의 특정 부분이 위험할 정도로 높은 온도를 가지고 있음을 발견한다.이 정보는 모든 실린더가 열 분산에 문제가 있다는 가설을 공식화하는 데 사용될 수 있다.이는 다른 모든 실린더에서 동일한 부위를 브러싱하고 온도 히스토그램에서 이러한 실린더의 온도가 예상보다 높다는 것을 확인함으로써 검증될 수 있다.[14]

데이터 모델

IVA의 데이터 소스는 일반적으로 데이터가 열과 행으로 표시되는 표 형식의 데이터다.데이터 변수는 독립 변수와 종속 변수의 두 가지 다른 범주로 나눌 수 있다.독립 변수는 예를 들어 시간 및 공간과 같이 관측된 값의 영역을 나타낸다.종속 변수는 온도, 압력 또는 높이와 같이 관찰되는 데이터를 나타낸다.[14]

IVA는 사용자가 차원이 적은 데이터 소스와 매우 많은 차원을 가진 데이터 소스에 대한 정보와 지식을 파악하는 데 도움을 줄 수 있다.[2]

IVA 수준

IVA 도구는 몇 가지 다른 수준의 복잡성으로 나눌 수 있다.이러한 수준들은 데이터를 분석하기 위한 다양한 상호작용 도구를 사용자에게 제공한다.대부분의 사용에서 첫 번째 수준은 충분하며, 또한 이 수준은 사용자에게 상호작용에서 가장 빠른 응답을 제공하는 수준이다.더 높은 레벨은 데이터에서 더 미묘한 관계를 밝혀내는 것을 가능하게 한다.그러나 이를 위해서는 도구에 대한 더 많은 지식이 필요하며 상호작용 프로세스는 응답 시간이 더 길다.[1]

기준레벨

IVA의 가장 간단한 형태는 브러싱과 링크로 구성된 베이스 레벨이다.여기서 사용자는 여러 데이터 집합 변수를 사용하여 여러 보기를 설정하고 보기 중 하나에 흥미로운 영역을 표시할 수 있다.선택 항목에 해당하는 데이터 지점은 다른 보기에 자동으로 표시된다.많은 정보는 이 IVA 수준에서 도출될 수 있다.변수 간의 관계가 합리적으로 간단한 데이터 집합의 경우, 이 기법은 일반적으로 사용자가 필요한 이해 수준을 달성하기에 충분하다.[7]

2단계

브러싱과 브러시의 논리적인 조합과의 연결은 IVA의 보다 발전된 형태다.이를 통해 사용자는 한 개 또는 여러 개의 뷰로 여러 영역을 표시하고 이러한 영역을 논리 연산자와 결합할 수 있다.이를 통해 데이터셋을 더 깊이 탐구하고 더 많은 숨겨진 정보를 볼 수 있다.[7]간단한 예로는 날씨 데이터의 분석을 들 수 있다.분석가는 따뜻한 기온과 강수량이 적은 지역을 발견하기를 원할 것이다.

3단계

선택 항목의 논리적 조합은 데이터 집합에서 의미 있는 정보를 찾기에 충분하지 않을 수 있다.데이터 내 숨겨진 관계를 더욱 분명하게 만드는 여러 가지 기법이 있다.이것들 중 하나는 속성 유래다.이를 통해 사용자는 파생상품, 군집화 정보 또는 기타 통계 속성과 같은 데이터에서 추가 속성을 도출할 수 있다.원칙적으로 운영자는 원시 데이터에 대해 어떠한 계산도 수행할 수 있다.파생된 속성은 다른 속성처럼 연결되고 브러싱될 수 있다.[7]

IVA 레벨 3의 두 번째 도구는 각도 브러싱, 유사성 브러싱 또는 백분위수 브러싱과 같은 고급 브러싱 기술이다.이러한 브러싱 도구는 일반적인 "점 및 클릭" 선택보다 고급 방식으로 데이터 포인트를 선택한다.고급 브러싱은 속성 파생보다 빠른 응답을 생성하지만 학습 곡선이 높고 데이터 집합에 대한 깊은 이해가 필요하다.[7]

4단계

네 번째 수준의 IVA는 각 데이터 집합에 특정되며 데이터 집합과 분석 목적에 따라 달라진다.고려 중인 데이터에 특정한 계산된 속성은 이 범주에 속한다.흐름 데이터 분석의 예로는 흐름 데이터에 존재하는 소용돌이 또는 기타 구조물의 감지 및 분류가 있다.즉, 4단계 IVA 기법은 특정 용도에 개별적으로 맞춤화되어야 한다.고차 형상을 감지한 후 계산된 속성은 원래 데이터 세트에 연결되고 링크와 브러싱의 정상적인 기법을 따라야 한다.[1]

IVA의 패턴

IVA의 "링크 및 브러싱"(선택) 개념은 데이터 집합의 다양한 변수 유형 간에 사용될 수 있다.어떤 패턴을 사용해야 하는지는 데이터 집합의 상관 관계 측면에 따라 달라진다.[1][15]

피쳐 로컬리제이션

종속 변수 집합에서 데이터 점(예: 온도)을 브러싱하고 이러한 데이터 점이 나타나는 독립 변수(예: 공간 또는 시간) 중 어디에 표시되는지 확인하는 것을 "특징 로컬리제이션"이라고 한다.기능 로컬리제이션으로 사용자는 데이터 집합에서 기능의 위치를 쉽게 식별할 수 있다.기상 데이터 집합의 예로는 어느 지역이 온난한 기후를 가지고 있는지 또는 연중 강수량이 많은 시간이 될 것이다.[1][15]

현지조사

독립 변수를 브러싱하고 종속적 보기에 대한 해당 연결을 찾는 경우 이를 "현지 조사"라고 한다.이를 통해 예를 들어 특정 지역이나 특정 시간의 특성을 조사할 수 있다.예를 들어, 기상 데이터의 경우, 우리는 겨울 동안 온도 분포를 발견할 수 있다.[1][15]

다변량 분석

종속 변수를 브러싱하고 다른 종속 변수에 대한 연결을 관찰하는 것을 다변량 분석이라고 한다.예를 들어 고온을 브러싱하고 압력 분포를 연계하여 관찰함으로써 고온이 압력과 상관관계가 있는지 여부를 알아내는 데 사용할 수 있다.

연결된 각 뷰는 대개 2개 이상의 차원을 가지기 때문에 다변량 분석은 예를 들어 단순한 산점도에서 쉽게 드러나지 않는 데이터의 고차원적 특징을 암묵적으로 파악할 수 있다.[1][15]

적용들

대화형 시각적 분석의 개념은 연구자와 상업적 목적을 위해 여러 소프트웨어 패키지로 구현되었다.

컴비스는 학계의 시각화 연구자들이 자주 사용하는 반면 심비스는 시뮬레이션 데이터 분석에 최적화돼 있다.[8][16]Tableau는 IVA의 개념을 활용한 상용 소프트웨어 제품의 또 다른 예다.

참고 항목

참조

  1. ^ a b c d e f g 과학 데이터의 대화형 시각적 분석.Steffen Oeltze, Helmut Doleisch, Helwig Hauser, Gunther Weber.IEEE VisWeek 2012, 시애틀(WA), 미국에서의 프레젠테이션
  2. ^ a b 하우저, 헬위그."포커스+ 컨텍스트 시각화 일반화"과학적 시각화:데이터에서 지식을 시각적으로 추출.2006년 스프링거 베를린 하이델베르크 305-327
  3. ^ 그레쉬, 도나 L 등"WEAVE: 3-D와 통계 시각화를 시각적으로 연결하기 위한 시스템으로, 심장 시뮬레이션과 측정 데이터에 적용된다."시각화'00에 관한 회의 진행.IEEE 컴퓨터 소사이어티 프레스, 2000.
  4. ^ Doleisch, Helmut, Martin Gaser, Helwig Hauser."복잡한 시뮬레이션 데이터의 포커스+ 컨텍스트 시각화를 위한 상호 작용 기능 사양"2003 데이터 시각화에 대한 심포지엄의 진행.유로그래픽스 협회, 2003.
  5. ^ a b Doleisch, Helmut.다중 이질적 뷰를 사용한 복잡한 시뮬레이션 데이터의 시각적 분석.2004.
  6. ^ a b c 케러, 요하네스다면 과학 데이터의 대화형 시각적 분석.2011년 노르웨이 버겐 대학교 정보학과 박사학위 논문.
  7. ^ a b c d e 코냐, 졸탄 등"데이터 집적과 유도를 이용한 곡선 패밀리의 인터랙티브 시각적 분석"제12차 지식경영 및 지식기술 국제회의의 진행.ACM, 2012.
  8. ^ a b 마트코비치, 크레시미르 등"콤비스:새로운 시각화 기술을 프로토타이핑하기 위한 조정된 다중 뷰 시스템."정보 시각화, 2008.IV'08. 제12차 국제회의.IEEE, 2008
  9. ^ 로버츠, 조나단 C. "예술의 상태: 탐색적 시각화에서 조정되고 다중 뷰"탐색적 시각화에서 조정된 다중 뷰, 2007.CMV07.제5차 국제 회의.IEEE, 2007.
  10. ^ 마틴, 앨런 R, 매튜 O. 워드."다변량 데이터의 대화형 탐색을 위한 고차원 브러싱"제6차 시각화 회의의 진행'95.IEEE 컴퓨터 협회, 1995.
  11. ^ Keim, Daniel A. "정보 시각화 및 시각 데이터 마이닝"시각화 및 컴퓨터 그래픽, IEEE 8.1(2002) 트랜잭션: 1-8.
  12. ^ Doleisch, Helmut, 그리고 Helwig Hauser."3D에서 시뮬레이션 데이터의 포커스+ 컨텍스트 시각화를 위한 부드러운 브러싱" WSCG 10.1(2002) 저널: 147-154.
  13. ^ 램핑, 존, 라마나 라오, 피터 피롤리."대규모 계층 구조를 시각화하기 위한 쌍곡 지오메트리에 기반한 포커스+ 컨텍스트 기법"컴퓨터 시스템의 인적 요인에 관한 SIGCHI 회의의 진행.ACM Press/Addison-Wesley Publishing Co., 1995.
  14. ^ a b 코니하, 졸탄 등"함수 그래프 패밀리의 상호활성 시각적 분석"시각화 및 컴퓨터 그래픽, IEEE 12.6(2006년): 1373-1385.
  15. ^ a b c d 오엘체, 스테펜 등"관류 데이터의 인터랙티브 시각적 분석"시각화 및 컴퓨터 그래픽, IEEE 13.6(2007) 트랜잭션: 1392-1399.
  16. ^ Doleisch, Helmut."심비스:대용량 및 시간에 따른 3D 시뮬레이션 데이터의 대화형 시각적 분석."제39차 동계 시뮬레이션 컨퍼런스 진행 : 40년!최고는 아직 오지 않았다.IEEE 프레스, 2007.