히트 맵

Heat map
여러 조건에서 유전자 발현 값을 반영하는 DNA 마이크로어레이 데이터에서 생성된 열 지도
무인기 탐지 시스템의 RF 커버리지를 보여주는 열 지도

지도(또는 열 지도)는 현상의 크기를 2차원으로 나타내는 데이터 시각화 기법입니다.색상의 변화는 색상이나 강도에 의해 나타날 수 있으며, 현상이 어떻게 집적되거나 공간에 따라 변화하는지에 대한 명확한 시각적 신호를 독자에게 제공한다.열 지도에는 기본적으로 클러스터 열 지도와 공간 열 지도라는 두 가지 범주가 있습니다.클러스터 열 지도에서 크기는 행과 열이 이산적인 현상 및 범주인 고정 셀 크기의 매트릭스로 배치되며, 행과 열의 정렬은 클러스터를 제안하거나 통계 분석을 통해 발견한 것으로 묘사하는 것을 목적으로 의도적이고 다소 자의적이다.셀의 크기는 임의이지만 명확하게 볼 수 있을 만큼 큽니다.반면, 공간 열 지도에서 매그니튜드의 위치는 해당 공간의 매그니튜드 위치에 의해 강제되며, 셀의 개념은 없다. 현상은 지속적으로 변화하는 것으로 간주된다.

"열 지도"는 비교적 새로운 용어이지만, 음영 행렬의 관습은 [1]한 세기 이상 존재해왔다.

역사

열 지도는 데이터 매트릭스의 값을 2D로 표시하는 데서 비롯되었습니다.큰 값은 작은 짙은 회색 또는 검은색 정사각형(픽셀)으로, 작은 값은 더 밝은 정사각형으로 나타냅니다.Tous Saint Loua[fr](1873)는 파리 [1]구 전체의 사회 통계를 시각화하기 위해 음영 매트릭스를 사용했다.Sneath(1957)는 행렬의 행과 열을 군집 분석에 따라 서로 유사한 값을 배치하도록 하여 군집 분석 결과를 표시했습니다.Jacques Bertin은 구트만 척도에 부합하는 데이터를 표시하기 위해 유사한 표현을 사용했다.군집 트리를 데이터 행렬의 행과 열에 결합하는 아이디어는 1973년 Robert Ling에 의해 시작되었습니다.Ling씨는, 픽셀 마다 1 문자폭의 회색의 다른 음영을 나타내기 위해서, 과도한 프린터의 문자를 사용했습니다.릴랜드 윌킨슨은 1994년에 고해상도 컬러 그래픽으로 클러스터 열 지도를 제작하는 최초의 컴퓨터 프로그램(SYSTAT)을 개발했습니다.그림에 표시된 Eisen 등 표시는 이전 SYSTAT [citation needed]설계의 복제품이다.

소프트웨어 디자이너 Cormac Kinney는 1991년에 [2]금융 시장 정보를 묘사한 2D 디스플레이를 설명하기 위해 '히트 맵'이라는 용어를 상표로 등록했습니다.2003년 Kinney의 발명품을 인수한 회사는 본의 아니게 상표를 [3]소멸시켰다.

공간 열 지도 예:빨간색이 가장 높고 파란색이 가장 낮은 온도로 월드 이미지 전체의 온도를 표시합니다.

종류들

열 지도에는 공간 및 그리드라는 두 가지 주요 유형이 있습니다.

공간 열 지도는 공간 현상의 크기를 색상으로 표시하며, 일반적으로 지도 위에 표시됩니다."공간 열 지도 예제"라는 레이블이 붙은 이미지에서는 온도가 세계 지도의 색상 범위별로 표시됩니다.색상 범위는 파란색(콜드)에서 빨간색(핫)까지입니다.

그리드 히트맵은 2차원 매트릭스에서 크기를 색상으로 표시하며, 각 차원은 특성 카테고리를 나타내고 색상은 두 카테고리 각각에서 결합된 특성에 대한 일부 측정의 크기를 나타냅니다.예를 들어 한 차원은 년을 나타내고 다른 차원은 달을 나타내며 측정된 값은 온도일 수 있습니다.이 열 지도는 매달 몇 년 동안 온도가 어떻게 변화했는지를 보여줍니다.그리드 열 지도는 군집화 행렬과 상관도 행렬의 두 가지 다른 유형으로 더 분류됩니다.[4]

  • 클러스터화된 열 지도:연도별 월별 기온의 예는 클러스터형 열 지도입니다.
  • 상관도:상관도는 특성 집합의 특성이 서로 상호 작용하는 방식을 표시하기 위해 각 축에 대해 동일한 특성을 갖는 군집화된 열 지도입니다.A-B의 조합은 B-A의 조합과 같기 때문에 두 번 표현할 필요가 없기 때문에 상관도는 정사각형 대신 삼각형이다.

사용하다

열 지도는 데이터를 단순화하고 시각적으로 데이터 분석을 매력적으로 만드는 기능 때문에 애플리케이션 간에 다양한 가능성을 가지고 있습니다.다양한 유형의 히트 맵을 사용하는 어플리케이션은 다음과 같습니다.

비즈니스 분석:열 지도는 기업의 현재 기능, 성능 및 개선 필요성을 시각적으로 나타내기 위해 비즈니스 분석에 사용됩니다.열 지도는 기업의 기존 데이터를 분석하고 성장 및 기타 특정 노력을 반영하여 업데이트하는 방법입니다.열 지도는 시각적으로 기업 또는 회사의 팀원 및 고객에게 어필합니다.

웹 사이트:웹 사이트 내에서 방문 사용자의 액션을 결정하기 위해 열 지도를 사용하는 방법은 여러 가지가 있습니다.일반적으로 페이지에서 가장 성능이 좋은 요소와 가장 나쁜 요소에 대한 웹 사이트에 대한 통찰력을 결정하기 위해 여러 개의 열 지도를 함께 사용합니다.웹 사이트 분석에 사용되는 특정 열 지도는 다음과 같습니다.

  • 마우스 추적:마우스 추적 열 지도 또는 호버 지도는 사이트 사용자가 커서를 움직이는 위치를 시각화하는 데 사용됩니다.
  • 아이 트래킹:아이 트래킹 히트맵은 웹 사이트 사용자의 눈 위치를 측정하고 눈 고정 용량, 눈 고정 기간, 관심 영역 등의 측정치를 수집합니다.
  • [ Tracking ]을 클릭합니다.클릭 클릭 열 지도 또는 터치 지도는 마우스 추적 열 지도와 유사하지만, 호버 동작 대신 이러한 유형의 열 지도를 사용하면 클릭 동작을 시각화할 수 있습니다.클릭 추적 히트 맵은 버튼이나 드롭다운 메뉴 등 웹 페이지의 클릭 가능한 컴포넌트를 시각적으로 표시할 수 있을 뿐만 아니라 페이지 상의 클릭 불가능한 오브젝트를 추적할 수도 있습니다.
  • AI 세대 주의: AI가 생성한 주의 열 지도는 방문 사용자의 주의가 웹 페이지의 특정 섹션에서 어디로 갈 것인지를 시각화하는 데 도움이 됩니다.이러한 유형의 열 지도는 사용자의 주의 행동을 결정하고 예측하기 위해 생성된 소프트웨어 알고리즘을 사용하여 구현됩니다.
  • 스크롤 트래킹: 스크롤 트래킹 히트맵은 웹 사이트 사용자의 스크롤 동작을 나타내기 위해 사용됩니다.이를 통해 사용자가 가장 [5]많은 시간을 보내는 웹 사이트의 섹션을 시각적으로 확인할 수 있습니다.
데이터 분석 열 지도 예:마우스(근육)의 Hist1 영역 내에서 Genomic Windows의 정규화된 연결 불균형을 표시합니다.
데이터 분석 열 지도 예: Hist1 영역이라고 불리는 마우스(Mus musculus)의 게놈 영역에서 중심도가 큰 5개의 허브 노드 중 하나의 서브그래프입니다.여기서 그래프 내의 각 셀은 게놈 네트워크의 한쪽 가장자리를 나타냅니다.

탐색적 데이터 분석:데이터 사이언티스트와 데이터 분석가는 소규모 및 대규모 데이터 세트를 사용하여 데이터 세트 내의 여러 포인트 간의 중요한 관계와 특징 및 데이터 포인트의 특징을 살펴보고 판단합니다.데이터 사이언티스트와 분석가는 다양한 분야의 다른 사람들과 함께 작업합니다.열 지도를 사용하면 조사 결과와 주요 구성요소를 시각적으로 쉽게 요약할 수 있습니다.데이터를 표현하는 방법은 여러 가지가 있지만, 열 지도는 너무 작고 시각적으로 매력적이지 않으면서 이러한 데이터 지점과 그 관계를 고차원 공간에서 시각화할 수 있습니다.데이터 분석에서 열 지도를 사용하면 축과 대각선의 행 및/또는 열의 특정 변수를 사용할 수 있습니다.

  • 생물학:생물학적 분야에서 열 지도는 크고 작은 데이터 세트를 시각적으로 표현하기 위해 사용된다.DNA, RNA, 유전자 발현 등의 패턴과 유사성에 초점을 맞춥니다.이러한 데이터 세트를 사용하여 생물 정보학 분야의 데이터 과학자는 다양한 개념에 초점을 맞추고 있으며, 그 중 일부는 커뮤니티 검출, 연관성 및 상관 관계이며, 열 지도는 결과를 시각적으로 요약하고 생물 정보학 또는 생물 정보학 분야가 아닌 다른 전문가들과 공유할 수 있는 설득력 있는 방법이다.s. "데이터 분석 열 지도 예"라는 라벨이 붙은 오른쪽에 있는 두 개의 열 지도는 생물학 분야 밖의 누군가에게 특정 영역(Hist1 영역)의 게놈 데이터를 제시할 수 있는 다른 방법을 보여 줍니다. 따라서 생물학자나 데이터 과학자가 제시하려는 일반적인 개념을 더 잘 이해할 수 있습니다.

재무 분석:다양한 제품 및 자산의 가치는 시간에 따라 빠르게 또는 점차적으로 변동합니다.매일매일 시장에 대한 변화를 기록할 필요가 있다.패턴에서 예측을 도출하는 동시에 과거 수치 데이터를 재방문할 수 있습니다.열 지도는 지루한 프로세스를 제거하고 사용자가 데이터 포인트를 시각화하고 여러 [6]성능자를 비교할 수 있도록 지원합니다.

지리적 시각화:열 지도는 데이터의 지리적 분포를 시각화하고 표시하는 데 사용됩니다.열 지도는 지리적 지도에서 사용자가 특정 현상의 강도를 볼 수 있도록 돕고 가장 중요하거나 덜 중요한 항목을 표시하기 위해 서로 다른 밀도의 데이터 지점을 나타낸다.일반적으로 지리적 시각화에 사용되는 열 지도는 Choropleth 지도로 오인되지만, 그 차이는 두 가지를 구별하는 특정 데이터가 어떻게 제시되는지에 따라 달라집니다.[7][8]

스포츠: 열 지도는 많은 스포츠에서 사용할 수 있으며 표시되는 데이터의 고밀도 및 저밀도에 따라 관리자 및/또는 코치의 결정에 영향을 미칠 수 있습니다.사용자는 게임 내 패턴, 상대 팀 및 자신의 팀의 전략을 파악하고, 플레이어, 팀 및 비즈니스에 도움이 되는 보다 정보에 입각한 결정을 내릴 수 있으며, 개선이 필요함을 식별하여 다양한 영역에서 성능을 향상시킬 수 있습니다.또한, 열 지도는 동일한 스포츠의 다른 팀 간 또는 다른 스포츠 간의 비교와 관계를 시각화합니다.[9]

색채 구성

열 지도를 설명하기 위해 다양한 색상표를 사용할 수 있으며, 각각에 대한 인식적 장점과 단점이 있습니다.데이터를 정확하고 효과적으로 표시하기 위해서는 좋은 색상표를 선택하는 것이 필수적이지만, 좋지 않은 색상표를 선택하면 시청자가 부정확한 결론을 내리거나 해당 데이터의 적절한 분석에서 색상 결함이 있는 사람들을 제외시킬 수 있습니다.

무지개 색 지도는 인간이 회색보다 더 많은 색조를 인식할 수 있기 때문에 일반적인 선택이며, 이는 이미지에서 감지할 수 있는 세부 사항의 양을 증가시킨다고 한다.하지만, 이것은 여러 가지 이유로 과학계에서 크게 권장되지 않는다.아마도 가장 큰 이유는 많은 색상이 관련된 경우 시각화를 통해 데이터에 실제로 존재하지 않는 구배가 있다는 인상을 줄 수 있기 때문일 수 있습니다.시각화에 사용되는 색상이 많을수록 더 많은 값이 함께 블리딩되기 시작하고 색상은 그레이스케일 또는 블랙바디 스펙트럼 콜로맵에서 볼 수 있는 자연스러운 지각 순서가 결여됩니다.또한 동일한 색상의 다른 음영으로 표시되는 값은 값이 관련이 없을 [10][11][12]때 관련이 있음을 암시할 수 있습니다.

색상표 선택 시 중요한 고려사항은 어떤 형태의 색상결핍이 있는 사람이든 데이터를 볼 수 있는지 여부입니다.청중이 어떤 형태의 색맹이라도 가지고 있는 경우, 눈에 띄는 빨간색과 녹색 또는 고르지 않은 색 [12]구배는 피하는 것이 현명할 수 있습니다.

Color Brewer 라이브러리의 "Blues" 색상 팔레트를 사용하여 1950년부터 2020년까지의 Southern Rockies 평균 기온을 나타내는 열 지도

대상자에 대한 고려사항과 더불어 데이터를 표시하는 형식을 고려하는 것도 중요합니다.예를 들어, 데이터가 흑백으로 인쇄되거나 대형 화면에 투영되는 경우 색상표 선택을 조정하는 것이 현명할 수 있습니다.일반적인 콜로맵(많은 시각화 소프트웨어 패키지에서 기본값으로 사용되는 "제트" 콜로맵과 같은)은 휘도에서 제어되지 않은 변화가 있어 표시 또는 인쇄를 위해 그레이스케일로 의미 있는 변환을 방해합니다.이는 또한 실제 데이터로부터 주의를 분산시켜 노란색 및 시안 영역을 실제로 가장 [10][12]중요한 데이터 영역보다 임의로 더 두드러지게 보이게 합니다.

소프트웨어 구현

몇 가지 열 지도 소프트웨어 구현은 자유롭게 사용할 수 있습니다.

이 열 지도는 마우스의 Hist1 영역(근육) 내에서 게놈 윈도우의 정규화된 연결 불균형을 보여줍니다.
  • 통계 컴퓨팅과 그래픽을 위한 자유 소프트웨어 환경인 R에는 열 [13][14]지도를 추적하는 몇 가지 기능이 포함되어 있습니다.
  • 범용 무료 명령줄 플롯 프로그램인 Gnuplot은 2D 및 3D 열 [15]지도를 추적할 수 있습니다.
  • Google Fusion 테이블은 Google [16]Sheets 스프레드시트에서 지리 데이터의 1000포인트로 제한된 열 지도를 생성할 수 있습니다.
  • Dave Green의 'cubehelix' 색 구성표는 흑백 포스트스크립트 장치에서 [17]단조롭게 증가하는 회색 스케일로 인쇄되는 색 구성표를 위한 리소스를 제공합니다.
  • 오픈레이어3은 벡터층 [18]내에 모든 지리적 특징의 선택된 성질의 열지도층을 그릴 수 있다.
  • D3.js,[19][20] AnyChart[21][22]HighCharts[23][24] 데이터 시각화용 JavaScript 라이브러리로, 솔루션의 일부로 기본에서 사용자 지정에 이르기까지 인터랙티브한 열 지도 차트를 작성할 수 있습니다.

Choropleth 지도와 히트 지도

미국의 주별 인구밀도를 시각화한 합창 지도.

지리적으로 [citation needed]시각화된 데이터를 참조할 때 초로플러스 맵과 히트 맵이 서로 잘못 사용되는 경우가 많습니다.두 기법 모두 관심 변수의 비율을 보여주지만, 두 기법은 변수의 데이터 집계에 대한 경계가 어떻게 구성되는지에 따라 다릅니다.관리 단위와 같은 불규칙한 경계를 사용하여 데이터를 수집하고 집계한 경우 해당 데이터를 표시하는 열 지도는 합창 지도와 동일하므로 두 가지 차이점에 대한 혼동을 부추깁니다.

초로플러스 지도는 국가, 주, 도, 심지어 범람원 등 지리적 경계별로 분류된 데이터를 보여줍니다.각 영역에는 색 강도, 음영 또는 패턴으로 시각화된 단일 값이 있습니다.미국의 주별 인구밀도를 보여주는 합창 지도를 보여주는 오른쪽에 있는 그림을 예로 들 수 있다.이 그림은 각 주의 경계에 의해 경계되는 다른 모든 주의 값에 비례하는 파란색 강도로 나타나는 단수 값(인구)을 보여준다.

마찬가지로, 열 지도는 지리적 영역에 걸쳐 데이터를 시각화할 수도 있습니다.그러나 초로플스 지도와 달리, 열 지도는 지리적 경계에 관계없이 임의적이지만 일반적으로 작은 그리드 크기에 대한 변수의 비율을 보여준다.[25] [26] 오른쪽에 있는 그림은 세계 인구의 열 지도를 보여주는 예입니다.그림은 임의의 그리드(평방킬로미터)에 경계된 단일 값(인구)을 나타내고 그리드 내의 각 셀은 다른 모든 셀에 대한 셀 값에 비례하는 색 강도로 표현된다.근사 지역 데이터를 사용하여 작성된 일부 열 지도는 실제로 존재하지 않는 시각화에 익숙한 지리적 경계를 나타낼 수 있다.지리적 경계는 시각화 기법보다는 데이터 세트 내에 패턴이 존재하기 때문입니다.세계 인구의 열 지도를 표시하는 오른쪽 그림에도 이러한 현상이 포함되어 있습니다.미국과 남아메리카의 시골 지역은 그러한 지역의 익숙한 지리적 국경과 매우 유사할 수 있다.

1994년 전 세계 평방 킬로미터당 인구 밀도를 시각화한 열 지도.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Wilkinson L, Friendly M (May 2009). "The History of the Cluster Heat Map". The American Statistician. 63 (2): 179–184. CiteSeerX 10.1.1.165.7924. doi:10.1198/tas.2009.0033. S2CID 122792460.
  2. ^ "United States Patent and Trademark Office, registration #75263259". 1993-09-01.
  3. ^ Silhavy R, Senkerik R, Oplatkova ZK, Silhavy P, Prokopova Z (2016-04-26). Software Engineering Perspectives and Application in Intelligent Systems. ISBN 978-3-319-33622-0.
  4. ^ "All About Heatmaps". 24 December 2020.
  5. ^ "A Guide to Heatmaps: What is a Heatmap, the Use, and Types? Attention Insight". 27 May 2021.
  6. ^ "5 Real Heat Map Examples from Leading Industries [2022] VWO". 20 January 2020.
  7. ^ "All About Heatmaps". 24 December 2020.
  8. ^ "Guide to Geographic Heat Maps [Types & Examples]". 20 December 2021.
  9. ^ "5 Real Heat Map Examples from Leading Industries [2022] VWO". 20 January 2020.
  10. ^ a b Borland D, Taylor MR (2007). "Rainbow color map (still) considered harmful". IEEE Computer Graphics and Applications. 27 (2): 14–7. doi:10.1109/MCG.2007.323435. PMID 17388198.
  11. ^ Borkin MA, Gajos KZ, Peters A, Mitsouras D, Melchionna S, Rybicki FJ, et al. (December 2011). "Evaluation of artery visualizations for heart disease diagnosis". IEEE Transactions on Visualization and Computer Graphics. 17 (12): 2479–88. CiteSeerX 10.1.1.309.590. doi:10.1109/TVCG.2011.192. PMID 22034369. S2CID 2548700.
  12. ^ a b c Crameri F, Shephard GE, Heron PJ (October 2020). "The misuse of colour in science communication". Nature Communications. 11 (1): 5444. Bibcode:2020NatCo..11.5444C. doi:10.1038/s41467-020-19160-7. PMC 7595127. PMID 33116149.
  13. ^ "Using R to draw a heat map from Microarray Data". Molecular Organisation and Assembly in Cells. 26 Nov 2009.
  14. ^ "Draw a Heat Map". R Manual.
  15. ^ "Gnuplot demo script: Heatmaps.dem".
  16. ^ "Fusion Tables Help - Create a heat map". Jan 2018. support.google.com
  17. ^ "Dave Green's 'cubehelix' colour scheme".
  18. ^ "ol/layer/Heatmap~Heatmap". OpenLayers. Retrieved 2019-01-01.
  19. ^ "Heatmap". D3.js Graph Gallery. Retrieved 25 July 2020.
  20. ^ "Most basic heatmap in d3.js". D3.js Graph Gallery. Retrieved 25 July 2020.
  21. ^ "Heat Map Chart". AnyChart Documentation. Retrieved 25 July 2020.
  22. ^ "Heat Map Charts - Gallery". AnyChart Gallery. Retrieved 25 July 2020.
  23. ^ "Heatmap - Highcharts docs". Highcharts. Retrieved 9 December 2019.
  24. ^ "Heat and tree maps - Highcharts demos". Highcharts. Retrieved 9 December 2019.
  25. ^ "Choropleth vs. Heat Map « Cartographer's Toolkit". Retrieved 2022-04-15.
  26. ^ "Heatmaps vs Choropleths". www.standardco.de. Retrieved 2022-04-15.

추가 정보

외부 링크