모자이크 그림
Mosaic plot모자이크 그림(Marimekko 다이어그램이라고도 함)은 둘 이상의 질적 변수에서 데이터를 시각화하는 그래픽 방법이다.[1] 이것은 하나의 변수에 대해서만 동일한 정보를 그래픽으로 표시하는 척추 플롯의 다차원 확장이다.[2] 데이터의 개요를 제공하고 서로 다른 변수 간의 관계를 인식할 수 있도록 한다. 예를 들어, 독립성은 범주의 상자들이 모두 동일한 영역을 가질 때 나타난다.[3] 모자이크 플롯은 1981년 하티건과 클라이너에 의해 도입되었고 1994년 프렌들리에 의해 확대되었다.[4] 모자이크 플롯은 마라이메코 차트와 유사하기 때문에 메코 차트라고도 불린다.
막대 차트 및 척추도와 마찬가지로, 빈 크기라고도 하는 타일의 영역은 해당 범주 내의 관측치 수에 비례한다.[5]
예
모자이크 플롯의 고전적인 예는 타이타닉에 탑승한 승객들의 데이터를 사용한다. 이 예제에 사용된 데이터는 2201개의 관측치와 3개의 변수를 가지고 있다. 변수는 다음과 같다.
- 개인의 성별(남성/여성)
- 클래스(1등, 2등 및 3등 또는 승무원)
- 이 사람은 침몰에서 살아남았는가(예/아니오)?
관찰 결과는 다음 표로 정리되었다.
| 성별 | 리바이벌 | 1교시 | 2교시 | 3교시 | 크루 |
|---|---|---|---|---|---|
| 남성 | 아니요. | 118 | 154 | 422 | 670 |
| 네 | 62 | 25 | 88 | 192 | |
| 여성 | 아니요. | 4 | 13 | 106 | 3 |
| 네 | 141 | 93 | 90 | 20 |
모자이크 플롯 구성
| 주문 | 변수 | 축 |
|---|---|---|
| 1. | 성별 | 수직 |
| 2. | 클래스 | 수평 |
| 3. | 리바이벌 | 수직 |
범주형 변수를 먼저 순서대로 배열한다. 그런 다음 각 변수를 축에 할당한다. 오른쪽 표에는 이 데이터 세트에 대한 시퀀스와 분류가 제시되어 있다. 다른 순서는 다른 모자이크 그림을 생성하게 된다. 즉, 변수 순서는 모든 다변량 그림에 대해 유의하다.
첫 번째 변수의 왼쪽 가장자리에서 먼저 "성별"을 표시하는데, 이는 데이터를 두 개의 블록으로 수직으로 나눈다는 것을 의미한다. 아래쪽 블록은 암컷에 해당하고 위쪽(거대)은 수컷에 해당된다. 승객의 약 4분의 1이 여성이고 나머지 3분의 1은 남성인 것을 즉시 알 수 있다.
그런 다음 두 번째 변수 "클래스"를 상단 가장자리에 적용한다. 따라서 네 개의 수직 기둥은 해당 변수의 네 가지 값(1차, 2차, 3차 및 승무원)을 표시한다. 열 너비는 모집단에서 해당 값의 상대적 비율을 나타내기 때문에 이 열은 가변 두께가 된다. 승무원들은 분명히 가장 큰 남성 그룹을 대표하고, 반면에 3등 승객들은 가장 큰 여성 그룹을 대표한다. 여성 승무원 수도 미미했던 것으로 보인다.
마지막 변수("Survived")가 최종적으로 적용되며, 이번에는 음영으로 강조된 결과를 왼쪽 가장자리를 따라: 짙은 회색 사각형은 재난에서 살아남지 못한 사람들, 밝은 회색 직사각형을 나타낸다. 곧바로 1급 여성이 생존 확률이 가장 높은 것으로 보인다. 여성의 생존 확률은 남성의 생존 확률(모든 계층에 걸쳐 결혼)보다 높은 것으로 보인다. 마찬가지로, 성별에 대한 한계화는 일등석 승객들이 생존할 가능성이 가장 높은 것으로 간주한다. 전체적으로 전체 인구의 약 1/3이 살아남았다.
특성.
- 표시된 변수는 범주형 또는 순서형 척도입니다.
- 줄거리는 최소한 두 개의 변수로 되어 있다. 상한은 없지만 너무 많은 변수가 그래픽 형태로 혼동될 수 있다.
- 관측치의 수는 제한되지 않고 영상에서 읽히지 않는다.
- 형상의 조합에 사용할 수 있는 직사각형 필드의 표면은 형상의 조합이 있는 관측치의 수에 비례한다.
- 예를 들어 상자 그림이나 QQ 그림과는 달리 모자이크 그림은 신뢰 구간을 표시할 수 없다. 따라서 다양한 특성 값의 다양한 주파수의 중요성은 시각적으로 관찰할 수 없다.
참고 항목
참조
- ^ Sandra D. Schlotzhauer (1 April 2007). Elementary Statistics Using JMP. SAS Institute. p. 407. ISBN 978-1-59994-428-9.
- ^ New Techniques and Technologies for Statistics II: Proceedings of the Second Bonn Seminar. IOS Press. 1 January 1997. p. 254. ISBN 978-90-5199-326-4.
- ^ Michael Friendly (1 January 1991). SAS System for Statistical Graphics. SAS Institute. pp. 512–. ISBN 978-1-55544-441-9.
- ^ SAS Institute (6 September 2013). JMP 11 Basic Analysis. SAS Institute. pp. 251–. ISBN 978-1-61290-684-3.
- ^ Martin Theus; Simon Urbanek (23 March 2011). Interactive Graphics for Data Analysis: Principles and Examples. CRC Press. ISBN 978-1-4200-1106-7.
추가 읽기
- 존 하티건, 비트 클라이너: 응급 테이블용 모자이크. in: 컴퓨터 과학 및 통계: 제13회 인터페이스 심포지엄의 진행. 1981, S. 268–273.

