잘못된 그래프

Misleading graph
잘라낸(왼쪽) 그래프 대 정규 그래프(오른쪽) 예제, 동일한 데이터 사용

통계학에서, 왜곡된 그래프라고도 하는 잘못된 그래프는 데이터를 잘못 나타내는 그래프이며, 통계의 오용을 구성하며, 그 결과 잘못된 결론이 도출될 수 있다.

그래프는 지나치게 복잡하거나 구성이 불량하여 오해를 일으킬 수 있습니다.데이터의 특성을 정확하게 표시하도록 구성된 경우에도 그래프는 다른 해석을 하거나 의도하지 않은 종류의 데이터를 외관상, 최종적으로 잘못 [1]도출할 수 있다.

잘못된 그래프는 의도적으로 데이터의 적절한 해석을 방해하거나 그래프 작성 소프트웨어에 익숙하지 않거나 데이터가 잘못 해석되거나 데이터를 정확하게 전달할 수 없기 때문에 우발적으로 생성될 수 있습니다.잘못된 그래프는 종종 잘못된 광고에 사용됩니다.오해의 소지가 있는 그래프에 대해 쓴 최초의 저자 중 한 명은 1954년 출간된 '통계학으로 거짓말을 하는 방법'의 출판자였던 Darrell Huff였다.

데이터 시각화 필드에서는 잘못된 그래프를 생성하지 않도록 정보를 표시하는 방법을 설명합니다.

잘못된 그래프 방법

그러나 객관성에 대한 환상을 망치는 형용사나 부사가 포함되어 있지 않기 때문에 [오해의 소지가 있는 그래프]가 훨씬 효과적입니다.아무도 당신에게 책임을 물을 수 없습니다.

--

오해의 소지가 있는 그래프를 구성하는 [3]방법은 여러 가지가 있습니다.

과도한 사용

필요하지 않은 곳에서 그래프를 사용하면 불필요한 혼란/해석이 [4]발생할 수 있습니다.일반적으로 그래프에 설명이 많이 필요할수록 그래프 자체의 [4]필요성은 줄어듭니다.그래프가 항상 [5]표보다 정보를 더 잘 전달하는 것은 아닙니다.

편향된 라벨링

그래프의 제목, 축 레이블 또는 캡션에서 편향되거나 로드된 단어를 사용하면 판독기가 [4][6]부적절하게 프라이밍될 수 있습니다.

조작된 경향

마찬가지로 상관 없는 데이터를 통해 추세선을 그리려고 하면 독자가 추세선이 존재하지 않는 곳에 있다고 착각할 수 있습니다.이는 의도적으로 독자를 오도하려는 시도 또는 환상적 상관 현상에 의한 결과일 수 있습니다.

파이 차트

  • 서로 다른 크기의 원형 차트를 비교하는 것은 사람들이 [7]원의 비교 영역을 정확하게 읽을 수 없기 때문에 오해를 일으킬 수 있습니다.
  • 얇은 조각의 용도는 식별이 어려울 수 있습니다.[7]
  • 표본 크기가 [8]작을 경우 원형 차트에서 백분율을 레이블로 사용하면 오해의 소지가 있습니다.
  • 파이 차트를 3D로 만들거나 비스듬한 부분을 추가하면 [9]원근법 왜곡으로 해석이 어려워집니다.슬라이스의 높이가 다른 막대 그래프는 [9]판독기에 혼란을 줄 수 있습니다.

3D 파이 차트 슬라이스 투시

원근법(3D) 원형 차트는 차트를 3D로 표시하는 데 사용됩니다.심미적인 이유로 자주 사용되는 3차원은 데이터 판독을 개선하지 않는다. 반대로, 이러한 플롯은 3차원과 관련된 원근법의 왜곡된 효과 때문에 해석하기 어렵다.관심 데이터를 표시하는 데 사용되지 않는 불필요한 치수는 원형 [10]차트뿐만 아니라 차트 전반에 사용하지 않는 것이 좋습니다.3D 파이 차트에서는 표시되는 [11]각도로 인해 판독기에 가까운 슬라이스가 뒤에 있는 슬라이스보다 큰 것으로 나타납니다.이 효과로 인해 독자는 2D보다 3D를 사용할 때 각 슬라이스의 상대적 크기를 판단하는 데 성능이 저하됩니다.

파이 차트 비교
오해의 소지가 있는 원형 차트 일반 원형 차트
Misleading Pie Chart.png Sample Pie Chart.png

항목 C는 오해의 소지가 있는 원형 차트에서 항목 A만큼 크지만 실제로는 절반 미만입니다.D 아이템은 B 아이템보다 훨씬 커 보이지만 사이즈는 같습니다.

미국의 저명한 통계학자 에드워드 터프테는 왜 테이블이 원 그래프보다 선호될 수 있는지 The Visual Display of Quantitive Information:[5]

많은 작은 데이터 세트에는 그래픽보다 테이블이 더 좋습니다.테이블은 거의 항상 바보 같은 원형 차트보다 낫다.파이 차트보다 나쁜 것은 여러 개이다.그러면 뷰어는 파이 내부와 파이 사이의 공간적 혼란에 있는 수량을 비교해야 한다.데이터 밀도가 낮고 시각적 차원에 따라 숫자를 정렬할 수 없기 때문에 원형 차트를 사용하면 안 된다.

부적절한 스케일링

막대 그래프에서 픽토그램을 사용하면 지각적으로 오해의 소지가 있는 [13]비교가 발생하므로 크기를 균일하게 조정해서는 안 된다.픽토그램의 면적은 높이 또는 [14]너비뿐만 아니라 해석됩니다.따라서 스케일링이 차이를 [14]제곱한 것처럼 보이게 됩니다.

막대 그래프에서 2D 픽토그램의 축척이 잘못됨
부적절한 스케일링 규칙적인. 비교
Improperly scaled picture graph.svg Picture Graph.svg Comparison of properly and improperly scaled picture graph.svg

부적절한 크기의 픽토그램 막대 그래프에서 B의 이미지는 실제로 A의 9배입니다.

2D 형상 스케일링 비교
광장 원형 삼각형
Box scaling.svg Circle scaling.svg Triangle scaling.svg

크기를 조정할 때 인식되는 크기가 증가합니다.

픽토그램의 부적절한 스케일링 효과는 픽토그램이 3차원을 가지며, 이 경우 효과가 [15]큐브화 되는 경우에 더욱 예시된다.

Graph showing improper 3D pictogram scaling.svg

주택 매매 그래프(왼쪽)는 오해의 소지가 있다.2001년 주택 판매는 전년 대비 8배 성장한 반면 실제로는 2배 성장한 것으로 보인다.또한 판매 대수도 명시되어 있지 않습니다.

크기가 잘못된 픽토그램은 항목 자체의 [16]크기가 변경되었음을 나타낼 수도 있습니다.

오해의 소지가 있다 규칙적인.
Pictograph not aligned and different size.svg Pictograph aligned and similar size.svg

그림들이 같은 양을 나타낸다고 가정하면, 오해의 소지가 있는 그래프는 바나나가 가장 많은 면적을 차지하고 있고 가장 오른쪽에 있기 때문에 바나나가 더 많다는 것을 보여준다.

로그 스케일링

로그(또는 로그) 척도는 데이터를 표현하는 유효한 수단입니다.그러나 로그 척도로 명확하게 라벨이 부착되지 않은 상태에서 사용하거나 익숙하지 않은 판독기에 표시할 경우 오해의 소지가 있습니다.로그 척도는 선택한 숫자(로그의 밑부분)의 데이터 값을 특정 검정력에 대입합니다.베이스는 보통 e(2.71828...) 또는 10입니다.예를 들어 로그 척도는 데이터의 값이 10이면 높이가 1이고 데이터의 값이 1,000,000(10)이면6 높이가 6일 수 있습니다.통나무 척도 및 변형은 예를 들어 화산 폭발 지수, 지진의 리히터 척도, 별의 크기, 산성 및 알칼리성 용액의 pH 등에 일반적으로 사용된다.이러한 경우에도 로그 척도로 인해 데이터가 눈에 잘 띄지 않을 수 있습니다.로그 척도를 사용하는 이유는 그래프 작성자가 동일한 축에 매우 다른 척도를 표시하려고 하기 때문입니다.로그 척도가 없으면 10 대9 10과 같은3 수량을 비교하는 것은 시각적으로 비현실적입니다.로그 척도가 명확하게 표시되어 있지 않은 그래프나 로그 척도를 모르는 뷰어에게 표시되는 로그 척도가 있는 그래프는 일반적으로 유사한 크기의 데이터 값을 실제로 매우 다른 크기로 보이게 하는 표현을 할 수 있습니다.로그 척도를 잘못 사용하면 서로 매우 다른 값(10 및 10,000 등)이 서로 근접하게 표시될 수 있습니다(기준 10 로그 척도로는 1과 4에 불과합니다).또는 로그 척도가 밑수보다 작은 숫자를 나타내기 때문에 작은 값이 음수인 것처럼 보일 수 있습니다.

로그 척도를 잘못 사용하면 수량 간의 관계가 선형으로 보일 수 있으며, 이러한 관계는 더 높은 값으로 매우 빠르게 상승하는 지수 또는 멱함수 법칙입니다.그것은 주로 유머러스한 방법으로 언급되었지만, "두툼한 마커펜으로 로그 로그 플롯에서 어떤 것이든 선형으로 보인다."[17]

동일 데이터에 대한 선형 척도 및 로그 척도 비교
선형 척도 로그 척도
Linear scale.png Logarithmic scale (2).png

두 그래프 모두 f(x) = 2의x 동일한 지수 함수를 보여 줍니다.왼쪽 그래프는 선형 척도를 사용하여 지수 추세를 명확하게 보여 줍니다.그러나 오른쪽 그래프에서는 로그 척도를 사용하여 직선을 생성합니다.그래프 뷰어가 이를 인식하지 못할 경우 그래프는 선형 추세를 보여 줍니다.


잘린 그래프

잘린 그래프(파열 그래프라고도 함)에는 0에서 시작하지 않는 y축이 있습니다.이러한 그래프는 비교적 변화가 적은 곳에 중요한 변화의 인상을 줄 수 있습니다.

잘라낸 그래프는 차이를 과도하게 그리거나 공간을 절약하기 위해 사용할 수 있지만 종종 사용하지 않는 경우가 있습니다.MS Excel 등의 상용 소프트웨어에서는 이 예시와 같이 값이 모두 좁은 범위 내에 있으면 기본적으로 그래프가 잘리는 경향이 있습니다.시간 경과에 따른 값의 상대적 차이를 표시하기 위해 인덱스 차트를 사용할 수 있습니다.잘린 다이어그램은 항상 기본 숫자를 시각적으로 왜곡합니다.여러 연구에 따르면 사람들에게 Y축이 잘렸다는 사실을 정확히 알렸더라도 실제 차이를 [18]과대평가한 경우가 많았다.

잘린 막대 그래프
잘린 막대 그래프 일반 막대 그래프
Truncated Bar Graph.svg Bar graph.svg

이러한 그래프에는 동일한 데이터가 표시되지만 왼쪽의 잘린 막대 그래프에서는 데이터가 유의한 차이를 보이는 반면 오른쪽의 일반 막대 그래프에서는 이러한 차이를 거의 볼 수 없습니다.

EU 3.png


Y축 파손을 나타내는 방법은 다음과 같습니다.

Y축 절단 표시
Bar graph break.svg Y-axis break.svg

축 변경

Y축 최대값 변경
원본 그래프 더 작은 최대값 더 큰 최대값
Line graph1.svg Line graph3.svg Line graph2.svg

Y축 최대값을 변경하면 그래프가 표시되는 방식에 영향을 미칩니다.최대값이 높을수록 그래프는 변동성이 적고, 성장이 적으며, 선이 가장 낮은 값보다 가파른 것으로 나타납니다.

그래프 치수 비율 변경
원본 그래프 반폭, 높이 2배 2배의 폭, 하프 하이트
Line graph1.svg Line graph1-3.svg Line graph1-4.svg

그래프의 치수 비율을 변경하면 그래프가 표시되는 방식에 영향을 미칩니다.

스케일 없음

그래프의 척도는 [19][20]종종 차이를 과장하거나 최소화하는 데 사용됩니다.

척도가 없는 잘못된 막대 그래프
차이가 적다 더 큰 차이
Example truncated bar graph.svg
Bar graph missing zero1.svg

y축의 시작 값이 부족하면 그래프가 잘리는지 여부가 불분명해집니다.또한 눈금 표시가 없으면 그래프 막대의 크기가 올바르게 조정되었는지 여부를 확인할 수 없습니다.눈금이 없으면 막대 사이의 시각차를 쉽게 조작할 수 있습니다.

척도가 없는 잘못된 선 그래프
변동성 안정적이고 빠른 성장 성장이 느리다
No scale line graph1.svg No scale line graph2.svg No scale line graph3.svg

세 그래프 모두 동일한 데이터를 공유하므로 (x, y) 데이터의 실제 기울기는 동일하지만 데이터가 플롯되는 방법은 그래프에서 선이 만드는 각도의 시각적 모양을 변경할 수 있습니다.이는 각 그래프의 수직 축에 다른 척도가 있기 때문입니다.척도가 표시되지 않기 때문에 이러한 그래프는 오해의 소지가 있습니다.

부적절한 간격 또는 단위

그래프에 사용되는 간격 및 단위를 조작하여 변경 [11]식을 만들거나 완화할 수 있습니다.

데이터 누락

생략된 데이터로 생성된 그래프는 결론을 내릴 정보를 제거합니다.

결측 범주가 있는 산점도
결측 범주가 있는 산점도 정규 산점도
Scatter Plot with missing categories.svg A scatter plot without missing categories.svg

왼쪽의 결측 범주가 있는 산점도에서는 변동이 적고 성장이 더 선형적인 것으로 나타납니다.

재무보고서에서 부정적인 수익률이나 긍정적인 전망과 상관관계가 없는 데이터는 시각적으로 더 [citation needed]좋은 인상을 주기 위해 제외될 수 있다.

3D

정보를 포함하지 않는 불필요한 3차원의 사용은 [9]독자를 혼란스럽게 할 수 있으므로 강력히 권장되지 않습니다.

복잡성

그래프는 통계 데이터를 더 쉽게 해석할 수 있도록 설계되었습니다.그러나 지나치게 복잡한 그래프는 데이터를 난독화시켜 해석을 어렵게 할 수 있다.

부실 공사

그래프가 잘못 구성되면 데이터를 식별하여 해석하기가 어려울 수 있습니다.

추리

잘못된 그래프를 사용하여 잘못된 추세를 [21]추정할 수 있습니다.

왜곡 측정

그래프가 왜곡되었는지 여부를 판단하고 이러한 왜곡을 [22][23]정량화하기 위한 몇 가지 방법이 개발되었습니다.

거짓말 요인

어디에

거짓말 계수(>1)가 높은 그래프는 나타내는 데이터의 변화를 과장하고 거짓말 계수(>0, <1)가 작은 그래프는 데이터의 변화를 [24]모호하게 한다.완벽하게 정확한 그래프는 거짓말 계수 1을 나타낼 것이다.

그래프 불일치 지수

어디에

그래프 왜곡 지수(GDI)로도 알려진 그래프 불일치 지수는 1998년 Paul John Steinbart에 의해 처음 제안되었다.GDI는 -100%에서 양의 무한대까지의 백분율로 계산되며, 0%는 그래프가 올바르게 구성되었음을 나타내며 ±5% 마진을 벗어나는 것은 [22]왜곡된 것으로 간주됩니다.그래픽스 왜곡의 척도로서 GDI를 사용하는 것을 조사한 결과, 일관성이 없고 불연속적인 것으로 판명되어 비교용 측정으로서 GDI를 사용하는 것은 [22]곤란하다.

데이터 잉크비

데이터 잉크 비율은 비교적 높아야 합니다.그렇지 않으면 차트에 불필요한 [24]그래픽이 있을 수 있습니다.

데이터 밀도

데이터 밀도는 비교적 높아야 합니다.그렇지 않으면 데이터를 표시하는 데 [24]테이블이 더 적합할 수 있습니다.

재무 및 기업 보고서의 사용 현황

그래프는 재무 [25]데이터의 요약과 해석에 유용하다.그래프를 사용하면 대규모 데이터 집합의 추세를 볼 수 있는 동시에 [25][26]비전문가도 데이터를 해석할 수 있습니다.

그래프는 기업의 연차 보고서에 인상 관리[27]한 형태로 자주 사용됩니다.미국에서 그래프는 AU 섹션 550 감사재무제표[27]포함하는 문서의 기타 정보에 해당하므로 감사할 필요가 없습니다.

발표된 여러 연구 결과에서는 여러 국가에서 서로 다른 기업의 기업 보고서에서의 그래프 사용에 대해 조사했으며,[27][28][29][30][31][32][33] 이러한 보고서 내에서 부적절한 설계, 선택성 및 측정 왜곡이 빈번하게 사용되고 있는 것으로 나타났습니다.연차 보고서에 잘못된 그래프가 존재함에 따라 표준을 [34][35][36]설정할 것을 요청하게 되었다.

연구에 따르면 재정 이해도가 낮은 독자들은 잘못된 [37]그래프에 의해 잘못 알려질 가능성이 더 크지만, 대출 담당자와 같은 재정 이해도가 있는 독자들조차도 현혹될 [34]수 있다.

학계

그래프에 대한 인식은 정신물리학, 인지심리학, 컴퓨터 [38]비전 등에서 연구된다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ 커크, 52페이지
  2. ^ 허허, 63페이지
  3. ^ 놀란, 49~52페이지
  4. ^ a b c "Methodology Manual: Data Analysis: Displaying Data - Deception with Graphs" (PDF). Texas State Auditor's Office. Jan 4, 1996. Archived from the original on 2003-04-02.{{cite web}}: CS1 maint: bot: 원래 URL 상태를 알 수 없습니다(링크).
  5. ^ a b Tufte, Edward R. (2006). The visual display of quantitative information (4th print, 2nd ed.). Cheshire, Conn.: Graphics Press. p. 178. ISBN 9780961392147.
  6. ^ 켈러, 페이지 84
  7. ^ a b 휘트브레드, 150페이지
  8. ^ 를 클릭합니다Soderstrom, Irina R. (2008), Introductory Criminal Justice Statistics, Waveland Press, p. 17, ISBN 9781478610342.
  9. ^ a b c d 휘트브레드, 페이지 151
  10. ^ Few, Stephen (August 2007). "Save the Pies for Dessert" (PDF). Visual Business Intelligence Newsletter. Perceptual Edge. Retrieved 28 June 2012.
  11. ^ a b Rumsey, 페이지 156
  12. ^ Siegrist, Michael (1996). "The use or misuse of three-dimensional graphs to represent lower-dimensional data". Behaviour & Information Technology. 15 (2): 96–100. doi:10.1080/014492996120300.
  13. ^ 와이스, 페이지 60
  14. ^ a b Uts, 페이지 146-147.
  15. ^ 헐리, 페이지 565-566
  16. ^ 허허, 페이지 72
  17. ^ "Akin's Laws of Spacecraft Design". spacecraft.ssl.umd.edu. Retrieved 2021-03-14.
  18. ^ Hanel, Paul H.P.; Maio, Gregory R.; Manstead, Antony S. R. (2019). "A New Way to Look at the Data: Similarities Between Groups of People Are Large and Important". Journal of Personality and Social Psychology. 116 (4): 541–562. doi:10.1037/pspi0000154. PMC 6428189. PMID 30596430.
  19. ^ Smith, Karl J. (1 January 2012). Mathematics: Its Power and Utility. Cengage Learning. p. 472. ISBN 978-1-111-57742-1. Retrieved 24 July 2012.
  20. ^ Moore, David S.; Notz, William (9 November 2005). Statistics: Concepts And Controversies. Macmillan. pp. 189–190. ISBN 978-0-7167-8636-8. Retrieved 24 July 2012.
  21. ^ Smith, Charles Hugh (29 Mar 2011). "Extrapolating Trends Is Exciting But Misleading". Business Insider. Retrieved 23 September 2018.
  22. ^ a b c Mather, Dineli R.; Mather, Paul R.; Ramsay, Alan L. (July 2003). "Is the Graph Discrepancy Index (GDI) a Robust Measure?". doi:10.2139/ssrn.556833.
  23. ^ Mather, Dineli; Mather, Paul; Ramsay, Alan (1 June 2005). "An investigation into the measurement of graph distortion in financial reports". Accounting and Business Research. 35 (2): 147–160. doi:10.1080/00014788.2005.9729670. S2CID 154136880.
  24. ^ a b c Craven, Tim (November 6, 2000). "LIS 504 - Graphic displays of data". Faculty of Information and Media Studies. London, Ontario: University of Western Ontario. Retrieved 9 July 2012.
  25. ^ a b Fulkerson, Cheryl Linthicum; Marshall K. Pitman; Cynthia Frownfelter-Lohrke (June 1999). "Preparing financial graphics: principles to make your presentations more effective". The CPA Journal. 69 (6): 28–33.
  26. ^ McNelis, L. Kevin (June 1, 2000). "Graphs, An Underused Information Presentation Technique". The National Public Accountant. 45 (4): 28–30.(설명 필요)
  27. ^ a b c Beattie, Vivien; Jones, Michael John (June 1, 1999). "Financial graphs: True and Fair?". Australian CPA. 69 (5): 42–44.
  28. ^ Beattie, Vivien; Jones, Michael John (1 September 1992). "The Use and Abuse of Graphs in Annual Reports: Theoretical Framework and Empirical Study" (PDF). Accounting and Business Research. 22 (88): 291–303. doi:10.1080/00014788.1992.9729446.
  29. ^ Penrose, J. M. (1 April 2008). "Annual Report Graphic Use: A Review of the Literature". Journal of Business Communication. 45 (2): 158–180. doi:10.1177/0021943607313990. S2CID 141123410.
  30. ^ Frownfelter-Lohrke, Cynthia; Fulkerson, C. L. (1 July 2001). "The Incidence and Quality of Graphics in Annual Reports: An International Comparison". Journal of Business Communication. 38 (3): 337–357. doi:10.1177/002194360103800308. S2CID 167454827.
  31. ^ Mohd 이사, Rosiatimah(2006년)."그래픽 정보에 대한 기업의 연례 보고서에서 빈도가 충실한 표현:말레이시아 기업들에 관한 연구".기술 보고서.연구소, 개발 및 상업의, Universiti Teknologi 사실.그 2016-08-15에 원래에서 Archived.또한 Mohd 이사, Rosiatimah(2006년):된다."그래픽 정보 기업 연차 보고서에:사용자 조사 및 Preparers적 지각".필기장 회계 회계의. 4(1):39–59. doi:10.1108/19852510680001583.
  32. ^ Beattie, Vivien; Jones, Michael John (1 March 1997). "A Comparative Study of the Use of Financial Graphs in the Corporate Annual Reports of Major U.S. and U.K. Companies" (PDF). Journal of International Financial Management and Accounting. 8 (1): 33–68. doi:10.1111/1467-646X.00016.
  33. ^ Beattie, Vivien; Jones, Michael John (2008). "Corporate reporting using graphs: a review and synthesis". Journal of Accounting Literature. 27: 71–110. ISSN 0737-4607.
  34. ^ a b Christensen, David S.; Albert Larkin (Spring 1992). "Criteria For High Integrity Graphics". Journal of Managerial Issues. Pittsburg State University. 4 (1): 130–153. JSTOR 40603924.
  35. ^ Eakin, Cynthia Firey; Timothy Louwers; Stephen Wheeler (2009). "The Role of the Auditor in Managing Public Disclosures: Potentially Misleading Information in Documents Containing Audited Financial Statements" (PDF). Journal of Forensic & Investigative Accounting. 1 (2). ISSN 2165-3755.
  36. ^ Steinbart, P. (September 1989). "The Auditor's Responsibility for the Accuracy of Graphs in Annual Reports: Some Evidence for the Need for Additional Guidance". Accounting Horizons: 60–70.
  37. ^ Beattie, Vivien; Jones, Michael John (2002). "Measurement distortion of graphs in corporate reports: an experimental study" (PDF). Accounting, Auditing & Accountability Journal. 15 (4): 546–564. doi:10.1108/09513570210440595.
  38. ^ Frees, Edward W; Robert B Miller (Jan 1998). "Designing Effective Graphs" (PDF). North American Actuarial Journal. 2 (2): 53–76. doi:10.1080/10920277.1998.10595699. Archived from the original on 2012-02-16.{{cite journal}}: CS1 maint: bot: 원래 URL 상태를 알 수 없습니다(링크).

책들

추가 정보

외부 링크