1. 데이터 시각화 개요
(1) 데이터 시각화 정의
- 데이터 시각화는 데이터의 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정과 기법을 말한다.
- 데이터 사이의 관계를 대표할 수 있는 특징을 이미지와 도표 등으로 표현하여 정보를 명확하고 효과적으로 전달하는 것을 목적으로 한다.
- 시각화를 위해서는 데이터의 의미를 정확하게 표현하는 기능적인 측면과 사람이 쉽게 인지하고 직관적으로 이해할 수 있는 심미적인 측면을 모두 고려해야 한다.
※ 데이터 시각화 학문적 정의
학자 | 정의 |
스터드(Sturat L. Card, 1999) | 추상적인 데이터를 컴퓨터의 쌍방향적 시각 표현을 통해서 이해와 이식의 정도를 증폭하는 것이다. |
앤디(Andy Kirk, 2002) | 대규모의 데이터를 탐색하고 이해하려 할 때 동일한 범주 안에서 많은 양의 데이터에 의미를 부여함으로써 공간에 배치된 숫자의 패턴을 인지하게 하는 방법이다. |
(2) 데이터 시각화 특성
※ 데이터 시각화 유사 개념
연관 개념 | 내용 |
정보 시각화 (Information Visualization) |
- 추상화된 데이터를 사람이 인지하기 쉽도록 색채, 통계(도표, 그래프 등), 이미지 등을 활용해 시각화하여 표현하는 것을 말한다. - 추상화 데이터는 수치정보뿐만 아니라 텍스트나 지형정보 같은 비수치 정보까지 포함한다. |
시각적 분석 (Visual Analysis) |
- 상호작용이 가능한 시각적 인터페이스를 사용해 데이터의 분석적 추론을 진행하는 과정을 말한다. - 문제의 크기가 크거나 복잡한 영역에서 시각적으로 다양한 측면에 따라 사람과 컴퓨터가 상호작용하면서 분석을 진행한다. |
정보 디자인 (Information Design) |
- 시각 디자인의 하위 영역으로 정보를 구성하여 효율적으로 사용할 수 있게 하는 디자인 기술 및 업무를 말한다. - 정보를 효과적으로 전달하기 위한 수단으로서 그래픽 디자인을 강조하는 용어로 사용된다. ex) 도로의 공공표지판 |
인포그래픽 (Infographic) |
- 복잡한 수치나 글로 표현되어 있는 정보와 지식을 차트, 지도, 다이어그램, 일러스트레이션 등을 활용하여 한눈에 파악할 수 있도록 시각적으로 표현하는 것이다. ex) 뉴스 기사의 그래픽 |
(3) 데이터의 유형
유형 | 특징 | |
범주형 | 명목형 데이터 (Nominal Data) |
- 특징 카테고리가 갖을 수 있는 값의 집합을 의미한다. - 순서를 매길 수 없지만 셀 수 있다. ex) 성별, 색깔, 취미, 혈액형 등 |
순서형 데이터 (Ordinal data) |
- 특정 카테고리가 갖을 수 있는 값이 순서로 구분할 수 있는 데이터를 의미한다. - 순서를 매길 수 있고 셀 수 있다. ex) 5점 척도, 학점 등 |
|
수치형 | 이산형 데이터 (Discrete Data) |
- 셀 수 있는 형태의 값을 표현하는 자료로 주로 정수값으로 표현된다. ex) 반별 학생수, 불량품수, 나이 등 |
연속형 데이터 (Continuous Data) |
- 연속인 어떤 구간에서 값을 취하는 자료로 주로 측정되는 양을 표현하는 데 사용된다. ex) 시간, 온도, 무게, 길이 등 |
(4) 주요 용어
① 탐색적 자료분석(Exploratory Data Analysis) : 주어진 자료에 대해서 다양한 탐색 기법을 이용해 자료에 대한 충분한 이해를 하는 방법으로 데이터셋에 대한 주요 특징을 주로 시각적 방법을 이용해 분석한다.
② 차트(Chart) : 개별적인 데이터를 표현하는 방식으로 원그래프, 막대그래프, 선 그래프, 면적그래프 등 데이터의 특성에 따라 다른 종류의 차트를 선택할 수 있다.
③ 데이터셋(Data Set) : 데이터 시각화의 기초가 되는 데이터의 집합이다.
④ 축(Axis) : 데이터가 표시될 위치에 대한 기준선으로 2차원 그래프는 2개, 3차원 그래프는 3개의 축으로 구성된다.
⑤ 스케일(Scale) : 그래프에 표현되는 데이터 값의 범위를 말하며, 각각의 축에 일정한 간격을 가지고 표시된다.
⑥ 범례(Legend) : 차트에 표현되고 있는 기호나 선 등이 어떤 의미인지 설명하는 역할을 한다.
⑦ 이상치(Outliers) : 데이터의 정상분포를 벗어나는 데이터로 데이터 시각화를 통해 이상치를 효율적으로 발견할 수 있다.
(5) 데이터의 시각적 속성
(6) 데이터 시각화 방법 및 도구
※ 데이터 시각화 방법
시각화 방법 | 주요 도구 |
시간 시각화 | 막대그래프, 누적막대그래프, 점/선그래프 |
분포 시각화 | 히스토그램, 파이차트, 도넛차트, 트리맵, 누적연속그래프 |
관계 시각화 | 산점도, 버블차트, 히트맵 |
비교 시각화 | 히트맵, 체르노프페이스, 스타차트, 평행좌표계, 다차원척도법 |
공간 시각화 | 지도 매핑 |