IT/빅데이터분석기사

[4과목] 분석결과 시각화 - 데이터 시각화 개요

김비서 2021. 9. 15. 23:02
728x90

1. 데이터 시각화 개요

(1) 데이터 시각화 정의

- 데이터 시각화는 데이터의 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정과 기법을 말한다.

- 데이터 사이의 관계를 대표할 수 있는 특징을 이미지와 도표 등으로 표현하여 정보를 명확하고 효과적으로 전달하는 것을 목적으로 한다.

- 시각화를 위해서는 데이터의 의미를 정확하게 표현하는 기능적인 측면과 사람이 쉽게 인지하고 직관적으로 이해할 수 있는 심미적인 측면을 모두 고려해야 한다.

 

※ 데이터 시각화 학문적 정의

학자 정의
스터드(Sturat L. Card, 1999) 추상적인 데이터를 컴퓨터의 쌍방향적 시각 표현을 통해서 이해와 이식의 정도를 증폭하는 것이다.
앤디(Andy Kirk, 2002) 대규모의 데이터를 탐색하고 이해하려 할 때 동일한 범주 안에서 많은 양의 데이터에 의미를 부여함으로써 공간에 배치된 숫자의 패턴을 인지하게 하는 방법이다.

 

(2) 데이터 시각화 특성

※ 데이터 시각화 유사 개념

연관 개념 내용
정보 시각화
(Information Visualization)
- 추상화된 데이터를 사람이 인지하기 쉽도록 색채, 통계(도표, 그래프 등), 이미지 등을 활용해 시각화하여 표현하는 것을 말한다.
- 추상화 데이터는 수치정보뿐만 아니라 텍스트나 지형정보 같은 비수치 정보까지 포함한다.
시각적 분석
(Visual Analysis)
- 상호작용이 가능한 시각적 인터페이스를 사용해 데이터의 분석적 추론을 진행하는 과정을 말한다.
- 문제의 크기가 크거나 복잡한 영역에서 시각적으로 다양한 측면에 따라 사람과 컴퓨터가 상호작용하면서 분석을 진행한다.
정보 디자인
(Information Design)
- 시각 디자인의 하위 영역으로 정보를 구성하여 효율적으로 사용할 수 있게 하는 디자인 기술 및 업무를 말한다.
- 정보를 효과적으로 전달하기 위한 수단으로서 그래픽 디자인을 강조하는 용어로 사용된다.
ex) 도로의 공공표지판
인포그래픽
(Infographic)
- 복잡한 수치나 글로 표현되어 있는 정보와 지식을 차트, 지도, 다이어그램, 일러스트레이션 등을 활용하여 한눈에 파악할 수 있도록 시각적으로 표현하는 것이다.
ex) 뉴스 기사의 그래픽

 

 

(3) 데이터의 유형

유형 특징
범주형 명목형 데이터
(Nominal Data)
- 특징 카테고리가 갖을 수 있는 값의 집합을 의미한다.
- 순서를 매길 수 없지만 셀 수 있다.
ex) 성별, 색깔, 취미, 혈액형 등
순서형 데이터
(Ordinal data)
- 특정 카테고리가 갖을 수 있는 값이 순서로 구분할 수 있는 데이터를 의미한다.
- 순서를 매길 수 있고 셀 수 있다.
ex) 5점 척도, 학점 등
수치형 이산형 데이터
(Discrete Data)
- 셀 수 있는 형태의 값을 표현하는 자료로 주로 정수값으로 표현된다.
ex) 반별 학생수, 불량품수, 나이 등
연속형 데이터
(Continuous Data)
- 연속인 어떤 구간에서 값을 취하는 자료로 주로 측정되는 양을 표현하는 데 사용된다.
ex) 시간, 온도, 무게, 길이 등

 

 

(4) 주요 용어

① 탐색적 자료분석(Exploratory Data Analysis) : 주어진 자료에 대해서 다양한 탐색 기법을 이용해 자료에 대한 충분한 이해를 하는 방법으로 데이터셋에 대한 주요 특징을 주로 시각적 방법을 이용해 분석한다.

② 차트(Chart) : 개별적인 데이터를 표현하는 방식으로 원그래프, 막대그래프, 선 그래프, 면적그래프 등 데이터의 특성에 따라 다른 종류의 차트를 선택할 수 있다.

③ 데이터셋(Data Set) : 데이터 시각화의 기초가 되는 데이터의 집합이다.

④ 축(Axis) : 데이터가 표시될 위치에 대한 기준선으로 2차원 그래프는 2개, 3차원 그래프는 3개의 축으로 구성된다.

⑤ 스케일(Scale) : 그래프에 표현되는 데이터 값의 범위를 말하며, 각각의 축에 일정한 간격을 가지고 표시된다.

⑥ 범례(Legend) : 차트에 표현되고 있는 기호나 선 등이 어떤 의미인지 설명하는 역할을 한다.

⑦ 이상치(Outliers) : 데이터의 정상분포를 벗어나는 데이터로 데이터 시각화를 통해 이상치를 효율적으로 발견할 수 있다.

 

 

(5) 데이터의 시각적 속성

 

 

(6) 데이터 시각화 방법 및 도구

※ 데이터 시각화 방법

시각화 방법 주요 도구
시간 시각화 막대그래프, 누적막대그래프, 점/선그래프
분포 시각화 히스토그램, 파이차트, 도넛차트, 트리맵, 누적연속그래프
관계 시각화 산점도, 버블차트, 히트맵
비교 시각화 히트맵, 체르노프페이스, 스타차트, 평행좌표계, 다차원척도법
공간 시각화 지도 매핑
반응형