분포 시각화 2

[4과목] 분석결과 시각화 - 분포 시각화

1. 분포 시각화 (1) 분포 시각화 정의 데이터의 분포를 시각적으로 표현하는 기법을 말하며, 특정 변수의 값들이 어떻게 분포되어 있는지를 파악하기 위해 사용한다. - 원그래프와 같이 비율로 영역을 표현하는 경우 각 영역을 모두 합치면 1 또는 100%가 되는 특징을 가진다. - 분포 데이터의 시각화는 최대, 최소, 전체분포를 나타내는 그래프로 표현하며, 전체의 관점에서 각 부분이 차지하는 정보를 히스토그램, 파이차트, 도넛차트, 누적막대그래프, 트리맵 등으로 시각화한다. ※ 시각화 방법들의 장단점을 구분하자. (2) 히스토그램(Histogram) 막대그래프의 일종으로 세로축은 데이터의 분포 정도를 표현하고, 가로축은 특정 변수의 구간 폭을 의미한다. - 데이터셋 안에서 특정 변수의 값이 어떻게 분포되어..

[4과목] 분석결과 시각화 - 데이터 시각화 개요

1. 데이터 시각화 개요 (1) 데이터 시각화 정의 - 데이터 시각화는 데이터의 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정과 기법을 말한다. - 데이터 사이의 관계를 대표할 수 있는 특징을 이미지와 도표 등으로 표현하여 정보를 명확하고 효과적으로 전달하는 것을 목적으로 한다. - 시각화를 위해서는 데이터의 의미를 정확하게 표현하는 기능적인 측면과 사람이 쉽게 인지하고 직관적으로 이해할 수 있는 심미적인 측면을 모두 고려해야 한다. ※ 데이터 시각화 학문적 정의 학자 정의 스터드(Sturat L. Card, 1999) 추상적인 데이터를 컴퓨터의 쌍방향적 시각 표현을 통해서 이해와 이식의 정도를 증폭하는 것이다. 앤디(Andy Kirk, 2002) 대규모의 데이터를 탐색하고 이해하..