IT/빅데이터분석기사

[4과목] 분석결과 해석 - 분석 모델별 결과 해석

김비서 2021. 9. 14. 23:36
728x90

1. 분석 모델별 결과 해석

(1) 분석모형 해석

분석 후 적합한 모형을 도출하는 데 사용되는 지표는 설명력, 오차율, 인자수, 잔차 등이 있으며 각 모델마다 평가되는 해석 지표들이 다르다.

 

① 회귀 모델

- 회귀분석을 평가할 때는 잔차, 결정계수 등을 사용한다.

- 잔차는 회귀모형으로 예측한 y값과 실제 데이터 간의 차이를 의미하는 것이며 잔차에는 패턴이나 추세가 있어서는 안된다.

- 결정계수는 추정된 회귀식이 변동을 얼마나 잘 설명했는가에 대한 지표로 값이 1에 가까울수록 실제 관측값이 회귀선상에 정확히 일치함을 의미한다.

 

② 분류 모델

- 각각의 경우에 따라 클래스별로 속할 확률의 정확도를 살펴본다.

 

③ 딥러닝 모델

- 딥러닝에서의 적합 모형 해석은 분류문제인 경우 정확도나 오차율을 사용한다.

- 사용하는 오차율은 상대오차나 평균 제곱근 편차를 사용한다.

 

④ 군집분석 모델

- 군집그룹의 통계량을 요약하고 관측치의 공통점과 변동성을 확인한다.

- 연속형 변수의 경우 평균 또는 중앙값을 계산하고 범주형 변수가 있는 경우 범주별로 각 군집의 분포를 사용한다.

 

⑤ 연관분석 모델

- 두 개 또는 그 이상의 품목들 사이의 상호 관련성으로 해석한다.

- 지지도, 신뢰도 및 향상도가 높은 규칙들을 찾되 최소 기준점을 적용하며 빈발집합을 고려하여 연관규칙을 생성하는 Apriori 알고리즘을 사용한다.

 

 

(2) 비즈니스 기여도 평가

데이터 분석은 비즈니스에 도입 활용함으로써 의사결정, 운영 프로세스의 효율화, 개선을 도출하게 되며 이에 대한 기여도 평가가 필요하다.

 

① 빅데이터 분석 목적 : 빅데이터 분석의 근본적인 목적은 과거의 데이터를 토대로 미래를 분석하는 것이다.

- 고객 인사이트(Customer Insight)
- 제품 및 절차 효율성(Product & Process Efficiency)
- 디지털 제품 및 서비스(Digital Products & Service)
- 운영의 탁월성(Operational Excellence)
- 디지털 마케팅(Digital Marketing)
- 위기 관리시스템(Risk Management and Compliance)

② 분석 결과의 기여도 평가 : 일반적으로 분석 결과의 기여도 평가는 ROI(Return Of Investment, 투자수익률) 또는 업무 효율성 향상에 대한 비율로 측정한다.

 

- ROI(투자수익률) : 투자한 자본에 대한 수익/손실 비율

ROI [출처 : 이기적스터디카페]

- 업무 효율성 향상에 대한 비율 : 분석 과제와 연관된 업무 효율성 향상 항목의 측정지표 기준 수립을 통해 산정한다.

 

 

 

2. 분석 모델별 시각화

(1) 회귀 모델

- 변수들 간의 관계 분석을 위해 히트맵(Heat Map)과 산점도(Scatter Plot)를 활용한다.

- 회귀 모델은 여러가지 변수들을 동시에 비교, 전체에서 식별이 되는 부분에 대한 수치, 정도를 표현하는 비교 시각화 기법으로 표현한다. 또한 각기 다른 변수들과의 관계를 표현하는 관계 시각화 기법으로도 시각화를 표현할 수 있다.

 

(2) 분류 모델

① SVM : 산점도와 구분선을 통한 비교시각화 기법으로 활용 범위와 영역을 구분한다.

② KNN : 비교시각화의 평행좌표계로써 변수들과의 연관성 및 그룹데이터의 경향성을 파악한다.

③ 의사결정나무 : 관계시각화 기법의 트리 다이어그램(Tree Diagram)으로 시각화한다.

 

(3) 딥러닝 모델

딥러닝 모델은 모델 아키텍처에서 파라미터, 가중치 시각화 및 특징 차원감소를 통해 시각화할 수 있다.

① Node-link Diagrams for Network Architectures(네트워크 구조를 위한 노드-링크 다이어그램) : 뉴런과 연결 가중치를 표현하는 Node로 시각화한다.

② Dimensional Reduction & Scatter Plots(차원 축소, 산포도)

③ Line Charts for Temporal Metrics(측정을 위한 선도표)

④ Instance-based Analysis & Exploration(객체 기반 분석 및 탐색)

 

(4) 군집분석 모델

다수의 객체를 군집으로 나누는 군집분석은 그룹 클러스터별 단위로 산점도로 시각화한다.

 

(5) 연관분석 모델

각 연관규칙 별로 연관성 있는 항목(item)끼리 묶여서 관계시각화 기법인 네트워크 그래프를 활용하여 시각화한다.

반응형