산포도 2

[4과목] 분석결과 해석 - 분석 모델별 결과 해석

1. 분석 모델별 결과 해석 (1) 분석모형 해석 분석 후 적합한 모형을 도출하는 데 사용되는 지표는 설명력, 오차율, 인자수, 잔차 등이 있으며 각 모델마다 평가되는 해석 지표들이 다르다. ① 회귀 모델 - 회귀분석을 평가할 때는 잔차, 결정계수 등을 사용한다. - 잔차는 회귀모형으로 예측한 y값과 실제 데이터 간의 차이를 의미하는 것이며 잔차에는 패턴이나 추세가 있어서는 안된다. - 결정계수는 추정된 회귀식이 변동을 얼마나 잘 설명했는가에 대한 지표로 값이 1에 가까울수록 실제 관측값이 회귀선상에 정확히 일치함을 의미한다. ② 분류 모델 - 각각의 경우에 따라 클래스별로 속할 확률의 정확도를 살펴본다. ③ 딥러닝 모델 - 딥러닝에서의 적합 모형 해석은 분류문제인 경우 정확도나 오차율을 사용한다. - ..

[2과목] 빅데이터 탐색 - 데이터분석, 상관분석, 기초통계, 분포형태

1. 데이터 탐색의 개요 1) 탐색적 데이터 분석(EDA : Exploratory Data Analysis) 수집한 데이터가 들어왔을 때, 다양한 방법을 통해서 자료를 관찰하고 이해하는 과정을 의미하는 것으로 본격적인 데이터 분석 전에 자료를 직관적인 방법으로 통찰하는 방법이다. 2) 탐색적 데이터 분석의 필요성 - 데이터의 분포 및 값을 검토함으로써 데이터가 표현하는 현상을 이해하며 내재된 잠재적 문제에 대해 인식하고 해결안을 도출할 수 있다. - 다양한 각도에서 데이터를 살펴보는 과정을 통해 문제 정의 단계에서 인지하지 못한 양상, 패턴을 발견할 수 있다. 3) 분석과정 및 절차 - 분석의 목적과 변수가 무엇인지, 개별변수의 이름이나 설명을 가지는지 확인한다. - 데이터의 문제성을 확인한다. 즉, 데..