의사결정나무 2

[4과목] 분석결과 해석 - 분석 모델별 결과 해석

1. 분석 모델별 결과 해석 (1) 분석모형 해석 분석 후 적합한 모형을 도출하는 데 사용되는 지표는 설명력, 오차율, 인자수, 잔차 등이 있으며 각 모델마다 평가되는 해석 지표들이 다르다. ① 회귀 모델 - 회귀분석을 평가할 때는 잔차, 결정계수 등을 사용한다. - 잔차는 회귀모형으로 예측한 y값과 실제 데이터 간의 차이를 의미하는 것이며 잔차에는 패턴이나 추세가 있어서는 안된다. - 결정계수는 추정된 회귀식이 변동을 얼마나 잘 설명했는가에 대한 지표로 값이 1에 가까울수록 실제 관측값이 회귀선상에 정확히 일치함을 의미한다. ② 분류 모델 - 각각의 경우에 따라 클래스별로 속할 확률의 정확도를 살펴본다. ③ 딥러닝 모델 - 딥러닝에서의 적합 모형 해석은 분류문제인 경우 정확도나 오차율을 사용한다. - ..

[3과목] 의사결정나무

1. 의사결정나무 의사결정 규칙을 나무(tree) 모양으로 조합하여 목표 변수에 대한 분류 또는 예측을 수행하는 기법이다. 의사결정나무 타이타닉 호 탑승객의 생존 여부를 결정하기 위해 남자인지 여자인지, 나이는 9.5세 아래인지 아닌지, 함께 탑승한 형제/배우자 수는 2.5명 이상인지 아닌지 구분으로 3가지 단계들을 거치게 되면 일종의 학습이 되고 여러 승객의 조건들을 해당 3가지 체크리스트를 기반으로 따라가면서 생존 여부에 대한 예측을 할 수 있다. 이와 같이 예측 가능한 규칙들의 조합을 만들어가는 형태가 나무 모양과 같다고 하여 의사결정나무라고 일컫는다. (1) 의사결정나무의 구성 ① 뿌리마디(Root Node) : 나무가 시작되는 마디 ② 중간마디(Internal Node) : 뿌리마디에서 나온 각..