앙상블 학습 2

[4과목] 분석모형 개선 - 분석모형 융합, 최종모형 선정

1. 분석모형 융합 분석 성능을 향상하기 위해 구축된 여러 모형을 결합, 융합한다. (1) 앙상블 학습 주어진 자료를 이용하여 여러 가지 분석 예측모형들을 만들고 해당 예측모형들을 결합하여 최종적인 하나의 예측모형을 만드는 방법이다. ① 장점 : 치우침이 있는 여러 모형의 평균을 취할시 균형적인 결과(평균)을 얻는다. 또한 여러 모형의 분석 결과를 결합하면 변동성 및 과적합의 여지가 줄어든다. ② 종류 : 배깅, 부스팅, 랜덤 포레스트 등이 있다. (2) 결합분석 모형 결합분석 모형은 두 종류 이상의 결과변수를 동시에 분석할 수 있는 방법으로 결과 변수 간의 유의성, 관련성을 설명할 수 있다. 2. 최종모형 선정 최종모형을 선정하기 위해 분석모형 평가지표들을 활용, 구축된 부문별 여러 모형을 비교하여 선..

[3과목] 의사결정나무

1. 의사결정나무 의사결정 규칙을 나무(tree) 모양으로 조합하여 목표 변수에 대한 분류 또는 예측을 수행하는 기법이다. 의사결정나무 타이타닉 호 탑승객의 생존 여부를 결정하기 위해 남자인지 여자인지, 나이는 9.5세 아래인지 아닌지, 함께 탑승한 형제/배우자 수는 2.5명 이상인지 아닌지 구분으로 3가지 단계들을 거치게 되면 일종의 학습이 되고 여러 승객의 조건들을 해당 3가지 체크리스트를 기반으로 따라가면서 생존 여부에 대한 예측을 할 수 있다. 이와 같이 예측 가능한 규칙들의 조합을 만들어가는 형태가 나무 모양과 같다고 하여 의사결정나무라고 일컫는다. (1) 의사결정나무의 구성 ① 뿌리마디(Root Node) : 나무가 시작되는 마디 ② 중간마디(Internal Node) : 뿌리마디에서 나온 각..