군집분석 3

[4과목] 분석모형 개선 - 분석모형 융합, 최종모형 선정

1. 분석모형 융합 분석 성능을 향상하기 위해 구축된 여러 모형을 결합, 융합한다. (1) 앙상블 학습 주어진 자료를 이용하여 여러 가지 분석 예측모형들을 만들고 해당 예측모형들을 결합하여 최종적인 하나의 예측모형을 만드는 방법이다. ① 장점 : 치우침이 있는 여러 모형의 평균을 취할시 균형적인 결과(평균)을 얻는다. 또한 여러 모형의 분석 결과를 결합하면 변동성 및 과적합의 여지가 줄어든다. ② 종류 : 배깅, 부스팅, 랜덤 포레스트 등이 있다. (2) 결합분석 모형 결합분석 모형은 두 종류 이상의 결과변수를 동시에 분석할 수 있는 방법으로 결과 변수 간의 유의성, 관련성을 설명할 수 있다. 2. 최종모형 선정 최종모형을 선정하기 위해 분석모형 평가지표들을 활용, 구축된 부문별 여러 모형을 비교하여 선..

[3과목] 고급 분석기법 - 다변량분석

1. 다변량분석(Multivariate Analysis) 다변량분석은 조사 중인 각 개인 혹은 대상물에 대한 다수의 측정치를 동시에 분석하는 모든 통계적 방법이라 볼 수 있다. 따라서 많은 다변량분석 기법은 일변량분석과 이변량분석의 확장형태라 할 수 있다. - 통계적으로는 종속변수의 관계성을 고려해서 여러 개의 단변량분석을 동시에 수행하는 것을 의미한다. (1) 용어 ① 종속 기법(Dependence Methods) : 변수들을 종속변수와 독립변수로 구분하여 독립변수들이 종속변수에 미치는 영향력을 분석하는 기법이다. ② 상호의존적 기법(Interdependence Methods) : 분석할 변수들을 종속변수와 독립변수로 구분하지 않고 전체를 대상으로 하는 분석이다. ③ 명목 척도(Nominal Scale..

[3과목] 분석기법 - 군집분석

1. 군집분석 비지도학습의 일종으로 주어진 각 개체들의 유사성을 분석해서 높은 대상끼리 일반화된 그룹으로 분류하는 기법이다. 규칙 내지 결과 없이 주어진 데이터들을 가장 잘 설명하는 그룹 또는 클러스터를 찾을 수 있는 방법으로 복잡하고 다양한 대상들을 이해하기 쉽게 구분한다. 군집분석 이상치에 민감하여 신뢰성과 타당성 검증이 어려우나 사전 정보 없이 특정 패턴, 속성을 파악하기 위한 효과적인 그룹 분류 기법으로 통용된다. 유통, 서비스 등 업종 분야에서 VIP 핵심 고객들을 군집화하거나 마케팅 조사에서 실제 앱 이용자들을 더 잘 이해하기 위해 이용자 정보와 이용 패턴 데이터를 수집하여 고객 세그멘테이션을 군집 분석 알고리즘을 통해 진행할 수 있다. 유사한 성향을 보이는 프랜차이즈 매장끼리 군집화하여 차별..