분석기법 3

[3과목] 분석기법 - 군집분석

1. 군집분석 비지도학습의 일종으로 주어진 각 개체들의 유사성을 분석해서 높은 대상끼리 일반화된 그룹으로 분류하는 기법이다. 규칙 내지 결과 없이 주어진 데이터들을 가장 잘 설명하는 그룹 또는 클러스터를 찾을 수 있는 방법으로 복잡하고 다양한 대상들을 이해하기 쉽게 구분한다. 군집분석 이상치에 민감하여 신뢰성과 타당성 검증이 어려우나 사전 정보 없이 특정 패턴, 속성을 파악하기 위한 효과적인 그룹 분류 기법으로 통용된다. 유통, 서비스 등 업종 분야에서 VIP 핵심 고객들을 군집화하거나 마케팅 조사에서 실제 앱 이용자들을 더 잘 이해하기 위해 이용자 정보와 이용 패턴 데이터를 수집하여 고객 세그멘테이션을 군집 분석 알고리즘을 통해 진행할 수 있다. 유사한 성향을 보이는 프랜차이즈 매장끼리 군집화하여 차별..

[3과목] 회귀분석

1. 회귀분석 특정 변수가 다른 변수에 어떤 영향을 미치는지, 즉 원인과 결과의 연관을 분석하는 방법으로 주어진 변수들에 대해 변수 사이의 모형을 구하여 적합도를 측정하는 기법이다. 회귀분석 TV 시청을 많이 할수록 운동하는 시간이 적어지는 가설을 입증하려 한다면, TV 시청 시간은 운동 시간에 영향을 미치는 원인 즉 독립변수가 되고, 운동하는 시간은 TV 시청 시간에 따라 영향을 받아 값이 달라지는 결과변수라고 할 수 있다. 이들의 관계를 하나의 함수화 시켜 운동시간을 예측하고자 할 때 회귀분석을 적용할 수 있게 된다. - 독립변수 : 입력값 또는 원인을 설명하는 변수이다. - 종속변수 : 결과값 또는 효과를 설명하는 변수이다. - 회귀선 : 독립변수가 주어질 때의 종속변수의 기댓값이다. - 최소자승법..

[3과목] 분석기법 적용 - 분석기법

1. 분석기법 개요 (1) 학습 유형에 따른 데이터 분석 모델 ① 지도학습(Supervised Learning) - 주어진 데이터에 대해 정답을 부여하고 동일한 정답이 나오도록 분류 또는 새로운 데이터의 정답을 예측하도록 학습한다. - 세부적으로 지도학습 모델은 크게 분류와 예측 모델로 구분되며 각 부문별 활용되는 데이터분석 기법은 다음과 같이 나뉜다. ※ 분류와 예측 모델을 구분할 줄 알아야 한다. ② 비지도학습(Unsupervised Learning) : 정답없이 컴퓨터 스스로 입력데이터 패턴을 구분하도록 학습한다. ③ 준지도학습(Semi-supervised Learning) : 효율적 학습을 위해 목표값이 표시된 데이터와 표시되지 않은 데이터를 모두 학습에 사용함으로써 주어진 데이터 특징을 표현하는..