IT/빅데이터분석기사

[3과목] 고급 분석기법 - 다변량분석

김비서 2021. 9. 12. 01:44
728x90

1. 다변량분석(Multivariate Analysis)

다변량분석은 조사 중인 각 개인 혹은 대상물에 대한 다수의 측정치를 동시에 분석하는 모든 통계적 방법이라 볼 수 있다. 따라서 많은 다변량분석 기법은 일변량분석과 이변량분석의 확장형태라 할 수 있다.

- 통계적으로는 종속변수의 관계성을 고려해서 여러 개의 단변량분석을 동시에 수행하는 것을 의미한다.

 

(1) 용어

① 종속 기법(Dependence Methods) : 변수들을 종속변수와 독립변수로 구분하여 독립변수들이 종속변수에 미치는 영향력을 분석하는 기법이다.

② 상호의존적 기법(Interdependence Methods) : 분석할 변수들을 종속변수와 독립변수로 구분하지 않고 전체를 대상으로 하는 분석이다.

③ 명목 척도(Nominal Scale) : 단지 분류만을 위해 사용된 숫자로서 숫자 그 자체는 전혀 의미가 없는 측정단위이다.

④ 순위 척도(Ordinal Scale) : 선호되는 순위를 나타낸 숫자로서 숫자 자체는 의미를 가지나 간격이나 비율이 의미를 가지지 못하는 측정단위이다.

⑤ 등간 척도(Interval Scale) : 측정된 숫자 자체와 숫자의 차이는 의미를 가지나 숫자의 비율은 의미를 가지지 못하는 측정단위이다.

 

⑥ 비율 척도(Ratio Scale) : 측정된 숫자와 그 간격이 의미를 가질 뿐만 아니라 숫자의 비율마저도 의미를 가지는 가장 높은 측정단위이다.

 

⑦ 정량적 자료(Metric Data) : 등간척도나 비율척도로 측정된 자료로서 질적자료(Qualitative Data) 또는 비모수화된 자료(Nonparametric Data) 라고도 한다.

 

⑧ 비정량적 자료(Nonmetric Data) : 명목척도나 순위척도로 측정된 자료로서 질적 자료(Qualitative Data) 또는 비모수화된 자료(Nonparametric Data) 라고도 한다.

 

⑨ 변량(Variate) : 변수(Variable)들이 연구자의 실험대상인 표본으로부터 수집한 자료 그대로를 나타내는 반면에 변량(Variate)은 이러한 변수들을 일종의 통계적인 방법으로 가중치를 주어 변수들의 합의 형태로 나타낸 새로운 변수를 말한다.

 

 

(2) 다변량분석기법의 분류

① 다중회귀분석(Multi Regression)

다중회귀분석은 하나의 계량적 종속변수와 하나 이상의 계량적 독립변수 간에 관련성이 있다고 가정되는 연구문제에 적합한 분석기법으로, 다수의 독립변수의 변화에 따른 종속변수의 변화를 예측한다.

※ 분석변수들이 종속변수와 독립변수로 구분 가능한지 파악한다.

 

② 다변량분산분석, 다변량공분산분석

- 다변량분산분석(Multivariate ANOVA) : 두 개 이상의 범주형 종속변수와 다수의 계량적 독립변수 간 관련성을 동시에 알아볼 때 이용되는 통계적 방법으로 일변량분산분석의 확장된 형태이다.

- 다변량공분산분석(Multivariate ANCOVA) : 실험에서 통제되지 않은 독립변수들의 종속변수들에 대한 효과를 제거하기 위해 다변량분산분석과 함께 이용되는 방법으로 그 절차는 이변량부분상관과 비슷하다.

 

③ 정준상관분석(Canonical Analysis)

정준상관분석은 하나의 계량적 종속변수와 다수의 계량적 독립변수 간의 관련성을 조사하는 다중회귀분석을 논리적으로 확대시킨 것이라 볼 수 있다.

 

④ 요인분석(Factor Analysis)

요인분석은 많은 수의 변수들 간 상호관련성을 분석하고, 이들 변수들을 어떤 공통 요인들로 설명하고자 할 때 이용되는 기법이다. 즉, 요인분석은 많은 수의 원래 변수들을 이보다 적은 수의 요인으로 요약하기 위한 분석기법이다.

 

⑤ 군집분석(Cluster Analysis)

군집분석은 집단에 관한 사전정보가 전혀 없는 각 표본에 대하여 그 분류체계를 찾을 때, 다시 말해 각 표본을 표본들 간의 유사성에 기초에 한 집단에 분류시키고자 할 때 사용되는 기법으로 판별분석과 달리 군집분석에서는 집단이 사전에 정의되어 있지 않다.

 

⑥ 다중판별분석(Multi Discriminant Analysis)

종속변수가 남/녀와 같이 두 개의 범주로 나누어져 있거나, 상/중/하와 같이 두 개 이상의 범주로 나누어져 있을 경우, 즉 종속변수가 비계량적 변수일 경우 다중판별분석이 이용된다.

 

⑦ 다차원척도법(MDS : Multi-Dimensional Scaling)

다차원척도법은 다차원 관측값 또는 개체들 간의 거리(distance) 또는 비유사성(dissimilarity)을 이용하여 개체들을 원래의 차원보다 낮은 차원(보통 2차원)의 공간상에 위치시켜(spatial configuration) 개체들 사이의 구조 또는 관계를 쉽게 파악하고자 하는데 목적이 있다.

반응형