IT/빅데이터분석기사

[3과목] 고급 분석기법 - 시계열분석

김비서 2021. 9. 12. 12:17
728x90

1. 시계열 분석

시계열 자료(data)를 분석하고 여러 변수들 간의 인과관계를 분석하는 방법론이다. 경제학에서도 매우 많이 쓰이는 방법론으로 계량경제학이나 금융, 거시경제분석에 사용한다. 시계열자료의 구분, 정상성 구분에 다른 분석모형 그리고 회귀분석에 대해서 이해할 수 있어야 한다.

 

(1) 시계열 자료

시간의 흐름에 따라서 관측되는 자료(데이터)를 지칭한다. 시계열 자료를 이용하여 미래에 대해 예측 또는 제어하는 것이 주 이용목적이다.

① 이산시계열 : 관측값들이 이산적인 형태로 분리되어 존재한다.

② 연속시계열 : 관측값들이 연속적으로 연결된 형태의 자료를 말한다.

③ 시차 (Time Lag) : 한 관측시점과 다른 관측시점 사이의 간격이다.

 

 

(2) 시계열자료의 성분

① 불규칙 성분(Irregular Component) : 시간에 따른 규칙적인 움직임이 없는(무관하게) 랜덤하게 변화하는 변동성분이다.

② 체계적 성분(Systemic Component) : 시간에 따른 규칙이 존재하는 변동성분이다.

  - 추세성분(Trend Component)

  - 계절성분(Seasonal Component)

  - 순환성분(Cyclical Component)

  - 복합성분

 

 

(3) 정상성(Stationarity)

시계열 데이터가 평균과 분산이 일정한 경우를 지칭한다. 일반적으로 시계열 데이터가 정상성을 가지면 분석이 용이한 형태로 볼 수 있다. 

※ 시계열 데이터가 정상성을 가지지 못한 경우 다루기가 힘드므로 전처리를 통해 정상성을 가지는 데이터로 만드는 과정이 필요하다.

 

① 평균이 일정

  - 모든 시점에 대해 평균이 일정하다.

  - 시계열 데이터가 평균이 일정하지 않으면 차분(difference)을 통해 정상성을 가지도록 한다.

② 분산이 일정

  - 모든 시점에서 분산이 일정하다.

  - 시계열 데이터가 분산이 일정하지 않으면 변환(transformation)을 통해 정상성을 가지도록 한다.

③ 공분산의 경우도 단지 시차에만 의조하며 특정시점에는 의존하지 않음

④ 정상성을 가지는 시계열 자료의 특징

 

 

(4) 시계열자료의 분석 방법

분석 방법 개요 [출처 : 이기적스터디카페]

 

① 단순방법

  - 이동평균법(Moving Average Method) : 과거로부터 현재까지 시계열 자료를 대상으로 일정기간(관측기간)을 시계열을 이동하면서 평균을 계산하는 방법.

  - 지수평활법(Exponential Smoothing Method)  : 이동평균법과 달리 관찰기간의 제한이 없이 모든 시계열 데이터를 사용하며 최근 시계열에 더 많은 가중치를 주며 추세를 찾는 방법.

중기 이상의 예측에 주로 사용한다.

단, 단순지수평활법의 경우 장기 추세나 계절성이 포함된 시계열 데이터에는 부적합하다.

  - 분해법(Decomposition Method) : 시계열자료의 성분 분류대로 시계열 데이터를 분해하는 방법.

시계열이 체계적 성분과 불규칙적 성분으로 이루어져 있다는 가정하에 체계적 성분을 시계열로부터 분리하여 분석/예측을 목적으로 하는 기법이다.

* 체계적 성분이란 추세성분, 계절성분 및 순환성분을 말한다.

 

② 모형에 의한 방법

  - 자기회귀모형(AR : Autoregressive Model)

    : P시점 전의 자료가 현재자료에 영향을 준다는 가정하에 만들어진 시계열예측 모형이다.

  - 자기회귀이동평균모형(ARMA : Autoregressive Moving Average Model)

  - 자기회귀누적이동평균모형(ARIMA : Autoregressive Integrated Moving Average Model)

 

 

반응형