Article 3. 시계열 분석 3223

2 minute read

Section 2. 고급 분석기법

Paragraph 1. 시계열 분석(Time-series Data)의 개념

연도별, 분기별, 월별 등 시계열로 관측되는 자료를 분석하여 미래를 예측하기 위한 분석기법이다.

Paragraph 2. 시계열 분석의 특징

  • x축에는 시간, y축에는 관측값을 나타내어 추세를 빠르게 분석한다.
  • 시계열 데이터는 규칙적, 불규칙한 특징을 갖는다.

Paragraph 3. 정상성

Subparagraph 1. 정상성(Stationary) 개념

  • 정상성은 시점에 상관없이 시계열의 특성이 일정하다는 의미이다.
  • 시계열 분석을 위해서는 정상성을 만족해야 한다.

Subparagraph 2. 정상성 조건

  • 평균이 일정하다.
  • 분산이 시점에 의존하지 않는다.
  • 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다.

Paragraph 4. 시계열 모형

시계열 모형에는 자기 회귀 모형, 이동평균모형, 자기 회귀 누적 이동평균모형이 있다.

Subparagraph 1. 자기 회귀 모형(AR 모형; Auto-Regressive Model)

  • 자기 회귀 모형은 현시점의 자료가 p 시점 전의 유한개의 과거 자료로 설명될 수 있다는 의미이다.

img

img

Subparagraph 2. 이동평균모형(Moving Average model)

  • 시간이 지날수록 관측치의 평균값이 지속적으로 증가하거나 감소하는 시계열 모형으로 MA 모형이라고 한다.

img

  • 현시점의 자료를 유한개의 백색잡음의 선형 결합으로 표현되었기 때문에 항상 정상성을 만족하므로 정상성 가정이 필요 없다.
  • 이동 평균 모형은 시계열 모델 중 자신의 과거 값을 사용하여 설명하는 모형으로 백색잡음의 현재 값과 자기 자신의 과거 값의 선형 가중합으로 이루어진 정상 확률 모형이다.
  • 모형에 사용하는 시계열 자료의 시점에 따라 1차, 2차, ⋅⋅⋅, P차 등을 사용하지만, 정상 시계열 모형에서는 주로 1, 2차를 사용한다.

img

Subparagraph 3. 자기 회귀 누적 이동평균모형

Clause 1. 자기 회귀 누적 이동평균모형(ARIMA 모형; Auto Regressive Integrated Moving Average Model) 개념

  • ARIMA 모형은 분기/반기/연간 단위로 다음 지표를 예측하거나 주간/월간 단위로 지표를 리뷰하여 트렌드를 분석하는 기법이다.
  • 기본적으로 비정상 시계열모형이기 때문에 차분이나 변환을 통해 AR 모형이나 MA 모형, ARMA 모형으로 정상화할 수 있다.

Clause 2. 자기 회귀 누적 이동평균모형 차수

ARIMA(p, d, q) 모형은 차수 p, d, q가 있다.

차수 설명
p AR 모형과 관련
q MA 모형과 관련이 있는 차수
d ARIMA에서 ARMA로 정상화할 때 몇 번 차분을 했는지를 의미

Clause 3. 자기 회귀 누적 이동평균모형과 다른 모형과의 관계

ARIMA(p, d, q) 모형은 차수 p, d, q의 값에 따라 모형의 이름이 다르게 된다.

조건 설명
p = 0 IMA(d, q) 모형이라 부르고, 이 모형을 d번 차분하면 MA(q) 모형이 됨
q = 0 AR(p, d) 모형이며, 이를 d번 차분한 시계열 모형이 AR(p) 모형을 따르게 됨
d = 0 ARMA(p, q) 모형이라 부르고, 이 모형은 정상성을 만족

Subparagraph 4. 분해 시계열

Clause 1. 분해 시계열 개념

  • 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법이다.
  • 시계열을 분리하는 분해식을 사용한다.

img

  • 회귀 분석적인 방법을 주로 사용하고 있다.

Clause 2. 시계열 구성요소

시계열 구성요소는 다음 4가지로 분류된다.

구성요소 내용
추세 요인
(Trend Factor)
자료가 어떤 특정한 형태를 취함
예) 선형적 추세, 이차식 형태, 지수적 형태 등
계열 요인
(Seasonal Factor)
고정된 주기에 따라 자료가 변화할 경우
예) 요일마다 반복, 일 년 중 각 월에 의한 변화, 사분기 자료에서 각 분기에 의한 변화 등
순환 요인
(Cyclical Factor)
알려지지 않은 주기를 가지고 자료가 변화
예) 명백한 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 가지고 변화
불규칙 요인
(Irregular Factor)
추세, 계졀, 순환 요인으로 설명할 수 없는 회귀 분석에서 오차에 해당하는 요인