Article 3. 시계열 분석 3223
Section 2. 고급 분석기법
Paragraph 1. 시계열 분석(Time-series Data)의 개념
연도별, 분기별, 월별 등 시계열로 관측되는 자료를 분석하여 미래를 예측하기 위한 분석기법이다.
Paragraph 2. 시계열 분석의 특징
- x축에는 시간, y축에는 관측값을 나타내어 추세를 빠르게 분석한다.
- 시계열 데이터는 규칙적, 불규칙한 특징을 갖는다.
Paragraph 3. 정상성
Subparagraph 1. 정상성(Stationary) 개념
- 정상성은 시점에 상관없이 시계열의 특성이 일정하다는 의미이다.
- 시계열 분석을 위해서는 정상성을 만족해야 한다.
Subparagraph 2. 정상성 조건
- 평균이 일정하다.
- 분산이 시점에 의존하지 않는다.
- 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않는다.
Paragraph 4. 시계열 모형
시계열 모형에는 자기 회귀 모형, 이동평균모형, 자기 회귀 누적 이동평균모형이 있다.
Subparagraph 1. 자기 회귀 모형(AR 모형; Auto-Regressive Model)
- 자기 회귀 모형은 현시점의 자료가 p 시점 전의 유한개의 과거 자료로 설명될 수 있다는 의미이다.
Subparagraph 2. 이동평균모형(Moving Average model)
- 시간이 지날수록 관측치의 평균값이 지속적으로 증가하거나 감소하는 시계열 모형으로 MA 모형이라고 한다.
- 현시점의 자료를 유한개의 백색잡음의 선형 결합으로 표현되었기 때문에 항상 정상성을 만족하므로 정상성 가정이 필요 없다.
- 이동 평균 모형은 시계열 모델 중 자신의 과거 값을 사용하여 설명하는 모형으로 백색잡음의 현재 값과 자기 자신의 과거 값의 선형 가중합으로 이루어진 정상 확률 모형이다.
- 모형에 사용하는 시계열 자료의 시점에 따라 1차, 2차, ⋅⋅⋅, P차 등을 사용하지만, 정상 시계열 모형에서는 주로 1, 2차를 사용한다.
Subparagraph 3. 자기 회귀 누적 이동평균모형
Clause 1. 자기 회귀 누적 이동평균모형(ARIMA 모형; Auto Regressive Integrated Moving Average Model) 개념
- ARIMA 모형은 분기/반기/연간 단위로 다음 지표를 예측하거나 주간/월간 단위로 지표를 리뷰하여 트렌드를 분석하는 기법이다.
- 기본적으로 비정상
시계열
모형이기 때문에 차분이나 변환을 통해 AR 모형이나 MA 모형, ARMA 모형으로 정상화할 수 있다.
Clause 2. 자기 회귀 누적 이동평균모형 차수
ARIMA(p, d, q) 모형은 차수 p, d, q가 있다.
차수 | 설명 |
---|---|
p | AR 모형과 관련 |
q | MA 모형과 관련이 있는 차수 |
d | ARIMA에서 ARMA로 정상화할 때 몇 번 차분을 했는지를 의미 |
Clause 3. 자기 회귀 누적 이동평균모형과 다른 모형과의 관계
ARIMA(p, d, q) 모형은 차수 p, d, q의 값에 따라 모형의 이름이 다르게 된다.
조건 | 설명 |
---|---|
p = 0 | IMA(d, q) 모형이라 부르고, 이 모형을 d번 차분하면 MA(q) 모형이 됨 |
q = 0 | AR(p, d) 모형이며, 이를 d번 차분한 시계열 모형이 AR(p) 모형을 따르게 됨 |
d = 0 | ARMA(p, q) 모형이라 부르고, 이 모형은 정상성을 만족 |
Subparagraph 4. 분해 시계열
Clause 1. 분해 시계열 개념
- 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법이다.
- 시계열을 분리하는 분해식을 사용한다.
회귀 분석적인 방법
을 주로 사용하고 있다.
Clause 2. 시계열 구성요소
시계열 구성요소는 다음 4가지로 분류된다.
구성요소 | 내용 |
---|---|
추세 요인 (Trend Factor) |
자료가 어떤 특정한 형태를 취함 예) 선형적 추세, 이차식 형태, 지수적 형태 등 |
계열 요인 (Seasonal Factor) |
고정된 주기에 따라 자료가 변화할 경우 예) 요일마다 반복, 일 년 중 각 월에 의한 변화, 사분기 자료에서 각 분기에 의한 변화 등 |
순환 요인 (Cyclical Factor) |
알려지지 않은 주기를 가지고 자료가 변화 예) 명백한 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 가지고 변화 |
불규칙 요인 (Irregular Factor) |
추세, 계졀, 순환 요인으로 설명할 수 없는 회귀 분석에서 오차 에 해당하는 요인 |