본문 바로가기
Certificates/ADsP

[ADsP] 시계열 에측

by Air’s Big Data 2020. 8. 19.

1. 데이터 이해 
1-1. 데이터의 이해 
1-2. 데이터의 가치와 미래 
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트 

2. 데이터 분석 기획 
2-1. 데이터 분석 기획의 이해 
2-2. 분석 마스터 플랜 

3. 데이터 분석 
3-1. R 기초와 데이터 마트 

3-2. 통계분석 

  3-2-1. 통계학 개론

  3-2-2. 기초 통계분석

  3-2-3. 다변량 분석

  3-2-4. 시계열 에측

3-3. 정형 데이터 마이닝 

 

시계열 에측

  정상성

  시계열 모형

 

 

 

정상성

#정상성

 - 시간의 흐름에 따라 관측된 시계열 자료를 분석하기 위해서는 정상성을 만족해야 함

 - 정상성이란, 시점에 관계없이 시계열의 특성이 일정함을 의미

 

 

#정상성의 조건

 - 평균이 일정, 분산이 시점에 의존하지 않음, 공분산은 시차에만 의존하고, 시점 자체에는 의존하지 않음

 - 위의 3가지 정상성 조건을 만족하지 못하는 경우 비정상 시계열로 부르며, 대부분의 자료가 비정상 시계열임

 - 때문에 시계열 자료의 분석을 위해서는 이를 판단하고, 분석 가능한 형태로 바꾸는 작업이 필요함

 

 

#비정상 시계열 자료의 분석을 위한 작업

 (1) 정상성 만족 여부 판단

  - 이상점과 개입을 살핌

  - 개략적인 추세 유무를 관찰(상승 또는 하락 추세가 있다면 평균이 일정하지 않음)

 (2) 비정상 시계열을 정상성을 만족하도록 수정

  - 이상점 존재 -> 이상값 제거

  - 개입 -> 회귀분석 수행

  - 추세 -> 차분(현 시점의 자료값에서 전 시점의 자료값을 빼는 것)

  - 분산이 일정하지 않음 -> 변환

 

 

시계열 모형

#AR (자기회귀모형)

 - 현 시점의 자료가 p시점 전까지 유한개의 과거 자료로 설명될 수 있다. (p차 자기회귀모형)

 - AR 모형인지 판단하기 위해 자기상관함수(ACF)와 부분자기상관함수(PACF)를 이용

 - AR(p) 모형은 부분자기상관함수(PACF)가 p+1 시점 이후 절단

 

 

#MA (이동평균모형)

 - 현 시점의 자료를 p시점 전까지 유한개 백색잡음들의 선형결합으로 표현

 - 항상 정상성을 만족하는 모형으로 정상성 가정이 필요없음

 - MA 모형인지 판단하기 위해 자기상관함수(ACF)와 부분자기상관함수(PACF)를 이용

 - MA(q) 모형은 자기상관함수(ACF)가 p+1 시점 이후 절단

 

 

#ARIMA (자기회귀 누적이동평균모형)

 - 기본적으로 비정상 시계열 모형

 - 차분, 변환을 통해 AR모형이나 MA모형, ARMA 모형으로 정상화

 

(출처: www.hcltech.com/blogs/time-series-based-forecasting-using-arima-models)

 

#분해 시계열

 - 시계열에 영향을 주는 일반적인 요인을 분리해 분석하는 방법

 - 회귀분석적인 방법을 주로 사용

 - 이론적 약점이 있음에도 널리 사용됨

 

 

 #시계열 구성 요소

 - 추세 요인 : 상승, 하락, 이차식, 지수식 형태

 - 계절 요인 : 요일, 월, 분기 등 고정된 주기에 따른 변화

 - 순환 요인 : 명백한 이유없이 알려지지 않은 주기를 가지고 변화

 - 불규칙 요인 : 위 세 가지 요인으로 설명할 수 없는 회귀분석의 오차에 해당하는 요인

 

 

(참고 사이트)

https://logoflife.tistory.com/33?category=803379

'Certificates > ADsP' 카테고리의 다른 글

[ADsP] 데이터의 가치와 미래  (0) 2020.08.21
[ADsP] 데이터의 이해  (0) 2020.08.20
[ADsP] 다변량 분석  (0) 2020.08.19
[ADsP] 기초 통계분석 - 기술통계, 회귀분석  (0) 2020.08.18
[ADsP] 모수 검정  (0) 2020.08.17

댓글