1. 데이터 이해
1-1. 데이터의 이해
1-2. 데이터의 가치와 미래
1-3. 가치 창조를 위한 데이터 사이언스와 전략 인사이트
2. 데이터 분석 기획
2-1. 데이터 분석 기획의 이해
2-2. 분석 마스터 플랜
3. 데이터 분석
3-1. R 기초와 데이터 마트
3-2. 통계분석
3-2-1. 통계학 개론
3-2-2. 기초 통계분석
3-2-3. 다변량 분석
3-2-4. 시계열 에측
3-3. 정형 데이터 마이닝
시계열 에측
정상성
시계열 모형
정상성
#정상성
- 시간의 흐름에 따라 관측된 시계열 자료를 분석하기 위해서는 정상성을 만족해야 함
- 정상성이란, 시점에 관계없이 시계열의 특성이 일정함을 의미
#정상성의 조건
- 평균이 일정, 분산이 시점에 의존하지 않음, 공분산은 시차에만 의존하고, 시점 자체에는 의존하지 않음
- 위의 3가지 정상성 조건을 만족하지 못하는 경우 비정상 시계열로 부르며, 대부분의 자료가 비정상 시계열임
- 때문에 시계열 자료의 분석을 위해서는 이를 판단하고, 분석 가능한 형태로 바꾸는 작업이 필요함
#비정상 시계열 자료의 분석을 위한 작업
(1) 정상성 만족 여부 판단
- 이상점과 개입을 살핌
- 개략적인 추세 유무를 관찰(상승 또는 하락 추세가 있다면 평균이 일정하지 않음)
(2) 비정상 시계열을 정상성을 만족하도록 수정
- 이상점 존재 -> 이상값 제거
- 개입 -> 회귀분석 수행
- 추세 -> 차분(현 시점의 자료값에서 전 시점의 자료값을 빼는 것)
- 분산이 일정하지 않음 -> 변환
시계열 모형
#AR (자기회귀모형)
- 현 시점의 자료가 p시점 전까지 유한개의 과거 자료로 설명될 수 있다. (p차 자기회귀모형)
- AR 모형인지 판단하기 위해 자기상관함수(ACF)와 부분자기상관함수(PACF)를 이용
- AR(p) 모형은 부분자기상관함수(PACF)가 p+1 시점 이후 절단
#MA (이동평균모형)
- 현 시점의 자료를 p시점 전까지 유한개 백색잡음들의 선형결합으로 표현
- 항상 정상성을 만족하는 모형으로 정상성 가정이 필요없음
- MA 모형인지 판단하기 위해 자기상관함수(ACF)와 부분자기상관함수(PACF)를 이용
- MA(q) 모형은 자기상관함수(ACF)가 p+1 시점 이후 절단
#ARIMA (자기회귀 누적이동평균모형)
- 기본적으로 비정상 시계열 모형
- 차분, 변환을 통해 AR모형이나 MA모형, ARMA 모형으로 정상화
#분해 시계열
- 시계열에 영향을 주는 일반적인 요인을 분리해 분석하는 방법
- 회귀분석적인 방법을 주로 사용
- 이론적 약점이 있음에도 널리 사용됨
#시계열 구성 요소
- 추세 요인 : 상승, 하락, 이차식, 지수식 형태
- 계절 요인 : 요일, 월, 분기 등 고정된 주기에 따른 변화
- 순환 요인 : 명백한 이유없이 알려지지 않은 주기를 가지고 변화
- 불규칙 요인 : 위 세 가지 요인으로 설명할 수 없는 회귀분석의 오차에 해당하는 요인
(참고 사이트)
'Certificates > ADsP' 카테고리의 다른 글
[ADsP] 데이터의 가치와 미래 (0) | 2020.08.21 |
---|---|
[ADsP] 데이터의 이해 (0) | 2020.08.20 |
[ADsP] 다변량 분석 (0) | 2020.08.19 |
[ADsP] 기초 통계분석 - 기술통계, 회귀분석 (0) | 2020.08.18 |
[ADsP] 모수 검정 (0) | 2020.08.17 |
댓글