1. 시계열 분석
시계열 분석
일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석
시계열은 추세요인, 계절요인, 순환요인, 불규칙 요인 등으로 구성
정상성
모든 시점에 일정한 평균과 분산을 갖는 것
시계열 예측에 필수
정상성 확보 방법
차분 : 현 시점의 자료 값에서 이전 시점의 자료 값을 빼는 것
분산 크기 일정 : 지수 변환, 로그 변환으로 일정하게 만들어야 함
자기상관계수(ACF : Autocorrelation Function)
'시간의 흐름'에 따른 변수 간의 상관관계 변화
부분자기상관계수(PACF : Partial Autocorrelation Function)
자기상관함수는 두 시계열 확률변수 간의 상관관계를 보여주지만, 부분자기상관함수는 두 시계열 확률 변수 간에 다른 시점의 확률변수 영향력은 통제하고 상관관계만 보여줌
시계열 분석 기법
이동평균법 : 일정 기간별로 자료를 묶어 평균 계산
지수평활법 : 최근 데이터일수록 큰 가중치를 부여하고, 오래된 데이터일수록 작은 비중을 부여하는 방식을 사용해 평균 계산
백색잡음
공분산과 자기공분산이 모두 0인 시계열 자료
가우시안 백색잡음 : 백색잡음이 평균이 $\mu$, 분산이 $\sigma^2$으로 정규분포를 따는 경우
2. 시계열 모형
자기회귀 (AR: Autoregressive) 모형
자기자신의 과거 값이 미래를 결정하는 모형
t라는 시점의 값은 이전 시점들 n개에 의해 설명될 수 있음을 의미
부분자기상관함수를 활용하여 적절한 n값 활용
이동평균(MA: Moving Average) 모형
백색잡음들의 선형 결합으로 표현된 모형
항상 정상성을 만족
자기회귀누적이동평균(ARIMA: Autoregressive Integrated Moving Average) 모형
비정상 시계열 자료를 다룰 수 있는 모형
차분이나 변환을 통해 정상화할 수 있음
ARIMA(p, d, q)
- p : AR모형의 차수
- d : 시계열 자료를 정상화하기 위한 필요 차분 횟수
- q : MA 모형의 차수
p = 0이면 IMA(d,q) 모형
d = 0 이면 ARMA(p,q) 모형
q = 0 이면 ARI(p,d) 모형
분해시계열
분석 목적에 따라 특정 요인만 분리해 분석하거나 제거하는 작업
분해 시계열은 추세요인(Trend), 계절요인(Seasonal), 순환요인(Cyclical), 불규칙 요인(Irregular) 등으로 구성
'테크 > Data Analysis' 카테고리의 다른 글
ADsP 3단원 데이터 분석 7장 분류 분석 정리 (0) | 2025.02.21 |
---|---|
ADsP 3단원 데이터 분석 6장 데이터 마이닝 정리 (0) | 2025.02.21 |
ADsP 3단원 데이터 분석 4장 다변량 분석 정리 (0) | 2025.02.20 |
ADsP 3단원 데이터 분석 3장 회귀분석 정리 (0) | 2025.02.20 |
ADsP 3단원 데이터 분석 2장 통계분석2 정리 (0) | 2025.02.20 |