DIVERSITY IS GOOD
DIVERSITY IS GOOD

테크/Data Analysis

ADsP 3단원 데이터 분석 5장 시계열 분석 정리

diversity is good 2025. 2. 20. 17:18
반응형

1.  시계열 분석

시계열 분석

 

일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석

시계열은 추세요인, 계절요인, 순환요인, 불규칙 요인 등으로 구성

 

정상성

 

모든 시점에 일정한 평균과 분산을 갖는 것

시계열 예측에 필수

 

정상성 확보 방법

 

차분 : 현 시점의 자료 값에서 이전 시점의 자료 값을 빼는 것

분산 크기 일정 : 지수 변환, 로그 변환으로 일정하게 만들어야 함

 

자기상관계수(ACF : Autocorrelation Function)

 

'시간의 흐름'에 따른 변수 간의 상관관계 변화

 

부분자기상관계수(PACF : Partial Autocorrelation Function)

 

자기상관함수는 두 시계열 확률변수 간의 상관관계를 보여주지만, 부분자기상관함수는 두 시계열 확률 변수 간에 다른 시점의 확률변수 영향력은 통제하고 상관관계만 보여줌

 

시계열 분석 기법

 

이동평균법 : 일정 기간별로 자료를 묶어 평균 계산

지수평활법 : 최근 데이터일수록 큰 가중치를 부여하고, 오래된 데이터일수록 작은 비중을 부여하는 방식을 사용해 평균 계산

 

백색잡음

 

공분산과 자기공분산이 모두 0인 시계열 자료

가우시안 백색잡음 : 백색잡음이 평균이 $\mu$, 분산이 $\sigma^2$으로 정규분포를 따는 경우

 

 

2. 시계열 모형

자기회귀 (AR: Autoregressive) 모형

 

자기자신의 과거 값이 미래를 결정하는 모형

t라는 시점의 값은 이전 시점들 n개에 의해 설명될 수 있음을 의미

부분자기상관함수를 활용하여 적절한 n값 활용

 

이동평균(MA: Moving Average) 모형

 

백색잡음들의 선형 결합으로 표현된 모형

항상 정상성을 만족

 

자기회귀누적이동평균(ARIMA: Autoregressive Integrated Moving Average) 모형

 

비정상 시계열 자료를 다룰 수 있는 모형

차분이나 변환을 통해 정상화할 수 있음

ARIMA(p, d, q)

    - p : AR모형의 차수

    - d : 시계열 자료를 정상화하기 위한 필요 차분 횟수

    - q : MA 모형의 차수

 

    p = 0이면 IMA(d,q) 모형

    d = 0 이면 ARMA(p,q) 모형

    q = 0 이면 ARI(p,d) 모형

 

분해시계열

 

분석 목적에 따라 특정 요인만 분리해 분석하거나 제거하는 작업

분해 시계열은 추세요인(Trend), 계절요인(Seasonal), 순환요인(Cyclical), 불규칙 요인(Irregular) 등으로 구성

 

반응형