DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

2025/02/20 4

ADsP 3단원 데이터 분석 5장 시계열 분석 정리

1.  시계열 분석시계열 분석 일정 시간 간격으로 기록된 자료들에 대하여 특성을 파악하고 미래를 예측하는 분석시계열은 추세요인, 계절요인, 순환요인, 불규칙 요인 등으로 구성 정상성 모든 시점에 일정한 평균과 분산을 갖는 것시계열 예측에 필수 정상성 확보 방법 차분 : 현 시점의 자료 값에서 이전 시점의 자료 값을 빼는 것분산 크기 일정 : 지수 변환, 로그 변환으로 일정하게 만들어야 함 자기상관계수(ACF : Autocorrelation Function) '시간의 흐름'에 따른 변수 간의 상관관계 변화 부분자기상관계수(PACF : Partial Autocorrelation Function) 자기상관함수는 두 시계열 확률변수 간의 상관관계를 보여주지만, 부분자기상관함수는 두 시계열 확률 변수 간에 다른 ..

ADsP 3단원 데이터 분석 4장 다변량 분석 정리

1. 다차원 척도법 (MDS : MultiDimensional Scaling) 다차원 척도법 객체 간의 근접성을 시각화데이터를 축소하는 목적으로 사용$$Stress = \sqrt{\frac{\sum(실제거리\, - \, 추정거리)^{2}}{\sum(실제거리^{2})}}$$Stress는 0~1의 값을 갖고 0에 가까울수록 적합도가 높음 계량적 MDS : 양적척도 활용비계량적 MDS : 순서척도(서열척도) 활용   2. 주성분 분석 (PCA, Principal Components주성분 분석 상관성 높은 변수들의 선형 결합으로 차원을 축소하여 새로운 변수 생성  스크리 플롯 (Scree plot) x축은 성분의 개수, y축은 분산변화로 설정하여 주성분의 개수를 선택하는데 도움을 준다. 바이 플롯 (Biplot..

ADsP 3단원 데이터 분석 3장 회귀분석 정리

1. 회귀분석회귀분석 독립변수들이 종속 변수에 얼마나 영향을 미치는지 추정 독립변수 : 원인 변수종속변수 : 결과 변수잔차 : 계산값과 예측값의 차이 회귀분석의 종류 단순회귀 : 1개의 독립변수와 종속변수다중회귀 : 2개 이상의 독립변수와 종속변수다항회귀 : 2개이 상의 독립변수와 종속변수가 2차 함수 관계를 이룸릿지회귀 : L2 규제를 포함라쏘회귀 : L1 규제를 포함 선형 회귀 분석의 분산분석표 요인제곱 합자유도제곱평균F회귀SSRkMSR = SSR/k 잔차SSEn-k-1MSE = SSE/(n-k-1) 총SST = SSR + SSEn-1 MSR/MSE$$SSR\, =\, \sum(\acute{Y}-Y)^2, \; SSE\, = \, \sum(Y-\acute{Y})^2$$  회귀 분석의 가정 선형성 : ..

ADsP 3단원 데이터 분석 2장 통계분석2 정리

1. t-검정 일 표본 t-검정 (One sample t-test) 하나의 모집단의 평균(n)값을 특정 값과 비교하는 경우 사용 일 표본 단측 t-검정 모수값이 "~보다 크다" 혹은 "~보다 작다"와 같이 한쪽의 방향성을 갖는 경우 수행 일 표본 양측 t-검정 모수값이 "~이다" 혹은 "~이 아니다"와 같이 방향성이 없는 경우 수행 이(독립) 표본 t-검정(Independent sample t-test) 서로 독립적인 두 개의 집단에 대하여 모수(모평균)의 값이 같은 값을 갖는지 통계적으로 검정하는 방법 이 표본 단측 t-검정 두 집단에 대하여 모수 비교를 할 때 "~이 ~보다 크다" 혹은 "~이 ~보다 작다"와 같이 두 집단 사이에 대소가 있는 경우 수행 이 표본 양측 t-검정 두 집단에 대하여 모수 ..

반응형