DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

2025/02/21 2

ADsP 3단원 데이터 분석 7장 분류 분석 정리

1. 로지스틱 회귀 분석로지스틱 회귀분석  종속변수가 범주형 변수일 때 독립변수의 선형 결합을 이용해 사건의 발생 가능성을 분류 예측각 범주에 포함될 확률값을 반환하여 분류한다. 오즈 성공할 확률이 실패할 확률의 몇 배인지$$Odds\, =\, \frac{성공 확률(P)}{실패 확률(1-P)}$$오즈는 두가지의 한계가 존재    - 음수를 가질 수 없다    - 확률값과 오즈의 그래프는 비대칭성을 보임 오즈에 의한 로지스틱 회귀분석 추정식 $$ln(\frac{P}{1-P})\, =\, \alpha + \beta_{1}X_{1} + \beta_{2}X_{2}+\cdots  + \beta_{k}X_{k}$$ 로짓 변환 오즈에 로그값을 취한 것독립변수X가 n 증가하면 확률이 $e^{n}$만큼 증가$$log(O..

ADsP 3단원 데이터 분석 6장 데이터 마이닝 정리

1. 데이터 마이닝데이터 마이닝 데이터 속에서 규칙, 패턴 등을 찾아내어 예측하거나 의사결정에 활용하는 것 지도 학습 : 정답이 있는 데이터를 활용해 분석 모델을 학습시키는 것    - 회귀 분석, 의사결정나무, 신경망비지도 학습 : 정답을 알려주지 않고 학습하는 것    - 군집 분석, 차원축소, 연관분석 데이터 마이닝 프로세스 목적 정의데이터 준비데이터 가공데이터 마이닝 기법 적용검증 데이터 분할 데이터 마이닝 기법을 적용하기에 앞서 데이터를 훈련용, 검정용 평가용의 세 가지 데이터로 분할 과대적합과 과소적합 과대적합 : 모델이 지나치게 데이터를 학습하여 매우 복잡해진 모델과소적합 : 모델이 데이터를 충분히 설명하지 못하는 것  2. 데이터 분할을 통한 검증홀드아웃 전체 데이터를 랜덤하게 추출해 학습..

반응형