DIVERSITY IS GOOD
DIVERSITY IS GOOD
반응형

2025/02/22 2

ADsP 3단원 데이터 분석 9장 연관 분석 정리

1. 연관분석의 개요 및 측도연관 분석 조건과 결과로 이루어진 패턴을 분석조건에 따른 결과의 형태로 해석 (IF~ THEN~)품목의 수가 증가하면 분석 계산이 기하급수적으로 증가 측도지지도두 개의 품목이 동시에 포함된 거래의 비율$$P(A\cap B)=\frac{N(A\cap B )(A와\, B가\, 동시에\, 포함된\, 거래\, 수)}{전체\, 거래수}$$신뢰도어떤 하나의 품목이 구매되었을 때 다른 품목이 구매될 확률$$P(B|A) = \frac{P(A\cap B)}{P(A)}$$$$P(A|B) = \frac{P(A\cap B)}{P(B)}$$향상도품목 A가 주어지지 않았을 때 품목 B가 구매될 확률 대비 A가 구매될 때 B가 구매될 확률$$향상도(A→B) = \frac{신뢰도(A→B)}{P(B)}$$..

ADsP 3단원 데이터 분석 8장 군집 분석 정리

1. 군집 분석군집 분석 비지도 학습데이터 사이의 유사성을 측정하고 유사한 자료들끼리 군집을 묶고 다변량 분석을 활용하여 각 군집에 대한 특징을 파악 거리 측도 연속형유클리디안 거리두 점 사이의 거리$d(x,\, y) = \sqrt{\sum_{i=1}^{n} (x_{i}-y_{i})^2}$맨하튼 거리변수들의 차이의 합$d(x, y) = \sum_{i=1}^{n} \left | x_{i}-y_{i} \right | $체비셰프 거리변수 간 거리 차이 중 최댓값$d(x,\, y) = max \left | x_{i}-y_{i} \right | $표준화 거리유클리디안 거리를 표준편차고 나눔$d = \sqrt{\sum_{i=1}^{n} \left(\frac{x_i - \mu_i}{\sigma_i}\right)^2}..

반응형