반응형
1. 연관분석의 개요 및 측도
연관 분석
조건과 결과로 이루어진 패턴을 분석
조건에 따른 결과의 형태로 해석 (IF~ THEN~)
품목의 수가 증가하면 분석 계산이 기하급수적으로 증가
측도
지지도 | 두 개의 품목이 동시에 포함된 거래의 비율 | $$P(A\cap B)=\frac{N(A\cap B )(A와\, B가\, 동시에\, 포함된\, 거래\, 수)}{전체\, 거래수}$$ |
신뢰도 | 어떤 하나의 품목이 구매되었을 때 다른 품목이 구매될 확률 | $$P(B|A) = \frac{P(A\cap B)}{P(A)}$$ $$P(A|B) = \frac{P(A\cap B)}{P(B)}$$ |
향상도 | 품목 A가 주어지지 않았을 때 품목 B가 구매될 확률 대비 A가 구매될 때 B가 구매될 확률 |
$$향상도(A→B) = \frac{신뢰도(A→B)}{P(B)}$$ |
향상도 > 1 : 양의 상관관계
향상도 = 1 : 상관 없음
향상도 < 1 : 음의 상관관계
2. 연관분석의 알고리즘
apriori 알고리즘
가능한 모든 경우의 수를 탐색하여 측정지표가 높게 나타나는 연관 규칙을 지지도를 사용해 계싼의 복잡도를 줄여준다.
FP-Growth 알고리즘
지지도가 낮은 품목부터 지지도가 높은 품목 순으로 차츰 올라가면서 빈도수가 높은 아이템 집합을 생성
반응형
'테크 > Data Analysis' 카테고리의 다른 글
분석의 첫 단추, 문제 정의와 가설 설정 완전 정복 (0) | 2025.04.22 |
---|---|
데이터 분석의 첫걸음, 명확하게 이해하고 시작하기 (0) | 2025.04.22 |
ADsP 3단원 데이터 분석 8장 군집 분석 정리 (0) | 2025.02.22 |
ADsP 3단원 데이터 분석 7장 분류 분석 정리 (0) | 2025.02.21 |
ADsP 3단원 데이터 분석 6장 데이터 마이닝 정리 (0) | 2025.02.21 |