DIVERSITY IS GOOD
DIVERSITY IS GOOD

테크/Data Analysis

ADsP 3단원 데이터 분석 9장 연관 분석 정리

diversity is good 2025. 2. 22. 04:03
반응형

1. 연관분석의 개요 및 측도

연관 분석

 

조건과 결과로 이루어진 패턴을 분석

조건에 따른 결과의 형태로 해석 (IF~ THEN~)

품목의 수가 증가하면 분석 계산이 기하급수적으로 증가

 

측도
지지도 두 개의 품목이 동시에 포함된 거래의 비율 $$P(A\cap B)=\frac{N(A\cap B )(A와\, B가\, 동시에\, 포함된\, 거래\, 수)}{전체\, 거래수}$$
신뢰도 어떤 하나의 품목이 구매되었을 때 다른 품목이 구매될 확률 $$P(B|A) = \frac{P(A\cap B)}{P(A)}$$
$$P(A|B) = \frac{P(A\cap B)}{P(B)}$$
향상도 품목 A가 주어지지 않았을 때 품목 B가 구매될 확률 대비
A가 구매될 때 B가 구매될 확률
$$향상도(A→B) = \frac{신뢰도(A→B)}{P(B)}$$

 

향상도 > 1 : 양의 상관관계

향상도 = 1 : 상관 없음

향상도 < 1 : 음의 상관관계

 

 

2. 연관분석의 알고리즘

apriori 알고리즘

 

가능한 모든 경우의 수를 탐색하여 측정지표가 높게 나타나는 연관 규칙을 지지도를 사용해 계싼의 복잡도를 줄여준다.

 

FP-Growth 알고리즘

 

지지도가 낮은 품목부터 지지도가 높은 품목 순으로 차츰 올라가면서 빈도수가 높은 아이템 집합을 생성

반응형