반응형
I. Apriori 알고리즘의 개요
가. Apriori 알고리즘의 정의
- 데이터들에 대한 발생 빈도를 기반으로 각 데이터 간의 연관관계를 밝히기 위한 방법
나. Apriori Principle (선험적 규칙)
- 모든 항목 집합에 대한 지지도를 계산하지 않고, 원하는 반발항목집합을 찾아내는데 이용되는 규칙
II. Apriori 알고리즘의 연관규칙 탐색 과정
가. 반발항목집합(Large Itemset) 탐색
- 반발항목집합을 찾는 과정 1) 데이터베이스로부터 후보항목집합을 생성하고, 이를 데이터베이스 트랜잭션과 비교하여 반발항목집합을 찾아내는 과정, 더 이상의 반발 k-항목 집합이 없을 때 까지 반복하는 과정을 거친 후 최종 반발항목집합 생성 2) 반발항목집합들을 찾기 위해서 미리 결정된 최소지지도 이상의 트랜잭션 지지도를 가지는 항목 집합들의 모든 집합들을 반발항목집합들이라고 하며 그 외 모든 항목 집합들은 작은 항목 집합들이라고 함 |
나. 연관규칙 생성
- 데이터베이스로부터 연관규칙을 생성하기 위하여 반발항목집합을 이용.
- 지지도(Support)와 신뢰도(Confidence)는 위의 식을 통해 계산
반응형
'IT기술노트 > 빅데이터' 카테고리의 다른 글
데이터마이닝 알고리즘 (0) | 2021.03.03 |
---|---|
KNN(K-Nearest Neighbor) (0) | 2021.03.03 |
군집분석(Cluster Analysis) (0) | 2021.03.03 |
K-Means (0) | 2021.03.03 |
데이터마이닝(Data Mining) (0) | 2021.03.03 |
MOLAP, ROLAP, HOLAP (0) | 2021.03.01 |
OLAP(Online Analysis Processing) (0) | 2021.03.01 |
ETL (Extract Transform Load), CDC (Change Data Capture) (0) | 2021.03.01 |
댓글