본문 바로가기
IT기술노트/빅데이터

Apriori

by 비트코기 2021. 3. 3.
반응형

I. Apriori 알고리즘의 개요

가. Apriori 알고리즘의 정의

   - 데이터들에 대한 발생 빈도를 기반으로 각 데이터 간의 연관관계를 밝히기 위한 방법

나. Apriori Principle (선험적 규칙)

   - 모든 항목 집합에 대한 지지도를 계산하지 않고, 원하는 반발항목집합을 찾아내는데 이용되는 규칙


II.  Apriori 알고리즘의 연관규칙 탐색 과정

가. 반발항목집합(Large Itemset) 탐색

- 반발항목집합을 찾는 과정

1) 데이터베이스로부터 후보항목집합을 생성하고, 이를 데이터베이스 트랜잭션과 비교하여 반발항목집합을 찾아내는 과정, 더 이상의 반발 k-항목 집합이 없을 때 까지 반복하는 과정을 거친 후 최종 반발항목집합 생성

2) 반발항목집합들을 찾기 위해서 미리 결정된 최소지지도 이상의 트랜잭션 지지도를 가지는 항목 집합들의 모든 집합들을 반발항목집합들이라고 하며 그 외 모든 항목 집합들은 작은 항목 집합들이라고 함

나. 연관규칙 생성

- 데이터베이스로부터 연관규칙을 생성하기 위하여 반발항목집합을 이용.

- 지지도(Support)와 신뢰도(Confidence)는 위의 식을 통해 계산

반응형

'IT기술노트 > 빅데이터' 카테고리의 다른 글

데이터마이닝 알고리즘  (0) 2021.03.03
KNN(K-Nearest Neighbor)  (0) 2021.03.03
군집분석(Cluster Analysis)  (0) 2021.03.03
K-Means  (0) 2021.03.03
데이터마이닝(Data Mining)  (0) 2021.03.03
MOLAP, ROLAP, HOLAP  (0) 2021.03.01
OLAP(Online Analysis Processing)  (0) 2021.03.01
ETL (Extract Transform Load), CDC (Change Data Capture)  (0) 2021.03.01

댓글