본문 바로가기
IT기술노트/빅데이터

데이터마이닝 알고리즘

by 비트코기 2021. 3. 3.
반응형

I. 데이터마이닝 알고리즘의 개요

가. 데이터마이닝 알고리즘의 정의

   - 복잡한 문제들을 해결하기 위해 비즈니스 및 과학적 기관들에 의해 다양한 방법과 알고리즘

나. 데이터마이닝 과업 유형

   - 예측, 연관, 분리


II. 데이터마이닝 과업과 알고리즘

분석기법

내용

연관성 분석

(Associate)

- 여러 개의 트랜잭션들 중에서 동시에 발생하는 트랜잭션의 연관관계를 발견

- 지지도, 신뢰도, 향상도 (Apriori 알고리즘)

연속성 규칙

(Sequence)

- 개인별 이력데이터를 시계열적 분석하여 트랜잭션의 향후 발생 가능성을 예측

분류 규칙

(Classification)

- 이미 알려진 특정그룹에 특징을 부여하여 정의된 분류에 맞게 구분

데이터 군집화

(Clustering)

- 상호간에 유사한 특징을 갖는 데이터들 집단화하는 과정

- K-means Clustering 알고리즘: K개의 묶음으로 군집하여 분류하는 기법

특성화

(Characterization)

- 데이터 집합의 일반적인 특성을 분석

- 데이터의 요약 과정을 통하여 특성 규칙을 발견

의사결정트리

(Decision Tree)

- 과거 축적된 데이터를 분석하여 나무모형으로 분류

신경망 분석

- 인간 두뇌세포 모방한 개념으로 학습을 통한 예측

 

반응형

'IT기술노트 > 빅데이터' 카테고리의 다른 글

통계 결측치(Missing Value)  (0) 2021.03.03
박스플롯 분석  (0) 2021.03.03
결측치, 이상치  (0) 2021.03.03
탐색적분석(Exploratory Data Analysis)  (0) 2021.03.03
KNN(K-Nearest Neighbor)  (0) 2021.03.03
군집분석(Cluster Analysis)  (0) 2021.03.03
K-Means  (0) 2021.03.03
Apriori  (0) 2021.03.03

댓글