본문 바로가기
IT기술노트/인공지능

DB SCAN Clustering (Density-Based Spatial Clustering of Applications with Noise)

by 비트코기 2023. 3. 15.

I. 밀도기반 군집화 기법, DB SCAN Clustering 의 개요

- 임의의 클러스터 중심값을 이동시키며 Epsilon, MinPt 기준으로 군집화를 수행하는 알고리즘

- 특징 : 고밀도 데이터, 무감독학습, Core Point 기반


II. DB SCAN Clustering 의 프로세스 및 단계별 활동

가. DB SCAN Clustering 의 프로세스

- Epsilon과 MinPt 값에 따라 각각의 포인트 구분

 

나. DB SCAN Clustering 의 단계별 활동

단계 활동 설명
초기 파라미터 설정 Epsilon 설정 - 클러스터 중심부에서 이웃간 최대거리
- Point를 선정하는 거리요소
MinPt 설정 - Epsilon 내에 들어있는 데이터의 최소 갯수를 설정
DB SCAN 포인트 설정
및 군집화
Core Point - Epsilon 내에 존재하는 데이터의 수가 MinPt보다 많거나 같은 경우
Border Point - Epsilon 내 데이터는 MinPt 보다 적지만 군집화에 포함되는 경우
Noise Point - Epsilon 내 데이터보다 적고 군집화에도 포함되지 않은 경우

- Epsilon, MinPt의 설정값은 성능에 큰 영향

반응형

댓글