IT기술노트/인공지능
DB SCAN Clustering (Density-Based Spatial Clustering of Applications with Noise)
비트코기
2023. 3. 15. 21:17
반응형
I. 밀도기반 군집화 기법, DB SCAN Clustering 의 개요
- 임의의 클러스터 중심값을 이동시키며 Epsilon, MinPt 기준으로 군집화를 수행하는 알고리즘
- 특징 : 고밀도 데이터, 무감독학습, Core Point 기반
II. DB SCAN Clustering 의 프로세스 및 단계별 활동
가. DB SCAN Clustering 의 프로세스
![]() |
- Epsilon과 MinPt 값에 따라 각각의 포인트 구분
나. DB SCAN Clustering 의 단계별 활동
단계 | 활동 | 설명 |
초기 파라미터 설정 | Epsilon 설정 | - 클러스터 중심부에서 이웃간 최대거리 |
- Point를 선정하는 거리요소 | ||
MinPt 설정 | - Epsilon 내에 들어있는 데이터의 최소 갯수를 설정 | |
DB SCAN 포인트 설정 및 군집화 |
Core Point | - Epsilon 내에 존재하는 데이터의 수가 MinPt보다 많거나 같은 경우 |
Border Point | - Epsilon 내 데이터는 MinPt 보다 적지만 군집화에 포함되는 경우 | |
Noise Point | - Epsilon 내 데이터보다 적고 군집화에도 포함되지 않은 경우 |
- Epsilon, MinPt의 설정값은 성능에 큰 영향
반응형