반응형
I. Bagging/Boosting의 개요
가. Bagging의 정의
- 주어진 데이터에서 여러 개의 Bootstrap 자료를 생성하고, 각 자료를 모델링 한 후 결합하여 최종 예측 모형을 만드는 알고리즘
나. Boosting의 정의
- 잘못 분류된 개체들에 가중치를 적용하여 새로운 분류 규칙을 만들고 이 과정을 반복해 최종 예측 모형을 만드는 Boosting 알고리즘
II. Bagging/Boosting 알고리즘 수행방법
알고리즘 |
수행방법 |
Bagging |
![]() |
1) Row Data에서 Bootstrap 데이터 추출 2) 추출을 반복하여 n개의 데이터 생성 3) 각 데이터를 각각 모델링 하여 모델 생성 4) 단일 모델을 결합하여 Bagging 모델 생성 - 여러 번의 샘플링을 통해 분산을 줄여 모델의 변동성을 감소시키는 방법 |
|
Boosting |
![]() |
1) Row Data에 동일 가중치로 모델 생성 2) 생성된 모델로 인한 오 분류 데이터 수집 3) 오 분류 데이터에 높은 가중치 부여 4) 과정 반복을 통하여 모델의 정확도 향상 - Boosting은 잘못 분류된 데이터에 집중해 모델의 정확도를 향상시키는 방법 |
반응형
'IT기술노트 > 빅데이터' 카테고리의 다른 글
PACELC 이론 (Partition-Availability-Consistency-Else-Latency-Consistency) (0) | 2022.02.04 |
---|---|
의사결정나무(Decision Tree) (0) | 2021.03.03 |
프로세스 마이닝(Process Mining) (0) | 2021.03.03 |
오피니언 마이닝 (0) | 2021.03.03 |
통계 결측치(Missing Value) (0) | 2021.03.03 |
박스플롯 분석 (0) | 2021.03.03 |
결측치, 이상치 (0) | 2021.03.03 |
탐색적분석(Exploratory Data Analysis) (0) | 2021.03.03 |
댓글