본문 바로가기
IT기술노트/빅데이터

Bagging/Boosting

by 비트코기 2021. 3. 3.

I. Bagging/Boosting의 개요

가. Bagging의 정의

   - 주어진 데이터에서 여러 개의 Bootstrap 자료를 생성하고, 각 자료를 모델링 한 후 결합하여 최종 예측 모형을 만드는 알고리즘

나. Boosting의 정의

   - 잘못 분류된 개체들에 가중치를 적용하여 새로운 분류 규칙을 만들고 이 과정을 반복해 최종 예측 모형을 만드는 Boosting 알고리즘


II.  Bagging/Boosting 알고리즘 수행방법

알고리즘

수행방법

Bagging

1) Row Data에서 Bootstrap 데이터 추출

2) 추출을 반복하여 n개의 데이터 생성

3) 각 데이터를 각각 모델링 하여 모델 생성

4) 단일 모델을 결합하여 Bagging 모델 생성

- 여러 번의 샘플링을 통해 분산을 줄여 모델의 변동성을 감소시키는 방법

Boosting

1) Row Data에 동일 가중치로 모델 생성

2) 생성된 모델로 인한 오 분류 데이터 수집

3) 오 분류 데이터에 높은 가중치 부여

4) 과정 반복을 통하여 모델의 정확도 향상

- Boosting은 잘못 분류된 데이터에 집중해 모델의 정확도를 향상시키는 방법

반응형

댓글