본문 바로가기
IT기술노트/빅데이터

의사결정나무(Decision Tree)

by 비트코기 2021. 3. 3.

I. 향후 전략 예측 모델, 의사결정나무의 개요

가. 의사결정나무(Decision Tree)의 정의

   - 관찰된 데이터로부터 분할 기준 속성을 판별하고 분할 기준 속성에 따라 트리 형태로 모델링 한 분류, 예측 모델

나. 의사결정나무의 특징

   - 분류의 정확도는 낮지만, 분류 과정의 이해 및 설명 용이

   - 주어진 데이터의 분류 목적으로 사용, 예측에는 사용할 수 없음

   - 목표 변수가 범주형이면 사용되며, 목표변수가 수치형이면 적용 불가


II.  의사결정나무의 개념도 및 분석단계

가. 의사결정나무의 개념도

- 순환적 분할 방식을 이용하여 나무를 구축하는 기법

나. 의사결정나무의 분석단계

단계

설명

의사결정나무 형성

- 분석의 목적과 자료구조에 따라서 적절한 분리기준(Split Criterion)과 정지기준(Stopping Rule)을 지정하여 의사결정나무를 획득

가지치기

- 분석오류(Classification Error)를 크게 할 위험이 높거나 부적절한 규칙을 가지고 있는 가지(Branch) 제거

타당성 평가

- 이익 도표(Gain Chart)나 위험도표(Risk Char) 또는 검정용 자료(Test Data)에 의한 교차 타당성(Cross Validation)을 이용해 평가

해석 및 예측

- 의사결정나무의 해석, 분류 및 예측모형 설정

- 정지/분리/평가 기준에 따라 다른 의사결정 나무 형성

 

 

반응형

댓글