반응형
I. 향후 전략 예측 모델, 의사결정나무의 개요
가. 의사결정나무(Decision Tree)의 정의
- 관찰된 데이터로부터 분할 기준 속성을 판별하고 분할 기준 속성에 따라 트리 형태로 모델링 한 분류, 예측 모델
나. 의사결정나무의 특징
- 분류의 정확도는 낮지만, 분류 과정의 이해 및 설명 용이
- 주어진 데이터의 분류 목적으로 사용, 예측에는 사용할 수 없음
- 목표 변수가 범주형이면 사용되며, 목표변수가 수치형이면 적용 불가
II. 의사결정나무의 개념도 및 분석단계
가. 의사결정나무의 개념도
- 순환적 분할 방식을 이용하여 나무를 구축하는 기법
나. 의사결정나무의 분석단계
단계 |
설명 |
의사결정나무 형성 |
- 분석의 목적과 자료구조에 따라서 적절한 분리기준(Split Criterion)과 정지기준(Stopping Rule)을 지정하여 의사결정나무를 획득 |
가지치기 |
- 분석오류(Classification Error)를 크게 할 위험이 높거나 부적절한 규칙을 가지고 있는 가지(Branch) 제거 |
타당성 평가 |
- 이익 도표(Gain Chart)나 위험도표(Risk Char) 또는 검정용 자료(Test Data)에 의한 교차 타당성(Cross Validation)을 이용해 평가 |
해석 및 예측 |
- 의사결정나무의 해석, 분류 및 예측모형 설정 |
- 정지/분리/평가 기준에 따라 다른 의사결정 나무 형성
반응형
'IT기술노트 > 빅데이터' 카테고리의 다른 글
ELT (Extract, Load, Transform) (0) | 2023.04.23 |
---|---|
데이터 패브릭 (Data Fabric) (0) | 2022.09.17 |
PACELC 이론 (Partition-Availability-Consistency-Else-Latency-Consistency) (0) | 2022.02.04 |
프로세스 마이닝(Process Mining) (0) | 2021.03.03 |
오피니언 마이닝 (0) | 2021.03.03 |
Bagging/Boosting (0) | 2021.03.03 |
통계 결측치(Missing Value) (0) | 2021.03.03 |
박스플롯 분석 (0) | 2021.03.03 |
댓글