반응형
I. 탐색적분석의 개요
가. 탐색적분석(Exploratory Data Analysis)의 정의
- 데이터의 구조와 특징을 파악하여 얻은 정보를 바탕으로 통계 모형을 만드는 분석 기법
나. 자료분석의 종류
종류 |
설명 |
탐색적 자료분석 |
- Exploratory Data Analysis - 데이터의 특징과 내재하는 구조적인 관례를 알아내기 위한 분석 기법 |
확증적 자료분석 |
- Confirmatory Data Analysis - 관측된 자료의 형태로 효과의 재현성을 평가하고 추정하는 전통적 분석 기법 |
II. 탐색적분석의 4가지 주제
주제 |
설명 |
저항성 (Resistance) |
- 자료의 일부가 기존과 현격히 다른 값으로 대체되었을 때, 즉 자료의 일부가 파손되었을 때 영향을 적게 받는 성질 |
자료의 재표현 (Re expression) |
- 데이터분석과 해석을 단순화할 수 있도록 원래 변수를 적당한 척도로 변환 - 이와 같은 변환을 통해 분포의 대칭성, 선형성, 분산의 안정성, 관련 변수의 가변성 등 데이터 구조파악과 해석에 도움을 받는다. |
잔차의 해석 (Residual) |
- 잔차를 구해봄으로 데이터의 또 다른 측면의 특징을 볼 수 있는 특징 - 잔차란 관찰 값들이 주 경향으로부터 얼마나 벗어났는지 알아냄 |
자료의 현시성 (Graphic Representation) |
- 자료의 그래프에 의한 표현 즉 자료 안에 숨어있는 정보를 시각적으로 표현 |
반응형
'IT기술노트 > 빅데이터' 카테고리의 다른 글
Bagging/Boosting (0) | 2021.03.03 |
---|---|
통계 결측치(Missing Value) (0) | 2021.03.03 |
박스플롯 분석 (0) | 2021.03.03 |
결측치, 이상치 (0) | 2021.03.03 |
데이터마이닝 알고리즘 (0) | 2021.03.03 |
KNN(K-Nearest Neighbor) (0) | 2021.03.03 |
군집분석(Cluster Analysis) (0) | 2021.03.03 |
K-Means (0) | 2021.03.03 |
댓글