본문 바로가기
IT기술노트/빅데이터

탐색적분석(Exploratory Data Analysis)

by 비트코기 2021. 3. 3.
반응형

I. 탐색적분석의 개요

가. 탐색적분석(Exploratory Data Analysis)의 정의

   - 데이터의 구조와 특징을 파악하여 얻은 정보를 바탕으로 통계 모형을 만드는 분석 기법

나. 자료분석의 종류

종류

설명

탐색적 자료분석

- Exploratory Data Analysis

- 데이터의 특징과 내재하는 구조적인 관례를 알아내기 위한 분석 기법

확증적 자료분석

- Confirmatory Data Analysis

- 관측된 자료의 형태로 효과의 재현성을 평가하고 추정하는 전통적 분석 기법


II. 탐색적분석의 4가지 주제

주제

설명

저항성

(Resistance)

- 자료의 일부가 기존과 현격히 다른 값으로 대체되었을 때, 즉 자료의 일부가 파손되었을 때 영향을 적게 받는 성질

자료의 재표현

(Re expression)

- 데이터분석과 해석을 단순화할 수 있도록 원래 변수를 적당한 척도로 변환

- 이와 같은 변환을 통해 분포의 대칭성, 선형성, 분산의 안정성, 관련 변수의 가변성 등 데이터 구조파악과 해석에 도움을 받는다.

잔차의 해석

(Residual)

- 잔차를 구해봄으로 데이터의 또 다른 측면의 특징을 볼 수 있는 특징

- 잔차란 관찰 값들이 주 경향으로부터 얼마나 벗어났는지 알아냄

자료의 현시성

(Graphic Representation)

- 자료의 그래프에 의한 표현 즉 자료 안에 숨어있는 정보를 시각적으로 표현

 

 

반응형

'IT기술노트 > 빅데이터' 카테고리의 다른 글

Bagging/Boosting  (0) 2021.03.03
통계 결측치(Missing Value)  (0) 2021.03.03
박스플롯 분석  (0) 2021.03.03
결측치, 이상치  (0) 2021.03.03
데이터마이닝 알고리즘  (0) 2021.03.03
KNN(K-Nearest Neighbor)  (0) 2021.03.03
군집분석(Cluster Analysis)  (0) 2021.03.03
K-Means  (0) 2021.03.03

댓글