반응형
I. 비정형 데이터에서 가치 있는 정보 추출, 텍스트 마이닝의 개요
가. 텍스트 마이닝(Text Mining)의 정의
- 자연어로 구성된 비정형 텍스트 데이터에서 패턴 또는 관계를 추출하여 가치와 의미있는 정보를 찾아내는 마이닝 기법
나. 텍스트 마이닝의 주요 분야
- 문서 분류, 문서 군집, 정보추출, 문서 요약
II. 텍스트 마이닝의 프로세스 및 기법
가. 텍스트 마이닝의 프로세스
나. 텍스트 마이닝의 기법
기법 |
설명 |
정보추출 |
- 일반적인 텍스트 문서로부터 사용자가 원하는 정보를 추출하는 기법 |
문서분류/문서 클러스터링 |
- 문서들을 문서의 내용에 따라 구조화 - 문서분류: 키워드에 따라 문서를 분류하는 기법 - 문서 클러스터링: 문서 분석하여 동일 내용의 문서들을 묶는 기법 - 문서분류/클러스터링: 문서를 관련된 내용 별로 자동으로 구조화 |
Topic Tracking |
- 사용자 프로필을 기반으로 사용자가 관심 있어 하는 문서가 어떤 문서인지 예측 |
Web Mining |
- 텍스트 마이닝 기법을 웹 사이트에 적용 |
문서요약 |
- 문서에서 다룬 중요한 내용을 글로 요약하려는 시도 |
반응형
'IT기술노트 > 빅데이터' 카테고리의 다른 글
비즈니스 인텔리전스와 비즈니스 애널리틱스의 비교 (0) | 2021.03.01 |
---|---|
비즈니스 애널리틱스(Business Analytics) (0) | 2021.03.01 |
코워드 분석 (0) | 2021.03.01 |
단어구름(Word Cloud) (0) | 2021.03.01 |
시계열분석 (0) | 2021.03.01 |
로짓변환(logit transformation) (0) | 2021.03.01 |
회귀분석(Regression Analysis) (0) | 2021.03.01 |
SNA(Social Network Analysis) (0) | 2021.03.01 |
댓글