본문 바로가기
IT기술노트/빅데이터

텍스트 마이닝(Text Mining)

by 비트코기 2021. 3. 1.
반응형

I. 비정형 데이터에서 가치 있는 정보 추출, 텍스트 마이닝의 개요

가. 텍스트 마이닝(Text Mining)의 정의

   - 자연어로 구성된 비정형 텍스트 데이터에서 패턴 또는 관계를 추출하여 가치와 의미있는 정보를 찾아내는 마이닝 기법

나. 텍스트 마이닝의 주요 분야

   - 문서 분류, 문서 군집, 정보추출, 문서 요약


II.  텍스트 마이닝의 프로세스 및 기법

가. 텍스트 마이닝의 프로세스

나. 텍스트 마이닝의 기법

기법

설명

정보추출

- 일반적인 텍스트 문서로부터 사용자가 원하는 정보를 추출하는 기법

문서분류/문서 클러스터링

- 문서들을 문서의 내용에 따라 구조화

- 문서분류: 키워드에 따라 문서를 분류하는 기법

- 문서 클러스터링: 문서 분석하여 동일 내용의 문서들을 묶는 기법

- 문서분류/클러스터링: 문서를 관련된 내용 별로 자동으로 구조화

Topic Tracking

- 사용자 프로필을 기반으로 사용자가 관심 있어 하는 문서가 어떤 문서인지 예측

Web Mining

- 텍스트 마이닝 기법을 웹 사이트에 적용

문서요약

- 문서에서 다룬 중요한 내용을 글로 요약하려는 시도

 

 

반응형

댓글