Text Mining은 Text Data로 부터 새로운 고급 정보를 이끌어 내는 과정으로 비정형 데이터 Mining의 유형중 하나이다. Text Mining은 말 그대로 Text을 캐낸다(Mining)는 의미로, 단어의 출현 빈도, 단어간 관계성 등을 파악하여 유의미
Text는 분석하기도, 주요 특징을 시각화 하기도 어려운 데이터다. 추상적인 단어들로 가득하고, 같은 단어도 문맥에 따라 개념이 변동되고, 유사 동의어 유의어 표현도 다양하다. 통계적 관점에서 단어 하나하나가 각 차원을 이루어 쉽게 처리하기 힘든 고차원성을 가진다.