텍스트 마이닝을 워드클라우드로 시작하는 법
워드클라우드는 복잡한 텍스트 분석을 하기 전에 자료 안에 어떤 단어가 자주 등장하는지 빠르게 살피는 탐색 도구입니다.
먼저 확인할 것
분석하려는 텍스트의 출처와 목적을 분명히 정합니다. 뉴스, 설문, 회의록, 리뷰는 문장 구조와 반복어가 다르므로 같은 설정을 그대로 적용하면 해석이 흐려질 수 있습니다.
불용어 정리가 중요한 이유
텍스트 마이닝에서는 자주 나오지만 의미가 약한 단어를 제거해야 핵심 주제가 드러납니다. 자동 정리 후에도 회사명, 날짜, 인사말처럼 분석 목적과 관계없는 반복어는 직접 제외하는 것이 좋습니다.
다음 단계
- 큰 단어를 보고 주요 주제 후보를 적습니다.
- 비슷한 뜻의 단어가 나뉘어 있는지 확인합니다.
- 중요 단어가 어떤 문맥에서 쓰였는지 원문을 다시 봅니다.