반응형
1.4 텍스트 마이닝의 주요 적용 분야
1.4.1 문서 분류
- 주어진 문서에 대해 미리 정의된 클래스로 분류하는 작업
- 메일의 내용을 분석해 스팸 메일의 여부 결정
- 문서의 내용이 호의적인지, 비호의적인지 확인
- 자연어 처리 및 텍스트 마이님에서 가장 기본적이면서 활용범위가 가장 넓은 분야
1.4.2 문서 생성
- 사람이 쓴 것과 유사한 문장을 만들어내는 작업
- 입력 데이터가 없다는 차이점을 가짐
- 아직 실질적인 응용분야는 많 않음
1.4.3 문서 요약
- 주어진 문서에서 중요하고 흥미 있는 내용을 추출해 요약문을 생성하는 작업
- sequence-to-sequence 문제, 단어의 시퀀스를 입력받아 다시 단어의 시퀀스를 출력하는 문제가 전형적인 예
1.4.4 질의응답
- 주어진 문장을 읽고, 주어진 문제에 대해 올바른 답을 생성하는 작업
- ChatGPT와 같이 현재 큰 주목을 받는 챗봇의 주요 미래 기술
1.4.5 기계번역
- 자연어 처리를 발전하게 한 출발점인 동시에 가장 중요한 분야 중 하나
- 두 언어체계를 완벽하게 이해해야 하므로 자연어 이해를 전제로 함
1.4.6 토픽 모델링
- 여러 문서에서 공통으로 등장하는 토픽을 추출하는 방법
- 다수의 문서에 잠재된 내용을 파악하는 데 활용
※ 해당 내용은 <파이썬 텍스트 마이닝 완벽 가이드>의 내용을 토대로 학습하며 정리한 내용입니다.
반응형
'텍스트 마이닝' 카테고리의 다른 글
텍스트 전처리 (4) (0) | 2023.06.21 |
---|---|
텍스트 전처리 (3) (0) | 2023.06.20 |
텍스트 전처리 (2) (0) | 2023.06.19 |
텍스트 전처리 (1) (0) | 2023.06.18 |
텍스트 마이닝 기초 (1) (0) | 2023.06.16 |