반응형
3.2 워드 클라우드로 내용을 한눈에 보기
- 워드 클라우드: 텍스트 분석 결과를 보여주는 시각화 도구 중 가장 많이 활용되는 방법
!pip install wordcloud
from wordcloud import WordCloud
# Generate a word cloud image
wordcloud = WordCloud().generate(doc_alice)
plt.axis("off")
plt.imshow(wordcloud, interpolation='bilinear') #이미지를 출력
plt.show()
wordcloud.to_array().shape
## (200, 400, 3)
wordcloud = WordCloud(max_font_size=60).generate_from_frequencies(alice_word_count)
plt.figure()
plt.axis("off")
plt.imshow(wordcloud, interpolation="bilinear")
plt.show()
import numpy as np
from PIL import Image
alice_mask = np.array(Image.open("alice_mask.png")) # 배경이미지를 불러와서 numpy array로 변환
wc = WordCloud(background_color="white", # 배경색 지정
max_words=30, # 출력할 최대 단어 수
mask=alice_mask, # 배경으로 사용할 이미지
contour_width=3, # 테두리선의 크기
contour_color='steelblue') # 테두리선의 색
wc.generate_from_frequencies(alice_word_count) # 워드 클라우드 생성
wc.to_file("alice.png") # 결과를 이미지 파일로 저장
# 화면에 결과를 출력
plt.figure()
plt.axis("off")
plt.imshow(wc, interpolation='bilinear')
plt.show()
※ 해당 내용은 <파이썬 텍스트 마이닝 완벽 가이드>의 내용을 토대로 학습하며 정리한 내용입니다.
반응형
'텍스트 마이닝' 카테고리의 다른 글
카운트 기반의 문서 표현 (1) (0) | 2023.06.25 |
---|---|
그래프와 워드 클라우드 (3) (0) | 2023.06.24 |
그래프와 워드 클라우드 (1) (0) | 2023.06.22 |
텍스트 전처리 (4) (0) | 2023.06.21 |
텍스트 전처리 (3) (0) | 2023.06.20 |