- 단어 빈도 사전
# 문자 단어 형태로 분리
words = text.split()
# 단어 빈도 사전
dic = {}
for i in words:
if i not in dic:
dic[i] = 1
else:
dic[i] += 1
# 데이터프레임화
df = pd.DataFrame({'단어':dic.keys(),
'빈도수':dic.values()})
- 워드클라우드
from wordcloud import WordCloud
import matplotlib.pyplot as plt
# 워드클라우드 설정
# background_color = 'white'
# font_path = '폰트파일.ttf'
# mask = img
wc = WordCloud()
cloud = wc.generate_from_frequencies(dic)
plt.imshow(cloud)
plt.show()
'Data Science' 카테고리의 다른 글
Google Colab에서 Konlpy 설치 (0) | 2023.09.09 |
---|---|
토픽 모델링 (0) | 2023.09.09 |
Google Colab에서 Selenium 사용하기 (0) | 2023.07.15 |
데이터 크롤링 (0) | 2023.07.15 |
데이터 시각화 (0) | 2023.07.08 |