빈도분석

2023. 7. 22. 10:56·Data Science
  • 단어 빈도 사전
# 문자 단어 형태로 분리
words = text.split()

# 단어 빈도 사전
dic = {}
for i in words:
    if i not in dic:
        dic[i] = 1
    else:
        dic[i] += 1
        
# 데이터프레임화
df = pd.DataFrame({'단어':dic.keys(),
             '빈도수':dic.values()})

 

 

  • 워드클라우드
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 워드클라우드 설정
# background_color = 'white'
# font_path = '폰트파일.ttf'
# mask = img
wc = WordCloud()
cloud = wc.generate_from_frequencies(dic)
plt.imshow(cloud)
plt.show()

'Data Science' 카테고리의 다른 글

Google Colab에서 Konlpy 설치  (0) 2023.09.09
토픽 모델링  (0) 2023.09.09
Google Colab에서 Selenium 사용하기  (0) 2023.07.15
데이터 크롤링  (0) 2023.07.15
데이터 시각화  (0) 2023.07.08
'Data Science' 카테고리의 다른 글
  • Google Colab에서 Konlpy 설치
  • 토픽 모델링
  • Google Colab에서 Selenium 사용하기
  • 데이터 크롤링
봄프로
봄프로
Data Scientist
  • 봄프로
    To be professional
    봄프로
    • 분류 전체보기 (59)
      • LLM (16)
      • Data Science (24)
      • ADP (8)
      • Domain (8)
      • Etc (3)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 인기 글

  • 태그

    KBI
    오블완
    티스토리챌린지
    YOLO
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.1
봄프로
빈도분석
상단으로

티스토리툴바