Rstudio(8-1) 애국가 형태소 분석 연습

hyukstory 혁스토리·2020년 8월 22일
0

Rstudio

목록 보기
11/16

Q. 애국가 형태소 분석 연습

step1. 사전 설정

install.packages("KoNLP")
library(KoNLP)
useSystemDic()
useSejongDic()
useNIADic()

step2. 파일 불러오기

word_data <- readLines("C:/TEMP/Rstudy/data/애국가(가사).txt")
word_data

step3. 명사만 추출

word_data2 <- extractNoun(word_data)

step4. 사용 빈도 확인

undata <- unlist(word_data2)
word_table <- table(undata)

step5. 필터링

undata2 <- Filter(function(x){ nchar(x) > 1 }, undata)
word_table2 <- table(undata2) # undata2의 빈도 확인 후 word_table2 변수에 할당당
word_table2

step6. 데이터 정렬하기

sort(word_table2, decreasing = T)

step7. 워드 클라우드 만들기

library(RColorBrewer)
display.brewer.all()  # 워드클라우드에 쓸 색상 리스트

palette <- brewer.pal(9,"Spectral") # Set1에서 9가지 색을 쓴다는 뜻

wordcloud

install.packages("wordcloud")
library(wordcloud)
wordcloud(names(word_table2),
          freq = world_table2,
          scale = c(3,0.5),
          rot.per = 0,        # 글씨 방향의 비율 (0 : 가로만/ 1: 세로만/ 0.x : 비율)
          min.freq = 1,       # 나타내는 최소 언급 값
          random.color = T,   # 글자 색 임의로 지정
          colors = palette,   # 글자 색
          family = "맑은 고딕")

wordcloud2

install.packages("wordcloud2")
library(wordcloud2)

wordcloud2(word_table2, 
           color = "random-light", 
           backgroundColor = "black",
           shape = "star") # circle(기본), diamond, triangle, triangle-forward, pentagon
profile
문돌이의 고군분투 개발 공부

0개의 댓글