Q. 애국가 형태소 분석 연습
step1. 사전 설정
install.packages("KoNLP")
library(KoNLP)
useSystemDic()
useSejongDic()
useNIADic()
step2. 파일 불러오기
word_data <- readLines("C:/TEMP/Rstudy/data/애국가(가사).txt")
word_data
step3. 명사만 추출
word_data2 <- extractNoun(word_data)
step4. 사용 빈도 확인
undata <- unlist(word_data2)
word_table <- table(undata)
step5. 필터링
undata2 <- Filter(function(x){ nchar(x) > 1 }, undata)
word_table2 <- table(undata2) # undata2의 빈도 확인 후 word_table2 변수에 할당당
word_table2
step6. 데이터 정렬하기
sort(word_table2, decreasing = T)
step7. 워드 클라우드 만들기
library(RColorBrewer)
display.brewer.all() # 워드클라우드에 쓸 색상 리스트
palette <- brewer.pal(9,"Spectral") # Set1에서 9가지 색을 쓴다는 뜻
wordcloud
install.packages("wordcloud")
library(wordcloud)
wordcloud(names(word_table2),
freq = world_table2,
scale = c(3,0.5),
rot.per = 0, # 글씨 방향의 비율 (0 : 가로만/ 1: 세로만/ 0.x : 비율)
min.freq = 1, # 나타내는 최소 언급 값
random.color = T, # 글자 색 임의로 지정
colors = palette, # 글자 색
family = "맑은 고딕")
wordcloud2
install.packages("wordcloud2")
library(wordcloud2)
wordcloud2(word_table2,
color = "random-light",
backgroundColor = "black",
shape = "star") # circle(기본), diamond, triangle, triangle-forward, pentagon