



from sklearn.feature_extraction.text import CountVectorizer
cnt_vector = CountVectorizer()
cnt_vector.fit(corpus)
feature_vector = cnt_vector.transform(corpus)
# 단어 확인
vocabs = sorted(cnt_vector.vocabulary_.items()) # 단어 순서대로 정렬
vocabs = [ item[0] for item in vocabs ] # 단어만 뽑아내기
문장 1: 피카츄는 전기 포켓몬이며, 피카츄가 진화하면 라이츄가 됩니다.
문장 2 : 꼬부기는 물 포켓몬이며, 꼬부기가 진화하면 어니부기가 됩니다.
문장 3 : 파이리는 불 포켓몬이며, 파이리가 진화하면 리자드가 됩니다
from sklearn.feature_extraction.text import TfidfVectorizer
tfidf_vector = TfidfVectorizer()
tfidf_vector.fit(corpus)
feature_vector = tfidf_vector.transform(corpus)
feature_vector
vocabs = sorted(cnt_vector.vocabulary_.items()) # 단어 순서대로 정렬
vocabs = [ item[0] for item in vocabs ] # 단어만 뽑아내기