# tfidf
총 3개의 포스트

TFIDF와 코사인 유사도를 통한 문서 추천하기
현재 가지고 있는 일기 데이터를 통해서 자신이 작성한 일기와 유사한 일기를 추천하는 시스템을 만들고자 하였습니다. TFIDF로 유사도를 측정하면서 문제점은 또 어떠한 것이 있는지 알아보겠습니다.먼저 프로젝트에 사용하는 모듈을 불러오기 위해서 가상환경을 설정해 줍니다.현
2021년 8월 8일
·
0개의 댓글·
1
NLP : TF-IDF 개념과 구현
개념DTM과 같은 단순 빈도수 기반 방법론의 문제는 중요한 단어와 불필요한 단어를 구분하지 못한다는 것이다예를 어 the, this, is 같은 stopwords(불용어)들은 어떤 문서이든 빈도수가 높지만 해당 문서를 대변하는 단어라고 볼 수 없다문서를 대변하는 단어에
2021년 8월 6일
·
2개의 댓글·
0