# tfidf

3개의 포스트
post-thumbnail

TF-IDF 설명회

2022년 4월 17일
·
0개의 댓글
·
post-thumbnail

TFIDF와 코사인 유사도를 통한 문서 추천하기

현재 가지고 있는 일기 데이터를 통해서 자신이 작성한 일기와 유사한 일기를 추천하는 시스템을 만들고자 하였습니다. TFIDF로 유사도를 측정하면서 문제점은 또 어떠한 것이 있는지 알아보겠습니다.먼저 프로젝트에 사용하는 모듈을 불러오기 위해서 가상환경을 설정해 줍니다.현

2021년 8월 8일
·
0개의 댓글
·
post-thumbnail

NLP : TF-IDF 개념과 구현

개념DTM과 같은 단순 빈도수 기반 방법론의 문제는 중요한 단어와 불필요한 단어를 구분하지 못한다는 것이다예를 어 the, this, is 같은 stopwords(불용어)들은 어떤 문서이든 빈도수가 높지만 해당 문서를 대변하는 단어라고 볼 수 없다문서를 대변하는 단어에

2021년 8월 6일
·
2개의 댓글
·