한 문서에서 중요한 단어를 카운트가 아닌 문서군 전체를 보고 판단하자
어떤 단어가 한 문서에서 자주나오면 중요하지만 이단어가 다른 문서에서는 잘 나오지 않는다면 더 중요하다고 볼수 있으리무리하지요
tf-idf score = tf x log(N/df)
단점 - 순서를 파악하기 어려움