본 포스트에서는 통계적 언어 모델의 작동 방식과 그 한계점에 대해 서술한다.
본 포스트에서는 카운트 기반 단어 표현법인 BoW와 DTM에 대하여 알아보고, 이를 통해 구할 수 있는 가중치인 TF-IDF애 대해 알아본다.
본 포스트에서는 최대 엔트로피 모델을 이용하여 자연어를 처리하는 방법을 설명한다.