# Smoothing

2개의 포스트
post-thumbnail

Language Modeling : Generalization, Smoothing, Interpolation, Good-Turing Smoothing, Kneser

N-gram Modeling을 할 때 Count형식으로 확률을 계산하면 거의 0이 나온다. 샤넌 시각화 방법은 우리가 만든 n-gram model에 대해 여러 가지 정보를 제공한다.가령, 셰익스피어를 기반으로 생성된 모델을 살펴보자.문제는, 셰익스 피어 내에 존재하는

2022년 1월 5일
·
0개의 댓글

텍스트분석 스터디 (1)

해당 글 및 앞으로 이루어질 내용은 한국어 임베딩 이란 책을 공부하고 스터디하며 정리하는 내용 텍스트 분석 임베딩 방법에 있어서 큰 3줄기 가 있음1\. 행렬 분해, 2. 예측, 3. 토픽 기반말뭉치 정보가 들어있는 원래 행렬을 두개 이상으로 쪼갬ex) GloVe, S

2021년 5월 1일
·
0개의 댓글