# TF-IDF

9개의 포스트
post-thumbnail

[DL] NLP를 위한 준비

BoW, DTM, TF-IDF, 단어 전처리

2022년 3월 12일
·
0개의 댓글
post-thumbnail

[Research] 리뷰에서 Aspect word가 될 만한 후보군을 통계적으로 추출해보기

Khaiii로 토크나이즈하고 TF-IDF와 유사한 형태의 함수를 커스터마이징 하여 리뷰 속 주요 단어(aspect seed)를 뽑아내는 작업을 해보았다.

2021년 8월 18일
·
0개의 댓글
post-thumbnail

[Text Analytics] 4-1강: Count-based Text Representation

[Text Analytics] 4-1강: Bow, TF-IDF, n-grams

2021년 8월 4일
·
0개의 댓글

NLP(Count-Based-Representation)

Natural Language Processing / Vector Representations

2021년 6월 15일
·
0개의 댓글

텍스트분석 스터디 (1)

해당 글 및 앞으로 이루어질 내용은 한국어 임베딩 이란 책을 공부하고 스터디하며 정리하는 내용 텍스트 분석 임베딩 방법에 있어서 큰 3줄기 가 있음1\. 행렬 분해, 2. 예측, 3. 토픽 기반말뭉치 정보가 들어있는 원래 행렬을 두개 이상으로 쪼갬ex) GloVe, S

2021년 5월 1일
·
0개의 댓글

NLP_L2_Vectorization_KIY

텍스트를 숫자로 변환하는 벡터화, 그래야 컴퓨터가 알아들을 수 있으니까벡터화 방법으로는(1) 통계와 머신 러닝을 활용한 방법(2) 인공 신경망을 활용하는 방법이번에는 (1)번만 배울 예정이다.단어들의 분포로 문서를 특성을 파악하는 기법이 가방은 중복을 제거하지않고 단어

2021년 4월 10일
·
0개의 댓글
post-thumbnail

TF-IDF

단어 빈도-역 문서 빈도

2021년 4월 9일
·
0개의 댓글