# LSA

4개의 포스트

텍스트 벡터화

Word2Vec의 대중화 이전에, 텍스트의 분포를 활용하여 텍스트를 벡터화하는 아이디어를 들여다보자. 단어 빈도를 이용한 벡터화(1) Bag of Words(2) Bag of Words 구현해보기(3) DTM과 코사인 유사도(4) DTM의 구현과 한계점(5) TF-

2022년 3월 7일
·
0개의 댓글

Topic modeling(LSA, LDA)

Topic modeling의 두 가지 알고리즘(LSA, LDA)을 구현해 보자

2022년 1월 28일
·
0개의 댓글

NLP_L2_Vectorization_KIY

텍스트를 숫자로 변환하는 벡터화, 그래야 컴퓨터가 알아들을 수 있으니까벡터화 방법으로는(1) 통계와 머신 러닝을 활용한 방법(2) 인공 신경망을 활용하는 방법이번에는 (1)번만 배울 예정이다.단어들의 분포로 문서를 특성을 파악하는 기법이 가방은 중복을 제거하지않고 단어

2021년 4월 10일
·
0개의 댓글