# Bag of Words

3개의 포스트

[NLP] Bag-of-Words

: 자연어 처리, text-mining 분야에서 딥러닝 기술이 적용되기 이전에 많이 활용된, 단어 및 문서를 숫자형태로 나타내는 가장 간단한 형태의 기술step1) 문장에서 고유 단어를 뽑아 단어 모음집을 만든다. sentences : “John really reall

2022년 3월 30일
·
0개의 댓글

텍스트분석 스터디 (1)

해당 글 및 앞으로 이루어질 내용은 한국어 임베딩 이란 책을 공부하고 스터디하며 정리하는 내용 텍스트 분석 임베딩 방법에 있어서 큰 3줄기 가 있음1\. 행렬 분해, 2. 예측, 3. 토픽 기반말뭉치 정보가 들어있는 원래 행렬을 두개 이상으로 쪼갬ex) GloVe, S

2021년 5월 1일
·
0개의 댓글

NLP_L2_Vectorization_KIY

텍스트를 숫자로 변환하는 벡터화, 그래야 컴퓨터가 알아들을 수 있으니까벡터화 방법으로는(1) 통계와 머신 러닝을 활용한 방법(2) 인공 신경망을 활용하는 방법이번에는 (1)번만 배울 예정이다.단어들의 분포로 문서를 특성을 파악하는 기법이 가방은 중복을 제거하지않고 단어

2021년 4월 10일
·
0개의 댓글