# word2vec

31개의 포스트

[Aiffel] 아이펠 59일차 개념 정리 및 회고

1. 개념 정리 2. 회고

2022년 3월 30일
·
0개의 댓글
post-thumbnail

[DL] Word2Vec

Embedding, Word2Vec, 분포가설

2022년 3월 12일
·
0개의 댓글
post-thumbnail

[Boostcamp AI Tech] Item2Vec and ANN

[Boostcamp AI Tech] Item2Vec and ANN

2022년 3월 12일
·
0개의 댓글
post-thumbnail

타이타닉 탑승객 Embedding 시각화

타이타닉 탑승객 Embedding 시각화

2022년 2월 13일
·
1개의 댓글

Sentiment Analysis | Use Pretrained Word2Vec #3

Sentiment Analysis - 사전의 단어 개수 X 워드 벡터 사이즈만큼의 크기를 가진 학습 파라미터감성분류 모델이 학습이 잘 되었다면, Embedding 레이어에 학습된 워드 벡터들도 의미 공간상에 유의미한 형태로 학습되었을 것Model_1의 Embedding

2022년 2월 11일
·
0개의 댓글

[D&A 운영진 딥러닝 스터디] 4주차 1차시

Text 데이터를 분석하고 모델링하는 분야NLU + NLG자연어 이해(NLU; Natural Language Understanding): 자연어를 이해하는 영역자연어 생성(NLG; Natural Language Generation): 자연어를 생성하는 영역NLP 과정T

2022년 1월 22일
·
0개의 댓글
post-thumbnail

Word2Vec

"밑바닥부터 시작하는 딥러닝 2"을 기반으로 정리한 내용입니다.Word2Vec은 앞서 살펴보았던 통계 기반 기법의 단점을 보완하고자 나온 추론 기반 기법이다.

2021년 12월 27일
·
0개의 댓글
post-thumbnail

[TIL] Word2Vec, fastText

Word2Vec와 fastText

2021년 12월 27일
·
0개의 댓글

Item2Vec

NLP에서 단어의 잠재적인 의미를 파악하기 위해 제안된 모델인 Word2Vec 방식에서 영감을 받아 Item2Vec라는 모델이 탄생(Word2Vec(SGNS) → Item based CF 확장)이 모델은 User Information을 활용할 수 없어도 Item-Ite

2021년 12월 25일
·
0개의 댓글
post-thumbnail

Embedding이 중요한 이유

임베딩에는 Corpus의 의미, 문법 정보가 함축되어있다.임베딩은 Vector이므로 연산이 가능하며, 단어/문장/문서 간의 유사도를 측정할 수 있다.전이학습(Transfer Learning)을 통해 Fine-tuning하여 과제에 맞게 업데이트. 효과적인 이유가 제로베

2021년 11월 17일
·
0개의 댓글
post-thumbnail

FastText 와 LDA 이해하기

이번에 프로젝트를 마무리 함에 있어서 FastText 와 LDA에 대해 다시 한 번 정리하는 시간을 가져보고자 한다. LDA에 관하여 우선 LDA 즉 잠재 디리클레 할당에 대해서 이해 하기 위해서 토픽 모델링과 기존에 작성하였던 TF-IDF로 추천 시스템 구현하기

2021년 10월 11일
·
0개의 댓글

word2vec 이해하기 2부

앞에서 word2vec 의 대표 모델로 주변에 있는 단어들을 가지고, 중간에 있는 단어들을 예측하는 방법인 CBOW와 중간에 있는 단어로 주변 단어들을 예측하는 방법인 Skip-Gram 가 있다. 둘의 매커니즘은 유사하며 먼저 CBOW에 대해서 알아보자 CBOW CB

2021년 9월 30일
·
0개의 댓글
post-thumbnail

word2vec 이해하기 1부

들어가기에 앞서 최근에 딥러닝 기반 추천시스템을 공부하면서 밑바닥부터 시작하는 딥러닝을 읽게 되었다. 그 중에서 자연어 처리중에 기본시 되는 word2vec를 이해하는 과정에서 Embedding 과 negative sampling 에 대해 알아보자. 자연어와 단어

2021년 9월 26일
·
0개의 댓글
post-thumbnail

[Research] Word2Vec으로 쇼핑 리뷰 속 유사한 의미를 갖는 단어들을 찾아보자-2

W2V의 Skipgram 방식으로 상품군별 쇼핑리뷰 corpus를 학습시키고, aspect seed와 유사한 단어들을 추출해내는 과정

2021년 8월 23일
·
0개의 댓글
post-thumbnail

[Research] Word2Vec으로 corpus 속 유사한 의미를 갖는 단어들을 찾아보자-1

aspect seed에서 aspect words를 뽑아내기 위해 W2V skipgram을 사용한다. 여기서는 W2V 방식에 대한 설명

2021년 8월 23일
·
0개의 댓글
post-thumbnail

자연어 처리 : Distributed Representation

이전 시간에는 문서 내 단어가 등장하는 횟수를 기반으로 벡터화를 하는 등장 횟수 기반 표현을 배웠는데.. 어제 했으나 다시 한 번 보러가야 할 것 같다 🤦‍♀️ 이번에는 단어 자체를 벡터화 하는 방법을 배운다 ‼

2021년 8월 19일
·
0개의 댓글
post-thumbnail

[Research] Khaiii 토크나이저를 활용한 리뷰 데이터셋 구축 - 1. Pipeline 계획

Khaiii를 활용해 리뷰 Aspect Extraction 데이터셋을 직접 구축하기 위한 계획

2021년 8월 17일
·
0개의 댓글

Word2vec

Intro 추론 기반 기법과 wordvec. 단어를 벡터로 표현하는 방법에서 대표적으로 '통계 기반 기법'과 '추론 기반 기법'이 있다. 통계 기반 기법의 문제점 단어의 frequency를 베이스로 표현했는데, 단어의 동시발생 행렬에 SVD를 적용하여 밀집벡어(단어의

2021년 8월 15일
·
0개의 댓글