# fasttext

11개의 포스트
post-thumbnail

[TIL] Word2Vec, fastText

Word2Vec와 fastText

2021년 12월 27일
·
0개의 댓글

fasttext 단어 학습

첫번째 인자로는 파일주소를 넣어줘야한다.학습하는 파일은 스트링으로 되어 있으며, 구분자는 \\n과 띄어쓰기로 되는것으로 추정이것도 된다고는 하는데 난 안됐음... 그래thㅓ 조금 슬펐ㄷr,,, 😿 😿 😿계속 파일을 training하는데 사용할 수 없다는 에러 발생

2021년 11월 29일
·
0개의 댓글
post-thumbnail

Embedding이 중요한 이유

임베딩에는 Corpus의 의미, 문법 정보가 함축되어있다.임베딩은 Vector이므로 연산이 가능하며, 단어/문장/문서 간의 유사도를 측정할 수 있다.전이학습(Transfer Learning)을 통해 Fine-tuning하여 과제에 맞게 업데이트. 효과적인 이유가 제로베

2021년 11월 17일
·
0개의 댓글

[TIL]파이토치 딥러닝 프로젝트 모음집_국민청원분류

한 줄씩 따라 해보는 파이토치 딥러닝 프로젝트 모음집책 내용을 colab을 통해 작성 및 실행크롤링 : API형태로 변경 : lovit님의 청와대 국민청원 데이터셋데이터 전처리토크나이징 및 변수생성 : konlpy(Twitter) -> pynori단어 임베딩 : wo

2021년 10월 22일
·
0개의 댓글
post-thumbnail

FastText 와 LDA 이해하기

이번에 프로젝트를 마무리 함에 있어서 FastText 와 LDA에 대해 다시 한 번 정리하는 시간을 가져보고자 한다. LDA에 관하여 우선 LDA 즉 잠재 디리클레 할당에 대해서 이해 하기 위해서 토픽 모델링과 기존에 작성하였던 TF-IDF로 추천 시스템 구현하기

2021년 10월 11일
·
0개의 댓글
post-thumbnail

자연어 처리 : Distributed Representation

이전 시간에는 문서 내 단어가 등장하는 횟수를 기반으로 벡터화를 하는 등장 횟수 기반 표현을 배웠는데.. 어제 했으나 다시 한 번 보러가야 할 것 같다 🤦‍♀️ 이번에는 단어 자체를 벡터화 하는 방법을 배운다 ‼

2021년 8월 19일
·
0개의 댓글

Distributed Representation

Natural Language Processing / Vector Representations

2021년 6월 16일
·
0개의 댓글
post-thumbnail

Lecture 12 – Subword Models

작성자: 숭실대학교 산업정보시스템공학과 이수민

2021년 5월 26일
·
11개의 댓글

fasttext 훈련 시 pretrainedVectors 추가하기

fasttext model을 추가로 훈련해보자!

2020년 12월 3일
·
0개의 댓글

Enriching Word Vectors with Subword Information(fasttext)

Fasttext 논문(Enriching Word Vectors with Subword Information)을 리뷰해 보았습니다.

2020년 8월 16일
·
0개의 댓글