# fasttext
fasttext 단어 학습
첫번째 인자로는 파일주소를 넣어줘야한다.학습하는 파일은 스트링으로 되어 있으며, 구분자는 \\n과 띄어쓰기로 되는것으로 추정이것도 된다고는 하는데 난 안됐음... 그래thㅓ 조금 슬펐ㄷr,,, 😿 😿 😿계속 파일을 training하는데 사용할 수 없다는 에러 발생

Embedding이 중요한 이유
임베딩에는 Corpus의 의미, 문법 정보가 함축되어있다.임베딩은 Vector이므로 연산이 가능하며, 단어/문장/문서 간의 유사도를 측정할 수 있다.전이학습(Transfer Learning)을 통해 Fine-tuning하여 과제에 맞게 업데이트. 효과적인 이유가 제로베
[TIL]파이토치 딥러닝 프로젝트 모음집_국민청원분류
한 줄씩 따라 해보는 파이토치 딥러닝 프로젝트 모음집책 내용을 colab을 통해 작성 및 실행크롤링 : API형태로 변경 : lovit님의 청와대 국민청원 데이터셋데이터 전처리토크나이징 및 변수생성 : konlpy(Twitter) -> pynori단어 임베딩 : wo

FastText 와 LDA 이해하기
이번에 프로젝트를 마무리 함에 있어서 FastText 와 LDA에 대해 다시 한 번 정리하는 시간을 가져보고자 한다. LDA에 관하여 우선 LDA 즉 잠재 디리클레 할당에 대해서 이해 하기 위해서 토픽 모델링과 기존에 작성하였던 TF-IDF로 추천 시스템 구현하기

자연어 처리 : Distributed Representation
이전 시간에는 문서 내 단어가 등장하는 횟수를 기반으로 벡터화를 하는 등장 횟수 기반 표현을 배웠는데.. 어제 했으나 다시 한 번 보러가야 할 것 같다 🤦♀️ 이번에는 단어 자체를 벡터화 하는 방법을 배운다 ‼
Enriching Word Vectors with Subword Information(fasttext)
Fasttext 논문(Enriching Word Vectors with Subword Information)을 리뷰해 보았습니다.