profile
Data scientist 지망생

NLP 기초 (7)

이미지 삽입 해야함이미지 삽입 해야함(1) Word Tokenization & Encoding(2) Training(3) Validation & Testing1D - CNN Model

2022년 6월 3일
·
0개의 댓글
·

NLP 기초 (6)

RNN이 갖고 있는 한계점: \- exploding gradient \- vanishing gradient RNN 구조에서 state $$xt$$에는 $$W{xx}$$가 계속 곱해지게 된다. \- 곱해지는 값이 1보다 크다면? 발산 \- 곱해지는 값이 1보다

2022년 6월 2일
·
0개의 댓글
·

NLP 기초 (5)

순환 신경만 (RNN)

2022년 5월 26일
·
0개의 댓글
·

NLP 기초 (4)

자연어 처리에 사용되는 대표적인 파이썬 패키지에는 NLTK가 있습니다. 해당 패키지에서는 말뭉치, 토큰 생성, 형태소 분석, 품사 태깅 등을 제공합니다.표준 토큰화 중 하나인 Treebank 표준 토큰화를 사용하는 방법은 아래와 같습니다.Treebank 토큰화 이외에도

2022년 5월 26일
·
0개의 댓글
·

NLP 기초 (3)

Fest Text (패스트 텍스트)

2022년 5월 23일
·
0개의 댓글
·
post-thumbnail

PyTorch 기초 정리

image.png페이스북이 초기 루아(Lua) 언어로 개발된 토치(Torch)를 파이썬 버전으로 개발하여 2017년도에 공개초기에 토치(Torch)는 넘파이(NumPy) 라이브러리처럼 과학 연산을 위한 라이브러리로 공개이후 GPU를 이용한 텐서 조작 및 동적 신경망 구

2022년 5월 21일
·
0개의 댓글
·

NLP 기초 (2)

Contents Word2Vec Glove 기존 모델 단점 Word Embedding 기존 정수 인코딩의 한계? 단어 사이의 연관성을 파악하기 어려움 원-핫 인코딩의 한계? 메모리 문제 희소 표현 (Sparse Representation)

2022년 5월 19일
·
0개의 댓글
·

NLP 기초 (1)

1) Chatbot \- Sentiment Analysis : 감정분석 \- Tokenization : 토큰화 \- Named Entity Recognition : 주제파악하기 \- Normalization : 의도된 오타 파악하기 \- Dependency Parsin

2022년 5월 18일
·
0개의 댓글
·