NLP 트랙의 첫 시작으로 NLP의 여러가지 task들과 Bag-of-Words와 word embedding에 대하여 공부하였다.
실습과제로 직접 워드 임베딩 과정을 구현해보고 spacy, konlpy를 사용해보았다.
그리고 새로운 팀원들과 앞으로 피어세션 시간때
월요일에는 논문리뷰, 화요일, 목요일에는 알고리즘 3문제, 수요일, 금요일에는 ai 인터뷰 질문 3개씩 준비해오기로 하였다.
ms-tcn 공식 구현 코드에 따로 전처리를 한 데이터셋을 사용해야된다. 그래서 데이터를 다운 받아 서버에 올리려는데 너무 용량이 커서 잘 안올려진다.ㅜㅜ
오늘은 RNN, LSTM과 GRU에 대해 공부하였다.
그리고 알고리즘 공부를 위해 백준 3문제를 풀었다.
이력서에 대한 특강을 들었는데, 얼른 나의 상황과 목표, 무엇을 해왔고 어떤 의미가 있었는 지를 정리해서 앞으로 의미있는 결정들을 하고싶다는 생각이 들었다.
Seq2Seq with Attention를 공부하고
AI 면접 예상문제에 대해 고민하였다.
transformer 논문을 읽었지만 정학히 어텐션 개념에 대한 이해가 부족했었다는 것을 알았다. 그리고 어텐션이 무엇인지 확실히 알 수 있었다.
오늘은 과제에 집중하였으며
Data Processing과 Vocabulary만드는 알고리즘을 짜는 과제를 하였다.
그리고 RNN based 모델을 구현하고 데이터들을 배치에 맞게 shape를 바꾸는 과제도 수행하였다.
그리고 백준 3문제도 풀면서 알고리즘 공부를 하였다.
오늘도 과제를 하였는데 Subword 임베딩에 대한 과제였다.
생각보다 힘들어서 많은 시간을 투자했는데
알고보니 논문에 pseudo code가 있었는데 모르고 풀었다가 나중에 피어세션때 팀원분이 알려주셨다...😯