[일일회고]데이터톤 2일차

차보경·2022년 5월 31일
1

회고록

목록 보기
3/8
post-thumbnail

🚀 사용한 라이브러리

  • NumPy
  • Matplotlib
  • Pandas
  • seaborn

😎 데이터톤에서 도전한 것

데이터 톤 내용

1. 최대한 회의 많이 하고

  • ㅇㅇ

2. 넘어가기

  • ㅇㅇ

🧐 그로인해 배운 것

1. 학습내용 중 새로 알게된 내용

  • NLP 내용 - 단어 Embedding / Tokenizer
  • Optimizer 별 loss 변화
  • Tokenizer 함수 내 num_words 변화에 따른 학습률 변화
    • 같은 embedding size에서 단어집 수를 42,000에서 20,000으로 줄이자 학습이 더 잘 되는 것으로 확인됨
      -> 데이터의 양이 충분하지 않다면, 단어의 양을 좁게 잡아 작은 단어들 사이의 관계를 더 확실하게 인지시키는 것이 학습에 도움이 되는 것 같다.

2. 유독 어려웠던 점

  • 장르가 묶여있는데, 이를 풀어서 그 점수를~~~
    (이거에 거의 2-3시간 잡혀있었던 것 같다.)

🥺 회고

  • 아직 내 스스로에대한 ???이 완성에대한 욕심보다 컸는지 모든 코드를 내 손으로 짜거나, 내가 찾은 것으로 만들어야

내일부터는?

  1. 완성에 더 집중하고 막히는 부분은 바로바로 요청하기

완료 피드백

  1. 아침 CS231 30분 듣고 정리하기
  2. 일일 회고 쓰기
profile
차보의 Data Engineer 도전기♥ (근데 기록을 곁들인)

0개의 댓글