Chaaaaabbo.log
로그인
Chaaaaabbo.log
로그인
[일일회고]데이터톤 2일차
차보경
·
2022년 5월 31일
팔로우
1
EDA
데이터톤
일일회고
전처리
케글데이터
1
회고록
목록 보기
3/8
🚀 사용한 라이브러리
NumPy
Matplotlib
Pandas
seaborn
😎 데이터톤에서 도전한 것
데이터 톤 내용
데이터톤 노션페이지
1. 최대한 회의 많이 하고
ㅇㅇ
2. 넘어가기
ㅇㅇ
🧐 그로인해 배운 것
1. 학습내용 중 새로 알게된 내용
NLP 내용 - 단어 Embedding / Tokenizer
Optimizer 별 loss 변화
Tokenizer 함수 내 num_words 변화에 따른 학습률 변화
같은 embedding size에서 단어집 수를 42,000에서 20,000으로 줄이자 학습이 더 잘 되는 것으로 확인됨
-> 데이터의 양이 충분하지 않다면, 단어의 양을 좁게 잡아 작은 단어들 사이의 관계를 더 확실하게 인지시키는 것이 학습에 도움이 되는 것 같다.
2. 유독 어려웠던 점
장르가 묶여있는데, 이를 풀어서 그 점수를~~~
(이거에 거의 2-3시간 잡혀있었던 것 같다.)
🥺 회고
아직 내 스스로에대한 ???이 완성에대한 욕심보다 컸는지 모든 코드를 내 손으로 짜거나, 내가 찾은 것으로 만들어야
내일부터는?
완성에 더 집중하고 막히는 부분은 바로바로 요청하기
완료 피드백
아침 CS231 30분 듣고 정리하기
일일 회고 쓰기
차보경
차보의 Data Engineer 도전기♥ (근데 기록을 곁들인)
팔로우
이전 포스트
[주간회고]5월 4째주(5/23~27)
다음 포스트
[주간회고]6월 1째주(5/30~6/3)
0개의 댓글
댓글 작성