NL data 처리
N21, N2N, N2M
nlp 기초 프로젝트에 앞서 필요한 nlp 지식과 실제 PyTorch lightning 사용 과정에 대해 배울 수 있었다. 공지에도 강의를 전부 수강한 후 대회에 참여하라는 학습 권유가 있어서 강의 먼저 들었다.
빨리 프로젝트를 진행하고 싶어서 정리를 자세히 못했다.
처음 코드를 보고 복잡해 보였는데 계속 보다 보니 어느 부분이 뭘 하는지 이해가기 시작했다. 모델을 바꿔보는 게 처음 시도였고 팀원 중 한 명이 모델을 바꿨더니 좋은 성능이 나왔다고 하여 수정해서 돌려보고 batch size, epoch, learing late를 계속 바꿔가며 training 해봤다.
loss 값을 매번 확인해 보면 좋은데 처음엔 터미널에서 일일이 확인했다가 팀원이 wandb를 적용한 train 파일을 참고하여 내 파일에 적용해 볼 수 있었다. 처음 써보는데 되게 신기..
주말에 이어서 생각해 보고 다음 주까지 해볼 만한 과제는 train과 test 데이터 셋의 label 분포, source 값에 따른 분포, 불용어 처리 등 시도해볼 게 많아 보이는데 다 할 수 있을지?
주 2회 했었던 cs224 발표도 했고 이외 시간에는 대부분 대회 관련 질의응답 및 토의 시간을 가졌다. 프로젝트 코드 내용뿐만 아니라 ssh 접속, vscode 설정 같은 개발 세팅도 많이 배울 수 있었다.
팀 대회이기 때문에 질문, 아이디어, 팁 등 회의가 활발하게 진행되었고 매우 알찬 시간을 보낸 것 같다.
역시 직접 코드를 수정해 보면서 결과를 보는 게 도움이 된다. 모델을 돌리고 점수가 나오니깐 욕심이 생기고 좀 더 연구하고 싶고 이런 식으로 실력이 향상되는 과정인 것 같다.
우리 팀 6주 동안 매일 보면서 많이 친해졌는데 남은 시간이 얼마 안 남아서 너무 아쉽다. 이 중 몇 명은 level 2까지 이어지지만 이 5명이 모일 수 있는 기회가 쉽게 오지는 않을 것 같다.
아 맥북💻을 샀는데 불편한 건 처음 잠깐이고 보면 볼수록 놀라움의 연속!