10주차에서 12주차에 걸쳐 KLUE 데이터셋을 활용한 문장 내 관계 추출 대회가 진행된다.
소금빵 팀과 level 2의 첫 P-stage인 RE 대회를 시작했다.
우리 트랙인 nlp라 그런지 지난 대회보다 훨씬 의욕적이고 성적보단 배우기 위해 노력하면서 여러 가지를 시도하고 있다.
우리 팀은 하루에 미팅을 기본 3-4시간 정도 하고 있다.
이렇게 소통이 많은 팀 프로젝트는 거의 처음인데, 배우는 것도 그만큼 많고 공유도 잘 돼서 여러 가지로 즐겁게 하고 있다.
1) 팀원과 진도 맞춰서 강의 수강
2) Baseline 코드 뜯어보기
3) 협업 환경 조성
4) EDA
5) 코드를 우리가 쓰기 편하게 다같이 일괄 수정 (baseline 코드 다듬기)
6) 분업 또는 같이 실험
7) 실험 결과 및 코드 공유, 같이 고민하기
등을 하였다.
1) 여러 pre-trained 모델 비교
2) special token으로 Entity token 추가
3) Data Augmentation - Back translation, EDA
4) 모델 저장 모니터 metric 비교
5) 음절 단위 학습
등을 하였다.
Preprocessing
Modeling