어느정도 metric 으로 결과가 나와서 할 일과 함께 정리하려고 한다.
이번주에는 기록한 모델 + 추가 모델 roberta 훈련시킨 것으로 각각 decoding, Mabel Intrinsic metric 을 가지고 평가를 진행했다. 눈에 띄기는 지표로써 내가 훈련한 모델과 원하는 방향대로 진행되고 있는지 평가하는 게 목표였는데, 생각보다 괜찮은? 지표를 얻었다.
위에 것이 논문에 나온 score고, 아래것이 내가 만든 score 다. 평가 지표 종합하는 ICAT score 가 MABEL 이 73.07 이었는데 70.64였고, (나머지 모델들은 다 이겼다) SS score FairFil 제외하고는 다 이겼다.
경진대회 관련해선 이번주에 기존 있던 모델에 + Loss 하기, 새로운 모델 추가하기(Seq2Emo) 가 할 일로 있었는데, Seq2Emo 는 접기로 confirm 받았다... 사실 코드 디버깅하면서 계속 스트레스 받고 안될 거 같다는 느낌을 계속 받긴했다. 일단 기존에 있는 모델들로만 가기로 결정.
당장 내일이 발표니까 준비도 해야한다. 그동안 좀 놓고있었는데 단기간에 쳐서 올려야지.
그동안 놓고 있었던 개인공부를 다시 시작해야겠다.. 일단 수요일까지는 1,2 에 집중하고, 수요일 이후부터 다시 할 생각.