이번주에 CV쪽 개인적인 공부하고 있는 것과 관련해선 새로운 데이터셋인 Oxford Dataset 을 사용해보기로 했고, 역시나 middle form 데이터셋으로 변환한 후 + config 수정등을 통해 훈련시켜 보는 것으로 마무리했다. 추가적으로 이후 파트인 Single shot Detector, one stage detector 쪽을 논문과 함께 읽어볼 계획이다. 아래는 Oxford data로 1시간 20분정도 훈련시켰을 때 기록용 사진이다.
최근에 debiasing 논문쪽 말고도 경진대회쪽에도 도움을 주기로해서 논문을 하나 읽고, 코드를 찾아봤다.
Asymmetric polynomial loss for multi-label classification 리뷰
해당 하는 코드를 찾고 기존 BCEWithLogitLoss 에 대신 APLLoss 를 적용해볼 생각이다. 논문을 읽으면서 쉽지 않았던 건.. BCEWithLogitLoss 를 바꿔서 적용하는 loss 인만큼 식이 좀 더 복잡하고, 때문에 코드도 좀 더 복잡했는데 아예 이런 loss 만 다루는 수학적인 내용이 깊이 가미가 되어있어서 추가적인 공부도 필요했던 거 같다. 어쨌든 완전히는 아니더라도 최대한 이해하려고 노력헀고, 바뀐 코드로 성능에 도움이 될 수 있으면 좋겠다.
기존 편향팀 연구로는 다음의 것들을 이번주에 했다.
아래처럼 최종은 아니지만 꾸준히 성능도 기록해보고 있다. 교수님이 말씀해주신 것처럼 ppl이 편향이 담긴 텍스트에 대해서 기하급수적으로 올라서 어느정도 의미가 있을 거 같다는 생각이 들었고, 이번주에 hate speech score 을 내보라고 해주셔서 점수를 같이 내 볼 생각이다.
이번주에는 특히나 리허설이랑 발표준비도 있어서 그것도 잘 해야할 거 같다.. 그래서 할 일을 좀 정리해보면
< 학부연구생 1 >
< 학부연구생 2 >
< CV >
< 발표 >