오늘은 딥러닝에서의 classification 문제에 대해 알아보자.
https://velog.io/@ckd248/%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-Camera-View-Adjustment-Prediction-for-Improving-Image-Composition-1
https://velog.io/@ckd248/%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0-Camera-View-Adjustment-Prediction-for-Improving-Image-Composition-2
이전에 읽었던 구도 가이드 AI의 논문에서는 상, 하, 좌, 우에 대해서만 가이드를 하고, 대각선 방향은 연속적인 모델 추론으로 해결한다고 서술되어 있었다. 그래서 모델도 multi-class classification으로 구도 변경의 종류를 예측하고 있었는데, 이를 multi-label classification으로 변경하여 대각선 방향도 구도 변경의 한 종류로 추론 가능하도록 변경하고 학습을 시키려고 한다. 따라서 multi-label classification을 조사한 겸 글을 적어본다.
Multi-Label Classification은 threshold를 정하는 것이 어려운 것 같다. 각 class마다 threshold에 의해서 받는 영향이 다를 수도 있으니 각각 따로 설정해줘야 하는 것이 힘든 점이다. 글 앞쪽에서 서술했듯 구도 가이드를 multi-label classification으로 변경하여 학습을 하고 있는데, 성능이 원래 모델만큼만 나와줬으면 좋겠다.