- 이미지 resize / crop 등 전처리 어떻게 할건지
; efficientnet B0 & twin tiny transfer 둘 다 input 224*224 (resize)
normalization 하고 breast 위주로 crop 해야 할까 ? [col/row 전부 black이면 remove? 근데 글자 있는 부분 때문에 제대로 안 짤릴 듯]
- transformer에 넣을꺼면 patch size 어떻게 할껀지
; 다른 사람들이 구현한거 찾아보면 224*224의 경우 patch_size=16으로 줘서 196개 patch로 쪼개는게 일반적이어 보임.
- clinical이랑 합칠 때, img input이랑 같이 넣을껀지(이러면 clinical 문장으로 만들어서 같이 넣어주는게 나을 수도:CLIP 처럼?) vs 따로 학습해서 feature map concat해서 final prediciton할지
- 다음주 수요일에 보고