1. is SFCN domain robust?
- 배우는게 쉽고 deeper semantic을 요구하지 않는 것으로 생각됨
- Cityscapes에서 비교적 잘하며, 몇 개 데모도 잘함
- 그런데 remote sensing, medical domain에서 잘하는지는 확실하지 않음
- 현재 BSDS-500의 굉장히 작은 데이터셋으로 학습 하였었음. -> 새로 학습 하려고 한다면, SA-1B로 부터 학습시키는 전략이 가능함..!!
2. CLIP 학습 계획
- base를 하기로 한건지 small을 하기로 한건지..
- 실험순서
화요일밤: CLIP-B-16 on CC3M, batch 4096, epoch 32
수요일밤: CC12M 옮기기, CC12M 학습 돌릴 수 있으면 돌리고 안되면..
3. dataset 조사

https://arxiv.org/pdf/2305.08675
위 논문에 데이터셋에 관한 자세한 얘기가 있고, gpt내용과 결합해서 정리해보자
https://arxiv.org/pdf/2110.05208
DeCLIP에서 Open29M을 처음 언급한 듯 하다.
4. VSCODE
cp -r /mnt/.vscode-server/ ./
5. 학습 현황
batchsize=4096, ViT-B/16, amp, cc3m, 32epoch, 8시간 내로 걸릴것으로 예상 13min/epoch,