input/data/
│ ├──train/...
│ └──eval/...
image-classification-level1-04/
│
├── train.py - main script to start training
├── test.py - evaluation of trained model
│
├── config.json - holds configuration for training
├── config_submit.json - holds configuration for submit
│
├── parse_config.py - class to handle config file and cli options
│
├── base/ - abstract base classes
│ ├── base_data_loader.py
│ ├── base_model.py
│ └── base_trainer.py
│
├── data_loader/ - anything about data loading goes here
│ ├── data_loader.py
│ ├── datasets.py
│ └── transforms.py
│
├── model/ - models, losses, and metrics
│ ├── model.py
│ ├── metric.py
│ └── loss.py
│
├── saved/
│ ├── models/ - trained models are saved here
│ └── log/ - default logdir for tensorboard and logging output
│
├── trainer/ - trainers
│ └── trainer.py
│
├── logger/ - module for tensorboard visualization and logging
│ ├── visualization.py
│ ├── logger.py
│ └── logger_config.json
│
└── utils/ - small utility functions
├── util.py
└── ...
호스트, 사용자명, 비밀번호, 포트
putty 사용해서 key 파일을 filezilla가 인식할 수 있도록 변형
RuntimeError: CUDA out of memory. Tried to allocate 48.00 MiB (GPU 0; 31.75 GiB total capacity; 30.53 GiB already allocated; 9.50 MiB free; 30.59 GiB reserved in total by PyTorch)
batch_size = 64 -> 32로 변경, 해결 완료 but 학습 속도가 느림