프로젝트 기간 동안 깨달음으로 대체
학습시간 09:00~02:00(당일17H/누적892H)
COCO 포맷을 YOLO 포맷으로 변경할 수 있다는 사실을 알았다. VOC, COCO, YOLO는 내 입맛에 따라 변경할 수 있는 것 같다. 모델이 받을 수 있는 포맷에 따라 유동적으로 바뀌어야하기 때문인 것 같다.
가상환경도 conda로 하는 게 있고 venv로 하는 게 있다. conda는 .yml 파일 기반이고 venv는 .txt 파일 기반이다. 근데 conda는 .txt 파일로 내보내는 것도 가능하다. 그래서 다들 conda를 쓰는 듯.
코랩에서는 .yml 파일을 받을 수가 없어서 꼭 .txt 파일로 버전을 맞추어야 하는데, 오늘 코랩에서 버전 동기화를 해보니까 모든 라이브러리를 설치해서 시간이 너무 오래 걸린다.
GPU를 땡겨서 팀플 가상환경에 쓸 수는 없을까 계속 연구하다가 자동으로 싱크를 맞춰주는 코드를 찾았다. 코드를 조금만 잘 짜면 로컬 클라우드 관계없이 가상환경을 왔다갔다 하면서 개발할 수 있을 것 같다. 대충 감이 왔다.
이미지 파일은 어떻게 EDA하는 게 좋은지 잘 모르겠다. 데이터프레임은 꽤 연습을 해서 알겠는데, 아무것도 모른 채로 이미지 EDA를 하려니까 막막하다.
이미지 전체 수와 annotation 파일 수가 다른 경우에는 어떻게 하는 게 모델 학습에 좋을지 생각해 봐야겠다.
데이터 증강에도 여러 기법이 있는데, 알약 탐지를 할 때는 왠지 색상과 크기를 함부로 변경하면 안 될 것 같다. 아니면 아예 상관이 없을지도 모르고. 어떤 기법을 추가해는 게 좋을지 생각해 봐야겠다.
__name__에 관하여아직 완벽히 이해가 되진 않지만, 이 코드를 입력하면 내가 이 파일을 직접 실행할 때만 코드가 작동하는 것 같다. 오늘 처음으로 main.py 이외의 파일에서 사용해 봤는데, 솔직히 왜 이 코드가 있어야 하는지 잘 모르겠다. 조금 더 연구가 필요한 부분이다.