[250527화909H] 알약 분류 인공지능 구현 - 팀프로젝트 일지 (3)

윤승호·2025년 5월 27일

프로젝트 기간 동안 깨달음으로 대체

학습시간 09:00~02:00(당일17H/누적909H)


◆ 오늘의 깨달음

1. 객체탐지 모델

객체탐지 모델이 꽤 다양하게 있다. 예전 미션에서 SSD모델을 사용했었는데, 이제 이 모델은 거의 이름조차 기억에 남겨지지 않을만한 기억의 저편 모델이 되었다고 한다. 탐지 모델 쪽에서 큰 업적을 세운 모델도 아니어서 큰 임팩트가 없었다고 함. 근데 지난 미션은 왜 이걸로 한 걸까... 내가 할 때는 성능이 나름 좋게 나왔는데 어쩌면 그게 SSD 모델의 한계였을 지도 모르겠다.


2. ultralytics

YOLO 모델을 찾아보다가 ultralytics라는 싸이트를 알게 되었다. 여기서 다 배포를 하는 것 같다. 버전 5부터 11까지 있는데, 성능 지표를 보니까 8부터는 드라마틱한 차이가 느껴지지 않는다. 개발환경에 맞추어 적당한 모델을 선택할 필요가 있을 것 같다.

모델을 각잡고 만들어보려고 했는데 YOLO모델은 생각보다 너무 쉽게 구현이 된다. 무슨 머신러닝 선형회귀 모델 학습하는 느낌이다. 그렇다면 이 프로젝트의 중점은 모델 만들기가 아니라는 뜻이다. 무엇이 핵심인지 생각을 해봐야할 것 같다. 과연 나에게 바라는 게 무엇일까?


3. 데이터 증강

객체탐지 테스크에서 가장 핵식은 바로 bbox 정보가 들어있는 annotation parser를 얼마나 잘 만드느냐다. 미션7의 기억을 돌이켜 보면 내가 좌표 매핑 및 증강을 얼마나 잘 하느냐에 따라서 모델 성능이 판가름났다. 이번에도 크게 다를 것 같지는 않은데, 문제는 한 이미지에 bbox가 여러 개 있는 것을 증강해야 한다는 점이다. 아마도 내가 모르는 데이터 증강 방법이 더 있을 것 같다. 시간을 더 투자해야겠다.


4. 폰트

그동안 시각화할 때 타이틀이나 라벨명 출력을 다 영어로해서 폰트 관련은 생각해본 적이 없다. 근데 이번에는 한국어로 출력해야해서 문제가 있다. 아직까지는 무슨 짓을 해도 무언가를 설치하는 방향으로 가지 않으면 한국어 출력이 안 된다. 헬퍼 클래스에 폰트를 주입해야 하나. 뭔가 라이브러리가 있나. 흠 이왕이면 예쁜 폰트로 하고 싶은데... 이것도 더 찾아봐야할 것 같다.


5. 데이터 스플릿

기존 신경망 기반의 모델은 내가 개발환경 메모리에 데이터를 잠시 올려서 스플릿하면 그만이었는데, 이제부터는 아예 경로 자체에서 물리적으로 나누어져 있어야 하는 듯하다. 내가 이걸 직접 나눌 수도 없어 어쩌지? 이것도 뭔가 방법이 있을 것 같은데,, 찾아볼 게 너무 많다.

profile
나는 AI 엔지니어가 된다.

0개의 댓글