[Challenge] 암 예후예측 데이터 구축 AI 경진대회

이준성·2023년 1월 2일
1

Challenge

목록 보기
2/2

😷 암 예후예측 데이터 구축 AI 경진대회


📝 Healthcare?

국방 AI 경진대회에서 특별상을 수상하면서 대회란 대회는 다 해봐야지 ㅎㅎ 라는 생각을 가지고 있었는데, 마침 Aiconnect에서 이런 걸 보게 되었다. 내가 HealthCare 분야의 경험이 많은 건 아니지만, 내 경험 중에서는 HealthCare 분야가 제일 많긴 했었다. 그래서 바로!! 도전해보기로 결심했다.

📝 서류 심사

같은 대학 동기랑 나가는 것이었는데, 서류는 크게 어려울 건 없었다. 둘 다 AI 수상 경력이 있고, 폐쇄형 GPU 사용 경험이 있었기에 큰 어려움 없이 서류를 넣었고, 서류 합격 결과를 받았다.

📝 모델 선정

당연히 이제 우리는 Semantic Segmentation 분야의 SOTA를 뒤적이기 시작했다. 나는 Medical 분야에서 사용하는 모델을 찾았고, 내 동기는 CityScape Dataset에 관련된 Semantic Segmentation을 찾았다.

몇 개를 가지고 테스트를 해봤는데 큰 문제는 없었다. 그러나 ... 폐쇄형 GPU라 그런지 서버 설정을 하는 기간이 따로 있었다 ㅋㅋㅋ 이게 무슨 말이냐면 이 기간 안에 모든 걸 다운받아야 한다. ckpt 파일이며 library며 다 다운받고 테스트를 끝내놓아야 하고, 본 대회 기간에는 Internet Access 없이 과제를 수행해야 한다. 심지어 Data Visualization도 불가능 ... 이런 건 처음 봤다.

그래서 나는 가장 좋다고 생각한 ColonFormerFCBFormer를 세팅해놓았고, 동기는 Paddle? 쪽 모델을 테스트했던 것 같다. 대표적으로는 SegFormer가 있었고 ...

그런데 ColonFormer와 SegFormer를 테스트할 때 에러가 발생했었다. 알고 보니 Torch Version이 달랐던 것이었는데, 버전이 크게 달라서 둘 중에 하나밖에 실행을 하지 못하는 것이었다. 동기가 SegFormer 외에 다른 모델도 몇 개 테스트한 게 있어서 Ensemble을 위해서는 ColonFormer를 버리는 게 나을 것 같았다.

ColonFormer 안뇽 ...

📝 Preprocessing & Training

사실 모델에 관해서는 크게 건들 건 없었고, Preprocessing이 조금 중요했다. 데이터 크기가 너무 커서 ㅋㅋㅋㅋ (무슨 10000 pixel이 넘어가) Resizing을 먼저 해놓고 진행하는 게 좋을 것 같다고 생각했다. 그래서 960x960, 480x480 등의 사이즈로 Interpolation Mode도 추가해 데이터를 미리 만들어놓고 Model Training을 진행했다.

정말 불편했던 건 GPU가 1개이고, 인터넷 접속이 안 된다는 것이었다. 그래서 코드의 이상 유무를 확인하는 것이 아닌 이상 모델 Training을 한 개 돌릴 때 계속 지켜보기만 해야 하는 것이었다. 그러다가 순간 에러나면 고치기 급급하고 ,,, 정말 힘들었다 ㅠ

📝 결과

시간이 없어서 Ensemble하는 것까지 진행하진 못했고, SegFormer로 진행한 것을 제출했다. 결과는 5등, 사후 검증은 완료했지만 수상권에는 들지 못한 것이 좀 아쉬웠다 ㅠㅠ 그래도 일반인들 대상으로 5등을 한 건 좀 만족스러웠다. 다음에는 더 열심히 하자.

아 그리고 폐쇄형 GPU 대회는 웬만하면 혼자 하는 것이 좋을 것 같다. 같이 하니까 오히려 힘든 것 같다...

그리고 앞으로는 논문을 자세히 읽으면서 이런 데이터셋에는 이런 모델을 적용하는 게 좋겠다!라는 시야를 기르는 것도 훈련해야겠다. 점수를 빨리 얻기 위해 불안한 마음에 일단 적용해보자!라는 마인드가 너무 생긴 것 같다.

profile
만나서 반갑습니다!

0개의 댓글