벌써 60일차이다. 그동안 뭘 했는지 모르겠다. 뭔가를 했지만 스쳐지나가는 기억으로만 남아 있는 느낌이다. 이대로 정말 괜찮을걸까?
지난 금요일은 쉬는 날이었다. 3개월만에 휴강이라 기분이 좋았다. 오랜만에 이번 주말에는 푹 쉬었다. 그러나 몸만 쉬었을 뿐 마음은 무거웠다. 그래서 이도저도 아닌 주말이었다.
주말동안 프로젝트를 마무리지으려 하였으나 실패했다. 변수 설정에서 시간이 오래 걸렸고, image augmentation을 하라고 하라는 부분에서 막혔기 때문이다.
pix2pix 모델을 돌리는데 있어서 변수의 설정을 잘 못해서 몇 번 학습을 시켰음에도 제대로 된 이미지가 나오지 않았다. 이미지가 나오는데, 뭔가 변수명이 이상해서 다시 한 번 돌리는 등 여러 차례의 시행착오 끝에 이미지는 어설프지만 뭔가 나오긴 했다. 그러나 1가지 이상의 augmentation을 쓰라는 부분에서 이해를 제대로 하지 못했다. albumentation 이라는 방법이 있길래 사용하려고 하였으나 이미지를 불러서 넣는 부분이 막혔다. open cv로 넣는 방법이 있지만 프로젝트에서는 어떻게 적용시켜야 할지 잘 모르겠다. imagegenerator도 시도해보려고 했지만 이것도 쉽지는 않았다. 이미지 처리 부분은 너무 어렵다. 하긴 안 어려운 것이 뭐가 있을까. 마음도 복잡하고 이것저것 해야할 것이 많으니 집중도 되지 않는다.
오늘은 수학 풀잎 스쿨 첫 날이다. 교재는 '인공지능을 위한 기초수학'이고, 풀잎시간에는 벡터와 선형방정식 부분을 나갔다. 풀잎 스쿨 전에 미리 예습을 해와서 풀잎스쿨에서는 잠깐의 교재 발표와 문제 풀이의 순으로 진행된다. 오늘 나간 부분은 수학 스터디에서 배웠던 내용이라 어렵지는 않았다. 계산은 직접 해봐야 느는 것 같다. 하지만 다음 시간부터는 쉽지는 않을 것 같다. 치환이라는 부분이 나오는데, 무슨 말을 하는 건지 잘 모르겠어서 다시 봐야할 듯 하다.
해커톤 2의 시작이다. 오리엔테이션을 하고 해커톤 2를 시작했다. 계획서를 써야하는데, 처음에는 아무 생각이 나지 않아서 갑갑했다. 중요한 것이 데이터와 태스크라는 생각이 나서 데이터와 태스크 종류를 봤다. 그래도 생각이 안 났다가 예전에 생각했었던 여행 관련 모델을 만들면 어떨까 하는 생각이 들었다. 사진을 보고 장소를 찾는 것이라던가.
감이 안 잡혀서 동기들의 이야기를 들어보기도 했다. 다들 뭔가 하고 싶은 것이 뚜렷한 것 같다. 나는 감도 못 잡아서 오후 내내 갑갑했다. 사진을 보고 장소를 찾는 것은 CV쪽이고, 기존에도 구글에서 사진을 넣어 장소 찾는 서비스도 있고.. 등등 내가 생각한 것이 뭔가 아니라는 생각을 떨칠 수 없었다.
그러다 집에 와서 영어 교육과 관련된 AI 기술을 찾아보았다. AI를 통해서 학습자의 수준을 판단하고 수준에 맞는 학습을 추천해 주는 서비스가 우선적으로 있었다. 그 외에는 발음을 교정하거나 인공지능 스피커로 스피킹 연습을 하기도 하고, 문장을 넣으면 문장을 교정해주는 서비스도 있었다.
여러 서비스를 보다가 갑자기 생각난 아이디어가 있었다. 찾아보니 그런 서비스도 없었다. 그런데 그 아이디어가 딥러닝으로 해결한 것인지, 그리고 왜 사람들이 그런 서비스를 만들지 않았던 것인지, 수익성이 있을만한 것인지가 궁금해졌다. 내 경우나 언어를 배우는 사람이라면 필요한 것인데 왜 없을까? 돈이 안 되서인지, 필요가 없어서인지 모르겠다. 사전이 있어서인가? 퍼실님과 아이디어에 내일(정확히 따지자면 오늘 아침) 이야기를 나눠봐야 겠다.
저녁에는 지시머 스터디를 했고, 대회 준비 조와 함께 이야기를 나눴다. 오늘 지시머에서 발표를 들은 MAP나 확률 분포는 할 만 했다. 그렇지만 여전히 여러 번 영상을 봐야 이해가 되는 것 같다.
대회 준비는 잘 되는 것인지 모르겠다. 왕언니가 분담해준 내 부분은 적용해봤지만 점수가 그리 많이 떨어지지는 않았다. val_loss가 안정적으로 변했다는 것으로 만족해야 하는걸까? 하이퍼파라미터 찾는 게 어렵다.
오늘은 O님과 함께 모델 바꾸는 것을 해봤다. 모델을 완벽히 이해하지 않고서는 바꾸는 것이 쉽지는 않은 것 같다. 어떤 변수가 모델에 들어가야 하는 것인지, 레이어는 어떻게 구성이 되는 것인지 등 여러 가지 것들을 고려해야 하는 것 같다. 그동안 모델을 나름 공부한다고 했지만 그것이 크게 도움이 되지는 않았다. 즉 제대로 공부하지 않았다는 거다. 레이어가 어떻게 구성되는지, 각 레이어가 어떤 역할을 하는 것인지가 혼동되었다.
오늘의 수확이 있다면, 이미지를 attention이나 transformer로 처리할 수 있다는 것을 안 것? 하지만 그걸 어떻게 적용하느냐가 문제다.
요즘 느끼는 건 공부를 정말 대충하고 있구나 하는 거다. 한 번에 이해되는 것이 하나도 없다. 보고 또 봐도 이해가 안 되는 것도 많고, 눈으로는 보고 있어도 이해가 안 되는 것도 많다. 부분적인 것을 알아도 전체를 못 보는 경우도 많고, 이론을 알아도 적용이 안 되는 경우는 더 많다. 안다고 생각해도 설명하려고 하면 안 되는 경우도 많고, 정리하고 그 당시에는 설명을 했지만 시간이 흘러 기억나지 않는 것도 많다. 코드 이해나 구현은 말할 것도 없다. 결론은 아는 것이 하나도 없다는 것이다. 시간은 흘러가는데, 정말 이대로 괜찮은 걸까?