[핸즈온 머신러닝] 3개월 간의 스터디 회고

박경민·2023년 6월 24일
0

[Hands-On Machine Learning]

목록 보기
23/23
post-thumbnail

오늘은 (끝난 지 시간이 꽤 지난) <핸즈온 머신러닝> 스터디 회고를 하려한다. 스터디 종료 직후 바로 글을 작성하려 했으나.. 기말고사 기간과 겹쳤고, 미루고 미루다 쓰는 회고다. 그래도 나름 시험 기간 중 지난 학습했던 것/느꼈던 것들을 곱씹어 봤으니, 오히려 시간이 지나서 정돈된 상태에서 글을 쓸 수 있으리라 생각한다.

회고에는 KPT 회고 방법론과 사이사이에 나의 이야기들을 덧붙일 것이다. 꽤나 솔직한 글이 될 것 같다.

KPT회고란?

  • Keep: 잘 해와서 유지하고 싶은 것
  • Problem: 어려움을 느껴서 개선하고 싶은 것
  • Try: K, P를 기반으로 앞으로 무엇을 시도해볼지

정리해보는 방법론이다!

본격적으로 회고를 진행하기 전에 도대체 어떤 내용에 대한 스터디였는지 간단하게 기록하고자 한다.

스터디 이름은 <데이터 사이언스 스터디> 였다. 그러나.. 스터디 자체에서 무엇을 했는지 담아내기엔 데이터 사이언스라는 이름보다는 <핸즈온 머신러닝 스터디>이 더 적절하다 생각한다. 목표는 핸즈온 머신러닝 책의 ML부분은 전부, DL부분에서 기본적인 이론, MLP와 CNN 구현과 컴퓨터 비전을 다룬 14장까지 학습하는 것이었고, 실제로 계획한 모든 범위를 빠짐없이 다뤘다. 매주 팀원(4명)들이 준비해 온 내용을 발표하고, 발표가 끝나면 해당 내용과 발전된 내용을 내가 한 번 더 다루는 방식으로 진행했다.

Keep?

후에 부족했던 점도 많이 생각나지만 돌아보면 잘했다 생각드는 점이 더 많은 거 같다. 하나씩 정리해보면

  • 처음 스터디를 시작하면서 마음 먹었던 목표가 있었고, 끝까지 지키려 노력했다는 점.
    그럼 그 목표가 무엇이었냐? 여기 3월 4일자 노션 기록이 있다.

스터디를 조직할 때 즈음인 3월 4일날 작성한 글이다. 학기 진행하면서 세운 여러 목표들 중 가장 1번에 위치한 게 위 2개의 스터디였고, 그 중 데이터분석 스터디는 리더로 참여하고자 마음을 먹었었다. 왜? 따라가는 위치가 아니라 이끄는 위치에 선 책임감이 나를 가장 크게 발전시킬 수 있다 믿었기 때문이다. 실제로 스터디에서 책의 내용을 더 깊게 이해해본다거나 활자 이외의 자료들을 더 찾아봤던 건 스터디를 진행하면서 나오는 의문이나 어려운 내용들에서 자연스럽게 나오는 '이해'에 관한 문제를 누군가는 해결해야 한다고 생각해서였다. 여러 부족한 면을 제외하고 좋았던 것들이 있다면 위의 4가지 목표를 매주 달성하려 노력했다는 점이 그 이유로 작용했을 것이다.

  • 구체적으로 무엇을? 수학과 가까워졌다. (가리지 않고 다 읽었다.)

그럼 구체적으로 어떤 부분에 대해서 지식의 성장을 경험했나?를 되돌아보면 아마 수학적인 접근을 많이 시도했다는 점을 꼽고싶다. 또 느낀 것은, 기계학습 / 딥러닝 적용의 어떤 분야든 수학을 빼면 시체라는 점..? 이 부분을 과거에도 느끼고 있었지만 정확히는 스터디 진행하는 내내 확인할 수 있었다. 특히나 기억에 남는 부분은 SVM 할 때랑 PCA 공부할 때였다. 다음은 SVM 스터디 준비하면서 적은 글에 담긴 의문이다.

이렇게 모르는 건 솔직하게 의문점을 던져놓고 해결하려 유튜브든 글이든 찾아서 읽었던 것이 돌아보면 가장 성장했던 순간이 아닐까싶다. 단순 내용을 요약하고 기록한 24편의 글 이외에도, ML에 8편의 글이 추가됐는데, 이 부분이 오히려 코어다.

이렇게 공부를 하면서 오히려 더 흥미를 느낄 수 있었고 / 다른 어떤 수학적 내용도 일단 부딪혀볼 수 있게 되었고 (한계를 느낀 적도 많았지만) / 결국은 현재의 논문들이 이야기하는 것도 새로운 실험과 base 에 깔린 수학적 아이디어라는 점을 알았다. 또 수학이 아니라 다른 CS 의 어떤 과목들도 이런 식으로 접근하면 해볼 수 있겠다라는 생각이 들었다.

  • 기존 설정한 위치까지 왔다. (앞으론 무얼 할까?)

두 가지 의미다. 하나는 3월에 설정한 '책'의 진도를 다 나갔다는 점, 다른 하나는 올해 초에 설정한 이맘때쯤의 목표, 기계학습 전반의 내용을 이해하고 > 해결하고픈 문제를 찾아보자라는 위치에 다다랐다는 점.

후자의 것이 더 크다. 여름방학 즈음~ 들어갈 때 현재 기술로 적용 가능한 도메인 분야들에 하나씩 도전해보고 싶다는 생각을 거의 매일 한 거 같다. 자연어처리가 될 수도, 비전, 강화학습 등이 될 수도 있겠다. 그러면서 심심할 때, 내가 공부하는 길이 어디인지 공부하는 모델로 적용 가능한 분야를 찾아보거나 / 이런저런 세미나를 찾아들었다.

Genome-based prediction

GPT-Machine Translation 성능과 한계

물론 이제까지 학습한 모델 / 수학적 베이스만 해도 끝이 없는 건 사실이다. 모르는 게 정말 많다. 그래도 applicable 한 문제들에 도전해볼 수 있는 곳까진 왔다고 생각하고, 하나씩 진행해나가며 모르는 것들은 다시 돌아오는 방향을 기획 중에 있다.

Problem?

그럼에도 문제는 많았다.

  • 좋은 전달의 문제
    대화든, 강의든, 스터디든 결국은 전달이 되어야 한다. 그런데 스터디 초반-초중반까지는 전달의 문제가 있었다. 아래는 스터디 1/2 반바퀴를 끝내고 적었던 글이다..

스터디 내용을 나조차도 완벽하게 알지 못한다거나, 이해했다며 준비해가도 바로 1주일 이내에 소화한 내용을 100% 상대방에게 전달하기란 쉬운 일이 아니었다. 1/2 반환점을 돌기 전엔 많이 알아가고 많이 말해야 한다는 부담이 무의식중에 있었던 것 같다. 4월 6일날 위와 같은 글을 적어보면서 마음을 고쳐먹었고, 안다의 기준을 높여 나는 모든 내용을 빠짐없이 준비하되 더 심플하고 더 쉽게 전달할 방법을 고민했던 것 같다. 다행히 후반기에는 동일한 문제가 거의 발생하지 않았지만.. 지금 생각해도 아쉬웠던 주차 몇 개가 있다.

  • 어디까지 알아야 하는가?

바로 위의 문제랑 직접적으로 연결이 되는 문제이기도 하다. 스터디 내용을 매주 조직하면서 도대체 책의 내용을 어디까지 소화해내야 하는지 의문이 들었다.

900페이지에 가까운 두꺼운 책이 빙산의 일각처럼 느껴졌다. 책에서 간단히 설명한 내용은 줄줄이 끌어내어 아래층까지 내려가봐야 그래도 그게 이해가 되었다고 말할 수 있을 것 같았다. 이 과정을 몇 번 반복하다 보니 우매함의 봉우리를 넘어 절망의 계곡으로 빠르게 빨려들어가는 나를 발견했다. 안다고 생각했던 것도 흐려지기 시작했고 자신감도 많이 떨어졌던 시기가 있었다. 지금도 그럴지 모르겠다.

  • 문제이기도 했던 수학

사실 수학식을 이해하는데 시간이 많이 투자된 이유는 흥미를 느껴서라기보다도 잘 몰라서인 이유가 더 클 것이다. 베이스가 있다면 기계학습 분야는 적용 정도지 않을까..? 나름 SW학과를 이중전공하면서도 충분하지 않는 수학 베이스의 수업에 억울해하면서도, 공학을 다루면서 당연히 알아야할 수학 정도는 챙기기로 했다. 다른 학교에서도 다루는 공학수학(1), (2) 에 등장하는 내용들은 꼭 공부할 것이다.

Try?

앞으로 구체적으로 무엇을 할 것인지 정리해보자.

  • 프로젝트, 일을 더 벌리고 과정을 기록해두자.

Problem 1과 연관이 있다. 일도 해본 사람이 더 잘하고, 혼자 일한 사람보다 같이 일해본 사람이 더 효율적일 것이라는 생각이 들었다. 묵묵히 책을 보며 나아가야 할 때도 있지만 결과를 내고 함께 일하는 방향으로 도전할 수 있을 때 도전하는 게 좋아보인다. 일을 벌리고, 성공과 실패를 기록해두고, 더 효율적인 방법은 없을지, 더 잘하기 위해 무엇을 덜/더 해야할지 끊임없이 생각하는 사람이 되자.

  • 수학적 베이스를 기를 것이고

좋아하지만 상대적 약점인 수학적 베이스를 기르기 위해 노력할 것이다. 그리고 이건 탐구보다 일정 수준에 빠르게 도달하는 형태로 도전할 것이다. 구체적인 방법 몇 개를 생각해둔 게 있긴 한데..

  • 세상에서 해결하고자 하는 문제를 찾을 것이다. (도메인과 연결시킬 것이다.)

Keep의 3번째와 연결할 수 있을 것이다. 가지치기 하며 여러 분야에 도전해보며 어떤 문제들이 있고, 어떻게 해결 중이고, 그 중에서 특히나 내가 하고싶은 분야는 무엇인지 / 왜 그 분야여야만 하는지 / 결과적으로 나는 어떤 문제 해결을 원하는지 찾아내고 싶다. 아직까진 그냥 ML/DL이 좋아서 공부한 거 같은데.. 도메인 관련 이유를 더 붙이면서 공부하면 스스로 동기도 얻고 나중에 나만의 무기가 되지 않을까 생각한다.

profile
Mathematics, Algorithm, and IDEA for AI research🦖

0개의 댓글