머신러닝 개발자로 발돋움하고 싶은 분들을 위한 프로그램입니다.
구글의 머신러닝 부트캠프는 작년인 4기부터 500명 규모로 모집을 시작했고, 이번 기수도 500명 규모를 유지했다.
올해는 작년보다 다소 빠른 7월 1일부터 프로그램이 시작되었고, 그 전주에 Google Meets를 이용해 원격 킥오프 미팅을 진행했다. 전반적인 프로그램 설명과 진행과정에 대한 설명, 작년 기수 분들의 간단한 연사, 그리고 경쟁률 등에 대한 간단한 FAQ를 진행했다.
올해 경쟁률은 약 4:1 정도로 작년에 비해 다소 낮아졌지만, 합격자 분들 중에는 '이런 분이 왜 여기에 계시는 거지...?' 싶은 NLP 현업 전문가분들도 상당수 계셨다. 근데 진짜 어쩌다가 참가하시게 되셨나요
참여가 확정되면 아래와 같이 Coursera Deep Learning Specialization을 무료로 수강할 수 있는 권한을 제공해준다. 이외에도 참가자별 진행상황, 개더 회의 공고, 프로그램 일정 및 기업 테크톡 사전질문 등을 입력하는 구글 스프레드시트 역시 공유받는다. 모든 공지 및 온라인 네트워킹은 구글 개발자 커뮤니티 디스코드 서버에서 권한을 받아 비공개 채널에서 이루어진다.
강사는 코세라의 창업자이자 스탠퍼드 대학교 컴퓨터공학과의 앤드류 응(Andrew Ng) 교수님. 이 업계에서는 유명인사이시다.
내용은 심층학습이 어떻게 이루어지는가에 대해 수학적으로 설명해주시는 것을 중심으로 진행된다. 강의 내용은 DeepLearning.AI 유튜브 채널에 그대로 있으니 내용이 궁금한 사람들은 이것을 통해 학습해도 좋을 것 같다. 1강 재생목록
한국어 자막은 Coursera 자막보다 YouTube 자막으로 보는 것이 더 좋을 수 있다. 그래도 나는 가급적이면 AI와 관련된 학술지들이 영문이 대부분이므로, 영문 자막으로 수강했다. 필기들도 영어로 수행했고, 후술할 퀴즈들도 영어로 풀었다.
상당히 자신감을 많이 심어주는 교수님이셨다. 얼마나 유명하면 저런 밈도 있다
"생각보다 어려울 수 있다" -> (설명) -> "아직은 이해 못해도 괜찮다" 패턴의 반복으로 '아 일단 그냥 들어보자'라는 생각으로 강의를 들었다. 강의만으로는 완벽하게 이해하는 것은 매우 힘들었지만, 이후 중간 점검 퀴즈들과 프로그래밍 과제를 하면서 감을 익혀가는 과정을 거쳤다.
우리 학교에는 학부 과정에 심층학습 과정이 따로 없고, 교수님에 따라 학기 후반부에 인공지능, 컴퓨터비전, 자연어처리 수업에서 해당 분야와 관련돼 맛보기 정도만 교육하는 수준이라 이 과정이 가뭄의 단비같았다.
각각의 과제는 통과 기준이 정해져있다. 퀴즈는 80점 이상, 코딩은 70점 이상을 획득해야 합격이다. 퀴즈는 3회 내에 통과하지 못하면 몇 시간 뒤에 다시 응시하는 방식으로 진행된다. 내용은 역시 해당 주차 강의 내용. 프로그래밍도 해당 주차 강의의 내용을 코드로 구현하는 실습으로, 상대적으로 주석으로 설명이 충분히 되어 있어 주석을 잘 읽고 파이썬 코드를 작성하면 된다.
주차별로 과제 기한이 적혀있는데, 이는 신경쓰지 않고 진행하면 된다. 부트캠프 측에서 각 강좌를 언제까지 완강해야 한다는 날짜를 정해뒀는데, 그 안에만 모두 수강해서 인증만 하면 된다.
총 5개의 강좌를 모두 수행하면 아래와 같은 코세라 수료증이 발급되는데, 이를 LinkedIn에 등록해서 인증을 받으면 된다.
위의 코세라가 대학교 강의와 같은 이론과 실습 중심의 교육이었다면, Kaggle은 사람들과 경쟁을 통해 실적을 내는 수단으로 사용되었다. 캐글은 AI를 학습에 필요한 데이터 및 코드를 공유하는 플랫폼으로, 여기서 실행되는 다양한 대회들을 통해 우수한 성적을 낸 팀에게는 상금을 수여하기도 한다.
학교에서 수강한 기계학습 수업에서 캐글을 활용해 과제를 진행했기 때문에, 어렵지 않게 적응할 수 있었다. 캐글을 처음 도전해보는 참가자들에게는 대회의 로직 설명을 해주기도 했다.
구글 머신러닝 부트캠프에서는 (1) Playground Competiton에서 2~3인으로 구성된 팀으로 상위 20% 이상의 성적을 거두거나, (2) Featured Competiton에서 개인 혹은 3인 이하 팀으로 상위 40% 이상의 성적을 거두는 것을 수료 조건으로 했다.
Playground는 캐글에서 직접 월 1회 주최하는 연습용 데이터를 이용한 대회로, 별도의 메달이나 상금은 없다. Featured는 기관에서 실제 데이터를 이용해 결과는 내는 대회로, 성적 우승자에게는 메달 및 상금이 주어진다. 부트캠프 측에서도 난이도가 Playground가 수료 조건을 만족하는 게 더 쉬울 것이라고 말했다.
별도로 상위 5% 이상의 성적을 거두거나, 메달을 획득하게 되면 선착순 100명에게 후드티 굿즈를 주는 이벤트도 있었다. 나는 우선 7월 Playground로 수료 조건을 만족시켜놓고, 8월 Playground를 통해 상위 5% 선착순 조건까지 만족시켜 굿즈도 받게 되었다.
방법이라면 대회에 참여하는 사람들이 서로의 코드를 공유하고 의견을 나누는 활동을 많이 가진다. 관련된 글과 코드를 읽어보고 나만의 것으로 소화한다면 수료 조건을 맞추는 건 어렵지 않을 것이다. 물론 난해한 대회들도 많다. 점수 인플레이션이 너무 많이 발생하기도 하고, private 점수가 공개되면 public과 비교해 순위 변동이 많이 일어나기도 한다. 이 점들을 유의하면서 참가를 하는 것이 좋을 것이다.
구글 머신러닝 부트캠프에는 여러 파트너 기업들이 함께 참여하여 취업과 관련된 활동을 지원해준다. 매년 기업이 달라지기도 하지만, 각 회사에서 기업 소개 및 취업 관련 안내, 그리고 관련된 FAQ를 진행했다. 이 활동에서 질문을 한 사람들에게 추후 회사에 직접 방문해 커피챗을 할 수 있는 기회를 선착순으로 모집하기도 한다. 나의 경우도 이 오피스 방문에도 참여한 경험이 있어 추후 후기를 나누도록 하겠다.
이외에도 이전 기수 참여자들이 Kaggle을 어떤 식으로 진행하면 좋을지 선배로서 알려주는 시간, 그리고 Gemma Sprint와 관련된 내용을 나누기 위해 Google Developer Expert를 초청해 멘토링을 받는 시간을 가지기도 했다. 대부분의 이 활동들은 Google Meets를 이용한 화상통화로 매회 약 1시간 정도 진행됐다.
디스코드에서는 채팅 채널만 지원을 받아 음성 및 화상 채팅을 자유롭게 할 수 없다. 대신 메타버스 기반의 가상 오피스인 게더타운에서 모여 여러 사람이서 스터디를 하거나 딥러닝과 관련된 내용을 공유하는 시간을 언제든지 가질 수 있다. 개더를 안 써본 사람들에게 간단하게 설명하자면, 바람의 나라 그래픽에 Zoom의 화상대화 기능이 탑재된 웹사이트다.
이곳에서 모여 이야기를 나누는 것 만으로도 재밌고 유익한 시간을 가질 수 있었다. 집에 있어도 서로의 얼굴을 마주보고 화면을 공유하면서 모르는 것을 질문하거나 답변하는 등의 활동을 제약없이 할 수 있다. 이런 활동을 몇 회 호스팅하거나 참여하는 등을 기록해서 구글코리아에서 굿즈를 제공해주기도 했다.
본래 Coursera는 8월 말까지, Kaggle은 10월 초까지 조건을 만족하면 됐다. 하지만 이번 기수부터 처음으로 실시되는 Gemma Sprint라는 변수가 있기 때문에 이들을 미리 끝낼 필요성을 느꼈다. 마침 나는 학부생에 방학동안 별도로 인턴 활동도 없었기 때문에 Coursera를 7월 말에 끝냈고, Kaggle 참여는 8월 말까지만 진행했다. 9월은 학교 수업을 병행하면서 Gemma를 활용한 프로젝트를 현재 진행중이다.
다음 포스팅까지는 조금 시간이 소요될 수도 있을 것이다. Gemma Sprint를 다 끝낸 후, 관련된 내용과 함께 파트너 기업들과 함께 하는 오프라인 토크 내용을 추후 공유하도록 하겠다.