2020년 상반기 회고 & 하반기 계획

황태용·2020년 7월 19일
1

성장기

목록 보기
1/1
post-thumbnail

2020년 3월 16일 비트윈(Between)타다(TADA) 를 운영하는 회사인 VCNC데이터 팀에서 첫 커리어를 시작했습니다. 짧은 시간이지만 지난 4개월 동안을 돌아보고 하반기에 대한 계획을 다짐해보려고 합니다.

상반기 회고

1. VCNC 에서의 첫 커리어의 시작

2020년 3월 16일 VCNC에 첫 출근을 했습니다. 타다 금지법과 코로나로 힘든 시기를 보낼 예정인 회사였지만 Death Vally 를 함께 넘어보자는 마음가짐으로 입사를 결심했습니다. VCNC 데이터 팀은 개발팀에 속해있는데요. 마케팅 팀이나 운영 팀에서 요청하는 애드혹 분석, Dash Board 제작 뿐만 아니라 Machine Learning, Optimization, Simulation 등의 개발과 관련된 다양한 일을 할 수 있다는 점에서 저를 성장시키기에 매우 좋은 회사라고 생각합니다.

제가 처음 입사 후 세운 목표는 크게 2가지 입니다.

" 적응하기 "
" SQL을 자유롭게 다루기 "

적응 하기 라는 목표는 정량적으로 평가하기 어려운 목표인데요. 회사에 출근하는 것이 부담이 없고 일을 하는게 즐겁다는 순간이 올 때 목표를 이뤘다고 생각하기로 했습니다. 입사 후 첫 한 달은 타다 베이직 서비스가 종료될 시점이라 매우 어수선했는데요. 대부분의 시간을 타다 프리미엄 의 운영을 효율화하고 수요를 올리는 데 시간을 쏟았던 것 같습니다. "회사에 적응했다" 라고 느껴지는 순간은 입사 후 2달 정도 지난 시점이었습니다. 훌륭한 동료들 덕분이기도 했고 회사 자체가 워낙 수평적인 회사라 편하고 활기찬 마음으로 회사를 다닐 수 있게 된 것 같습니다.

SQL을 자유롭게 다루기 라는 목표는 현재 진행형입니다. VCNC는 BigQuery 를 사용하고 있는데요. 처음에는 데이터를 조인하고 원하는 데이터를 뽑아내는데 많은 시간이 들었습니다. 하지만 지금은 모빌리티라는 도메인에 익숙해진 상태라서 분석에 필요한 데이터를 대부분 뽑아낼 수 있습니다. 깔끔하고 효율적인 쿼리를 완성시킨 후 따로 정리해나가고 있습니다.

제가 쿼리를 정리해나가는 방식은 다음과 같은데요.

[날짜] [프로덕트] [쿼리에 대한 설명]

한 가지 간단한 예를 들면,

[2020-07-13] [타다 프리미엄] [날짜 별 이용자 수]

와 같이 정리해 나가고 있습니다.

2. 회사에서 느낀 점

대학교에서 벗어나 (물론 아직 졸업은 안했습니다 ㅠㅠ) 데이터 기반의 회사에서 일을 하면서 저를 많이 돌아보게 되었습니다. 회사를 다니면서 느꼈던 점들을 조금씩 적어보려고 합니다. 몇가지 섹터로 나누어서 적어보겠습니다.

데이터 시각화

  • 각 축의 스케일은 같고 범례가 다른 막대그래프가 최고다.
  • 시각화 자료를 다른 팀과 공유할 때 → 측정값에 대한 정의를 자세하게 적는다.
  • 일 별로 발생한 매출을 보고 싶을 때 → 7일 이동평균선을 포함하면 전체적인 경향성 파악에 훨씬 좋다.
  • 일 별로 측정값을 볼 때 이상치가 발생했다. → 해당 일이 서비스 초기인지 검토한다.

파이썬

  • np.concatenate 는 시간 복잡도가 매우 높은 연산 중 하나이다. → 빈 array를 만든 후 값을 넣는 방식이 더욱 효과적이다.

AB Test

  • AB Test 의 핵심은 표본집단을 선정하는 것이다. 우리가 테스트 해보려는 자극이 각 그룹의 유일한 차이 인지 수 차례 검토해야한다.

Machine Learning

  • Test set 을 설계 할 때 팀원들과 함께 선정하고 이를 고정시켜 놓은 후 여러가지 실험을 해보는 것이 효과적이다.
  • Forward looking 주의하자. 실무에서 Target Encoding, Mean Encoding 은 지양하는 것이 좋다.
  • 어느 시점에 사용될 모델인지 를 미리 고민, 검증한 후 피처를 만들어야 한다. 우리가 만든 모델이 적용되고 난 이후에 생성되는 데이터를 피처로 활용할 수는 없다.

문제 해결

  • 문제 해결을 최대한 단순화하자 ! 머신러닝이 항상 답은 아니다.
  • 의견을 제시할 때 주눅들 필요는 없다.
  • 나는 주니어이다. 잘 하지 못하는 것을 당당하게 말하고 보완하자. 잘 모르는 것을 숨기는 것은 회사, 나에게 모두 손해이다.

3. 퇴근 후 활동

상반기 동안 퇴근 후에도 저를 성장시키기 위해 많은 노력을 해왔습니다.

글또 활동
전체 데이터 그룹의 지주(?)라고 할 수 있는 카일의 글또 에 가입하여 2주에 한번씩 데이터와 관련된 글을 쓰고 있습니다. 차곡차곡 글이 쌓여가는 것도 즐겁지만 이제는 글쓰기가 습관화 된 것 같아서 뿌듯합니다. 글또는 가능하다면 평생 지속하고 싶습니다.

데이콘 우승자 관련 책 집필 시작

Dacon에서 작년 말에 열린 대회인 퇴근시간 버스승차인원 예측 대회에서 운이 좋게 대상을 받았었는데요. 위키북스에서 좋은 제안이 와서 우승 솔루션과 관련된 책을 집필하고 있습니다. 사실 책을 쓰는 것은 처음이라 많이 힘들지만 '꼭 마무리는 지어보자!' 라는 목표로 열심히 달려가고 있습니다.

매주 목요일 논문 스터디
대학교 동기들 (지금은 대학원생인 2명의 친구) 들과 함께 매주 목요일마다 논문 스터디를 진행하고 있습니다. 제가 있는 팀은 Research 팀이 아니라서 평소 좋아했던 Deep Learning을 사용할 기회가 매우 적은데요. 다행이 친한 친구들이 AI를 연구를 하고 있어서 1주일에 1번씩 논문 스터디를 진행하고 있습니다.

출 퇴근 시간에 조금씩 글 읽기
회사와 사는 곳이 좀 멀어서 출 퇴근 시간이 의미없이 흘러왔었습니다. 조금이라도 의미있게 시간을 보내기 위해 신문이나 글 등을 읽고 있습니다. 글을 요약해서 나중에 읽기 편하게 페이스북에 조금씩 업로드 하고 있습니다.


하반기 계획

운동을 꾸준히 → 3대 300 달성
좋은 룸메이트를 만나서 매일 운동을 하고 있습니다. 허리를 다치는 바람에 좋아하던 축구도 못하고 헬스도 그만두었는데요. 수영으로 재활을 마친 상태라 다시 몸을 만들기 위해 노력하고 있습니다 ! VCNC 데이터 팀이 장난으로 세운 목표는 3명이 함께 3대운동 1000을 달성하자 ! 였는데요(ㅋㅋㅋ). 우리 팀의 KPI 상승을 위해 노력해야겠습니다.

윌라 오디오북과 함께 독서 시작 → 5권 이상 읽기
데이터 분석만 하다 보면 한번씩 드는 생각이 사고방식이 조금씩 좁아지는 느낌이 올 때가 있었습니다. 그럴 때 마다 옥상에 올라가서 머리도 좀 식히고 생각도 환기하는데요. 데이터 분석을 잘 하기 위해서는 논리적인 사고 방식넓은 시야가 정말 중요한 것 같습니다. 다행히 요즘 오디오북에 빠져서 출 퇴근 시간에 책을 듣고 있습니다. 하반기 까지5권 의 책을 읽고 가능하다면 글도 써보려고 합니다.

ISLR (Introduction to Statistical Learning) 공부하기
VCNC 데이터 팀의 훌륭한 문화 중 하나는 읽.쓰.정 이라는 문화인데요. 주1회 데이터 분석이나 개발 관련 원하는 자료 (블로그, 슬라이드, Youtube, 기타 등등) 1개씩 읽고와서 요약해서 소개해주는 스터디입니다. 이 때 ISLR을 공부하고 팀원 들과 공유해보려고 합니다. 구체적인 공부 계획 및 내용은 따로 포스팅 하겠습니다.

회사와 함께 성장하는 기쁨 느끼기
스타트업에 입사한 이유는 창업에 꿈이 있고, 능동적으로 일하고 싶었기 때문인데요. VCNC는 어려운 시기를 보내고 있지만 위기를 함께 극복하는 경험을 함으로써 함께 성장해보려고 합니다.

0개의 댓글