MegaCon2022_후기

김민석·2022년 6월 18일

패스트캠퍼스에서 수료자 대상 'MegaCon 2022 : DATA&AI'을 진행했다.

당시 취업준비생이다보니 뭐라도 닥치는 대로 신청하고 서류를 넣던 때라 당연하게도 신청.
결과적으로 만족스러운 시간이었다.

연사님 별 말씀을 정리한 내용을 공유한다.

1. 이민용 연사님(뱅크샐러드)

최근 국내 기술 산업에서의 데이터가 중요.

  • 국내 데이터 직무 증가 20%

산업에 데이터가 필요한 이유

  • 데이터 기반 의사결정 : 제품 개발 프로세스 모든 단계에서 데이터를 활용
  • 데이터 제품 : 데이터를 활용하여 가치를 만드는 제품

데이터를 다루는 사람들은 '어떤 문제를 해결하려 하는가'에 집중해야 한다.

많은 사람들이 기술에 집착하려하는데 이를 경계해야.

업계에서는 사용자 임팩트, 비지니스 임팩트를 만드는 것이 궁극적인 목표
이것을 위한 역량은 복잡한 문제를 단순하고 효과적으로 풀어내는 역량

Q&A

(1) 기술 발전 속도가 빠른데, 트렌드에 대한 인사이트는 어떻게 얻고, 트렌드를 따라가야할 지, 혹은 할 수 있는 분야를 더 집중적으로 할 지?
답변 :
기술에 있어서 팔로우업을 하는게 아주 중요하다고 생각하진 않는다.
요즘 어떤 업계에서는 이런 활용 방식을 한다더라의 트렌드를 팔로우업하는 것이 더 중요하다고 생각

(2) 기업이 데이터 사이언티스트에게 요구하는 역량이나 역할은 어떻게 변할지 궁금합니다

답변 :
가장 중요한 건 문제해결 역량
사용자 문제를 명확하게 정의하고, 단순하고 효율적으로 해결할 수 있는 역량
+) 커뮤니케이션도 중요
가장 이런 역량을 쌓는데 실무 경험이 좋다!

(3) 학력의 중요성과, 커리어의 시작

답변 :
어떤 학교보다는 어떤 프로젝트를 했는가를 더 많이 보게 된다.
회사가 필요한 역량에 따라 다르긴 하겠지만 결과적으로 어떤 프로젝트를 했고 어떤 임팩트를 만들어냈는지를 중요하게 생각.
학위 추가보다는 유의미한 프로젝트를 찾아서 임팩트를 도출해내는 것이 좋을 것

2. 하용호 연사님 (데이터오븐)

주제 : 2022 데이터 하는 사람들 어떤 커리어를 밟아야 하나

데이터업은 커리어를 쌓기에 적절한 분야인가?

지금의 경영은 데이터에 의존, (신입으로서) 미약하지 않은 채로 시작해볼 수 있다

다만, 대부분의 회사가 데이터 기반으로 일해본 적 없다.

따라서 주도적으로 뭔가 해야한다.
= 결과를 내야한다.

역사로 돌아보는 데이터사이언스 커리어 변화

(1) 데이터를 존재하게 하기에 집중(2010~13)

데이터 제대로 모으고 저장하는 것만으로도 큰 일
(Hadoop 세팅도 큰 과제)
분석 하나를 MapReduce 프로그래밍을 며칠 씩 작성
백엔드 엔지니어 출신이 상당수 - 특히 검색 엔진 엔지니어

(2) 데이터 프로세싱 성숙기(2013~14)
분석이 어렵던 시기 -
극복하기 위해 SQL을 MR로 자동 변환해 병렬 실행해주는 툴 생김
점차 데이터 인기가 폭발
데이터 엔지니어 직업이 확립
초기 수준 workflow 엔진들과 비주얼라이즈 툴들이 나오기 시작

(3) 분석과 적용기(2015~16)
데이터 엔지니어의 활동으로 데이터는 테이블로 정리
SQL 만 알아도 접근이 가능
장벽 낮아지며 데분이 등장
데이터 씬 증가 - IT 이외 회사도 데이터 팀 두기 시작
회사가 대시보드 많이 생산, 소비
Ad-hoc도 많이 하고 , A/B

(4) ML 득세기 - 알파고 지배기(2016~18)
모든 것에 ML
많은 코스도 생기고 ML 엔지니어가 직업적으로 확립

(5) 대 그로스 시대(2018~20)
많은 기술이 제품화되어 편리하게
제품 사용하는 그로스 해커, 퍼포먼스 마케터 확립
PM, PO, 기획자 등 모든 직군이 데이터를 직접
데이터로 진짜 이득 만드는 것에 집중
많은 데이터, ML 코스

(6) Tool Chain 시대 (2021~)
Cloud 벤더의 솔루션과 거기에 꽂아 사용하는 SaaS 제품의 생태계가 엄청나게 풍성하고 단단
모든 데이터 스택에 좋은 제품이 존재
ML도 GCP의 AutoML, AWS sageMaker 가 좋아짐
여러 클라우드 툴들을 잘 Chaining 시켜 빠르게 결과를 만들수 있다.
능력이 아니라 구매로 갭을 뛰어넘을 수 있다

그래서 이젠 어떻게 해야하나?

전에는 몇 개월짜리 코스를 통해 어떤 결과물을 낼 수 있는 사람이 되기 힘들었지만 요즘은 실력을 돈으로 살 수 있을 정도로 좋은 클라우드 툴이 나온다.
= 잘 체이닝 시키면 몇 사람 분 일을 할 수 있다.

따라서 어떤 직군이든 절반쯤은 백엔드 클라우드 엔지니어가 되야 한다.


데이터 분석가로 일을 시작한 지금
하용호 연사님의 데이터 분석가 커리어에 대한 이야기가 도움이 되었다.

데이터 분석가

많은 부류 : 포지션 열리면 이력서 많이 들어오고있음.

타전공 수료하고, 교육과정 이수, 사용 언어 SQL만 하는 경우 많다.
= 독립적으로 일 할 수 없다.

귀한 부류 : python, pandas, jupyternotebook 다 하는 경우
원천 데이터가 RDBMS나 클라우드에 있을 때, 백엔드와 통신하는 코드 작성해 직접 가져올 수 있는 사람이 적다
자신의 앞뒤에 연결되는 영역까지 아는게 필요


연사님께서 뽑는 사람 입장에서 이력서에 대한 팁을 주셨다.

현재 문제 : 이력서가 다 비슷
자기소개, 쓸 수 있는 기술, 받은 교육, 프로젝트
등등 —> 큰 차이가 없으면 고를 수 없다.

성격이 다른 회사에 똑같은 1개의 이력서로 지원하니까 구분이 안 간다

  • 이력서 커스터 마이즈가 필요
    주니어 때는 이력서가 각 회사에 맞게 커스터마이즈 되어야한다.
    회사 간 JD를 살피는 게 중요
    해당 회사가 현재 집중하고 있는 테마가 보인다.

예) 어떤 회사에서 추천을 가장 중요하게 여긴다 - 추천에 맞는 코스를 수강하고, 오픈소스 XX를 사용해 개인 프로젝트 D를 해보며 논문에 E를 적용했고 이런 어려움이 있어 이런 식으로 해결했다 - 문제 풀이 생각 과정에 대해 알고 싶어한다.

—> 이것이 차별화

깃허브

메인 계정만 걸려있으면 사실 잘 안 본다

  • 설명 부족한 상태로 commit 몇 개로 끝난 레포지토리면 마이너스
    깃허브 나열용 전시용 아니다
  • 이력서 쓴 내용이 진짜라는 것을 말하기 위한 증거용
    이력서에서 바로 다 볼 수 있게 해줘라
    링크 걸 때는 세부 레포 주소나 이슈나 멋드러진 PR로 직접 링크

개인 프로젝트라도 타겟 시스템을 쓰면 더 좋기는 하다

--

일을 시작하면 어떻게 성장해 나가야 하나?

(1~3년차 주니어 / 4~6년차 시니어로 정의)

데이터 분석가

주니어 :
어디를 가든 회사에 데이터가 제대로 준비되어 있지 않은 가능성이 많다

  • 결국 데이터를 존재하게 하는 일부터 할 수 밖에 없다.
  • 보통 모은 데이터와 풀어야할 문제가 조금 겹치거나 안 겹치는 경우가 많다. -> 겹치게 하는 작업을 해야한다.
  • 데이터를 존재하게 하는 최소의 기술은 가지고 있어야
    저장과 분석 같이하게 하는 Product Analytics tool 많다
    예 ) Amplitude, Mixpanel, GA4
    저 PA 툴에 데이터 부어넣는 작업도 도와줄 사람이 없을 것
    간단한 스크립팅이나 GTM 등으로 넣는 방법
    무엇을 모아야 할 지, 데이터 수집 체계 잡는 역할도 해야할 경우가 많다. (생각보다 이름 짓는데 많은 시간, 생각보다 멀티롤)

기초 과정이 잡히면 상당부분 Ad hoc 요청, 대시보드 요청
다 들어주면 산발적 업무 하며 시간 간다

  • What 요청이 오면 how 부터 생각하지만, why를 탐방하는 소프트 스킬이 필요
  • 이를 통해 업을 이해하고 진짜 중요한 일만 하면서 내 시간을 세이브
  • SQL은 신인가 싶을 정도로 훈련
  • 가독성 있게 쓰는 연습도 꼭
  • 외부 툴 도입해 최대한 사람들이 데이터를 self-serving 하게 노력
  • 시니어가 있다면 바로, 혼자라면 3년차 쯤 되었을 때 가능할 것

시니어 :
결국 시니어로 넘어갈 땐 프로그래밍을 알아야
대부분 데이터가 big query, Athena, redshift 등에 담겨있는데 클라우드에서 내가 원하는 원천을 당겨올 수 있어야

분석을 위한 ML에 익숙

  • sklearn에 포함된 ML을 분석용도로 활용
  • Random forest 등 사용 할 줄 알아야
  • ML로 학습하고 모델 해체해 데이터 패턴 찾아내는 역공학 방법이 유행
  • 단순 통계 벗어난 영역
  • 시계열, Causal Inference 도 뜨고 있다

스킬 외에도 본인이 일하는 것 뿐만 아니라 회사의 데이터 체계를 잡는데 일조해야!

  • 다른 부서 비지니스 목표 OMTM가 무엇이 되어야할 지 외부자가 제안, 컨설팅 해줄 정도의 비지니스 이해와 그 설명력도

사내 구성원의 데이터 접근성 높이기 위한 노력

  • 데이터 카탈로그 구축
  • 데이터 탁소노미 구축
  • 데이터 접근 인프라 구축(데이터 엔지니어와 함께)
  • 이것을 해야 ad-hoc 지옥에서 벗어남

이쯤에서 다시 분기를 타기도 하는데
Product Analyst로 제품에 집중하거나, 문제 발견해나가는 인하우스 컨설턴트, 아예 전직으로 PO로 조직을 지휘하는 역할로 가기도 하고
프로그래밍 많이 배운 사람은 데싸로 전직 하기도

결국 스킬은 도구 - 가치를 만드는 것이 업의 본질

스킬에서 비지니스 뷰로 올라가야한다.
비니지니 본질에 대한 관심과 소프트 스킬이 시니어로 올라가며 중요한 부분

  • 주니어 : 위에서 세부기술 정해주고, 개인이 잘 해낼 것을 기대
  • 시니어 : 위에서 세부 문제를 정해주고, 팀을 잘 조직해 해결할 것을 기대
  • 전문가 : 모르던 회사의 문제를 발견해주고, 조직들을 활용해 해결해주기를 기대

하용호 연사님이 좋아하는 말

“배우가 우는 것이 드라마가 아니라 관객이 울어야 드라마다”

멋진 분석 리포트/모델을 만들어야 전문가가 아니라 회사가 가치르
만들어야 전문가다.

책 추천 : 일하는 마음
‘그리하여 다르게 살려면, 유능해져야 한다’.
-> 자유에 도달하기를


이외에도 주재걸 교수님이나 현업자 분들과의 이야기가 있었다.

가장 인상깊던 것은 하용호 연사님의 이야기였다.

아무래도 현업에 1세대로 시작해 쭉 커리어를 이어오셨고 많은 성공 결과물이 존재하는 분을로서 이야기에서 배울 점이 많았다.

앞으로의 길라잡이가 되어줄 후기글을 공유해본다.

profile
데이터 사이언스를 공부하는 커피쟁이

0개의 댓글