데이터 분석가, 커리어UP 을 위한 지름길

거친코딩·2022년 6월 6일
3
post-thumbnail

이 분들을 위한 글

  • 데이터분석가를 처음 준비하거나,
  • SQL, 파이썬(pandas, numpy, scipy 등 기초라이브러리), BI툴(태블로, 퀵사이트, 구글스튜디오 등)을 직무 필요기술 이라 생각하고 더욱 배우려고 하는 데이터분석가

위 기술 스택을 가지고 있는 분석가들이 흔히 생각하는 커리어업이란?

  • 어느정도 알고 있는 기초 SQL 쿼리를 더 고급지게 짠다?
  • 파이썬 라이브러리를 더욱 자유자재로 사용하고, 더 많은 라이브러리를 사용할 수 있다?
  • 분석결과 리포팅을 BI툴을 활용하여 빠르게 나타내고, 모든 사람에게 대시보드를 빠르게 서빙할 수 있다?

당연한 스택으로 커리어 상승을 기대할 수 있을까?

  • 당연히 위 말 그대로 SQL 쿼리도 더 잘짜고, 파이썬에 대한 이해도도 높으며, BI 시각화 툴까지 잘 다룰줄 안다면 데이터 분석가가 되기 위한 좋은 기반을 쌓은 것이다.
  • 하지만 위 기술들은 데이터에 대해서 "Passive"한 스킬이라는 공통적인 단점이 존재한다.
  • 여기서 말하는 "Passive"하다는 말은, 데이터 하나 없이는 SQL 쿼리하나 못날려보거나, 다양한 라이브러리를 알고 있는 파이썬 기술도 무색하며, 그릴 것 하나 없는 BI 툴 신세를 말한다.
  • 그리고 데이터가 설령 있다할지라도, 누군가가 짜놓은 판에서만 수동적으로 분석할 수 밖에 없고, 그 판 자체를 바꿀 수는 없는 기술을 말한다.

요즘 사회가 데이터분석가에게 차려놓은 밥상이란

  • 4차 산업의 발달로 데이터 중요성이 점점 커지는만큼, 많은 기업들에서 데이터 분석을 통한 의사결정 내리기에 매우 관심이 많다.

  • 그래서 많은 기업들에서 데이터 팀 꾸리기에 큰 리소스를 들이려고 하고, 좋은 데이터 분석가 채용을 위해서 눈 부릅뜨고 혈안이 되어 있다.

  • 기본적으로 데이터 분석 채용 JD(Job Description)를 보면 거의 공통적으로 위에서 언급한 3가지 스킬은 대부분 요구하는 것 같다.

  • 그래서 뭐 어찌저찌해서 한 회사의 데이터분석가로 들어가보면, 보통 다음 경우를 만날 수 있다.
    "데이터 스키마 이렇게 이렇게 있으니 테이블 구조 파악 하세요(ERD 조차 없는 경우도 있음)"
    "데이터 요청오면 이 쪽 바라보고 쿼리 날리셔서 추출하면 되구요(내 업무의 절반)"
    "대시보드 언제까지 만들어주세요(나는 피카소)"
    "이쪽 데이터는 저희가 권한이 없어서, 권한요청 해야돼요(기다림의 지옥)"

  • 그리고 위에서 말한 Passive한 스킬이라는 부분도 고려해보면, "데이터분석가에게 데이터가 없으면 시체"란 생각도 들고, "누가 이미 만들어 놓은 데이터 판"에서만 일한다고 생각이 들면 점차 성장성이 줄어든다고 느껴질 때도 있을 것이다.

  • 이러한 일들의 반복은 예전 데이터분석가를 꿈꾸던 자신의 모습을 과거로 돌아가 뜯어 말리고 싶은 마음이 들것이다.

내가 일하는 환경의 주도권을 잡아보자

  • 다시 이 포스팅의 제목("데이터 분석가, 커리어UP 을 위한 지름길")대로 어떻게 급변하는 사회에서 데이터분석가로서 잘 성장할 수 있을까?
  • Passive Skill만을 가진 데이터 분석가가 아닌, 내가 분석할 데이터 환경을 꾸려가는 Active Skill을 키워야 한다고 생각이 든다.
  • 여기서 말하는 Active Skill이란, "데이터 엔지니어링"을 말한다.
  • 잠깐잠깐... 데이터 엔지니어링? "여기 포스팅 데이터분석가를 위한 글 아닌가?"라는 생각이 들것이다.
  • 정확히 좋은 시니어 데이터분석가가 되기 위한 포스팅 맞다.
  • 데이터 분석가로서 일하면서 느낀 부분은 개발에도 프론트엔드와 백엔드를 동시에 함께하는 풀스택개발자가 있는 것처럼, 데이터분야에도 "데이터 엔지니어 VS 데이터 분석가" 직군을 나누지 않고 풀스택으로 일하는 풀스택분석가도 될 수 있지 않을까?란 생각을 한다.
  • 왜냐하면 데이터 활용에 변화를 줄때마다 엔지니어와 소통해야 하는 프로세스가 너무 부담이 되고, 이러한 부담은 확장적 데이터 분석에 큰 위축감을 주는 것 같다.
  • 그럼에도 불구하고 충분히 풀스택(엔지니어링&분석)으로 일했을 때의 Task의 Scope의 범위 또한 무시할 수는 없을 것이다.
  • 하지만 여기서 우리에게는 "갓마존(aws)"이라는 킹왕짱이 등장한다.
  • 여기서 말하는 aws란 클라우드 컴퓨터 분야에서 압도적인 세계 1위 점유율을 차지하고 있는 클라우드 컴퓨팅 서비스이기 때문에, 웬한만 모든 기업의 서비스에서 사용되고 있다고 말할 수 있다.
  • AWS에 기본적으로 보유한 컴퓨팅, 스토리지, 데이터베이스, 인프라, 데이터 레이크 및 인공지능 서비스들이 데이터 분석가가 엔지니어링까지 커버하기 위한 큰 도움을 줄 수 있다.
  • 다시 말해서 데이터분석가들이 AWS 서비스들을 하나씩 배워간다면, 데이터 영역에서 엔지니어링 능력까지 겸비한 분석가들의 확실한 주도권 및 영향력을 가질 수 있다는 확신이 있다.

글을 마무리하며

개발에 풀스택 개발자가 있다면, 데이터에도 풀스택 분석가가 있기를 희망하고 되기를 꿈꾼다.
나 또한 이 글을 쓰는게 어디서 보고 들은 것을 말하는게 아니라, 데이터 분석가 실무자로서 일하면서 어떻게 하면 좋은 데이터 분석가로 성공할 수 있을지 느낀 부분을 적은 것이다.
AWS의 서비스 기반의 데이터 엔지니어링 기술을 겸비하여 "데이터 수집 - 가공 - 처리 - 분석"까지, 모든 프로세스를 이해하고 커버할 수 있는 데이터 분석가가 "현재 커리어UP 을 위한 지름길"이라 생각이 든다.

profile
데이터 분석 유튜버 "거친코딩"입니다.

1개의 댓글

comment-user-thumbnail
2023년 1월 17일

좋은 글 잘 읽고 갑니다 🙋🏻‍♂️

답글 달기