[취준생편] 데이터분석 멘토링할 때 자주 나오는 질문들

거친코딩·2022년 7월 4일
1
post-thumbnail

글을 시작하며

  • [취준생]과의 인프런에서 멘토링을 진행하면서 자주 나오는 질문들을 정리함으로써, 데이터분석가를 준비하시는 분들께 작은 도움이나마 드리고자 작성하게 되었습니다.
  • 세상에 절대 바보 같은 질문은 없다고 생각하기 때문에, 세세한 질문까지 다 나열해보겠습니다.


QA 리스트

Q. 데이터 분석가가 되려면 Python을 해야 할까요 ? R을 해야 할까요?

A. 현직 실무자 관점 및 프로그래밍 언어의 확장성을 고려해봤을 때, Python을 배우셔야 합니다.

  • 직종에 따라 천차만별 다르겠지만, IT를 처음 시작하시는 분들의 공통적인 가장 큰 고민은 어떤 언어로 나의 기술 스택을 쌓을까? 일것입니다.
  • 데이터 분석 하시는 분들의 경우, Python, R, SAS 등 다양한 프로그래밍 언어들 중 선택할 수 있는데,
  • 파이썬의 경우 다음과 같은 장점이 있습니다.
    • 다른 언어보다의 커뮤니티의 크기가 크다.
    • 인공지능, 서버 개발, 분산처리, 클라우드 서비스 등 다양한 기술들에 대한 확장성이 좋다.
    • 개인적인 의견이지만, Python이 다른 언어보다 배우기 쉽다.

Q. 데이터 분석가가 되려면 자격증(ADSP, 빅데이터 분석기사 등)이 도움이 되나요?

A. 도움이 되냐 안되냐라기보다는, 모의 프로젝트 중심으로 준비를 하는게 더 효율적입니다.

  • 해당 질문은 취준생 분들이라면 반드시 하는 질문입니다.
  • 하지만 결론적으로 말씀드리자면, 데이터분석가를 구하는 기업 입장에서 자격증은 정말 냉정하게 안보는 것 같습니다.(공기업에서 가산점을 주는 경우는 제외합시다.)
  • 기업의 관심은, 자격증을 가진 사람의 실력 입증이라기 보다는, 기업이 가진 서비스에서 분석해야할 과제들에 이 친구를 투입시킨다면 정말 잘할 수 있는지에 더 관심이 있을 것입니다.
  • 그러면 해답은 나오지 않나요? 많은 자격증보다, 여러 모의 분석 프로젝트 경험을 가진다면 기업에서 더욱 원하는 신입의 인재상이 될 수 있는 것이죠.

Q. 학원을 다닐까요? 아니면 인강을 볼까요?

A. 실력 수준에 따라 다르다고 생각합니다.

  • 일단 저는 학원도 다녀보고, 인강도 다 들어봤기 때문에 정말로 제 경험에서 나오는 답을 드리겠습니다.
  • 학원을 다녀야 할 사람
    • 컴퓨터를 처음 해보는 사람
    • 데이터분석에 대한 기초가 전혀 없는 사람
  • 인강을 들어야 할 사람
    • 적당히 분석 기본 개념(Python 언어, 통계지식, 인공지능 기초 등) 익힌 사람들
  • 일단 학원에서는 컴퓨터 좀 할줄 알고, 데이터 분석 좀 해본사람들이 다닌다면, 시간 낭비가 어마어마하다라는 것이 분명하게 느끼실 겁니다.
    • python만 설치하는데 1일, for문 까지 가는데 2~3주
    • 다만 정말로 컴퓨터를 아예 다룰줄 모르시는 분들에게는 강력 추천드립니다.
    • 그리고 반드시 명심해야할 것은 3개월이상은 다니지 마세요.
    • 적당히 "아 이런 컴퓨터 메커니즘이 있구나"를 익히신다면 바로 인강으로 갈아타세요.(시간적으로 효율)
  • 인강 또한 너무 오래 보지 마세요.
    • 인강 많이 들었다고, 회사에서 그 노고를 인정해주지 않습니다.
    • 그렇기 때문에 적당히 인강보시고, 개인 혹은 친구들과 얼른 모의 프로젝트를 하시면서 모르는 개념들은 구글링해서 보시는게 시간 효율이 더 매우 좋습니다.

Q. Kaggle로 입상해서 스펙으로 남겨보려하는데.. 괜찮나요?

A. 냉정하게 비추천 드립니다.

  • 저 또한 처음에 데이터분석을 할 때 인공지능이 멋져보이고 좋아서 시작했습니다.
  • 또한 데이터 사이언스가 어떻게 보면 데이터 분석이라는 큰 범주에 포함 되기도 하구요.
  • 그렇다보니 Kaggle이라는 인공지능 Competition 사이트에 관심을 안가질 수 가 없죠
  • 메달을 따고 하면 정말 엄청난 영광이기도 하구요
  • 하지만 우리는 취업을 하기 위해서 공부를 하는데, 이것은 순서가 잘 못 되어도 참 잘못되었다고 생각이 듭니다.
  • 예를 들어서 축구를 처음 시작하는 사람들의 첫 목표가 올림픽 금메달이라고 하는게 올바른 방향일까요?
    • 많은 기본기 연습과 수 많은 친선경기를 통해서 역량부터 길러야 한다고 생각이 듭니다.
  • 그래서 대신 목표를 메달로 두는 것이 아니라, Kaggle에 나와있는 좋은 리더 보드의 예시를 착안하여 이전에 말씀드린 모의 프로젝트에 적용해보는 것이 훨씬 좋다고 생각이 듭니다.

Q. 신입 데이터분석가 기준, 최소한으로 가져야할 기술 스택은 무엇인가요?

A. Python, SQL, 리눅스 기본 명령어, BI 라고 생각합니다.

  • Python
    • 기초 프로그래밍 문법
    • Pandas, Numpy, scipy, Matplotlib, seaborn, scikit-learn
  • SQL
    • SQL도 마찬가지로 영역이 매우 넓기 때문에 어떤 것 부터 해야할지 모르실 수 있습니다.
    • 그래서 간단하게 정리해드리면, 보통 CRUD라고 하죠,
      • C : Create
      • R : Read
      • U : Update
      • D : Delete
    • Create(2순위) : Datamart를 만들기 위해서는 테이블 생성을 하셔야 하니, 테이블 생성에 필요한 기본 지식을 갖추세요.
    • Read(1순위) : CRUD중 select(Read)문만 잘 공부하셔도 실무에 가장 많이 쓰이는 부분이기 때문에 일단은 이것만 먼저 잘 챙기면 된다고 생각이 듭니다.
    • Update(4순위) : 딱히 처음에 데이터 수정하실 일은 없을거에요.
    • Delete(3순위) : 잘못 올라간 데이터 삭제 정도만 아시면 됩니다.
  • 리눅스 기본 명령어
    • 터미널에서 자주 사용되는 아주 기본적인 명령어(cd, ls, cp, mv 등)들 정도만 익히시면 됩니다.
    • 갑자기 리눅스 기본 명령어를 왜 익히냐 라고 물으실 수 있습니다.
    • 해당 이유는 기본적인 리눅스 기본 명령어을 배움으로써 일을 더 능률적이게 할 수 있다기보다는, 향후 가상환경, 도커, 서버, 깃헙 등등 터미널 작업을 해야하는 일들이 있기 때문에 앞서 리눅스 기본 명령어를 익힘으로써 터미널과 조금 더 친숙해지시라 라는 뜻에 있습니다.
  • BI
    • BI에는 여러가지 태블로, 퀵사이트, 데이터스튜디오 등이 있습니다.
    • 저는 그 중에서 가장 학습 접근성이 좋고, 커뮤니티도 잘 활성화되어있고, 툴 사용 접근성이 좋은 태블로를 강력히 추천드립니다.
    • 거의 모든 규모있는 회사에서는 태블로를 사용할 것입니다.
    • 그런데 여기서 BI가 무엇이냐?라는 질문을 할 수 있습니다.
    • 여기서 말하는 BI(Business Intelligence)는 시각화 툴이라고 생각하시면 가장 이해하시기 편하실 것입니다.
  • 이 4가지를 제가 말씀드렸는데, 질문 그대로 신입 데이터 분석가 기준으로 가장 최소한으로 가져야할 기술 스택을 말씀드렸습니다. 하지만 한편 다른 일각에서는 "엥? 취업하려면 겨우 이정도로 되겠어?"라고 생각할 수 있습니다. 물론 부족하기는 하지만, 최소한 이것 이상은 되어야 한다는 관점에서 말씀드리는 것이구요. 더 많은 지식과 기술 스택을 가지면 물론 더욱 좋겠죠.

지금까지 데이터 분석가를 준비하시는 취준생분들이 가장 많이 남겨주신 질문들이었습니다.
사실 위 5가지 질문 이외에도 많은 질문들이 있지만 지금 다 말씀드리지는 못하고, 앞으로 계속해서 자주 물으시는 질문에 대한 내용을 남기도록 하겠습니다.
그리고 궁금하신 내용들은 언제든지 댓글에 남겨주시면 최대한 답을 드리도록 노력하겠습니다.
많은 데이터분석가 취준생분들께 도움되셨기를 바라며 원하시는 "데이터분석가"로 꼭 취업 성공하시기를 기원하겠습니다.
감사합니다.

profile
데이터 분석 유튜버 "거친코딩"입니다.

0개의 댓글