[아티클] 데이터 분석가는 어떤 일을 하나요?

전민정·2025년 4월 23일

https://medium.com/modulabs/%EC%BD%98%ED%85%90%EC%B8%A0-%ED%81%AC%EB%A6%AC%EC%97%90%EC%9D%B4%ED%84%B0-%EC%86%8C%EA%B0%9C-b2455d77c6d0

데이터 분석가, 데이터 엔지니어, 데이터 사이언스트는 다른 건가요?

데이터 분석가는 '기획자'에 가깝고, 데이터 엔지니어와 사이언티스트는 '개발자'쪽에 가깝다. 이 직업들은 데이터를 다루는 직군이지만 각각의 성향이 다른 걸 알 수 있다.
그러나 각 회사마다 직무의 구분 및 업무의 범위가 모두 다르다. 데이터 분석가 포지션이지만 데이터 엔지니어 업무를 하는 경우도 종종 있다. 그래서 데이터 분석가를 희망한다고 하더라도 각각 회사별 채용공고를 먼저 확인하여 내가 어떤 업무를 하고 싶은지를 먼저 정하는 게 좋다.

데이터 분석가는 어떤 일을 하나요?

데이터 사이언스가 되기 위해서는 수학(Maths) & 통계학(Statistics) + 비즈니스(Business)/도메인(Domain) 전문지식(Expertise)이 갖춰져야 한다.

[수학(Maths) & 통계학(Statistics)]

회사별, 직군별, 프로젝트마다 수학과 통계에 대해 요구하는 지식이 다르다. 일반적으로 기초 통계학에 대한 부분만 이해하고 있어도 업무를 하는데 큰 문제는 없다. (머신러닝 기술을 사용한다면 미적분, 벡터 등에 대한 지식은 기본적으로 알고 있어야 합니다.)

[비즈니스(Business)/도메인(Domain) 전문지식(Expertise)]

데이터 분석가는 로우 데이터(Raw Data; 정제되지 않은 날 것의 데이터)를 통해 데이터 내에 숨겨진 의미 있는 패턴과 추세 등을 찾는 업무가 중심이 되며, 한마디로 정의하면 데이터 분석가는 분석, 기술 및 비즈니스 목표들을 통합하여 수집된 데이터가 회사의 목표를 달성하는데 사용되도록 하는 역할을 수행한다고 정의할 수 있다.
전문화된 프로젝트나 광고의 효율성, 시장의 수요 예측 등 이러한 일을 효과적으로 하려면 데이터에 대한 지식과 통계적 지식이 필요하다. 수치를 보고 좋은지, 나쁜지를 파악하기 위해서는 산업군에 대한 이해와 데이터가 어떤 의미를 담고 있는지를 이해하는 과정이 선행되어야 한다. 사내 데이터도 업무별로 도메인이 다를 수도 있는데, 해당 통계에 대해 수치를 보고 숫자만 파악하는 것이 아닌 해당 수치가 어떤 의미를 가지는지 이해할 수 있어야 한다.

데이터 분석가는 어떤 역량을 갖춰야 하나요?

도메인에 대한 이해

도메인에 대해 명확하게 이해하고 있어야 한다. 서비스가 어떤 흐름으로 진행되는지에 대해 파악하고 있어야 어떤 아이팀을 분석할지, 어떤 부분을 개선할지에 대한 생각이 떠오를 수 있다.
만약 산업에서의 도메인을 이해하기 위해서는 산업에 대한 관심을 가져야 한다. 관심을 갖게 되면 자연스럽게 도메인에 따른 수치들을 이해할 수 있다. 또한 전체적 관점에서 데이터를 해석하려는 시도를 해야 한다. '내가 얼마만큼 관심을 갖고 데이터를 해석하느냐'가 중요한 부분이다.

문제 해결

분석가는 때때로 그런 상황을 어떻게 해결할 수 있을지, 창의력을 발휘해야 한다. 문제해결 부분에서 데이터 분석가로 업무를 시작했을 때 데이터로 어떤 것을 할 수 있을지, 어떤 데이터가 필요한지, 가장 빠르게 문제를 해결할 수 있는 방법은 어떤 것이 있을지 파악할 때 필요한 능력이다.

의사소통

데이터 분석가는 분석한 결과물을 보고받는 사람의 입장에서 이해하기 쉬운 용어를 사용하여 결과를 공유하고, 공유한 내용에 대한 질문에 답하거나 해결할 준비가 되어있어야 한다. 무엇보다 수치를 기반으로 다른 사람이 이해할 수 있도록 설명하는 소통 방식이 중요한 부분 중 하나이다.

의미 있는 결론 도출

데이터 분석에 있어 목표 설정을 매우 중요하며 데이터 분석가는 데이터 내에 숨어 있는 더 큰 메시지를 가리키는 작은 단서를 알아차릴 수 있어야 한다. 각각 OMTM(지금 우리에게 가장 중요한 지표)를 설정한 뒤, 설정한 지표를 어떻게 쪼갤 수 있을까를 고민해야 하고, 올바른 지쵸를 설정한 것인지 허영 지표(Vanity Metric)를 세운 것은 아닌지 고민해 볼 필요하다.

[인사이트]

데이터 분석을 하면서 늘 부딪히던 부분이 있었다. 분석 결과로 나온 수치가 왜 그런 값을 가지는지, 또 그 수치가 긍정적인 의미인지 아닌지를 판단하기가 어려웠다. 시각화를 통해 결과를 봐도, 그 결과를 있는 그대로 받아들여야 하는 건지 늘 고민이 많았다. 가끔은 이 모든 데이터를 다 써야 하는 게 아닐까 하는 막연한 부담감도 있었고, 분석을 하다 보면 어디서부터 손을 대야 할지 막막해질 때도 많았다.

하지만 이번에 읽은 글을 통해 내가 데이터 자체에 대한 이해 뿐 아니라, 그 데이터를 둘러싼 도메인에 대한 이해가 부족했다는 사실을 명확히 깨달았다. 데이터 분석은 단순히 수치를 해석하는 작업이 아니라, 그것이 발생한 맥락과 배경을 아우르는 도메인 지식을 기반으로 이뤄져야 한다는 것을 알게 되었다.

앞으로는 데이터를 분석할 때 보다 넓은 시야로 접근하려 한다. 단편적인 수치 해석에서 벗어나, 데이터가 담고 있는 전체적인 흐름과 맥락을 파악하고, 그 속에서 의미 있는 인사이트를 도출할 수 있도록 도메인에 대한 이해를 넓히는 데 집중할 계획이다. 단기간의 학습만으로 해결될 문제가 아니기에, 다양한 경험을 통해 도메인 지식을 축적하고, 이를 기반으로 한층 더 깊이 있는 분석을 해나가고 싶다.

팀원 전체의 인사이트

[공통 인사이트]

  • 데이터 분석에서 도메인 지식이 왜 필요한지, 얼마나 중요한지 알게 되었다.
  • 어떤 도메인을 주력으로 할 것인지 탐색 중이다.

[의미 있었던 의견]

  • 본문을 보며 구체적인 도메인 탐색 방법을 찾을 수 있었다. 캐글에서 각 산업에 대한 데이터를 찾고, 그 데이터를 이해하고 파악하려고 시도하는 것이다.

0개의 댓글