데이터 직무
데이터 직무는 기업 내 데이터와 연관된 다양한 개별 업무 또는 업무들의 집합을 말한다.
세부적으로 데이터 자체에 집중하는 '데이터 집중 직무'와 비즈니스에 데이터를 활용하는 '데이터 활용 직무'로 나뉜다.
데이터 집중 직무는 데이터를 수집 및 관리하는 '데이터 엔지니어', 데이터로 미래를 예측하는 '데이터 사이언티스트', 데이터를 통해 현재 상황을 분석하는 것에 집중하는 '데이터 분석가'로 나누어진다.
데이터 엔지니어 (a.k.a. 개발자)
개발자 느낌의 데이터 엔지니어는 데이터 수집 및 관리를 담당한다.
어떻게 데이터를 쌓을지, 어떻게 관리할지 고민하여 회사 내 데이터 흐름을 생성한다. (ETL작업)
데이터 엔지니어링 분야의 핵심은 데이터를 조직 내 구성원이 잘 활용할 수 있게 하는 것이다.
Hadoop, MapReduce, MySQL(RDBMS) 등을 다룬다.
데이터 사이언티스트 (a.k.a. 연구원)
연구원 느낌의 데이터 사이언티스트는 대량의 데이터로부터 인사이트를 도출한다.
보통 기업의 R&D 부서에 데이터 사이언티스트가 속하고, 새로운 논문을 기반으로 자사 서비스의 시스템을 개선하는 역할을 한다.
데이터 사이언티스트는 일정 패턴을 찾아내면 해당 패턴이 유의미한 것인지 알아내는 역할까지 통상 진행하기에 통계학적 지식 또한 많이 필요하다.
Apache Spark, 머신러닝, 통계 등을 다룬다.
데이터 분석가 (a.k.a. 기획자)
기획자 느낌의 데이터 분석가는 말 그대로 데이터를 분석하고 발생하는 문제를 해결한다.
데이터 사이언티스트와 마찬가지로 데이터를 통해 인사이트를 발굴하고자 하는 목적이 있다.
새로운 제품이나 서비스가 추가될 때 어떤 데이터를 수집할 것인지를 정의하는 일부터 비즈니스 주요 지표를 정의하고 분석하는 일, 데이터를 쉽게 파악할 수 있도록 시각화하는 일 등 다양한 업무를 진행한다.
MS Excel, SPSS(통계 툴)을 주로 다룬다.
전체적으로 데이터의 수급과 유지보수에 방점이 찍혀 있으면 '엔지니어', 비즈니스 쪽에 초점이 맞춰져 있으면 '분석가', 데이터 분석과 프로그래밍을 통해 비즈니스 / 데이터 특성을 연구한다면 '사이언티스트'로 요약할 수 있다.
내용 정리
현실에서는 데이터 엔지니어 정도를 제외하고는 데이터 직무 내부에서 중첩되는 부분이 많이 있다.
이러한 점은 다양한 산업에 대한 이해를 할 수 있고 다양한 직무의 중간에 있어서 직무 전환도 쉽다는 점에서 매력적으로 느껴지기도 하고, 여러 분야의 트렌드를 캐치업하기 위해서는 개인적으로 공부에 투자해야 하는 시간이 있어야 한다는 점에서 어려움으로 다가오기도 한다.
장점도 단점도 같은 원인이기에 '나'와 해당 직무가 잘 맞는지 파악하고, 경쟁력을 갖춰가도록 해야겠다.