데이터 분석 TIL - 데이터 관련 직무 조사

테리·2025년 10월 21일

데이터 분석가
"설명 + 실행 제안"
데이터 사이언티스트
"예측 + 자동화/최적화 제안"

역할 비교

데이터 분석가란?

과거/현재 데이터를 통해 비즈니스 문제를 데이터 기반으로 해석하고 제안함으로써 의사결정을 지원하는 역할

하는 일

  • 현황 분석: 매출, 이탈 등 주요 지표 추출 및 분석
  • 데이터 시각화
  • 문제 원인, 상관 관계 분석 및 의사 결정 지원
  • 경영진, PM, 기획자와의 커뮤니케이션 중심

핵심 역량

  • 도메인에 대한 이해
  • SQL, Pyhon 등 데이터 분석을 위한 언어 스킬
  • 데이터 시각화(Tableau, Power BI 등)
  • 문제 해결 능력
  • 데이터 분석을 위한 통계적 지식
  • 의사 소통: 다른 사람이 이해할 수 있도록 풀어서 설명하는 소통 방식

기술 스택
SQL, Python, Amplitude, GA4, Tableau, Looker Studio 등


데이터 사이언티스트란?

주요 비즈니스 질문에 AI/머신러닝 모델을 통한 '예측'을 제공하고 자동화된 의사결정을 지원하는 역할

하는 일

  • 분석의 유효성을 결정하기 위해 통계 모델을 평가
  • 예측, 분류, 최적화 모델 구축
  • 제품/서비스에 적용할 데이터 기반 솔루션 개발
  • 모델의 지속적 학습 및 최적화
  • 데이터 전처리 및 피처 엔지니어링
  • MLOps(Machine Learning Operations): 모델 배포, 파이프라인 자동화, 모니터링, 재학습 등
  • 데이터 기반 의사결정 지원

핵심 역량

  • 머신러닝, AI에 대한 지식
  • 데이터 분석을 위한 통계적 지식
  • 모델링을 위한 프로그래밍 능력
  • SQL, Python 등 데이터 분석을 위한 언어 스킬

기술 스택
SQL, Python, R, Scikit-learn, TensorFlow, Pytorch 등

회사와 조직에 따라 데이터 분석가와 데이터 사이언티스트 사이의 업무 범위가 서로 겹치는 경우도 많으며 데이터 파이프라인 구축, DW(데이터 웨어하우스), DM(데이터 마트) 구축과 같은 데이터 엔지니어의 업무 역할을 일부 병행하기도 한다.


사례 비교

데이터 분석가 사례

온라인 쇼핑몰의 매출 감소 분석
→ 데이터 분석을 통해 특정 카테고리에서 전환율 급감 발견
→ 진열 순서 및 프로모션 변경 제안
→ 매출 20% 개선 달성

데이터 사이언티스트 사례

구독 서비스의 고객 이탈 예측 모델 구축
→ 머신러닝으로 이탈 확률 예측
→ 높은 이탈 가능 고객에게 자동 할인 쿠폰 발송
→ 고객 유지율 10% 상승

두 경우 모두 “의사결정”과 “전략 개선”을 이끌었다는 점에서 동일한 목표를 가진다.


제조업 데이터 관련 직무

생산, 품질, 공정, 설비 등의 데이터를 수집·분석하여 생산성 향상, 품질 개선, 공정 자동화를 이끄는 역할.
일반적인 데이터 분석가보다 머신러닝·딥러닝 기반의 모델링과 운영(MLOps) 역량이 강조되는 데이터 사이언티스트 혹은 ML 엔지니어 직무가 대부분.

주로 다루는 데이터

  • 생산 및 공정 데이터 : 공정 파라미터, 공정 조건, 생산 수율 등
  • 설비 및 센서 데이터 : 온도, 진동, 소리, 장비 알람 등 시계열 데이터
  • 검사 및 품질 데이터 : 검사 이미지, 불량률 등

주요 업무

  • 설비 이상 탐지 및 예측 모델 개발: ML·DL 기반 시계열 분석 및 설비 이상 예측
  • 예지보전(PdM) 및 잔여수명(RUL) 예측: 장비의 고장 시점 예측 및 유지보수 최적화
  • 공정 최적화 모델링: 품질·수율 향상을 위한 운영 파라미터 추천 및 시뮬레이션
  • 데이터 파이프라인 구축 및 모델 운영: 공정/설비 데이터 실시간 수집, 전처리, 모델 배포 및 모니터링(MLOps)
  • AI 모델 성능 개선: LLM, 임베딩, 멀티모달 모델 등 최신 기법을 통한 성능 고도화

필요 역량

  • 반도체, LCD, 배터리, 자동차 등 양산 제조 라인의 데이터를 활용하여 실제 문제를 해결한 경험
  • 다변량 시계열 데이터 분석 및 모델링
  • MLOps, 데이터파이프라인 구축 또는 활용 경험
  • LLM, 임베딩, 멀티모달 모델 등의 파인튜닝 경험
  • 커뮤니케이션 역량

기술 스택

  • SQL
  • Python(pandas, numpy 등)
  • ML, 딥러닝 프레임워크(PyTorch, TensorFlow 등) 활용 역량

이커머스 도메인 직무

이커머스 플랫폼에서 발생하는 다양한 데이터(이탈률, 광고 성과, 매출 등)를 수집·분석해 비즈니스 인사이트를 도출하고, 이를 바탕으로 전략을 수립하는 역할

주로 다루는 데이터

  • 고객 행동 데이터
  • 구매 데이터
  • 마케팅 반응 데이터

주요 업무

  • A/B 테스트 중심의 실험 설계 및 임팩트 측정
  • 사용자·상품·마케팅 데이터 등을 통합적으로 활용해, 구매 전환율을 높일 수 있는 전략 수립
  • 문제 정의, 가설 설정, 실험 설계, 결과 분석까지 액션의 효과성을 데이터로 검증하고 도출한 인사이트를 실행 가능한 태스크로 연결
  • 의사 결정을 위한 지표 설계
  • 대시보드 제작 및 관리

필요 역량

  • 분석 방법론(코호트 분석, Funnel 분석, RFM 등)에 대한 이해도
  • A/B 테스트 설계 경험 및 역량
  • 데이터를 전 처리하고 시각화하는데 필요한 SQL, Python 역량
  • BI/시각화 도구 활용 경험(Tableau, Redash, QuickSight, Looker Studio 등)
  • Amplitude, Google Analytics 등 행동 기반 분석 도구 활용 경험
  • 커머스 및 플랫폼 데이터에 대한 이해도
  • AI를 활용한 생산성 향상에 관심

기술 스택

  • SQL, Python, Tableau, R, GA4, Amplitude

물류/유통 도메인 직무

판매 전략 수립, 재고 최적화와 같이 매장·온라인 채널별 판매 전략을 수립하고 배송 시간 단축, 경로 최적화, 비용 절감 등의 운영 효율을 높임으로써 데이터 기반의 사업 전략 수립과 비즈니스 의사 결정을 지원

주로 다루는 데이터

  • 판매·거래 데이터
  • 상품 데이터
  • 고객 데이터
  • 재고 및 운영 데이터
  • 배송 데이터(배송 시간, 거리, 지연, 물류 센터 위치 등)

주요 업무

  • 물류 인사이트 분석 및 발굴: 입고, 출고, 배송 등의 데이터를 기반으로 물류 프로세스 개선 및 최적화
  • 지표 고도화 및 분석 시각화: 기존 지표 재정의 및 신뢰도 높은 지표 생성, Tableau, power BI 등 시각화 도구를 활용한 대쉬 보드 구성 및 분석 결과 시각화
  • 머신러닝을 활용한 수요 예측, 재고 최적화, 프로모션 최적화 등 운영 효율을 높이기 위한 분석 및 모델링

필요 역량

  • SQL, Python, R, Tableau 등 데이터 분석 및 자동화 도구 활용 역량
  • 데이터 수집부터 정제, 전처리등 데이터파이프라인 전반에 대한 역량
  • 다양한 통계 / 데이터 모델링 기법 및 문제 해결 역량
  • 물류 운영 전반에 대한 도메인 지식, 개선 프로젝트 경험

기술 스택
SQL, Python, R, Tableau, ML 활용 역량(ex scikit-learn)

헬스케어 도메인 직무

질병 조기 예측, 의료진의 의사 결정 지원과 같이 건강 및 의료 데이터로 건강관리와 진단, 치료에 실질적인 인사이트와 솔루션을 제공

주로 다루는 데이터

  • 환자 기본 데이터
  • 의료 기록 데이터(처방 내역, 검사 결과 등)
  • 전자의무기록(EMR)
  • 임상 및 치료 데이터
  • 진료 영상 데이터

주요 업무

  • Funnel 분석, Cohort 분석, AARRR 분석을 통한 인사이트 도출
  • SQL을 사용한 데이터 추출 및 전처리를 통한 지표관리
  • 주요 지표(KPI) 설계 및 대시보드 개발·관리
  • 서비스 개선을 위한 가설 수립 및 검증
  • 질병 예측 모델 개발, 생체신호를 분석
  • AI 기반 의료 업무 최적화(LLM, 질병 탐지)
  • 생체신호 기반의 정량적 / 질적 평가 알고리즘 및 예측 알고리즘 개발

필요 역량

  • SQL(Bigquery), Python 등을 이용해 데이터 추출/가공/분석 능력
  • Funnel, AARRR, Cohort Analysis 등 데이터 분석 방법에 대한 지식과 경험
  • 데이터에 기반한 가설을 세워 A/B Test를 설계하고 진행 경험
  • 머신러닝 또는 예측 분석 경험
  • 대용량 데이터 처리 경험
  • LLM 기반 서비스 상용화에 필요한 요건을 분석하고 직접 구현

기술 스택
SQL, Tableau, Python(Pandas, NumPy, Scikit-learn 등), R, 머신러닝/딥러닝 프레임워크(PyTorch, TensorFlow 등)


정리

  • 제조 도메인: 데이터 엔지니어 & 사이언 티스트 역량 중심의 제조 산업의 솔루션 구축
  • 이커머스 도메인: 데이터 분석 업무 기반의 빠른 실험 설계와 테스트(+ ML 일부 활용)
  • 물류/유통 도메인: 데이터 분석 & ML 기반의 인사이트 도출, 운영 전략 수립/최적화
  • 헬스케어 도메인: AI 중심 의료 솔루션을 개발하는 직무가 대부분이며 서비스 기반의 데이터 분석 직무는 다른 데이터 분석 직무와 동일함

0개의 댓글