[Python] 데이터 전처리 & 시각화 01

Data_Student·2024년 10월 23일
0

Python

목록 보기
3/7

[Python] 데이터 전처리 & 시각화 01

데이터 전처리 & 시각화 - 내용 정리


01. 강의개요

1. 강의 소개

  • Pandas를 활용해서 간단하게 데이터를 전처리하는 방법
  • Matplotlib을 활용해서 데이터를 시각화하는 방법

02. 내가 생각하는 데이터 분석가는 누구인가?!

  • 비즈니스 분석가
    • 주로 비즈니스 문제를 이해하고 해결하기 위해 데이터를 분석합니다.
    • 비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정을 지원합니다.
    • 주로 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행합니다.
  • 프로덕트 분석가
    • 제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석합니다.
    • 사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여합니다.
    • 주로 제품 경험과 사용자 행동에 대한 분석을 수행하며, A/B 테스트, 사용자 경로 분석 등을 담당합니다.
  • 데이터 분석가
    • 주로 정형 데이터를 분석하여 기업의 의사 결정을 지원합니다.
    • 데이터베이스, 스프레드시트 등에서 데이터를 추출하고, 데이터를 정제하여 보고서 및 시각화를 생성합니다.
    • 주로 기술적인 기술이 필요하며, SQL, Excel, 데이터 시각화 등을 활용하여 업무를 수행합니다.
  • BI 분석가
    • 기업의 비즈니스 인텔리전스 플랫폼과 도구를 사용하여 데이터를 시각화하고 보고서를 작성합니다.
    • 주로 기업 내부 데이터를 시각화하고, 이를 통해 의사 결정에 필요한 정보를 제공합니다.
    • BI 도구 (Tableau, Power BI 등)를 사용하여 대시보드를 구축하고, 데이터 시각화 및 보고서 작성을 담당합니다.
  • 데이터 사이언티스트
    • 주로 데이터를 활용하여 예측, 패턴 발견, 복잡한 분석을 수행하여 비즈니스 문제를 해결합니다.
    • 통계, 머신러닝, 딥러닝 등의 기술과 알고리즘을 사용하여 데이터를 분석하고 모델을 구축합니다.
    • 데이터 수집, 전처리, 모델링, 평가 및 해석을 포함한 end-to-end 데이터 분석 작업을 수행합니다.

03. 데이터 전처리와 시각화는 왜 해야할까?

  1. 데이터 전처리와 시각화가 필요한 이유
  • 데이터의 목적은 결국 설득이다.
  • 데이터를 분석하고 시각화를 통해 잘 설득하기 위해 전처리와 시각화가 필요하다.
    • 글 vs 시각화 자료
      시각화 자료가 직관적으로 이해하기 쉽다.
  • 데이터 분석 설계 예시
    1. 목표설정하기 : 무엇을 위해 데이터 전처리와 시각화가 필요한 것인가?
    2. 예상 산출물 정의하기 : 데이터 처리 및 시각화해서 나타날 예상 결과물은 무엇인가?
    3. As-is vs To-be 생각하기 : 현재 문제와 상황이 무엇인지 인지하고 어떤식으로 개선할 것인가 생각하며 분석 방향성을 설정하기

0개의 댓글