데이터 사이언스

타키탸키·2021년 7월 5일
0

데이터 사이언스

목록 보기
1/26
post-thumbnail

💾 데이터 사이언스를 배워야 하는 이유

  • 데이터 사이언스
    • 데이터를 다루는 일
  • 데이터가 많을수록 할 수 있는 일이 많다
  • 소프트웨어를 통해 데이터 수집, 저장
    • 인스타그램, 카카오톡, 유튜브, 쿠팡, ...
    • 결제 시스템
    • 교통 카드
  • 데이터를 기반으로 움직이는 업계들
    • 쇼핑몰
    • 음악 스트리밍 사이트
    • 정치인 선거 캠페인
  • 분야를 막론하고 중요한 데이터
    • 데이터를 다룰 수 있는 능력 >> 경쟁력

💾 데이터 사이언스

  • 데이터 과학
    • 다양한 데이터로부터 지식과 인사이트를 추출하는 분야
    • 데이터와 연관된 모든 것
  • 데이터 사이언스에 필요한 역량
    • 프로그래밍
      • 데이터 수집
      • 데이터 분석
    • 수학 / 통계
      • 논리적 분석
      • 머신러닝
    • 특정 분야에 대한 전문성
      • 현실의 문제 해결 수단
  • 데이터 사이언티스트
    • 가치를 더할 수 있는 일을 찾고 데이터를 이용해서 문제를 해결하는 사람

💾 데이터 사이언스에 대한 오해

  • 데이터 사이언스에서 가장 중요한 건 인공지능, 딥러닝??
    • 데이터 사이언스의 순서
      • 데이터 엔지니어링(수집, 저장, 정리)
      • 분석
      • A/B 테스트
      • 인공지능
    • 인공지능 전 단계
      • 적은 노력으로 많은 가치를 얻을 수 있는 과정
    • 인공지능 단계
      • 노력, 돈, 시간 대비 가치가 비교적 적은 편
  • 데이터 사이언티스트는 하루종일 컴퓨터와 수학만 하는 사람??
    • 데이터 사이언스의 목표
      • 가치를 더할 수 있는 문제를 데이터로 해결하는 것
    • 데이터 사이언스를 위한 역량
      • 수학/통계/프로그래밍
      • 특정 분야의 문제 인식
      • 창의적 문제 해결을 위한 인사이트
      • 커뮤니케이션

💾 Python으로 데이터 분석을 하는 이유

  • 데이터 분석을 위한 프로그래밍 언어의 양대 산맥
    • Python
    • R
  • R
    • 통계와 시각화를 위해 만들어진 언어
    • 데이터 분석의 도구가 잘 갖춰짐
    • 주로 연구에 활용
  • Python
    • 다양한 용도로 만들어진 언어
    • 데이터 분석의 도구가 평범
    • Numpy, Pandas, Tensorflow 같은 라이브러리로 R의 일부 기능 대체

💾 데이터 사이언스 프로세스

  • 데이터 사이언스의 단계
    • 문제 정의하기
    • 데이터 모으기
    • 데이터 다듬기
    • 데이터 분석하기
    • 데이터 시각화 및 커뮤니케이션
  • 문제 정의하기
    • 해결하고자 하는 문제를 정의하는 단계
    • 목표 설정
    • 기간 설정
    • 평가 방법 설정
    • 필요한 데이터 설정
  • 데이터 모으기
    • 필요한 데이터를 모을 수 있는 방법을 찾는 단계
    • 웹 크롤링
    • 자료 모으기
    • 파일 읽고 쓰기
  • 데이터 다듬기
    • 데이터의 퀄리티를 높여서 의미 있는 분석이 가능하게끔 하는 단계
    • 데이터 관찰하기
    • 데이터 오류 제거
    • 데이터 정리하기
  • 데이터 분석하기
    • 준비된 데이터로부터 의미를 찾는 단계
    • 데이터 파악하기
    • 데이터 변형하기
    • 통계 분석
    • 인사이트 발견
    • 의미 도출
  • 커뮤니케이션
    • 분석 결과를 다른 사람들에게 전달하는 단계
    • 다양한 시각화
    • 커뮤니케이션
    • 리포트
출처: CODEIT - 데이터 사이언스 입문
profile
There's Only One Thing To Do: Learn All We Can

0개의 댓글