데이터 분석과 데이터 과학

HanSol Choi·2024년 6월 17일

데이터 분석

정보를 발견하고 결론을 유추하거나 데이터를 조사, 정제, 변환, 모델링 하는 과정

  1. 기술 통계 : 관측이나 실험을 통해 수집한 데이터를 정량화 하거나 요약
  2. 탐색적 데이터 분석(EDA) : 데이터를 시각적으로 표현하여 주요 특징을 분석
  3. 가설검정 : 주어진 데이터를 기반으로 특정 가정이 합당한지 평가

데이터 분석을 위한 도구

  1. 파이썬 : 문법이 단순하고 쉽게 배울 수 있음
  2. R : 통계 계산을 위해 개발된 언어
  3. SQL : 데이터베이스를 다루기 위해 고안된 언어

필수 사용 패키지

  1. Numpy : 고성능 과학 계산과 다차원 배열 생성
  2. Pandas : 데이터 분석을 위한 패키지, 데이터 프레임 생성 가능하며 데이터 처리와 분석 관련 기능 제공
  3. Matplotlib : 데이터 시각화를 위한 패키지, 정적 및 동적 그래프를 그릴 수 있고 다른 과학 패키지와 호환 가능
  4. Scipy : Numpy를 기반으로 구축된 수학 및 과학 계산 전문 패키지
  5. Scikit-learn : 파이썬의 독보적인 머신러닝 패키지

데이터 과학

구분데이터 분석데이터 과학
범주비교적 소규모대규모
목표의사 결정을 돕기 위한 통찰 제공문제 해결을 위해 최선의 솔루션을 만드는 것
주요 기술컴퓨터 과학, 통계학, 시각화 등컴퓨터 과학, 통계학, 머신러닝, 인공지능 등
빅데이터사용사용
profile
ML/DL Study,기록📝

0개의 댓글