관통프로젝트

이남경·2024년 4월 5일
0

SSAFY 11기

목록 보기
56/67

Django에서 데이터 사이언스 패키지 사용하기

numpy : 빠르게 배열 연산

pandas : 조작 + 분석

matplotlib : 시각화 (그래프)

데이터 사이언스 프로세스

  • 필요한 정보를 추출하는 5가지 단계
  1. 문제 정의 : 해결하고자 하는 문제 정의

  2. 데이터 수집 : 문제 해결에 필요한 데이터 수집

  • API (날씨, 공공 데이터)

  • 캐글 (다운로드)

  1. 데이터 전처리(정제): 실질적인 분석을 수행하기 위해 데이터를 가공하는 단계
  • 수집한 데이터의 오류 제거(결측치, 이상치), 데이터 형식 변환 등
  1. 데이터 분석 : 전처리가 완료된 데이터에서 필요한 정보를 추출하는 단계

  2. 결과 해석 및 공유 : 의사 결정에 활용하기 위해 결과를 해석하고 시각화 후 공유하는 단계

Django 에서 데이터 사이언스 패키지를 사용하는 이유

  • 결과를 웹 페이지에서 보여주기 위함

Django에서 데이터 사이언스 패키지를 사용하기 위해 알아야 할 내용

  • 데이터 사이언스 3종 패키지 사용 방법

  • Django 기본 사용 방법

    웹 페이지 구성 (template)

    데이터 전달 (View -> template)

  • 파이썬 BytesIO 패키지

View에서 Template로 이미지 전달하기

View에서 Template으로 이미지 형식(실제로는 이차원 픽셀)의 데이터를 직접 전달할 수 없습니다.

저장된 이미지의 경로를 전달하여 Template에서 출력해야 합니다.

matplotlib의 그래프를 버퍼에 이미지 형식(savefig() 이미지를 직접 저장 -> 비효율적)으로 저장 후 저장된 경로를 전달합니다.

  • 버퍼 (buffer) : 임시로 데이터를 저장하는 공간

Python 'BytesIO'클래스

  • 파이썬 내장 모듈인 io' 모듈에 포함된 클래스

  • 메모리 내에 데이터를 저장 및 조작할 수 있는 기능 제공

0개의 댓글

관련 채용 정보