[TIL] [프로젝트] 데이터 웨어하우스를 이용한 대시보드 구성 (2)

이원진·2023년 5월 30일
0

데브코스

목록 보기
37/54
post-thumbnail

학습내용


  1. 회의 내용

  2. 개발 진행사항

  3. To-do

1. 회의 내용


  • 코드를 작성할 일이 많이 없을 것 같아서 공용 Github Repo를 파는 것 대신 Colab으로 함께 작업

    • 추후에 확장이 필요할 경우 Repo 생성

  • 공공데이터 CSV 파일 당 12행씩으로 이루어져있어서 10개의 파일을 하나로 합쳐서 작업

  • AWS Redshift는 프리티어(DC2.large)로 구성

    • AWS S3를 함께 사용해 벌크 업데이트로 데이터 적재
  • 현업에서 Tableau를 많이 사용하기 때문에 Superset 대신 Tableau 사용

  • CSV 파일의 날짜 형식이 “YYYY-MM-DD” 중 “DD” 부분이 빠져있어서 날짜 컬럼을 변환해서 사용

2. 데이터 분석 설계


  • 행태 별 파이차트(개별여행, 부분패키지, 패키지)

  • 행태와 목적 간의 관계 분석

  • 특정 여행 목적이 많은 기간 분석

  • 특정 여행 행태가 많은 기간 분석

  • 코로나 기간(2019, 2020, 2021, 2022) 동안 여행객 수 증감 추이 분석

  • 코로나 기간과 코로나 기간 이전 평균 여행객 수 차이 분석

  • 사회적 거리두기 관련 기사 크롤링해, 거리두기 정책이 제주도 여행객 수에 끼친 영향 분석


3. To-do


  • Tableau Cloud를 사용해 데이터 분석 및 시각화

0개의 댓글