[프로젝트] 대시보드 시각화 2

김종욱·2023년 5월 30일
0

aws 연결
-vpc 기본 vpc
-vpc 보안그룹 설정

  • 인바운드에서 레드쉬프트 포트 추가

태블로 사용하기로 결정. 동석님 의견. 업계에서 많이 사용.

데이터베이스는 Redshift 고정비용옵션.

새로운 과제 발생. (성일님)

  • S3, redshift의 계정 소유자가 다를 때, s3에서 redshift로 COPY로 테이블 적재.

https://repost.aws/ko/knowledge-center/redshift-s3-cross-account

각 계정의 특정 리소스를 수용할 수 있는 정책을 만들어 역할을 만든 뒤, 각자의 리소스에 달아줘야함 RoleA, RoleB
나의 경우 RoleB의 역할이었고 성일님의 S3관련 IAM의 ARN을 넘겨받아 정책을 생성함.
이후 역할을 만든 뒤 redshift를 감싸고 있는 VPC의 보안그룹에 들어가 해당 정책을 추가하였다.

데이터 타입 에러. (종욱)
기본적으로 날짜 관련 데이터 타입은 'YYYY-MM-DD'이다. 그러나 우리 데이터는 'YYYY-MM' 형식으로 되어 있었다. 이것에 관한 토의로
1. 임의로 DD 위치에 00 값을 만든 뒤, 이걸 DATE 타입인 테이블에 COPY
2. 테이블 컬럼의 데이터 타입을 VARCHAR로 생성 후, COPY

2안 채택. 우려 -> DATEDIFF 함수를 못쓰지 않나? -> 이번 분석에서는 사용하지 않을 것다. 범주형 데이터로 사용.

COPY 성공.

태블로에서 redshift 연결
서버 단을 redshift 엔드포인트를 복사하면 되기는 하나, 뒤에 ::5439/dev을 제거해야함.

그리고 태블로 데스크탑에서 설치해야되는 줄 알았는데, 인터넷 상에서도 작업 가능함.
태블로 클라우드를 이용해서 공동작업 가능.

내일 목표.
태블로 시각화 구현.
보고서 초안 작성.
추가 구현 구상

  • 성일님: 제주도 관련 데이터를 가져와 JOIN 하여 새로운 유의미한 요약 테이블 생성.
profile
반갑습니다 햄스터 좋아합니다

0개의 댓글