aws 연결
-vpc 기본 vpc
-vpc 보안그룹 설정
태블로 사용하기로 결정. 동석님 의견. 업계에서 많이 사용.
데이터베이스는 Redshift 고정비용옵션.
새로운 과제 발생. (성일님)
https://repost.aws/ko/knowledge-center/redshift-s3-cross-account
각 계정의 특정 리소스를 수용할 수 있는 정책을 만들어 역할을 만든 뒤, 각자의 리소스에 달아줘야함 RoleA, RoleB
나의 경우 RoleB의 역할이었고 성일님의 S3관련 IAM의 ARN을 넘겨받아 정책을 생성함.
이후 역할을 만든 뒤 redshift를 감싸고 있는 VPC의 보안그룹에 들어가 해당 정책을 추가하였다.
데이터 타입 에러. (종욱)
기본적으로 날짜 관련 데이터 타입은 'YYYY-MM-DD'이다. 그러나 우리 데이터는 'YYYY-MM' 형식으로 되어 있었다. 이것에 관한 토의로
1. 임의로 DD 위치에 00 값을 만든 뒤, 이걸 DATE 타입인 테이블에 COPY
2. 테이블 컬럼의 데이터 타입을 VARCHAR로 생성 후, COPY
2안 채택. 우려 -> DATEDIFF 함수를 못쓰지 않나? -> 이번 분석에서는 사용하지 않을 것다. 범주형 데이터로 사용.
COPY 성공.
태블로에서 redshift 연결
서버 단을 redshift 엔드포인트를 복사하면 되기는 하나, 뒤에 ::5439/dev
을 제거해야함.
그리고 태블로 데스크탑에서 설치해야되는 줄 알았는데, 인터넷 상에서도 작업 가능함.
태블로 클라우드를 이용해서 공동작업 가능.
내일 목표.
태블로 시각화 구현.
보고서 초안 작성.
추가 구현 구상