AWS에서 지원하는 데이터 웨어하우스 서비스
Still OLAP : 응답 속도가 느려서 프로덕션 DB로 사용하기 힘들다.
컬럼 기반의 스토리지 : 컬럼별 압축이 가능하며, 컬럼의 추가와 삭제가 빠르다.
벌크 업데이트 지원 : S3와 연계해서 Copy 커맨드로 Redshfit에 복사가 가능하다.
Datashare 지원
PK uniqueness를 보장하지 않는다.
SQL 기반이며 PostgreSQL 8.x을 호환한다.
두 대 이상의 노드로 구성되면 복잡해진다.
레코드 분배와 저장 방식
참고) VARCHAR의 경우 한중일 언어는 1CHAR가 3Byte이기 때문에 주의해야 한다.
주의) 3달 or $300 비용 초과인 경우에 Free Trial이 만료됨!
참고) 비용 측면에서 free trial은 서울이 비싸기 때문에 오레곤으로 시작
Colab 연결
엔드 포인트
Admin 계정 생성
연결을 위해 endpoint, username, password 정보가 필요하다.
Public access 설정
- 작업 그룹 구성에 진입
- 네트워크 및 보안의 퍼블릭 액세스를 켜야한다.
- VPC 보안 그룹의 세팅 변경이 필요하다.
- 인바운드 규칙 변경
- 규칙 추가를 진행 → 포트 넘버 5439 선택, 소스의 경우 모든 접근을 설정하기 위해 0.0.0.0으로 설정한다.
CREATE SCHEMA <schema_name>
SELECT * FROM pg_namespace;
CREATE GROUP
ALTER GROUP group_name ADD USER username
SELECT * FROM pg_group;
SELECT * FROM SVV_ROLES;
CREATE ROLE role_name
GRANT ROLE staff TO ROLE role_name 또는 TO username
SELECT * FROM pg_user;
CREATE USER username password ‘…’;
SELECT * FROM stl_load_errors ORDER BY starttime DESC;
CREATE TABLE analytics.mau_summary AS
SELECT
TO_CHAR(A.ts,'YYYY-MM') AS month,
COUNT(DISTINCT B.userid) AS mau
FROM raw_data.session_timestamp A
JOIN raw_data.usersession_channel B ON A.sessionid = B.sessionid
GROUP BY 1
ORDER BY 1 DESC;