GROUP BY와 AGGREGATE 함수
GROUP BY & Aggregate 함수
- 테이블의 레코드를 그룹핑하여 그룹별로 다양한 정보를 계산
- 이는 두 단계로 이뤄짐
- 먼저 그룹핑을 할 필드 결정 (하나 이상의 필드가 될 수 있음)
- GROUP BY로 지정 (필드 이름을 사용하거나 필드 일련번호를 사용)
- 다음 그룹별로 계산할 내용 결정
- 여기서 Aggregate함수 사용
- COUNT, SUM, AVG, MIN, MAX, LISTAGG, ...
- 보통 필드 이름을 지정하는 것이 일반적 (alias)
CTAS와 CTE
CTAS : SELECT를 가지고 테이블 생성
- 간단하게 새로운 테이블을 만드는 방법
- 자주 조인하는 테이블들이 있다면 이를 CTAS를 사용해서 조인해두면 편리해짐
항상 시도해봐야하는 데이터 품질 확인 방법들
- 중복된 레코드들 체크하기
- 최근 데이터의 존재 여부 체크하기 (freshness)
- Primary key uniqueness가 지켜지는지 체크하기
- 값이 비어있는 컬럼들이 있는지 체크하기
이 글에서 소개된 내용은 프로그래머스 데이터분석1기에서 진행된 한기용 강사님의 온라인 강의를 참조하여 작성되었습니다.