[23일차] SQL을 이용한 데이터 분석

isnotnull·2023년 12월 22일

GROUP BY와 AGGREGATE 함수

GROUP BY & Aggregate 함수

  • 테이블의 레코드를 그룹핑하여 그룹별로 다양한 정보를 계산
  • 이는 두 단계로 이뤄짐
    • 먼저 그룹핑을 할 필드 결정 (하나 이상의 필드가 될 수 있음)
      • GROUP BY로 지정 (필드 이름을 사용하거나 필드 일련번호를 사용)
    • 다음 그룹별로 계산할 내용 결정
      • 여기서 Aggregate함수 사용
      • COUNT, SUM, AVG, MIN, MAX, LISTAGG, ...
        - 보통 필드 이름을 지정하는 것이 일반적 (alias)

CTAS와 CTE

CTAS : SELECT를 가지고 테이블 생성

  • 간단하게 새로운 테이블을 만드는 방법
  • 자주 조인하는 테이블들이 있다면 이를 CTAS를 사용해서 조인해두면 편리해짐

항상 시도해봐야하는 데이터 품질 확인 방법들

  • 중복된 레코드들 체크하기
  • 최근 데이터의 존재 여부 체크하기 (freshness)
  • Primary key uniqueness가 지켜지는지 체크하기
  • 값이 비어있는 컬럼들이 있는지 체크하기

이 글에서 소개된 내용은 프로그래머스 데이터분석1기에서 진행된 한기용 강사님의 온라인 강의를 참조하여 작성되었습니다.

0개의 댓글