SQL에서 GROUP BY는 보통 중복을 제거하거나 집계함수를 이용하여 집계성 데이터를 나타낼 때 사용된다. 중복을 제거하고 단순히 범주만 보고싶다면 DISTINCT를 사용해도 되지만 DISTINCT는 행이 합쳐질 때 하나의 행만 제외하고 다른 행의 정보를 다 지워버리기 때문에 집계값을 구할 수 없다.
GROUP BY절을 사용하는 프로그래머스 문제를 풀어보았다.
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다.
동물 보호소에 들어온 동물 중 고양이와 개가 각각 몇 마리인지 조회하는 SQL문을 작성해주세요. 이때 고양이를 개보다 먼저 조회해주세요.
SELECT ANIMAL_TYPE, COUNT(ANIMAL_TYPE) AS count FROM ANIMAL_INS GROUP BY ANIMAL_TYPE ORDER BY ANIMAL_TYPE;
이 문제는 집계값을 구해야하기 때문에 DISTINCT는 사용할 수 없다.
따라서 GROUP BY를 사용해 고양이와 개의 데이터를 각각 묶어주고 COUNT 함수로 고양이와 개의 총 마리수를 구해준다. 고양이가 개보다 먼저 조회되어야 하기 때문에 CAT의 C가 DOG의 D보다 빠르므로 ANIMAL_TYPE의 오름차순으로 정렬해준다.