
링크: https://school.programmers.co.kr/learn/courses/30/lessons/59413
ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각 동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다.
| NAME | TYPE | NULLABLE |
|---|---|---|
| ANIMAL_ID | VARCHAR(N) | FALSE |
| ANIMAL_TYPE | VARCHAR(N) | FALSE |
| DATETIME | DATETIME | FALSE |
| NAME | VARCHAR(N) | TRUE |
| SEX_UPON_OUTCOME | VARCHAR(N) | FALSE |
보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알아보려 합니다. 0시부터 23시까지, 각 시간대별로 입양이 몇 건이나 발생했는지 조회하는 SQL문을 작성해주세요. 이때 결과는 시간대 순으로 정렬해야 합니다.
SQL문을 실행하면 다음과 같이 나와야 합니다.
| HOUR | COUNT |
|---|---|
| 0 | 0 |
| 1 | 0 |
| 2 | 0 |
| 3 | 0 |
| 4 | 0 |
| 5 | 0 |
| 6 | 0 |
| 7 | 3 |
| 8 | 1 |
| 9 | 1 |
| 10 | 2 |
| 11 | 13 |
| 12 | 10 |
| 13 | 14 |
| 14 | 9 |
| 15 | 7 |
| 16 | 10 |
| 17 | 12 |
| 18 | 16 |
| 19 | 2 |
| 20 | 0 |
| 21 | 0 |
| 22 | 0 |
| 23 | 0 |
코드
SELECT
HOUR(DATETIME),
COUNT(*) COUNT
FROM ANIMAL_OUTS
GROUP BY 1
ORDER BY 1;
결과:
| HOUR(DATETIME) | COUNT |
|---|---|
| 7 | 3 |
| 8 | 1 |
| 9 | 1 |
| 10 | 2 |
| 11 | 13 |
| 12 | 10 |
| 13 | 14 |
| 14 | 9 |
| 15 | 7 |
| 16 | 10 |
| 17 | 12 |
| 18 | 16 |
| 19 | 2 |
결과를 보면 알 수 있듯이 값이 존재하는 시간에 대해서만 COUNT 해서 문제의 의도와는 다르게 출력되는 것을 확인할 수 있다. 따라서, 존재하지 않는 시간에 대해 0 으로 나타나도록 수정을 해야한다.
그렇다면 없는 값들을 포함해서 COUNT 를 할 수 있는 방법은 뭐가 있을까? 이에 대한 답으로 두가지 방법을 찾을 수 있었다.
전체 코드:
SET @hour := -1;
SELECT (@hour := @hour + 1) AS HOUR,
(SELECT COUNT(*)
FROM ANIMAL_OUTS
WHERE HOUR(DATETIME) = @hour) AS COUNT
FROM ANIMAL_OUTS
WHERE @hour < 23
GROUP BY HOUR
ORDER BY HOUR;
설명:
변수 초기화
SET @hour := -1;
메인쿼리
SELECT (@hour := @hour + 1) AS HOUR,
(SELECT COUNT(*)
FROM ANIMAL_OUTS
WHERE HOUR(DATETIME) = @hour) AS COUNT
FROM ANIMAL_OUTS
WHERE @hour < 23
GROUP BY HOUR
ORDER BY HOUR;
(SELECT COUNT(*)
FROM ANIMAL_OUTS
WHERE HOUR(DATETIME) = @hour)위 쿼리문의 핵심은 SET 명령과 사용자 정의 변수를 사용하는 것이다.
전체 코드:
WITH RECURSIVE hours AS (
SELECT 0 AS hour
UNION ALL
SELECT hour + 1
FROM hours
WHERE hour < 23
)
SELECT
h.hour AS HOUR,
COALESCE(COUNT(a.ANIMAL_ID), 0) AS COUNT
FROM hours h
LEFT JOIN ANIMAL_OUTS a
ON HOUR(a.DATETIME) = h.hour
GROUP BY h.hour
ORDER BY h.hour;
설명:
재귀 CTE(Common Table Expression) 정의:
WITH RECURSIVE hours AS (
SELECT 0 AS hour
UNION ALL
SELECT hour + 1
FROM hours
WHERE hour < 23
)
SELECT 0 AS hourSELECT hour + 1
FROM hours
WHERE hour < 23이 재귀 CTE 는 0 부터 23 까지의 숫자를 생성하여 hours 라는 임시 테이블에 저장한다.
메인쿼리
SELECT
h.hour AS HOUR,
COALESCE(COUNT(a.ANIMAL_ID), 0) AS COUNT
FROM hours h
LEFT JOIN ANIMAL_OUTS a
ON HOUR(a.DATETIME) = h.hour
GROUP BY h.hour
ORDER BY h.hour;
FROM hours h
LEFT JOIN ANIMAL_OUTS a ON HOUR(a.DATETIME) = h.hourCOALESCE(COUNT(a.ANIMAL_ID), 0) AS COUNTGROUP BY h.hour
ORDER BY h.hour이 쿼리문의 핵심은 WITH RECURSIVE 개념
개인적으로는 두 번째 방법이 조금 더 가독성이 좋아보이고 이해하기 쉬운것 같으나, 조금 더 고민이 필요할 거 같다. 간단한 문제라고 생각했는데, 생각보다 복잡하고 새로운 개념들에 대한 공부가 필요했던 문제였다.