다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 저자 정보(AUTHOR) 테이블입니다.
BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
| Column name | Type | Nullable | Description |
|---|---|---|---|
| BOOK_ID | INTEGER | FALSE | 도서 ID |
| CATEGORY | VARCHAR(N) | FALSE | 카테고리 (경제, 인문, 소설, 생활, 기술) |
| AUTHOR_ID | INTEGER | FALSE | 저자 ID |
| PRICE | INTEGER | FALSE | 판매가 (원) |
| PUBLISHED_DATE | DATE | FALSE | 출판일 |
AUTHOR 테이블은 도서의 저자의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
| Column name | Type | Nullable | Description |
|---|---|---|---|
| AUTHOR_ID | INTEGER | FALSE | 저자 ID |
| AUTHOR_NAME | VARCHAR(N) | FALSE | 저자명 |
BOOK_SALES 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
| Column name | Type | Nullable | Description |
|---|---|---|---|
| BOOK_ID | INTEGER | FALSE | 도서 ID |
| SALES_DATE | DATE | FALSE | 판매일 |
| SALES | INTEGER | FALSE | 판매량 |
2022년 1월의 도서 판매 데이터를 기준으로 저자 별, 카테고리 별 매출액(TOTAL_SALES = 판매량 * 판매가) 을 구하여, 저자 ID(AUTHOR_ID), 저자명(AUTHOR_NAME), 카테고리(CATEGORY), 매출액(SALES) 리스트를 출력하는 SQL문을 작성해주세요.
결과는 저자 ID를 오름차순으로, 저자 ID가 같다면 카테고리를 내림차순 정렬해주세요.
예를 들어 BOOK 테이블과 AUTHOR 테이블, BOOK_SALES 테이블이 다음과 같다면
| BOOK_ID | CATEGORY | AUTHOR_ID | PRICE | PUBLISHED_DATE |
|---|---|---|---|---|
| 1 | 인문 | 1 | 10000 | 2020-01-01 |
| 2 | 경제 | 1 | 9000 | 2021-02-05 |
| 3 | 경제 | 2 | 9000 | 2021-03-11 |
| AUTHOR_ID | AUTHOR_NAME |
|---|---|
| 1 | 홍길동 |
| 2 | 김영호 |
| BOOK_ID | SALES_DATE | SALES |
|---|---|---|
| 1 | 2022-01-01 | 2 |
| 2 | 2022-01-02 | 3 |
| 1 | 2022-01-05 | 1 |
| 2 | 2022-01-20 | 5 |
| 2 | 2022-01-21 | 6 |
| 3 | 2022-01-22 | 2 |
| 2 | 2022-02-11 | 3 |
2022년 1월의 도서 별 총 매출액은 도서 ID 가 1 인 도서가 총 3권 * 10,000원 = 30,000원, 도서 ID 가 2 인 도서가 총 14권 * 9,000 = 126,000원 이고, 도서 ID 가 3 인 도서가 총 2권 * 9,000 = 18,000원 입니다.
저자 별 카테고리 별로 매출액을 집계하면 결과는 다음과 같습니다.
| AUTHOR_ID | AUTHOR_NAME | CATEGORY | TOTAL_SALES |
|---|---|---|---|
| 1 | 홍길동 | 인문 | 30000 |
| 1 | 홍길동 | 경제 | 126000 |
| 2 | 김영호 | 경제 | 18000 |
그리고 저자 ID, 카테고리 순으로 내림차순 정렬하면 다음과 같이 나와야 합니다.
| AUTHOR_ID | AUTHOR_NAME | CATEGORY | TOTAL_SALES |
|---|---|---|---|
| 1 | 홍길동 | 인문 | 30000 |
| 1 | 홍길동 | 경제 | 126000 |
| 2 | 김영호 | 경제 | 18000 |
출처: 프로그래머스 코딩 테스트 연습, https://school.programmers.co.kr/learn/challenges
이번 문제는 조인 연산이 많이 사용되어 차근차근 프로세스를 세워 풀어나갔다 🍀
- 2022년 1월의 도서 별 총 매출액을 구하기 위해 우선 도서별 총 판매량을 집계한다.
SELECT BOOK_ID, SUM(SALES) AS TOTAL_SALES_AMOUNT FROM BOOK_SALES WHERE DATE_FORMAT(SALES_DATE, '%Y-%m') = '2022-01' GROUP BY BOOK_ID
- BOOK 테이블과의
LEFT OUTER JOIN연산을 통해 저자 별 카테고리 별로 매출액을 집계하기 위해AUTHOR_ID, CATEGORY로GROUP BY해주고, SUM(총 판매량 * 가격) TOTAL_SALES 컬럼을 만든다.SELECT B.AUTHOR_ID, B.CATEGORY, SUM(B.PRICE * S.TOTAL_SALES_AMOUNT) AS TOTAL_SALES FROM ( SELECT BOOK_ID, SUM(SALES) AS TOTAL_SALES_AMOUNT FROM BOOK_SALES WHERE DATE_FORMAT(SALES_DATE, '%Y-%m') = '2022-01' GROUP BY BOOK_ID ) AS S LEFT OUTER JOIN BOOK AS B ON S.BOOK_ID = B.BOOK_ID GROUP BY B.AUTHOR_ID, B.CATEGORY
AUTHOR_NAME을 가져오기 위해 추가적으로AUHTHOR테이블과LEFT OUTER JOIN연산을 진행한다. 이후, 필요로한 컬럼들을 SELECT 해준다. 마지막으로 정렬 조건을 충족시켜준다.SELECT NEW_BOOK.AUTHOR_ID, A.AUTHOR_NAME, NEW_BOOK.CATEGORY, NEW_BOOK.TOTAL_SALES FROM ( SELECT B.AUTHOR_ID, B.CATEGORY, SUM(B.PRICE * S.TOTAL_SALES_AMOUNT) AS TOTAL_SALES FROM ( SELECT BOOK_ID, SUM(SALES) AS TOTAL_SALES_AMOUNT FROM BOOK_SALES WHERE DATE_FORMAT(SALES_DATE, '%Y-%m') = '2022-01' GROUP BY BOOK_ID ) AS S LEFT OUTER JOIN BOOK AS B ON S.BOOK_ID = B.BOOK_ID GROUP BY B.AUTHOR_ID, B.CATEGORY ) AS NEW_BOOK LEFT OUTER JOIN AUTHOR A ON NEW_BOOK.AUTHOR_ID = A.AUTHOR_ID ORDER BY NEW_BOOK.AUTHOR_ID ASC, NEW_BOOK.CATEGORY DESC;
SELECT NEW_BOOK.AUTHOR_ID, A.AUTHOR_NAME, NEW_BOOK.CATEGORY, NEW_BOOK.TOTAL_SALES
FROM (
SELECT B.AUTHOR_ID, B.CATEGORY, SUM(B.PRICE * S.TOTAL_SALES_AMOUNT) AS TOTAL_SALES
FROM (
SELECT BOOK_ID, SUM(SALES) AS TOTAL_SALES_AMOUNT
FROM BOOK_SALES
WHERE DATE_FORMAT(SALES_DATE, '%Y-%m') = '2022-01'
GROUP BY BOOK_ID
) AS S
LEFT OUTER JOIN BOOK AS B
ON S.BOOK_ID = B.BOOK_ID
GROUP BY B.AUTHOR_ID, B.CATEGORY
) AS NEW_BOOK
LEFT OUTER JOIN AUTHOR A
ON NEW_BOOK.AUTHOR_ID = A.AUTHOR_ID
ORDER BY NEW_BOOK.AUTHOR_ID ASC, NEW_BOOK.CATEGORY DESC;