다음은 어느 자동차 대여 회사에서 대여 중인 자동차들의 정보를 담은 CAR_RENTAL_COMPANY_CAR 테이블과 자동차 대여 기록 정보를 담은 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 자동차 종류 별 대여 기간 종류 별 할인 정책 정보를 담은 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블 입니다.
CAR_RENTAL_COMPANY_CAR 테이블은 아래와 같은 구조로 되어있으며, CAR_ID, CAR_TYPE, DAILY_FEE, OPTIONS 는 각각 자동차 ID, 자동차 종류, 일일 대여 요금(원), 자동차 옵션 리스트를 나타냅니다.
| Column_name | Type | Nullable |
|---|---|---|
| CAR_ID | INTEGER | FALSE |
| CAR_TYPE | VARCHAR(255) | FALSE |
| DAILY_FEE | INTEGER | FALSE |
| OPTIONS | VARCHAR(255) | FALSE |
자동차 종류는 '세단', 'SUV', '승합차', '트럭', '리무진' 이 있습니다. 자동차 옵션 리스트는 콤마(',')로 구분된 키워드 리스트(예: ''열선시트,스마트키,주차감지센서'')로 되어있으며, 키워드 종류는 '주차감지센서', '스마트키', '네비게이션', '통풍시트', '열선시트', '후방카메라', '가죽시트' 가 있습니다.
CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블은 아래와 같은 구조로 되어있으며, HISTORY_ID, CAR_ID, START_DATE, END_DATE 는 각각 자동차 대여 기록 ID, 자동차 ID, 대여 시작일, 대여 종료일을 나타냅니다.
| Column_name | Type | Nullable |
|---|---|---|
| HISTORY_ID | INTEGER | FALSE |
| CAR_ID | INTEGER | FALSE |
| START_DATE | DATE | FALSE |
| END_DATE | DATE | FALSE |
CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블은 아래와 같은 구조로 되어있으며, PLAN_ID, CAR_TYPE, DURATION_TYPE, DISCOUNT_RATE 는 각각 요금 할인 정책 ID, 자동차 종류, 대여 기간 종류, 할인율(%)을 나타냅니다.
| Column_name | Type | Nullable |
|---|---|---|
| PLAN_ID | INTEGER | FALSE |
| CAR_TYPE | VARCHAR(255) | FALSE |
| DURATION_TYPE | VARCHAR(255) | FALSE |
| DISCOUNT_RATE | INTEGER | FALSE |
할인율이 적용되는 대여 기간 종류로는 '7일 이상' (대여 기간이 7일 이상 30일 미만인 경우), '30일 이상' (대여 기간이 30일 이상 90일 미만인 경우), '90일 이상' (대여 기간이 90일 이상인 경우) 이 있습니다. 대여 기간이 7일 미만인 경우 할인정책이 없습니다.
CAR_RENTAL_COMPANY_CAR 테이블과 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블에서 자동차 종류가 '세단' 또는 'SUV' 인 자동차 중 2022년 11월 1일부터 2022년 11월 30일까지 대여 가능하고 30일간의 대여 금액이 50만원 이상 200만원 미만인 자동차에 대해서 자동차 ID, 자동차 종류, 대여 금액(컬럼명: FEE) 리스트를 출력하는 SQL문을 작성해주세요. 결과는 대여 금액을 기준으로 내림차순 정렬하고, 대여 금액이 같은 경우 자동차 종류를 기준으로 오름차순 정렬, 자동차 종류까지 같은 경우 자동차 ID를 기준으로 내림차순 정렬해주세요.
문제에서 2022년 11월 1일부터 2022년 11월 30일까지 대여 가능 이라는 표현이 한번에 이해가 되지 않았다. 이해는 되었어도 어떻게 SQL로 구현할 수 있을지도 의문이었다.
“어떤 차량이 2022-11-01부터 2022-11-30까지 한 달 동안 대여 가능하다”는 말은 해당 기간(기준 기간)과 그 차량의 기존 대여 기록들이 하나도 겹치지 않아야 한다는 의미이다. 즉 기준 기간과 겹치는 대여 이력(하나라도 존재)이 있으면 그 차량은 제외해야 한다.
두 구간(대여 A = [START_DATE, END_DATE] 와 기준 B = ['2022-11-01', '2022-11-30'])이 겹치지 않는 경우는 오직 두 가지이다.
따라서 겹치지 않는다 = (END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30')
우리가 실제로 쿼리에서 걸러내야 할 것은 겹치는 경우이다. 겹치는 경우는 위 조건의 부정(negation)이므로 드모르간 법칙을 쓰면:
NOT ( (END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30') )
=> (END_DATE >= '2022-11-01') AND (START_DATE <= '2022-11-30')
즉, 겹침 조건은 END_DATE >= '2022-11-01' AND START_DATE <= '2022-11-30' 이다.
(이 식은 부분적으로 걸치는 경우와, 기준 기간을 완전히 포함하거나 기준 기간이 완전히 포함되는 모든 케이스를 포함한다.)
예시
"겹치지 않는다"는 목적을 달성하기 위해서는 경우 1 혹은 경우 2 중 하나만 만족하면 된다. 따라서 두 조건은 OR로 연결되어야 함.
경우 1 OR 경우 2 (한쪽으로만 떨어져 있으면 겹치지 않음)경우 1 AND 경우 2 (11월 전에 끝나면서 동시에 11월 이후에 시작하는 기간은 존재 불가)여기서 포인트는 “겹치지 않는 경우를 찾는 것”이 아니라
“겹치는 경우가 하나도 없어야 한다”는 조건이라는 점이다.
논리 전환 (De Morgan 관점)
겹치지 않음
겹침
그래서 겹치는 레코드가 하나라도 있으면 탈락시키기 위해 NOT EXISTS 사용한다.
NOT EXISTS (
겹치는 조건을 만족하는 행
)
(END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30')NOT ((END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30'))(NOT END_DATE < '2022-11-01') AND (NOT START_DATE > '2022-11-30')END_DATE >= '2022-11-01' AND START_DATE <= '2022-11-30'디지털 논리 개념을 활용하면 이해가 더욱 명확해진다
End Date < 1일 AND Start Date > 30일 이어야 한다면End Date >= 1일 AND Start Date <= 30일 이 아니어야 함날짜 필터링 시 혼동을 방지하기 위해 다음 규칙을 기억하자.
| 상태 | 논리 연산자 | 핵심 근거 |
|---|---|---|
| 겹치지 않는다 | OR | 왼쪽 혹은 오른쪽, 한 곳으로만 떨어져 있으면 충분함 |
| 겹친다 | AND | 시작일은 기준 종료일보다 이전이고, 종료일은 기준 시작일보다 이후여야 함 |
START_DATE > '2022-11-01' AND END_DATE < '2022-12-01' 와 같은 식은 대여 기간이 기준 기간 내에 완전히 포함되는 경우만 잡게 된다. 10월에 빌려 12월에 반납하는(기준 기간을 통째로 포함하는) 기록을 놓치지 않으려면 반드시 위에서 도출한 최종 겹침 조건을 사용해야 한다.
SELECT * , floor(daily_fee *(1- discount_rate/100)* 30) FEE
FROM (SELECT *
FROM CAR_RENTAL_COMPANY_CAR
WHERE car_type in ('세단','SUV')
#11월 1일부터 2022년 11월 30일까지 대여 가능
and CAR_ID NOT IN (
SELECT CAR_ID
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
WHERE START_DATE <="2022-11-30"
AND END_DATE >= "2022-11-01"
)
) c JOIN (SELECT *
FROM CAR_RENTAL_COMPANY_DISCOUNT_PLAN
WHERE DURATION_TYPE = "30일 이상") as p
ON c.CAR_TYPE = p.CAR_TYPE
WHERE FEE >= 500000 and FEE < 2000000
SQL 실행 중 오류가 발생하였습니다.
Unknown column 'FEE' in 'where clause'
SQL 쿼리에서 발생한 오류는 WHERE 절에서 FEE 컬럼을 사용하려고 시도했지만, SELECT 절에서 계산된 FEE는 WHERE 절에서 직접 참조할 수 없기 때문입니다. SQL에서는 SELECT에서 계산된 별칭은 WHERE 절에서 바로 사용할 수 없으며, HAVING 절을 사용하거나 서브쿼리를 활용해야 합니다.
WITH RENTAL_H AS (
SELECT *
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
WHERE START_DATE <= '2022-11-30' and END_DATE >= '2022-11-01')
SELECT c.CAR_ID, c.CAR_TYPE, FLOOR(c.DAILY_FEE * 30 * (1- p.discount_rate/100 )) FEE
FROM ( SELECT * FROM CAR_RENTAL_COMPANY_CAR
WHERE car_type in ('세단','SUV')) c
LEFT JOIN RENTAL_H h
on h.CAR_ID = c.CAR_ID
JOIN CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
ON c.CAR_TYPE = p.CAR_TYPE
AND p.duration_type = '30일 이상'
WHERE h.HISTORY_ID IS NULL
HAVING FEE > 500000 AND FEE < 2000000
ORDER BY FEE DESC, c.CAR_TYPE, c.CAR_ID DESC
장점
단점 (성능 관점)
📌 중소 데이터에서는 문제 없음,
📌 히스토리 테이블 커지면 불리
with filtered_type as (
select *
from CAR_RENTAL_COMPANY_CAR c
where c.CAR_TYPE in ('세단', 'SUV')
and not exists(
select 1
from CAR_RENTAL_COMPANY_RENTAL_HISTORY h
where h.CAR_ID = c.CAR_ID
and h.START_DATE <= '2022-11-30'
and h.END_DATE >= '2022-11-01'
)
)
select
f.car_id,
f.CAR_TYPE,
FLOOR(f.daily_fee * (1- p.DISCOUNT_RATE/100)*30) FEE
from filtered_type f join CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
on f.CAR_TYPE = p.CAR_TYPE
and p.DURATION_TYPE = '30일 이상'
having FEE >= 500000 and FEE <2000000
order by 3 dEsc, 2, 1 desc
장점
성능 관점
📌 실무 / 코딩테스트 / 대용량 기준 전부 가장 안정적인 방향이다
/* 최종 테이블의 컬럼 선택 (CAR_ID, CAR_TYPE, FEE) */
select A.CAR_ID, A.CAR_TYPE, ROUND(DAILY_FEE*30*((100-DISCOUNT_RATE)/100),0) as FEE
/* 메인 테이블(CAR_RENTAL_COMPANY_CAR) 에서 CAR_TYPE이 '세단', 'SUV'인 것만 추출 */
from
(select * from CAR_RENTAL_COMPANY_CAR where CAR_TYPE in ('세단', 'SUV')) as A
/* 조인 테이블(CAR_RENTAL_COMPANY_DISCOUNT_PLAN) 에서 DURATION_TYPE이 '30일 이상' 인 것만 추출 */
left join CAR_RENTAL_COMPANY_DISCOUNT_PLAN as B
on A.CAR_TYPE = B.CAR_TYPE and DURATION_TYPE = '30일 이상'
/* 최종 테이블에서 START_DATE와 END_DATE 사이에 "2022-11-01" 또는 "2022-11-31"가 포함되지 않는 CAR_ID 행을 선택 */
where CAR_ID not in (select CAR_ID from CAR_RENTAL_COMPANY_RENTAL_HISTORY
where ("2022-11-01" between START_DATE and END_DATE)
or ("2022-11-31" between START_DATE and END_DATE))
/* CAR_ID 그룹화 (혹은 group by 대신 최종 테이블의 컬럼 선택 시 distinct로 대체 가능) */
group by CAR_ID
/* CAR_ID 그룹 중 FEE 가 500,000원 이상 2,000,000원 이하인 그룹 선택 */
having FEE >= 500000 and FEE < 2000000
/* FEE 기준 내림차순 -> CAR_TYPE 기준 오름차순 -> A.CAR_ID 기준 내림차순 */
order by FEE desc, A.CAR_TYPE, A.CAR_ID desc
/*
CAR_ID CAR_TYPE FEE
3 세단 1518000
23 세단 1380000
*/
문제점
1 NOT IN + NULL : 서브쿼리 결과에 NULL 하나라도 있으면 전체 결과가 0 rowSTART_DATE <= '2022-11-30' AND END_DATE >= '2022-11-01' 인데 BETWEEN 두 번은 일부 케이스 누락 가능.2026-02-17 다시 풀기
with filtered as (
select c.car_id, daily_fee, CAR_TYPE
from CAR_RENTAL_COMPANY_RENTAL_HISTORY rh join CAR_RENTAL_COMPANY_CAR c
on c.car_id = rh.car_id
and START_DATE > '2022-11-30' or END_DATE < '2022-11-01'
and CAR_TYPE in ('SUV','세단')
)
select distinct car_id, f.car_type, round(daily_fee*(1- discount_rate/100)*30) FEE
from filtered f join CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
on f.CAR_TYPE = p.CAR_TYPE
and p.DURATION_TYPE = "30일 이상"
having FEE >= 500000 and FEE < 2000000
order by FEE desc,CAR_TYPE, car_id desc
| car_id | CAR_TYPE | FEE |
|---|---|---|
| 3 | 세단 | 1518000 |
| 23 | 세단 | 1380000 |
| 27 | SUV | 655500 |
| 18 | SUV | 627000 |
이거는 START_DATE > '2022-11-30' or END_DATE < '2022-11-01' 조건 때문에 생긴 일인데,
조건을 다시 잘 써야 한다.
with filtered as (
select *
from CAR_RENTAL_COMPANY_CAR c
where not exists(
select 1
from CAR_RENTAL_COMPANY_RENTAL_HISTORY h
where c.CAR_ID = h.CAR_ID
and START_DATE <= '2022-11-30'
and END_DATE >= '2022-11-01'
)
and CAR_TYPE in ('세단', 'SUV')
)
select car_id, f.car_type,
round(daily_fee * (1- DISCOUNT_RATE/100) ) * 30 FEE
from filtered f join CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
on f.car_type = p.car_type
and DURATION_TYPE = '30일 이상'
having FEE >= 500000 and FEE < 2000000
order by 3 desc, 2, 1 desc