[SQL_Q] 특정 기간동안 대여 가능한 자동차 (기간 겹침 로직)

Hyunjun Kim·2024년 10월 23일

SQL

목록 보기
21/98

특정 기간동안 대여 가능한 자동차들의 대여비용 구하기

문제 설명

다음은 어느 자동차 대여 회사에서 대여 중인 자동차들의 정보를 담은 CAR_RENTAL_COMPANY_CAR 테이블과 자동차 대여 기록 정보를 담은 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 자동차 종류 별 대여 기간 종류 별 할인 정책 정보를 담은 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블 입니다.

CAR_RENTAL_COMPANY_CAR 테이블은 아래와 같은 구조로 되어있으며, CAR_ID, CAR_TYPE, DAILY_FEE, OPTIONS 는 각각 자동차 ID, 자동차 종류, 일일 대여 요금(원), 자동차 옵션 리스트를 나타냅니다.

Column_nameTypeNullable
CAR_IDINTEGERFALSE
CAR_TYPEVARCHAR(255)FALSE
DAILY_FEEINTEGERFALSE
OPTIONSVARCHAR(255)FALSE

자동차 종류는 '세단', 'SUV', '승합차', '트럭', '리무진' 이 있습니다. 자동차 옵션 리스트는 콤마(',')로 구분된 키워드 리스트(예: ''열선시트,스마트키,주차감지센서'')로 되어있으며, 키워드 종류는 '주차감지센서', '스마트키', '네비게이션', '통풍시트', '열선시트', '후방카메라', '가죽시트' 가 있습니다.

CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블은 아래와 같은 구조로 되어있으며, HISTORY_ID, CAR_ID, START_DATE, END_DATE 는 각각 자동차 대여 기록 ID, 자동차 ID, 대여 시작일, 대여 종료일을 나타냅니다.

Column_nameTypeNullable
HISTORY_IDINTEGERFALSE
CAR_IDINTEGERFALSE
START_DATEDATEFALSE
END_DATEDATEFALSE

CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블은 아래와 같은 구조로 되어있으며, PLAN_ID, CAR_TYPE, DURATION_TYPE, DISCOUNT_RATE 는 각각 요금 할인 정책 ID, 자동차 종류, 대여 기간 종류, 할인율(%)을 나타냅니다.

Column_nameTypeNullable
PLAN_IDINTEGERFALSE
CAR_TYPEVARCHAR(255)FALSE
DURATION_TYPEVARCHAR(255)FALSE
DISCOUNT_RATEINTEGERFALSE

할인율이 적용되는 대여 기간 종류로는 '7일 이상' (대여 기간이 7일 이상 30일 미만인 경우), '30일 이상' (대여 기간이 30일 이상 90일 미만인 경우), '90일 이상' (대여 기간이 90일 이상인 경우) 이 있습니다. 대여 기간이 7일 미만인 경우 할인정책이 없습니다.

문제

CAR_RENTAL_COMPANY_CAR 테이블과 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블에서 자동차 종류가 '세단' 또는 'SUV' 인 자동차 중 2022년 11월 1일부터 2022년 11월 30일까지 대여 가능하고 30일간의 대여 금액이 50만원 이상 200만원 미만인 자동차에 대해서 자동차 ID, 자동차 종류, 대여 금액(컬럼명: FEE) 리스트를 출력하는 SQL문을 작성해주세요. 결과는 대여 금액을 기준으로 내림차순 정렬하고, 대여 금액이 같은 경우 자동차 종류를 기준으로 오름차순 정렬, 자동차 종류까지 같은 경우 자동차 ID를 기준으로 내림차순 정렬해주세요.

문제에서 2022년 11월 1일부터 2022년 11월 30일까지 대여 가능 이라는 표현이 한번에 이해가 되지 않았다. 이해는 되었어도 어떻게 SQL로 구현할 수 있을지도 의문이었다.

추가 설명

1) 문제의 핵심을 한 문장으로

“어떤 차량이 2022-11-01부터 2022-11-30까지 한 달 동안 대여 가능하다”는 말은 해당 기간(기준 기간)과 그 차량의 기존 대여 기록들이 하나도 겹치지 않아야 한다는 의미이다. 즉 기준 기간과 겹치는 대여 이력(하나라도 존재)이 있으면 그 차량은 제외해야 한다.


2) 날짜 구간의 겹침(Overlap) 논리 — 직관·수식·드모르간

두 구간(대여 A = [START_DATE, END_DATE] 와 기준 B = ['2022-11-01', '2022-11-30'])이 겹치지 않는 경우는 오직 두 가지이다.

  1. 대여 A가 기준 B보다 완전히 앞에 있을 때: END_DATE < '2022-11-01'
  2. 대여 A가 기준 B보다 완전히 뒤에 있을 때: START_DATE > '2022-11-30'

따라서 겹치지 않는다 = (END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30')

우리가 실제로 쿼리에서 걸러내야 할 것은 겹치는 경우이다. 겹치는 경우는 위 조건의 부정(negation)이므로 드모르간 법칙을 쓰면:

NOT ( (END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30') )
=> (END_DATE >= '2022-11-01') AND (START_DATE <= '2022-11-30')

즉, 겹침 조건은 END_DATE >= '2022-11-01' AND START_DATE <= '2022-11-30' 이다.
(이 식은 부분적으로 걸치는 경우와, 기준 기간을 완전히 포함하거나 기준 기간이 완전히 포함되는 모든 케이스를 포함한다.)

예시

  • 10월 25일 ~ 11월 3일 → 겹침 (끝이 11월 전에 있더라도 끝이 11월 1일 이후이므로)
  • 11월 5일 ~ 11월 20일 → 겹침
  • 12월 1일 ~ 12월 10일 → 겹치지 않음 (시작이 11월 30일 이후)
  • 2022-10-01 ~ 2022-10-31 → 겹치지 않음 (끝이 11월 1일보다 작음)

왜 OR를 사용하는가?

"겹치지 않는다"는 목적을 달성하기 위해서는 경우 1 혹은 경우 2 중 하나만 만족하면 된다. 따라서 두 조건은 OR로 연결되어야 함.

  • 옳은 논리: 경우 1 OR 경우 2 (한쪽으로만 떨어져 있으면 겹치지 않음)
  • 틀린 논리: 경우 1 AND 경우 2 (11월 전에 끝나면서 동시에 11월 이후에 시작하는 기간은 존재 불가)

그런데 왜 NOT EXISTS를 쓰는가?

여기서 포인트는 “겹치지 않는 경우를 찾는 것”이 아니라
“겹치는 경우가 하나도 없어야 한다”
는 조건이라는 점이다.

논리 전환 (De Morgan 관점)

  • 겹치지 않음

    • (경우 1 OR 경우 2)
  • 겹침

    • NOT (경우 1 OR 경우 2)
    • (NOT 경우 1) AND (NOT 경우 2)

그래서 겹치는 레코드가 하나라도 있으면 탈락시키기 위해 NOT EXISTS 사용한다.

NOT EXISTS (
  겹치는 조건을 만족하는 행
)

논리 전개 과정

  1. 겹치지 않는 조건: (END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30')
  2. 부정(NOT) 적용: NOT ((END_DATE < '2022-11-01') OR (START_DATE > '2022-11-30'))
  3. 드모르간 법칙 적용: (NOT END_DATE < '2022-11-01') AND (NOT START_DATE > '2022-11-30')
  4. 최종 겹침 조건: END_DATE >= '2022-11-01' AND START_DATE <= '2022-11-30'

4. 논리 회로식 표현

디지털 논리 개념을 활용하면 이해가 더욱 명확해진다

  • 기본 원리: A AND B=¬(¬A OR ¬B)A \text{ AND } B = \neg (\neg A \text{ OR } \neg B)
  • 가용성 조건: End Date < 1일 AND Start Date > 30일 이어야 한다면
  • 차단(Overlap) 조건: End Date >= 1일 AND Start Date <= 30일 이 아니어야 함

5. 핵심 요약

날짜 필터링 시 혼동을 방지하기 위해 다음 규칙을 기억하자.

상태논리 연산자핵심 근거
겹치지 않는다OR왼쪽 혹은 오른쪽, 한 곳으로만 떨어져 있으면 충분함
겹친다AND시작일은 기준 종료일보다 이전이고, 종료일은 기준 시작일보다 이후여야 함

잘못된 접근 주의

START_DATE > '2022-11-01' AND END_DATE < '2022-12-01' 와 같은 식은 대여 기간이 기준 기간 내에 완전히 포함되는 경우만 잡게 된다. 10월에 빌려 12월에 반납하는(기준 기간을 통째로 포함하는) 기록을 놓치지 않으려면 반드시 위에서 도출한 최종 겹침 조건을 사용해야 한다.

풀던 중 오류

SELECT * , floor(daily_fee *(1- discount_rate/100)* 30) FEE
FROM (SELECT *
    FROM CAR_RENTAL_COMPANY_CAR 
    WHERE car_type in ('세단','SUV') 
    #11월 1일부터 2022년 11월 30일까지 대여 가능
      and CAR_ID NOT IN (
        SELECT CAR_ID 
        FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
        WHERE START_DATE <="2022-11-30" 
        AND END_DATE >= "2022-11-01"
    )
) c JOIN  (SELECT * 
    FROM CAR_RENTAL_COMPANY_DISCOUNT_PLAN
    WHERE DURATION_TYPE = "30일 이상") as p
ON c.CAR_TYPE = p.CAR_TYPE
WHERE FEE >= 500000 and FEE < 2000000

SQL 실행 중 오류가 발생하였습니다.
Unknown column 'FEE' in 'where clause'

SQL 쿼리에서 발생한 오류는 WHERE 절에서 FEE 컬럼을 사용하려고 시도했지만, SELECT 절에서 계산된 FEE는 WHERE 절에서 직접 참조할 수 없기 때문입니다. SQL에서는 SELECT에서 계산된 별칭은 WHERE 절에서 바로 사용할 수 없으며, HAVING 절을 사용하거나 서브쿼리를 활용해야 합니다.

풀이

나의 풀이

WITH RENTAL_H AS (
SELECT *
FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
WHERE START_DATE <= '2022-11-30' and END_DATE >= '2022-11-01')

SELECT c.CAR_ID, c.CAR_TYPE, FLOOR(c.DAILY_FEE * 30 * (1- p.discount_rate/100 )) FEE 
FROM ( SELECT * FROM CAR_RENTAL_COMPANY_CAR 
      WHERE car_type in ('세단','SUV')) c 
LEFT JOIN RENTAL_H h
on h.CAR_ID = c.CAR_ID
JOIN CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
ON c.CAR_TYPE = p.CAR_TYPE
AND p.duration_type = '30일 이상'
WHERE h.HISTORY_ID IS NULL
HAVING FEE > 500000 AND FEE < 2000000
ORDER BY FEE DESC, c.CAR_TYPE, c.CAR_ID DESC

장점

  • 논리적으로 맞음
  • 많이 쓰이는 패턴

단점 (성능 관점)

  • RENTAL_HISTORY가 1:N이면 JOIN 결과가 커짐
  • 옵티마이저가 항상 ANTI-JOIN으로 바꿔주지는 않음
  • 조인 → 필터 → 제거 흐름이라 중간 결과셋이 불필요하게 커질 수 있음

📌 중소 데이터에서는 문제 없음,
📌 히스토리 테이블 커지면 불리

다른 시도

with filtered_type as (
    select *
    from CAR_RENTAL_COMPANY_CAR c
    where c.CAR_TYPE in ('세단', 'SUV')
    and not exists(
        select 1
        from CAR_RENTAL_COMPANY_RENTAL_HISTORY h
        where h.CAR_ID = c.CAR_ID
        and h.START_DATE <= '2022-11-30'
        and h.END_DATE >= '2022-11-01'
    )
)
select 
    f.car_id, 
    f.CAR_TYPE, 
    FLOOR(f.daily_fee * (1- p.DISCOUNT_RATE/100)*30) FEE
from filtered_type f join CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
on f.CAR_TYPE = p.CAR_TYPE
and p.DURATION_TYPE = '30일 이상'
having FEE >= 500000 and FEE <2000000
order by 3 dEsc, 2, 1 desc

장점

  • 존재 여부 판단에 최적화된 문법
  • MySQL 옵티마이저가 → ANTI-JOIN으로 변환
  • 첫 매칭 발견 시 즉시 중단 (short-circuit)
  • JOIN 결과셋 확장 ❌
  • NULL 이슈 ❌

성능 관점

  • 인덱스 (CAR_ID, START_DATE, END_DATE) 있으면 거의 O(1) 체감

📌 실무 / 코딩테스트 / 대용량 기준 전부 가장 안정적인 방향이다

다른 사람 풀이

/* 최종 테이블의 컬럼 선택 (CAR_ID, CAR_TYPE, FEE) */
select A.CAR_ID, A.CAR_TYPE, ROUND(DAILY_FEE*30*((100-DISCOUNT_RATE)/100),0) as FEE
/* 메인 테이블(CAR_RENTAL_COMPANY_CAR) 에서 CAR_TYPE이 '세단', 'SUV'인 것만 추출 */
from 
(select * from CAR_RENTAL_COMPANY_CAR where CAR_TYPE in ('세단', 'SUV')) as A
/* 조인 테이블(CAR_RENTAL_COMPANY_DISCOUNT_PLAN) 에서 DURATION_TYPE이 '30일 이상' 인 것만 추출 */
    left join CAR_RENTAL_COMPANY_DISCOUNT_PLAN as B 
        on A.CAR_TYPE = B.CAR_TYPE and DURATION_TYPE = '30일 이상'
/* 최종 테이블에서 START_DATE와 END_DATE 사이에 "2022-11-01" 또는 "2022-11-31"가 포함되지 않는 CAR_ID 행을 선택 */
where CAR_ID not in (select CAR_ID from CAR_RENTAL_COMPANY_RENTAL_HISTORY
        where ("2022-11-01" between START_DATE and END_DATE)
        or ("2022-11-31" between START_DATE and END_DATE)) 
/* CAR_ID 그룹화 (혹은 group by 대신 최종 테이블의 컬럼 선택 시 distinct로 대체 가능) */
group by CAR_ID
/* CAR_ID 그룹 중 FEE 가 500,000원 이상 2,000,000원 이하인 그룹 선택 */
having FEE >= 500000 and FEE < 2000000
/* FEE 기준 내림차순 -> CAR_TYPE 기준 오름차순 -> A.CAR_ID 기준 내림차순 */
order by FEE desc, A.CAR_TYPE, A.CAR_ID desc
/*
CAR_ID CAR_TYPE FEE
3 세단 1518000
23 세단 1380000
*/

문제점

  • 1 NOT IN + NULL : 서브쿼리 결과에 NULL 하나라도 있으면 전체 결과가 0 row
  • 날짜 조건 자체도 불완전. 겹침 판정은 START_DATE <= '2022-11-30' AND END_DATE >= '2022-11-01' 인데 BETWEEN 두 번은 일부 케이스 누락 가능.
  • GROUP BY 강제 : 원래 필요 없는 집계를 억지로 넣음. 옵티마이저 입장에서 불리

2026-02-17 다시 풀기

with filtered as (
    select c.car_id, daily_fee, CAR_TYPE
    from CAR_RENTAL_COMPANY_RENTAL_HISTORY rh join CAR_RENTAL_COMPANY_CAR c
    on c.car_id = rh.car_id
    and START_DATE > '2022-11-30' or END_DATE < '2022-11-01' 
    and CAR_TYPE in ('SUV','세단')
)
select distinct car_id, f.car_type, round(daily_fee*(1- discount_rate/100)*30) FEE
from filtered f join CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
on f.CAR_TYPE = p.CAR_TYPE
and p.DURATION_TYPE = "30일 이상"
having FEE >= 500000 and FEE < 2000000
order by FEE desc,CAR_TYPE,  car_id desc
car_idCAR_TYPEFEE
3세단1518000
23세단1380000
27SUV655500
18SUV627000

이거는 START_DATE > '2022-11-30' or END_DATE < '2022-11-01' 조건 때문에 생긴 일인데,

  • 해당 기간 내에 걸치는 기록이 "하나라도 있으면 제외"해야 하기 때문에

조건을 다시 잘 써야 한다.

with filtered as (
    select *
    from CAR_RENTAL_COMPANY_CAR c
    where not exists(
        select 1
        from CAR_RENTAL_COMPANY_RENTAL_HISTORY h
        where c.CAR_ID = h.CAR_ID
        and START_DATE <= '2022-11-30'
        and END_DATE >= '2022-11-01'
    )
    and CAR_TYPE in ('세단', 'SUV')
)
select car_id, f.car_type, 
    round(daily_fee * (1- DISCOUNT_RATE/100) ) * 30 FEE
from filtered f join CAR_RENTAL_COMPANY_DISCOUNT_PLAN p
on f.car_type = p.car_type
and DURATION_TYPE = '30일 이상'
having FEE >= 500000 and FEE < 2000000
order by 3 desc, 2, 1 desc
profile
Data Analytics Engineer 가 되

0개의 댓글