[SQL] 자동차 평균 대여 기간 구하기

유지민·2024년 3월 6일

SQL

목록 보기
21/23
post-thumbnail

문제 보기

문제 설명

다음은 어느 자동차 대여 회사의 자동차 대여 기록 정보를 담은 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블입니다. CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블은 아래와 같은 구조로 되어있으며, HISTORY_ID, CAR_ID, START_DATE, END_DATE 는 각각 자동차 대여 기록 ID, 자동차 ID, 대여 시작일, 대여 종료일을 나타냅니다.

Column name	Type	Nullable
HISTORY_ID	INTEGER	FALSE
CAR_ID	INTEGER	FALSE
START_DATE	DATE	FALSE
END_DATE	DATE	FALSE

문제

CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블에서 평균 대여 기간이 7일 이상인 자동차들의 자동차 ID와 평균 대여 기간(컬럼명: AVERAGE_DURATION) 리스트를 출력하는 SQL문을 작성해주세요. 평균 대여 기간은 소수점 두번째 자리에서 반올림하고, 결과는 평균 대여 기간을 기준으로 내림차순 정렬해주시고, 평균 대여 기간이 같으면 자동차 ID를 기준으로 내림차순 정렬해주세요.

예시

예를 들어 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블이 다음과 같다면

HISTORY_ID	CAR_ID	START_DATE	END_DATE
1	1	2022-09-27	2022-10-01
2	1	2022-10-03	2022-11-04
3	2	2022-09-05	2022-09-05
4	2	2022-09-08	2022-09-10
5	3	2022-09-16	2022-10-15
6	1	2022-11-07	2022-12-06

자동차 별 평균 대여 기간은

자동차 ID가 1인 자동차의 경우, 대여 기간이 각각 5일, 33일, 30일인 기록이 존재하므로 평균 22.7일
자동차 ID가 2인 자동차의 경우, 대여 기간이 각각 1일, 3일인 기록이 존재하므로 평균 2일
자동차 ID가 3인 자동차의 경우, 대여 기간이 30일인 기록만 존재하므로 평균 30일 입니다. 평균 대여 기간이 7일 이상인 자동차는 자동차 ID가 1, 3인 자동차이고, 평균 대여 기간 내림차순 및 자동차 ID를 기준으로 내림차순 정렬하면 다음과 같이 나와야 합니다.

CAR_ID	AVERAGE_DURATION
3	30.0
1	22.7

정답 코드

SELECT CAR_ID, 
        ROUND(AVG(DATEDIFF(END_DATE, START_DATE)+1), 1) AS AVERAGE_DURATION
        FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
GROUP BY CAR_ID
HAVING AVERAGE_DURATION >= 7
ORDER BY AVERAGE_DURATION DESC, CAR_ID DESC;

오답 코드

SELECT CAR_ID, 
        ROUND(AVG(DATEDIFF(END_DATE, START_DATE)), 1) AS AVERAGE_DURATION
        FROM CAR_RENTAL_COMPANY_RENTAL_HISTORY
WHERE DATEDIFF(DAY, END_DATE, START_DATE) >= 7
ORDER BY AVERAGE_DURATION DESC, CAR_ID DESC;

그룹화를 왜 해줘야 하지? 싶었는데, 중복되는 CAR_ID가 있었고, 이 CAR_ID를 기반으로 평균 대여 기간이 7일 이상인 컬럼들을 필터링하는 것이기에 반드시 필요했다.
DATEDIFF에 DAY를 넣어주니까 오류가 났던 이유는 뭔지 모르겠다...
실행 환경이 SQL Server인지, MySQL인지 환경에 따라 인자에 변화가 있나보다.
안전하게 인자 2개 쓰기...^.^

정답 쿼리(by GPT)

  • 목적: CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블에서 각 CAR_ID별로 평균 대여 기간을 계산하고, 평균 대여 기간이 7일 이상인 차량을 찾습니다.
  • 대여 기간 계산: DATEDIFF(END_DATE, START_DATE)+1을 사용하여 대여 기간을 계산합니다. 여기서 +1은 시작일과 종료일을 모두 포함하는 대여 기간을 정확하게 계산하기 위해 추가됩니다.
  • 그룹화 및 필터링: GROUP BY CAR_ID로 각 차량별로 그룹화한 후, HAVING AVERAGE_DURATION >= 7을 사용하여 평균 대여 기간이 7일 이상인 그룹만 필터링합니다.
  • 정렬: ORDER BY AVERAGE_DURATION DESC, CAR_ID DESC로 평균 대여 기간이 긴 순으로 정렬하고, 평균 대여 기간이 같을 경우 CAR_ID의 내림차순으로 정렬합니다.

오답 쿼리(by GPT)

  • 잘못된 조건: WHERE DATEDIFF(DAY, END_DATE, START_DATE) >= 7는 SQL 구문 오류를 포함하고 있습니다. DATEDIFF 함수는 보통 DATEDIFF(END_DATE, START_DATE) 형식으로 사용되며, DAY 키워드는 여기서 필요하지 않습니다.
  • 필터링 시점의 문제: 이 쿼리는 대여 기간이 7일 이상인 레코드만 대상으로 평균을 계산하려고 시도합니다. 그러나 이는 전체 대여 기록에서 평균 대여 기간을 계산한 후 7일 이상인 경우를 필터링하는 첫 번째 쿼리의 의도와 다릅니다.
  • 그룹화 누락: GROUP BY CAR_ID 구문이 없어서 각 차량별로 평균을 계산하는 로직이 누락되었습니다. 이로 인해 쿼리가 정확한 결과를 생성할 수 없습니다.
  • 결과 필터링: 첫 번째 쿼리에서는 HAVING을 사용하여 평균 계산 후 결과를 필터링하지만, 두 번째 쿼리는 이러한 후처리 필터링이 부재합니다.
profile
끊임없이 도전하며 사고하는 주니어 Web 개발자 유지민입니다.

0개의 댓글