[오늘의 문제] 연도별 대장균 크기의 편차 구하기

shlim55·2025년 10월 12일

코딩테스트

목록 보기
147/223

출처: https://school.programmers.co.kr/learn/courses/30/lessons/299310

문제 설명
대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column name Type Nullable
ID INTEGER FALSE
PARENT_ID INTEGER TRUE
SIZE_OF_COLONY INTEGER FALSE
DIFFERENTIATION_DATE DATE FALSE
GENOTYPE INTEGER FALSE
최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.

문제
분화된 연도(YEAR), 분화된 연도별 대장균 크기의 편차(YEAR_DEV), 대장균 개체의 ID(ID) 를 출력하는 SQL 문을 작성해주세요. 분화된 연도별 대장균 크기의 편차는 분화된 연도별 가장 큰 대장균의 크기 - 각 대장균의 크기로 구하며 결과는 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬해주세요.

예시
예를 들어 ECOLI_DATA 테이블이 다음과 같다면

ID PARENT_ID SIZE_OF_COLONY DIFFERENTIATION_DATE GENOTYPE
1 NULL 10 2019/01/01 5
2 NULL 2 2019/01/01 3
3 1 100 2020/01/01 4
4 2 10 2020/01/01 4
5 2 17 2020/01/01 6
6 4 101 2021/01/01 22
분화된 연도별 가장 큰 대장균의 크기는 다음과 같습니다.

2019 : 10
2020 : 100
2021 : 101

따라서 각 대장균의 분화된 연도별 대장균 크기의 편차는 다음과 같습니다.

ID 1 : 10 - 10 = 0
ID 2 : 10 -2 = 8
ID 3 : 100 - 100 = 0

ID 4 : 100 - 10 = 90
ID 5 : 100 - 17 = 83
ID 6 : 101 -101 - 0

이를 분화된 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬하면 결과는 다음과 같아야 합니다.

YEAR YEAR_DEV ID
2019 0 1
2019 8 2
2020 0 3
2020 83 5
2020 90 4
2021 0 6

내가 작성한 코드문

-- 코드를 작성해주세요
SELECT LEFT(DIFFERENTIATION_DATE, 4) AS YEAR
       , MAX(SIZE_OF_COLONY) - MIN(SIZE_OF_COLONY) AS YEAR_DEV
       , ID
FROM ECOLI_DATA 
GROUP BY YEAR
ORDER BY YEAR ASC, YEAR_DEV ASC

🚫 문제점 요약: GROUP BY 규칙 위반
1. 에러의 원인: ID 컬럼

  • 문제 컬럼: ID

  • 에러 메시지: Expression #3 of SELECT list is not in GROUP BY clause and contains nonaggregated column '...ID' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

  1. 구체적인 작동 방식의 충돌

쿼리 요소 역할 및 상태 문제점

역할및 상태: GROUP BY YEAR 연도(YEAR)별로 모든 행을 묶어 하나의 그룹으로 만든다.
문제점: 2023년 그룹에는 여러 개의 ID가 포함된다.

역할및 상태: MAX() - MIN() 집계 함수로, 그룹(YEAR) 내의 여러 값을 계산해 하나의 YEAR_DEV 값을 만든다.
문제점: 이는 정상적인 집계 처리입니다.

역할및 상태: SELECT ID 집계되지 않은 개별 ID를 요구한다.
문제점: SQL 엔진은 2023년 그룹에 속한 여러 ID 중 어떤 ID 값 하나를 대표로 출력해야 할지 결정할 수 없다. 이 모호성 때문에 에러가 발생한다.

ID별로 연도 편차를 계산하여 개별 행 데이터를 출력하게 바꾼다.

최종 코드문

-- 코드를 작성해주세요
SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR,
(
    SELECT MAX(SIZE_OF_COLONY) FROM ECOLI_DATA
    WHERE YEAR(DIFFERENTIATION_DATE) = YEAR
) - SIZE_OF_COLONY AS YEAR_DEV,
ID
FROM ECOLI_DATA
ORDER BY YEAR, YEAR_DEV

서브쿼리를 통해 연도별 MAX값을 찾아주는게 중요하다.

profile
A Normal Programmer

0개의 댓글