[MySQL] 윈도우 함수(2) : 윈도우 함수를 이용해 계산하기

lazy_h·2026년 1월 12일

MySQL 다루기

목록 보기
14/18
post-thumbnail

(※개인 공부 목적의 게시물입니다.)


프로그래머스 > sql > sum, max, min > 연도별 대장균 크기의 편차 구하기

문제 바로가기


<문제설명>

대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.

다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다.

ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column nameTypeNullable
IDINTEGERFALSE
PARENT_IDINTEGERTRUE
SIZE_OF_COLONYINTEGERFALSE
DIFFERENTIATION_DATEDATEFALSE
GENOTYPEINTEGERFALSE

최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.

<문제>

분화된 연도(YEAR), 분화된 연도별 대장균 크기의 편차(YEAR_DEV), 대장균 개체의 ID(ID) 를 출력하는 SQL 문을 작성해주세요.

분화된 연도별 대장균 크기의 편차는 분화된 연도별 가장 큰 대장균의 크기 - 각 대장균의 크기로 구하며, 결과는 연도에 대해 오름차순으로 정렬하고 같은 연도에 대해서는 대장균 크기의 편차에 대해 오름차순으로 정렬해주세요.


<풀이코드>

SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR,
	MAX(SIZE_OF_COLONY) 
    OVER(PARTITION BY YEAR(DIFFERENTIATION_DATE)) - SIZE_OF_COLONY 
    AS YEAR_DEV,
    ID
FROM ECOLI_DATA
ORDER BY YEAR, YEAR_DEV;

<설명>

  • SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR
    • DIFFERENTIATION_DATE 에서 연도만 가져와야 하므로 YEAR() 함수를 사용
    • YEAR() 함수는 데이터 전체를 일일이 처리하며 연도로 변환하기 때문에 특정 날짜를 조회할 땐 속도가 느리고 비효율적이지만, 해당 문제에서는 ECOLI_DATA 테이블의 DIFFERENTIATION_DATE 모든 값의 연도를 추출해서 검색하는 것으로 사용하는 것이 적합함
  • MAX(SIZE_OF_COLONY) 
        OVER(PARTITION BY YEAR(DIFFERENTIATION_DATE)) - SIZE_OF_COLONY 
        AS YEAR_DEV
    • 분화된 연도별 대장균 크기의 편차 = 연도별 가장 큰 대장균의 크기 - 각 대장균의 크기
    • 모든 대장균에 대해서 편차를 구해야하므로 GROUP BY 대신 윈도우 함수 내 PARTITION BY로 연도별 그룹을 지어줌(그래야 모든 행에 대해서 계산이 가능, GROUP BY시 연도별 가장 큰 대장균의 크기 1개만 남음)
    • 연도별 그룹 지어준 뒤, MAX(SIZE_OF_COLONY) 로 가장 큰 대장균의 크기 구하고, SIZE_OF_COLONY를 빼서 편차를 구함
    • AS YEAR_DEV : 계산 결과를 YEAR_DEV 라는 컬럼으로 새로 추가
  • ORDER BY YEAR, YEAR_DEV
    • SELECT 절에서 지정한 별명을 사용해 ORDER BY 정렬가능

profile
fun coding

0개의 댓글