[SQL_Q]대장균의 크기에 따라 분류하기 2 (using NTile)

Hyunjun Kim·2025년 10월 26일
0

SQL

목록 보기
87/90

https://school.programmers.co.kr/learn/courses/30/lessons/301649

ntile 을 사용했다.

문제

문제 설명
대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.
다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column_nameTypeNullable
IDINTEGERFALSE
PARENT_IDINTEGERTRUE
SIZE_OF_COLONYINTEGERFALSE
DIFFERENTIATION_DATEDATEFALSE
GENOTYPEINTEGERFALSE

최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.

문제
대장균 개체의 크기를 내름차순으로 정렬했을 때 상위 0% ~ 25% 를 'CRITICAL', 26% ~ 50% 를 'HIGH', 51% ~ 75% 를 'MEDIUM', 76% ~ 100% 를 'LOW' 라고 분류합니다. 대장균 개체의 ID(ID) 와 분류된 이름(COLONY_NAME)을 출력하는 SQL 문을 작성해주세요. 이때 결과는 개체의 ID 에 대해 오름차순 정렬해주세요 . 단, 총 데이터의 수는 4의 배수이며 같은 사이즈의 대장균 개체가 서로 다른 이름으로 분류되는 경우는 없습니다.

예시
예를 들어 ECOLI_DATA 테이블이 다음과 같다면

IDPARENT_IDSIZE_OF_COLONYDIFFERENTIATION_DATEGENOTYPE
1NULL102019/01/015
2NULL22019/01/013
311002020/01/014
42162020/01/014
52172020/01/016
641012021/01/0122
761012022/01/0123
8612022/01/0127

기준에 의해 분류된 대장균들의 ID는 다음과 같습니다.

CRITICAL (상위 0% ~ 25%) : ID 6, ID 7
HIGH (상위 26% ~ 50%) : ID 3, ID 5
MEDIUM (상위 51% ~ 75%) : ID 1, ID 4
LOW (상위 76% ~ 100%) : ID 2, ID 8

따라서 결과를 ID 에 대해 오름차순 정렬하면 다음과 같아야 합니다.

IDCOLONY_NAME
1MEDIUM
2LOW
3HIGH
4MEDIUM
5HIGH
6CRITICAL
7CRITICAL
8LOW

내 풀이

with tiles as (
    select id, 
    Ntile(4) over (order by SIZE_OF_COLONY ) as tile
    from ECOLI_DATA
)
select id,
case 
    when tile = 1 then "LOW"
    when tile = 2 then "MEDIUM"
    when tile = 3 then "HIGH"
    when tile = 4 then "CRITICAL"
end as COLONY_NAME
from tiles 
order by 1

내 풀이2

SELECT 
    ID,
    CASE NTILE(4) OVER (ORDER BY SIZE_OF_COLONY)
        WHEN 1 THEN 'LOW'
        WHEN 2 THEN 'MEDIUM'
        WHEN 3 THEN 'HIGH'
        WHEN 4 THEN 'CRITICAL'
    END AS COLONY_NAME
FROM ECOLI_DATA
ORDER BY ID;
profile
Data Analytics Engineer 가 되

0개의 댓글