[프로그래머스] 상품을 구매한 회원 비율 구하기 - SQL

Donghyun·2024년 8월 5일
0

Code Kata - SQL

목록 보기
34/62
post-thumbnail

링크: https://school.programmers.co.kr/learn/courses/30/lessons/131534

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_IDGENDERAGEJOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.

Column nameTypeNullable
USER_IDINTEGERFALSE
GENDERTINYINT(1)TRUE
AGEINTEGERTRUE
JOINEDDATEFALSE

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

Column nameTypeNullable
ONLINE_SALE_IDINTEGERFALSE
USER_IDINTEGERFALSE
PRODUCT_IDINTEGERFALSE
SALES_AMOUNTINTEGERFALSE
SALES_DATEDATEFALSE

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.


문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 회원 수)을 년, 월 별로 출력하는 SQL문을 작성해주세요. 상품을 구매한 회원의 비율은 소수점 두번째자리에서 반올림하고, 전체 결과는 년을 기준으로 오름차순 정렬해주시고 년이 같다면 월을 기준으로 오름차순 정렬해주세요.


예시

예를 들어 USER_INFO 테이블이 다음과 같고

USER_IDGENDERAGEJOINED
11262021-06-01
2NULLNULL2021-06-25
30NULL2021-06-30
40312021-07-03
51252022-01-09
61332022-02-14

ONLINE_SALE 이 다음과 같다면

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
115412022-01-01
21322022-01-25
343412022-01-30
4625332022-02-03
523122022-02-09
653512022-02-14
755712022-02-18

2021년에 가입한 회원은 USER_ID가 1, 2, 3, 4 인 회원들로 총 4명 입니다. ONLINE_SALE 테이블에서 해당 회원들에 대한 판매 데이터는 다음과 같습니다.

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
115412022-01-01
21322022-01-25
343412022-01-30
523122022-02-09

그러므로 년, 월 별로 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 구하고 결과를 정렬하면 다음과 같아야 합니다.

YEARMONTHPURCHASED_USERSPUCHASED_RATIO
2022120.5
2022210.3

문제풀이

이 문제를 풀 때 2021년에 가입한 회원 중 상품을 구매한 회원수2021년에 가입한 전체 회원 수 이 둘을 어떻게 나눠야 할지가 첫 번째 고민이었다.

2021년에 가입한 전체 회원 수는 USER_INFO 테이블에서 JOINED 의 년도가 2021년인 것을 찾으면 되고

2021년에 가입한 회원 중 상품을 구매한 회원수는 ONLINE_SALE 테이블에서 USER_ID 가 위의 조건에 맞는 그 갯수를 구하면 되니까 WHERE 절에서 서브쿼리를 사용해주면 될 거 같다.

근데 여기서 또 두 조건에 맞게 테이블을 새로 만들어서 JOIN 시키는 방법을 해야할지 어떻게 해야할지 두 번째 고민이 생겼다.

한참을 고민하던 중 SELECT 절에서 서브쿼리를 사용하는 방법이 생각났다.

  • SELECT 절에서의 서브쿼리는 하나의 열처럼 사용되므로 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 구할 때 사용할 수 있을거 같다.

최종코드

SELECT
    YEAR(SALES_DATE) YEAR,
    MONTH(SALES_DATE) MONTH,
    COUNT(DISTINCT USER_ID) PURCHASED_USERS,
    ROUND(COUNT(DISTINCT USER_ID) / (SELECT COUNT(*) 
                                     FROM USER_INFO
                                     WHERE YEAR(JOINED) = '2021'), 1) PUCHASED_RATIO
FROM ONLINE_SALE
WHERE USER_ID IN( SELECT USER_ID 
                  FROM USER_INFO
                  WHERE YEAR(JOINED) = '2021') 
GROUP BY MONTH
ORDER BY 1 ASC, 2 ASC;

설명

메인궈리 FROM, WHERE, GROUP BY

FROM ONLINE_SALE
WHERE USER_ID IN( SELECT USER_ID 
                  FROM USER_INFO
                  WHERE YEAR(JOINED) = '2021')
GROUP BY 2
  • ONLINE_SALE 테이블에서
  • USER_ID 가 서브쿼리에 해당하고
    • 서브쿼리
      • USER_INFO 테이블에서
      • 가입한 날짜의 년도가 2021년인
      • USER_ID
  • 판매일의 월 을 기준으로 GROUP BY

메인쿼리 SELECT 절

SELECT
    YEAR(SALES_DATE) YEAR,
    MONTH(SALES_DATE) MONTH,
    COUNT(DISTINCT USER_ID) PURCHASED_USERS,
    ROUND(COUNT(DISTINCT USER_ID) / (SELECT COUNT(*) 
                                     FROM USER_INFO
                                     WHERE YEAR(JOINED) = '2021'), 1) PUCHASED_RATIO
  • 판매일의 년도
  • 판매일의 월
  • 중복을 제거한 USER_ID 의 갯수를 COUNT 한 PURCHASED_USERS
  • 중복을 제거한 USER_ID 의 갯수를 서브쿼리를 사용해 2021년에 가입한 전체 회원수로 나눠준다.
    • 서브쿼리
      • USER_INFO 테이블에서
      • 가입 년도가 2021인
      • 갯수를 COUNT
  • 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 소수점 두번째 자리에서 반올림

메인쿼리 ORDER BY

ORDER BY 1 ASC, 2 ASC;
  • 년을 기준으로 오름차순 정렬, 년이 같다면 월을 기준으로 오름차순 정렬
profile
데이터분석 공부 일기~!

0개의 댓글