| 일수 | 일자 | 교과목 | 내용 | 편성시간 |
|---|---|---|---|---|
| 8 | 24/11/29 | 기반기술 | Database | 8 |
실습을 들어가기 전에

mysql에서 제공하는 sample데이터를 Reverse Engineer로 돌리면 ERD를 볼 수 있다.

샘플 데이터를 이용해 미리 주어진 관계를 가지고
: 조회할 데이터 지정한다.
SELECT 속성, 속성, 속성 FROM 테이블이름;
SELECT * FROM customers;
SELECT * FROM customers;
SELECT customerNumber, customerName, country FROM customers;
SELECT 속성, 속성, 속성, FROM 테이블이름 WHERE 조건;
응용
글자를 비교할 때는 글자를 무조건 ''로 묶어주고 숫자는 그냥 작성
SELECT customerNumber, customerName, country FROM customers WHERE country='USA';
DB에서 다르다는 NOT을 사용
SELECT customerNumber, customerName, country FROM customers WHERE NOT country='USA';
= 같은지 비교, > 큰지 비교, < 작은지 비교, <=, >= 등등이 있을 수 있다.
SELECT customerName, creditLimit FROM customers WHERE creditLimit >= 100000;
여러 개의 조건을 같이 사용하는 것도 가능
SELECT customerName, creditLimit FROM customers WHERE country='USA' AND creditLimit >= 100000;
SELECT customerNumber FROM customers WHERE country LIKE '단어';
응용
# a 뒤에 %를 붙이면 a로 시작하는 어떤 나라든 조회
SELECT customerNumber FROM customers WHERE country LIKE 'a%';
# 어디에든 a가 포함되기만 하면 된다면 앞뒤에 붙이기 (알파벳 a가 들어간 모든 나라의 고객 번호 조회)
SELECT customerNumber FROM customers WHERE country LIKE '%a%';
# ASC(오름차순)은 생략되어있다고 생각, DESC 내림차순
SELECT customerNumber, country FROM customers ORDER BY country;
LIMIT 데이터의 수 OFFSET 몇 번째부터
응용
SELECT customerNumber, country FROM customers LIMIT 5;
SELECT customerNumber, country FROM customers LIMIT 3 OFFSET 3;
#다음과 같이 축약해서 쓸 수도 있다.
#LIMIT 몇 번째부터, 데이터의 수
SELECT customerNumber, country FROM customers LIMIT 3, 3;
한 데이터베이스 내의 여러 테이블을 조합하여 하나의 열로 표현한 것

INNER JOIN [합칠 테이블] ON 조인이 될 조건
SELECT * FROM users
INNER JOIN orders ON users.user_id = orders.order_id
LEFT JOIN, RIGHT JOIN도 사용법이 같되, INNER 부분에 LEFT[RIGHT]를 넣어주면 된다.
SELECT * FROM customers INNER JOIN orders ON customers.customerNumber = orders.customerNumber;
처음부터 join을 생각하지 말고, 우선 테이블 목록을 뽑은 다음 조건을 뒤에 조금씩 붙이기
# customerNumber가 customers와 orders 테이블 둘 다에 있으므로 어느 테이블의 customerNumber인지 테이블이름.속성 으로 지정해주기
SELECT customers.customerNumber, customerName, orderNumber
FROM customers
INNER JOIN orders ON customers.customerNumber = orders.customerNumber;
응용
# 회원 테이블과 주문 테이블에서 주문 상태가 Disputed인 회원의 회원 번호, 이름, 주문 번호, 주문 상태를 조회
SELECT customers.customerNumber, customerName, orderNumber, status
FROM customers
INNER JOIN orders ON customers.customerNumber = orders.customerNumber
WHERE status='Disputed';
# LEFT JOIN으로 붙이기
SELECT customers.customerNumber, customerName, orderNumber, status FROM customers
LEFT JOIN orders ON customers.customerNumber = orders.customerNumber
WHERE status='Disputed';
# 런던에서 주문한 고객들의 주문 번호와 고객 이름 조회
# customers의 city, orders의 ordernumber, customers의 customerName
SELECT orders.orderNumber, customers.customerName FROM customers
INNER JOIN orders ON customers.customerNumber = orders.customerNumber
where customers.city='London';

주문한 제품의 수량이 35개 이상인 주문의 주문 번호와 고객 이름
SELECT orders.orderNumber, customers.customerName from customers
INNER JOIN orders on customers.customerNumber = orders.customerNumber
INNER JOIN orderdetails on orderdetails.orderNumber = orderdetails.orderNumber
WHERE orderdetails.quantityOrdered >= 35;

#territory가 apac에서 근무하는 직원이 담당하는 고객의 이름과 고객 번호 조회
SELECT customers.customerName, customers.customerNumber from customers
INNER JOIN employees on employees.employeeNumber = customers.salesRepEmployeeNumber
INNER JOIN offices on employees.officeCode = offices.officeCode
WHERE offices.territory='APAC';


#주문 상태가 Shipped인 주문에 포함된 제품의 이름과 주문한 고객의 이름 조회
SELECT products.productName, customers.customerName from customers
INNER JOIN orders on customers.customerNumber = orders.customerNumber
INNER JOIN orderdetails on orders.orderNumber = orderdetails.orderNumber
INNER JOIN products on products.productCode = orderdetails.productCode
where orders.status='Shipped';

여러 개의 SELECT문의 결과를 한 번에 표헌할 때 사용
각각의 SELECT문으로 선택된 속성의 개수와 타입, 순서가 모두 같아야 한다.
중복된 값은 제거하고 보여준다.
UNION ALL
중복된 값까지 모두 보려면 UNION ALL을 사용
SELECT A AS one, B AS two
FROM TABLE_A
UNION (또는 UNION ALL)
SELECT C AS one, D AS two
FROM TABLE_B
JOIN과의 차이점
JOIN : 새로운 열로 결합한다. (수평결합)
UNION : 새로운 행으로 결합한다. (수직결합)

join 결과 (예시는 inner join)

union 결과
위와 같이, join은 옆에 붙는다면 union은 아래에 붙는다.
SELECT, INSERT, UPDATE, DELETE, SET, DO 문을 사용할 때 해당 쿼리 내부에 또다른 쿼리를 사용하는 것
SELECT a, b FROM T1 WHERE a IN (SELECT a FROM T2 WHERE b=2)
*가급적 서브쿼리는 안 쓰는 게 좋다.
일정한 기능을 수행하는 내용을 미리 만들어 둔 것
사용자는 일정한 기능을 수행하고 싶을 때 함수를 사용하기만 하면 된다.
응용
SELECT SUM(quantityOrdered) FROM orderdetails;

# 총 주문받은 횟수
SELECT COUNT(orderNumber) FROM orders;

#도시 별 고객의 수
SELECT city, COUNT(customerNumber) FROM customers
GROUP BY city;

도시별로 주문한 고객들의 수와 도시 이름을 나타내려고 한다.
SELECT customers.city, count(customers.customerNumber) from customers
inner join orders
on orders.customerNumber = customers.customerNumber
group by customers.city;
SELECT customers.city, count(distinct customers.customerNumber) from customers
inner join orders
on orders.customerNumber = customers.customerNumber
group by customers.city;
이때, 첫 번째와 같이 코드를 짠다면 같은 제품을 여러 번 구매한 고객의 수가 중복되어 집계된다. 이때 중복되는 값을 distinct 함수를 통해 제거할 수 있다.


distinct 하나로 값이 달라진 것을 볼 수 있다.
그 외에도 다양한 내장함수가 존재한다.
# 주문한 제품별 제품의 이름과 고객의 수
select products.productName, count(distinct customers.customerNumber) from products
inner join orderdetails on products.productCode = orderdetails.productCode
inner join orders on orders.orderNumber = orderdetails.orderNumber
inner join customers on customers.customerNumber = orders.customerNumber
group by products.productName;

# territory별 근무하는 직원이 담당하는 고객의 수
SELECT territory, count(customers.customerNumber) from customers
INNER JOIN employees on employees.employeeNumber = customers.salesRepEmployeeNumber
INNER JOIN offices on employees.officeCode = offices.officeCode
group by offices.territory;

집계함수로 뽑은 결과에 조건을 넣고싶을 때 사용
having은 늘 group by와 함께 한다.
# territory별 근무하는 직원 중 담당하는 고객의 수가 30명인 직원
SELECT territory, count(customers.customerNumber) from customers
INNER JOIN employees on employees.employeeNumber = customers.salesRepEmployeeNumber
INNER JOIN offices on employees.officeCode = offices.officeCode
group by offices.territory
HAVING COUNT(customers.customerNumber) > 30;

조건에 부합하는 중고거래 댓글 조회
https://school.programmers.co.kr/learn/courses/30/lessons/164673
오랜 기간 보호한 동물
https://school.programmers.co.kr/learn/courses/30/lessons/59044
보호소에서 중성화한 동물
https://school.programmers.co.kr/learn/courses/30/lessons/59045
있었는데요 없었습니다
https://school.programmers.co.kr/learn/courses/30/lessons/59043
없어진 기록 찾기
https://school.programmers.co.kr/learn/courses/30/lessons/59042
카테고리 별 도서 판매량 집계하기 - 나중에 다시 풀어볼 것
https://school.programmers.co.kr/learn/courses/30/lessons/144855
문제 설명
다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 판매 정보(BOOK_SALES) 테이블입니다.
BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
| Column name | Type | Nullable | Description |
|---|---|---|---|
| BOOK_ID | INTEGER | FALSE | 도서 ID |
| CATEGORY | VARCHAR(N) | FALSE | 카테고리 (경제, 인문, 소설, 생활, 기술) |
| AUTHOR_ID | INTEGER | FALSE | 저자 ID |
| PRICE | INTEGER | FALSE | 판매가 (원) |
| PUBLISHED_DATE | DATE | FALSE | 출판일 |
BOOK_SALES 테이블은 각 도서의 날짜 별 판매량 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.
| Column name | Type | Nullable | Description |
|---|---|---|---|
| BOOK_ID | INTEGER | FALSE | 도서 ID |
| SALES_DATE | DATE | FALSE | 판매일 |
| SALES | INTEGER | FALSE | 판매량 |
문제
2022년 1월의 카테고리 별 도서 판매량을 합산하고, 카테고리(CATEGORY), 총 판매량(TOTAL_SALES) 리스트를 출력하는 SQL문을 작성해주세요.
결과는 카테고리명을 기준으로 오름차순 정렬해주세요.
예시
예를 들어 BOOK 테이블과 BOOK_SALES 테이블이 다음과 같다면
| BOOK_ID | CATEGORY | AUTHOR_ID | PRICE | PUBLISHED_DATE |
|---|---|---|---|---|
| 1 | 인문 | 1 | 10000 | 2020-01-01 |
| 2 | 경제 | 1 | 9000 | 2021-02-05 |
| 3 | 경제 | 2 | 9000 | 2021-03-11 |
| BOOK_ID | SALES_DATE | SALES |
|---|---|---|
| 1 | 2022-01-01 | 2 |
| 2 | 2022-01-02 | 3 |
| 1 | 2022-01-05 | 1 |
| 2 | 2022-01-20 | 5 |
| 2 | 2022-01-21 | 6 |
| 3 | 2022-01-22 | 2 |
| 2 | 2022-02-11 | 3 |
2022년 1월의 도서 별 총 판매량은 도서 ID 가 1 인 도서가 총 3권, 도서 ID 가 2 인 도서가 총 14권 이고, 도서 ID 가 3 인 도서가 총 2권 입니다.
카테고리 별로 판매량을 집계한 결과는 다음과 같습니다.
| CATEGORY | TOTAL_SALES |
|---|---|
| 인문 | 3 |
| 경제 | 16 |
카테고리명을 오름차순으로 정렬하면 다음과 같이 나와야 합니다.
| CATEGORY | TOTAL_SALES |
|---|---|
| 경제 | 16 |
| 인문 | 3 |
풀이
한 번에 풀려고 하기보다는 조금씩 정보를 쪼개서 완성해 나간다.
USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 우선 뽑기SELECT * FROM USER_INFO
INNER JOIN ONLINE_SALE ON USER_INFO.USER_ID = ONLINE_SALE.USER_INFO
WHERE JOINED LIKE '2021-%'
SELECT
DATE_FORMAT(ONLINE_SALE.SALES_DATE, '%Y') AS 'YEAR',
DATE_FORMAT(ONLINE_SALE.SALES_DATE, '%m') AS 'MONTH',
#WHERE절로 2021년에 가입한 회원만 뽑았음을 생각하자
COUNT(DISTINCT U.USER_ID) AS PURCHASED_USERS, #2021년에 가입한 회원 중 상품을 구매한 회원 수
FROM USER_INFO
INNER JOIN ONLINE_SALE ON USER_INFO.USER_ID = ONLINE_SALE.USER_ID
WHERE JOINED LIKE '2021-%'
GROUP BY YEAR, MONTH
# 2021년에 가입한 전체 회원의 수
SELECT COUNT(USER_INFO.USER_ID)
FROM USER_INFO WHERE JOINED LIKE '2021-%'
SELECT
DATE_FORMAT(O.SALES_DATE, '%Y') AS YEAR,
DATE_FORMAT(O.SALES_DATE, '%c') AS MONTH,
COUNT(DISTINCT U.USER_ID) AS PURCHASED_USERS,
ROUND((COUNT(DISTINCT U.USER_ID))/(SELECT COUNT(USER_INFO.USER_ID) FROM USER_INFO WHERE JOINED LIKE '2021%'),1) AS PUCHASED_RATIO
FROM USER_INFO AS U
INNER JOIN ONLINE_SALE AS O
ON U.USER_ID = O.USER_ID
WHERE JOINED LIKE '2021-%'
GROUP BY YEAR, MONTH
ORDER BY YEAR ASC, DATE_FORMAT(O.SALES_DATE, '%m')