DAY15 - 데이터 그룹화

은나현·2023년 2월 10일

[프로젝트 중심] 자바 개발 & 빅데이터 분석 전문가 양성과정

목록 보기

24/88

자료 값의 개수를 세는 등의 목적으로 이용하는 distinct 함수는 중복 자료를 제거해 버리기 때문에 집계함수(count, sum, max...)와 함께 사용할 수 없다.
group by 함수는 데이터를 그룹핑해서 그 결과를 가져오므로 집계함수와 짝을 이루어 사용할 수 있다.
- DEPARTMENT_ID 값이 같은 자료들을 그룹화하여 가져오는 예시
```
		SELECT 	DEPARTMENT_ID 
		FROM 	EMPLOYEES e 
		GROUP BY DEPARTMENT_ID 
		;
```
- DEPARTMENT_ID 값이 같은 각 그룹의 SALARY값 합계를 가져오는 예시
```
		SELECT 		DEPARTMENT_ID , SUM(SALARY) 
		FROM 		EMPLOYEES e 
		GROUP BY 	DEPARTMENT_ID 
		;
```
- GROUP BY 함수에 ,를 사용하면 명시한 열의 순서대로 다중 그룹화가 가능하다.
  - DEPARTMENT_ID 안에서 JOB_ID로 한 번 더 그룹화한 그룹들의 각 그룹 인원수와 SALARY 평균을 가져오는 예시
```
		SELECT 	DEPARTMENT_ID	,	JOB_ID 
			,	COUNT(JOB_ID)	, 	AVG(SALARY) 
		FROM 	EMPLOYEES e 
		GROUP BY DEPARTMENT_ID ,	JOB_ID 
		ORDER BY DEPARTMENT_ID ,	JOB_ID 
		;
```
  - ORDER BY 함수도 같은 방식으로 나열해서 사용할 수 있다.