이것은 자바다 16장(스트림과 병렬처리)

min seung moon·2021년 4월 1일

1

이것이자바다 13 ~

목록 보기

5/5

1. 스트림 소개

01. 스트림이란?

자바 8부터 추가된 컬렉션(배열 포함)의 저장 요소를 하나씩 참조
람다식(함수적-스타일(functional-style))으로 처리할 수 있도록 해주는 반복자

02. 반복자 스트림

03. 스트림의 특징

Iterator와 비슷한 역할 하는 반복자
람다식으로 요소 처리 코드 제공
- 대부분의 요소처리 메소드는 함수적 인터페이스 매개 타입
내부 반복자 사용하므로 병렬처리 쉬움
- 컬렉션 내부에서 요소들 반복 시킴
- 개발자는 요소당 처리해할 코드만 제공
내부 반복자와 외부 반복자의 비교
스트림은 중간 처리와 최종 처리가 가능

2. 스트림의 종류

01. 스트림의 종류

자바 8부터 새로 추가
java.util.stream 패키지에 스트림(stream)API존재
BaseStrem
- 모든 스트림에서 사용가능한 공통 메소드(직접 사용X)
Stream - 객체 요소 처리
IntStream, LongStream, DoubleStream은 각각 기본 타입인 int, long, double 요소 처리
스트림 인터페이스의 구현 객체(p.790~792)
- 주로 컬렉션과 배열에서 얻음
- 소스로부터 스트림 구현 객체 얻는 경우

02. 파일로부터 스트림 얻기

Files의 정적 메소드인 lines()와 BufferedReader의 lines()메소드 이용
문자 파일 내용을 스트림 통해 행 단위로 읽고 콘솔에 출력
- 예제 793p

03. 디렉토리로부터 스트림 얻기

Files의 정적 메소드인 list() 이용
디렉토리 내용(서브 디렉토리 또는 파일 목록)을 스트림 통해 읽고 콘솔에 출력

3. 스트림 파이프 라인

01. 리덕션(Reduction)

대량의 데이터를 가공해 축소하는 것
데이터의 합계, 평균값, 카운팅, 최대값, 최소값
컬렉션의 요소를 리덕션의 결과물로 바로 집계할 수 없을 경우에는?
- 집계하기 좋도록 필터링, 매핑, 정렬, 그룹핑 등의 중간 처리 필요
  -> 스트림 파이프 라인의 필요성

02. 파이프라인

여러 개의 스트림이 연결되어 있는 구조
파이프라인에서 최종 처리를 제외하고는 모두 중간 처리 스트림

03. 중간 처리와 최종 처리

Stream 인터페이스는 필터링, 매핑, 정렬 등의 많은 중간 처리 메소드 가짐
메소드들은 중간 처리된 스트림 리턴
스트림에서 다시 중간 처리 메소드 호출해 파이프라인 형성
EX) 회원들 중 남자 회원들의 나이 평균 구하기(p.795 ~ 797)

04. 중간 처리 메소드와 최종 처리 메소드

스트림이 제공하는 중간 처리용 메소드 - 리턴 타입이 스트림
스트림이 제공하는 최종 처리용 메소드
- 리턴 타입이 기본 타입이거나 OptionalXXX

4. 필터링

01. 필터링 이란?

중간 처리 기능으로 요소 걸러내는 역할
필터링 메소드인 distinct()와 filter() 메소드
- 모두 스트림이 가지고 있는 공통 메소드
distinct() 메소드 - 중복을 제거하는 기능
- Stream의 경우 Object.equals(Object)가 true
  - 동일한 객체로 판단해 중복 제거
- IntStream, LongStream, DoubleStream은 동일값일 경우 중복 제거
filter()메소드
- 매개값으로 주어진 Predicate가 true를 리턴하는 요소만 필터링

5. 매핑

01. 매핑(mapping)

중간 처리 기능으로 스트림의 요소를 다른 요소로 대체하는 작업
flatMapXXX()메소드
- 요소를 대체하는 복수 개의 요소들로 구성된 새로운 스트림 리턴
- flatMapXXX() 메소드의 종류
mapXXX() 메소드
- 요소를 대체하는 요소로 구성된 새로운 스트림 리턴

02. asDoubleStream(), asLongStream, boxed()메소드

6. 정렬

01. 정렬

스트림은 요소가 최종 처리되기 전에 중간 단계에서 요소를 정렬
최종 처리 순서 변경 가능
요소를 정렬하는 메소드

7. 루핑

01. 루핑(looping)

요소 전체를 반복하는 것
peek()
- 중간 처리 메소드
- 중간 처리 단계에서 전체 요소를 루핑하며 추가 작업하기 위해 사용
- 최종처리 메소드가 실행되지 않으면 지연
  - 반드시 최종 처리 메소드가 호출되어야 동작
forEach()
- 최종 처리 메소드
- 파이프라인 마지막에 루핑하여 요소를 하나씩 처리
- 요소를 소비하는 최종 처리 메소드
  - sum()과 같은 다른 최종 메소드 호출 불가

8. 매칭

01. 매칭이란?

최종 처리 단계에서 요소들이 특정 조건에 만족하는지 조사하는 것
allMatch() 메소드
- 모든 요소들이 매개값으로 주어진 Predicate의 조건을 만족하는지 조사
anyMatch()메소드
- 최소한 한 개의 요소가 매개값으로 주어진 Predicate조건을 만족하는지 조사
noneMatch() 메소드
- 모든 요소들이 매개값으로 주어진 Predicate의 조건을 만족하지 않는지 조사

9. 기본 집계

01. 집계(Aggregate)

최종 처리 기능으로 요소들을 처리해 카운팅, 합계, 평균값, 최대값, 최소값 등과 같이 하나의 값으로 산출하는 것
집계는 대량의 데이터를 가공해서 축소하는 리덕션(Reduction)
스트림이 제공하는 기본 집계
스트림이 제공하는 기본 집계

02. Optional 클래스

Optional, OptionalDouble, OptionalInt, OptionalLong 클래스
저장하는 값의 타입만 다를 뿐 제공하는 기능은 거의 동일
단순히 집계 값만 저장하는 것이 아님
집계 값이 존재하지 않을 경우 디폴트 값을 설정 가능
집계 값을 처리하는 Consumer도 등록 가능
Optional 클래스들이 제공하는 메소드들

10. 커스텀 집계

sum(), average(), count(), max(), min() 이용
- 기본 집계 메소드 이용
reduce() 메소드
- 프로그램화해서 다양한 집계 결과물 만들 수 있도록 제공

11. 수집

01. 수집 기능

요소들을 필터링 또는 매핑 한 후 요소들을 수집하는 최종 처리 메소드인 collect()
필요한 요소만 컬렉션으로 담을 수 있음
요소들을 그룹핑한 후 집계(리덕션)

02. 필터링한 요소 수집

Stream의 collect(Collector<T,A,R>collector)메소드
- 필터링 또는 매핑된 요소들을 새로운 컬렉션에 수집하고, 이 컬렉션 리턴

03. 매개값인 Collector(수집기 p. 819~822)

어떤 요소들 어떤 컬렉션에 수집할 것인지 결정
Collector의 타입 파라미터 T는 요소
A는 누적기(accumulator)
R은 요소가 저장될 컬렉션
- 해석하면 T요소를 A 누적기가 R에 저장한다는 의미
Collectors 클래스의 정적 메소드

04. 사용자 정의 컨테이너에 수집하기(p. 823 ~ 826)

스트림은 요소들을 필터링, 또는 매핑해 사용자 정으 ㅣ컨테이너 객체에 수집할 수 있도록
이를 위한 추가적인 collector() 메소드

05. 요소를 그룹핑해서 수집(p.826 ~ 830)

collect()를 호출시 Collectors의 groupingBy() 또는 groupingByConcurrent()가 리턴하는 Collector를 매개값 대입
- 컬렉션의 요소들을 그룹핑해서 Map 객체 생성

06. 그룹핑 후 매핑 및 집계(p.831 ~ 834)

Collectors.groupingBy()메소드
- 그룹핑 후, 매핑이나 집계(평균, 카운팅, 연결, 최대, 최소, 합계)를 할 수 있도록 두 번째 매개값으로 Collector를 가질 수 있는 특성

12. 병렬 처리

01. 병렬 처리(Parallel Operation)

멀티코어 CPU 환경에 쓰임
하나의 작업을 분할해서 각각의 코어가 병렬적 처리하는 것
병렬 처리의 목적은 작업 처리 시간을 줄이기 위한 것
자바 8부터 요소를 병렬 처리할 수 있도록 하기 위해 병렬 스트림 제공

02. 동시성(Concurrency)과 병렬성(Parallerlism)

동시성 - 멀티 작업을 위해 멀티 스레드가 번갈아 가며 실행하는 성질
- 싱클 코어 CPU를 이용한 멀티 작업
  - 병렬적으로 실행되는 것처럼 보임
  - 실체는 번갈아 가며 실행하는 동시성 작업
병렬성 - 멀티 작업 위해 멀티 코어 이용해서 동시에 실행하는 성질

03. 동시성과 병렬성의 비교

04. 병렬성의 종류

데이터 병렬성
- 전체 데이터를 쪼개어 서브 데이터들로 만든 뒤 병렬 처리해 작업을 빨리 끝내는 것
- 자바8에서 지원하는 병렬 스트림은 데이터 병렬성을 구현한 것
- 멀티 코어의 수많은 대용량 요소를 서브 요소들로 나누고
- 각각의 서브 요소들을 분리된 스레드에서 병렬처리
  - ex) 쿼드 코어(Quad Core) Cpu일 경우 4개의 서브 요소들로 나누고, 4개의 스레드가 각각의 요소들을 병렬처리
작업 병렬성
- 작업 병렬성은 서로 다른 작업을 병렬 처리하는 것
- EX) 웹 서버(Web Server)
  - 각각의 브라우저에서 요청한 내용을 개별 스레드에서 병렬로 처리

05. 포크 조인 프레임워크

런타임 시 포크조인 프레임워크 동작
포크 단계에서는 전체 데이터를 서브 데이터로 분리
서브 데이터를 멀티 코어에서 병렬로 처리
조인 단계에서는 서브 결과를 결합해서 최종 결과 도출

06. 포크 조인 프레임워크의 원리

ForkJoinPool 사용해 작업 스레드 관리

07 병렬 스트림 생성

코드에서 포크조인 프레임워크 사용해도 병렬처리 가능
병렬 스트림 이용할 경우 백그안우에서 포크조인 프레임워크 동작
- 매우 쉽게 구현해 사용 ㄱ능
병렬 스트림을 얻는 메소드
- parallelStream() 메소드
  - 컬렉션으로부터 병렬 스트림을 바로 리턴
- parallel() 메소드
  - 순차 처리 스트림 병렬 처리 스트림으로 변환해서 리턴

08. 병렬 처리가 정삭적으로 이루어질 때 CPU의 상태

쿼드 코어 CPU

09. 병렬처리 성능

병렬 처리에 영향을 미치는 3가지 요인
- 요소의 수와 요소당 처리 시간
  - 요소 수가 적고 요소당 처리 시간 짧으면 순차 처리가 빠름
- 스트림 소스의 종류
  - ArrayList, 배열은 인덱스로 요소 관리 -> 병렬처리가 빠름
- 코어(Core)의 수 - 싱글 코어의 경우 순차 처리가 빠름

아직까지는 코린이!

이전 포스트

이것은 자바다 15장(컬렉션 프레임워크 별도)

0개의 댓글