스트림

seongmin·2022년 9월 17일

stream

Java

목록 보기

11/30

스트림

스트림을 이용하면, 선언형으로 데이터 소스를 처리할 수 있다.
람다식으로 요소 처리 코드를 제공한다.

Stream 이 제공하는 대부분의 요소 처리 메서드는 함수형 인터페이스 매개타입을 가지기 때문에 람다식 또는 메서드 참조를 이용해서 요소 처리 내용을 매개값으로 전달할 수 있다.
내부 반복자를 사용하므로 병렬 처리가 쉽다.

외부반복자(external iterator)란 개발자가 코드로 직접 컬렉션의 요소를 반복해서 가져오는 코드 패턴이다. index를 사용하는 for문, Iterator를 이용하는 while문 은 모두 외부 반복자를 이용하는 형태다.

내부 반복자(internal iterator)는 컬렉션 내부에서 요소들을 반복시키고 개발자는 요소당 처리해야할 코드만 제공하는 코드 패턴이다.

내부 반복자를 사용해서 얻는 이점은 컬렉션 내부에서 어떻게 요소를 반복시킬 것인가는 컬렉션에게 맡겨두고, 개발자는 요소 처리 코드에만 집중할 수 있다는 점이다.
중간 연산과 최종 연산을 할 수 있다.

스트림은 컬렉션의 요소에 대해 중간 연산과 최종 연산을 수행할 수 있는데, 중간 연산에서는 매핑, 필터링, 정렬 등을 수행하고 최종 연산에서는 반복, 카운팅, 평균, 총합 등의 집계를 수행할 수 있다.

파이프라인

스트림은 데이터의 필터링, 매핑, 정렬, 그루핑 등의 중간 연산과 합계, 평균, 카운팅, 최대 / 최소값 등의 최종 연산을 파이프라인(pipelines)으로 해결한다.
파이프라인은 여러개의 스트림이 연결되어 있는 구조를 의미한다. 파이프라인에서 최종 연산을 제외하고는 모두 중간 연산 스트림이다.
중간 스트림이 생성될 때 요소들이 바로 중간 연산(필터링, 매핑, 정렬)되는 것이 아니라 최종 연산이 시작되기 전까지는 지연된다. 최종 연산이 시작되면 비로소 컬렉션의 요소가 하나씩 중간 스트림에서 연산되고 최종 연산까지 오게 된다.

스트림생성

stream() 을 사용하면 해당 Collection의 객체를 소스로 하는 Stream을 반환한다.

// List로부터 스트림을 생성
List<String> list = Arrays.asList("a", "b", "c");
Stream<String> listStream = list.stream();
listStream.forEach(System.out::prinln); //스트림의 모든 요소를 출력.

배열의 원소들을 소스로하는 Stream을 생성하기 위해서는 Stream 의 of 메서드 또는 Arrays 의 stream 메서드를 사용한다.

// 배열로부터 스트림을 생성
Stream<String> stream = Stream.of("a", "b", "c"); //가변인자
Stream<String> stream = Stream.of(new String[] {"a", "b", "c"});
Stream<String> stream = Arrays.stream(new String[] {"a", "b", "c"});
Stream<String> stream = Arrays.stream(new String[] {"a", "b", "c"}, 0, 3); //end 범위 미포함

int와 long 그리고 double과 같은 원시 자료형들을 사용하기 위한 특수한 종류의 Stream(IntStream, LongStream, DoubleStream)들도 사용할 수 있으며, Intstream은 range()함수를 사용하여 기존의 for문을 대체할 수 있다.

// 4이상 10미만의 숫자를 갖는 IntStream
IntStream stream = IntStream.range(4, 10);

스트림 사용 시 주의사항

스트림은 데이터 소스로부터 데이터를 읽기만 할 뿐 변경하지 않는다(Read-only).
스트림은 일회용이다. 한 번 사용하면 닫히므로, 필요하다면 새로운 스트림을 만들어야 한다.

중간 연산

중간 연산은 연산 결과를 스트림으로 반환하기 때문에, 연속해서 여러 번 수행할 수 있다.
필터링 filter() distinct()
distinct() : Stream의 요소들에 중복된 데이터가 존재하는 경우, 중복을 제거하기 위해 사용한다.
filter() : Stream에서 조건에 맞는 데이터만을 정제하여 더 작은 컬렉션을 만들어낸다. filter() 메서드에는 매개값으로 조건(Predicate)이 주어지고, 조건이 참이 되는 요소만 필터링한다.

매핑 map()
map은 기존의 Stream 요소들을 대체하는 요소로 구성된 새로운 Stream을 형성하는 연산이다.

map() 메서드는 작업을 하다 보면 일반적인 Stream 객체를 원시 Stream으로 바꾸거나 그 반대로 하는 작업이 필요한 경우에 쓰인다. 반대로 원시 객체는 mapToObject 를 통해 일반적인 Stream 객체로 바꿀 수 있다.

flatMap(): flatMap은 요소를 대체하는 복수 개의 요소들로 구성된 새로운 스트림을 리턴한다. flatMap()과 map()의 차이점은, map()은 스트림의 스트림을 반환하는 반면, flatMap()은 스트림을 반환한다는 것이다.

예를 들면, 전자의 리턴 타입이 Stream이라면, 후자의 리턴 타입은 Stream이 되는 것이다.
정렬 sorted()

Stream의 요소들을 정렬하기 위해서는 sorted를 사용해야 하며, 파라미터로 Comparator를 넘길 수도 있다. Comparator 인자 없이 호출할 경우에는 오름차순으로 정렬이 되며, 내림차순으로 정렬하기 위해서는 Comparator의 reverseOrder 를 이용한다.
연산 결과 확인 peek()
peek(), forEach() 는 요소를 하나씩 돌면서 출력한다는 기능에서는 동일하지만, 동작 방식은 다르다.

peek 은 중간 연산 메서드이고, forEach는 최종 연산 메서드이다.

forEach 는 스트림의 요소를 소모하므로 한 번만 호출할 수 있지만(재호출하려면 새로운 스트림을 생성해야 함), peek 은 중간 연산이므로 하나의 스트림에 여러 번 사용할 수 있다.

peek() 은 주로 연산 중간에 결과를 확인하여 디버깅하고자 할 때 사용한다.

intStream
	.filter(a -> a%2 ==0)
	.peek(n-> System.out.println(n))
	.sum();

최종연산

최종 연산은 연산 결과가 스트림이 아니므로, 한 번만 연산이 가능하다.
연산 결과 확인(forEach())
forEach는 최종 연산 메서드이기 때문에 파이프라인 마지막에서 요소를 하나씩 연산한다.

forEach 값을 출력할 때도 사용하지만, 이메일 발송, 스케줄링 등 리턴 값이 없는 작업에서도 많이 사용한다.

intStream
	.filter(a -> a%2 ==0)
	.forEach(n -> System.out.println(n));

매칭 match()
Stream의 요소들이 특정한 조건을 충족하는지 검사하고 싶은 경우에는 match() 메서드를 이용할 수 있다.

match() 메서드는 함수형 인터페이스 Predicate를 받아서 해당 조건을 만족하는지 검사하고, 검사 결과를 boolean으로 반환한다.

allMatch() : 모든 요소들이 매개값으로 주어진 Predicate의 조건을 만족하는지 조사
anyMatch() : 최소한 한 개의 요소가 매개값으로 주어진 Predicate의 조건을 만족하는지 조사
noneMatch() : 모든 요소들이 매개값으로 주어진 Predicate의 조건을 만족하지 않는지 조사
기본 집계 sum(), count(), average(), max(), min()
집계는 최종 연산 기능으로 요소들을 카운팅, 합계, 평균값, 최대값, 최소값 등으로 연산하여 하나의 값으로 산출하는 것을 의미한다.
reduce()
reduce는 누적하여 하나로 응축(reduce)하는 방식으로 동작한다. 앞의 두 요소의 연산 결과를 바탕으로 다음 요소와 연산한다.

reduce 메서드는 최대 3개의 매개변수를 받을 수 있다.

Accumulator: 각 요소를 계산한 중간 결과를 생성하기 위해 사용
Identity: 계산을 수행하기 위한 초기값
Combiner: 병렬 스트림(Parlallel Stream)에서 나누어 계산된 결과를 하나로 합치기 위한 로직
collect()
Stream의 요소들을 List나 Set, Map, 등 다른 종류의 결과로 수집하고 싶은 경우에는 collect 메서드를 이용할 수 있다.

Optional `<T>`

Optional 클래스는 모든 타입의 객체를 담을 수 있는 래퍼(Wrapper) 클래스이다.
Optional은 NullPointerException(NPE), 즉 null 값으로 인해 에러가 발생하는 현상을 객체 차원에서 효율적으로 방지하고자 도입되었다.
연산 결과를 Optional에 담아서 반환하면, 따로 조건문을 작성해주지 않아도 NPE가 발생하지 않도록 코드를 작성할 수 있다.

public final class Optional<T> {
	private final T value; // T타입의 참조변수
}

Optional 객체를 생성하려면 of() 또는 ofNullable() 을 사용한다. 참조변수의 값이 null 일 가능성이 있다면, ofNullable() 을 사용한다.

Optional<String> opt1 = Optional.ofNullable(null);
Optional<String> opt2 = Optional.ofNullable("123");
System.out.println(opt1.isPresent()); //Optional 객체의 값이 null인지 여부를 리턴한다.
System.out.println(opt2.isPresent());

Optional 타입의 참조변수를 기본값으로 초기화하려면 empty() 메서드를 사용한다.

Optional<String> opt3 = Optional.<String>empty();

Optional 객체에 객체에 저장된 값을 가져오려면 get() 을 사용한다.
참조변수의 값이 null일 가능성이 있다면 orElse() 메서드를 사용해 디폴트 값을 지정할 수 있다.

Optional<String> optString = Optional.of("codestates");
System.out.println(optString);
System.out.println(optString.get());

String nullName = null;
String name = Optional.ofNullable(nullName).orElse("kimcoding");
System.out.println(name);

seongmin

이전 포스트

람다

다음 포스트

스트림

Java

스트림

파이프라인

스트림생성

중간 연산

최종연산

Optional `<T>`

람다

JVM

0개의 댓글

스트림

Java

스트림

파이프라인

스트림생성

중간 연산

최종연산

Optional <T>

람다

JVM

0개의 댓글

Optional `<T>`