똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많다.
String s = new String("bikini");
String s = "bikini"; // 이게 낫다는 것
두 번째 코드는 새로운 인스턴스를 매번 만드는 대신 하나의 String 인스턴스를 사용한다. 이 방식을 사용하면 같은 가상 머신 안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다.
생성자 대신 정적 팩토리 메서드를 제공하는 불변 클래스에서는 정적 팩토리 메서드를 사용해 불필요한 객체를 피할 수 있다. 예컨대 Boolean(String) 대신 Boolean.valueOf(String) 팩토리 메서드를 사용하는 것이 좋다. (이는 자바 9 에서 deprecated 되었음)
생성자는 호출할 때마다 새로운 객체를 만들지만, 팩터리 메서드는 전혀 그렇지 않다. 불변 객체만이 아니라 가변 객체라하더라도 사용 중 변경되지 않을 것이라는 것을 안다면 재사용할 수 있다.
생성 비용이 큰 객체도 있는데 이게 반복해서 필요하다면 ‘캐싱’하여 재사용하길 권장한다.
다음은 정규표현식을 활용한 예제다.
static boolean isRomanNumeral(String s) {
return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
+ "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3))$");
}
String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해 사용하긴 적합하지 않다.
이 메서드는 내부에서 만드는 정규표현식용 Pattern 인스턴스를 한 번 쓰고 버려 바로 가비지 컬렉션 대상이 된다. Pattern 클래스는 정규표현식에 해당하는 유한 상태 머신을 만들기 때문에 비용이 높다.
성능을 개선하기 위해서 불변 Pattern 인스턴스 클래스 정적 초기화 과정에서 직접 생성해 캐싱해두고 나중에 isRomanNumeral이 호출될 때마다 재사용해서 쓰는 것이 좋다.
public class RomanNumerals {
private static final Pattern ROMAN = Pattern.compile(
"^(?=.)M*(C[MD]|D?C{0,3})"
+ "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3))$");
static boolean isRomanNumeral(String s) {
return ROMAN.matcher(s).matches();
}
}
이렇게 변경하면 내 컴퓨터에서 길이가 8인 문자열을 입력했을 때 개선 전에는 1.1μs, 개선 후에는 0.17μs의 속도 차이가 난다. 또, Pattern 인스턴스를 끄집어냄으로써 이름이 명시적으로 드러나 코드의 의미를 훨씬 잘 알 수 있다.
하지만, 이렇게 초기화 후 한 번도 쓰지 않는다면 쓸데없는 작업을 한 것이다. isRomanNumeral 메서드가 처음 호출될 떄 필드를 초기화하는 지연초기화(lazy initialization)로 불필요한 초기화를 없앨 수는 있지만, 코드도 복잡해지고 성능개선에도 도움되지 않을 때가 더 많다.
객체가 불변이라면 재사용해도 안전하지만 덜 명확하거나 직관에 반대되는 상황도 있다. 예를들어, 어댑터 같은 경우 실제 작업은 뒷단 객체에 위임하고 자신은 제 2의 인터페이스 역할을 하는 객체로 뒷단 객체만 관리해주면 된다. 즉, 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 만들어지면 된다.
예를들어, Map 인터페이스의 keySet 메서든 Map 객체 안의 키 전부를 담은 Set 뷰를 반환한다. keySet을 호출할 때마다 새로운 인스턴스를 만들어 질 수도 있지만 매번 같은 Set 인스턴스를 반환할지도 모른다.
반환된 Set 인스턴스가 일반적으로 가변이더라도 반환된 인스턴스들은 기능적으로 모두 또같다. 즉, 반환한 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀐다. 모두가 똑같은 Map 인스턴스를 대변하기 때문이다. 따라서 keySet이 뷰 객체를 여러 개 만들어도 상관없지만, 이득은 없다.
@DisplayName(“어댑터 패턴이 적용된 keySet 테스트”)
@Test
void name() {
Map<Integer, String> map = new HashMap<>();
map.put(1, “첫번째”);
map.put(2, “두번째”);
map.put(3, “세번째”);
// keySet 은 view 의 역할을 한다.
Set<Integer> keySet = map.keySet();
assertThat(keySet).contains(1, 2, 3);
// 따라서 뒷단 객체인 map 이 기능을 담당하고 있다.
map.remove(3);
assertThat(keySet).doesNotContain(3);
// view 인 keySet 에서 기능을 동작하려 하면 exception 이 발생한다.
assertThatThrownBy(() -> keySet.add(3))
.isInstanceOf(UnsupportedOperationException.class);
}
오토박싱은 기본 타입과 박싱된 기본 타입을 섞어쓸 때 자동으로 변환해주는 기술로 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주지만, 완전히 없애주는 것은 아니다. 또, 성능에서도 차이가 난다.
private static long sum() {
Long sum =0L;
for(long i = 0; i<= Integer.MAX_VALUE; i++) {
sum += i;
}
return sum;
}
다음 코드는 모든 양의 정수 총합을 구하는 메서드로 int는 long을 사용해 계산하고 있다.
sum 변수를 Long으로 선언해 불필요한 Long 인스턴스 변수가 2^31개나 만들어졌다. 단순히 Long을 long으로 바꿔주면 6초나 빨라진다. 될 수 있으면 박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 주의하자
요즘의 JVM에서는 별다른 일을 하지 않는 작은 객체를 생성하고 회수하는 일이 크게 부담되진 않는다. 오히려, 프로그램의 명확성, 간결성, 기능을 위해 객체를 추가로 생성하는 것이라면 일반적으로 좋은 일이다.
거꾸로 아주 무거운 객체가 아니면 객체 생성을 피하고자 객체 pool을 만들지는 말자. 데이터베이스 연결 같은 경우는 생성 비용이 워낙 비싸기 때문에 재사용하는 것이 좋지만, 자체 객체 풀은 메모리 사용량을 늘리고 성능을 떨어뜨리기 때문이다. 요즘의 JVM의 가비지 컬렉터는 상당히 최적화 되어있어 가벼운 객체용을 다룰 때는 직접 만든 객체 풀보다 훨씬 빠르다.
Item50 에서는 이와 대조적인 새로운 객체를 만들어야 한다면 기존 객체를 재사용하지 마라 라는 주제를 다룰 것이다. 방어적 복사가 필요한 상황에서 객체를 재사용했을 때의 피해가 필요 없는 객체를 반복 생성했을 때의 피해보다 훨씬 크다는 사실을 기억하자. 방어적 복사에 실패하면 버그와 보안구멍이 생성되지만, 불필요한 객체 생성은 단지 코드 형태와 성능에만 영향을 줄 뿐이다.