Effective Java Item 06

Dong yeong Kim·2022년 7월 5일
0

EffectiveJava

목록 보기
6/14

6. 불필요한 객체 생성을 피하라

안녕하세요, 이번 포스팅은 조금 중요한 내용인 것 같습니다. (물론 다른 아이템도 중요합니다..)
바로 불필요한 객체 생성을 피하라는 것인데요.

바로 예시를 통해 알아보도록 하겠습니다.


똑같은 기능의 객체를 매번 생성하는 것 보다, 객체 하나를 재사용하는 편이 좋은 경우가 많습니다. 특히 불변 객체(Item. 17)는 언제든 재사용할 수 있습니다.

아래 코드는, 억지스러운 예시이지만 절대 하지말아야 할 극단적인 예시입니다.

String s = new String("parrineau");

이 문장은, 실행될 때마다 String 인스턴스를 새로 만듭니다.
정말 완전히 쓸데없는 행위입니다...

String 생서자에 넘겨진 "parrineau" 자체가 이 생성자로 만들어내려는 String과 기능이 모두 같습니다. (그렇죠?)

이 문장이 만약 반복문, 빈번히 호출되는 메서드 레벨로 들어간다면, 쓸데없는 String 인스턴스가 수백만 개 만들어질 수도 있습니다.

모두들 사용하는 것 처럼, 아래 문장이 가장 바람직합니다.

String s = "parrineau";

책에는 처음 설명을 쉽게 풀어나가고자 하기 위해 극단적인 예시를 든 것 같습니다.
위 문장은 새로운 인스턴스를 매번 만드는 대신 하나의 String 인스턴스를 사용합니다. 그리고 이 방식을 사용한다면 같은 가상 머신(JVM)안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장됩니다.


생성자 대신 정적 팩터리 메서드(Item. 1)를 제공하는 불변 클래스에서는 불필요한 객체 생성을 피할 수 있습니다. 예를 들어 Boolean(String) 생성자 대신, Boolean.valueOf(String) 팩터리 메서드를 사용하는 것이 좋습니다.
(새로 알게 된 사실인데, 이 생성자는 자바 9에서 deprecated 되었다고 하네요?)

앞의 포스팅에서 언급했지만, 생성자는 호출할 때마다 새로운 객체를 만듭니다. 그러나 팩터리 메서드는 전혀 그렇지 않다는 점이 장점입니다.

물론, 불변 객체만이 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임을 안다면 재사용할 수 있습니다.


모든 개발자들은 비용 절감을 위해, 즉 최적화를 위해 고민합니다.
주로 이런 "비싼 비용"의 객체가 자주 반복되어 생성된다면 부담이 될 것이고, 이것을 다시 재사용하기 원합니다.

하지만 개발자가 만드는 객체 모두 비싼 객체인지 매번 명확히 알기는 힘듭니다.

예를 들어, 주어진 문자열이 유효한 로마숫자인지 확인하는 메서드를 작성한다고 가정하겠습니다. 아래는 책에 나온 예시, Regex를 사용하여 활용한 예시입니다.

package item6;

public class Item6Main {

    static boolean isRomanNumeral(String s) {
        return s.matches("^(?=.)M*(C[MD]|D?C{0,3})" + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
    }
}

아주 머리를 잘 싸매서 정규표현식을 작성했다고 가정합시다.
이 방식의 문제는 String.matches 메서드를 사용하는 데 있습니다.
이는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않습니다.
(앞의 Stirng 인스턴스 생성의 극단적인 예시를 참고하면 이해가 쉬울 것 같습니다.)

이 메서드의 내부에서 만드는 정규표현식용 Pattern 인스턴스는, 한 번 쓰고 버려져서 곧바로 가비지 컬렉션(GC)의 대상이 됩니다. Pattern은 입력받은 정규표현식에 해당하는 유한 상태 머신(finite state machine)을 만들기 때문에, 인스턴스 생성 비용이 높습니다.

성능 개선을 위해, 필요한 정규표현식을 표현하는(불변인) Pattern 인스턴스 클래스를 클래스 초기화(정적 초기화) 과정에서 직접 생성해 캐싱해두고, 나중에 이 메서드가 호출될 때마다 재사용하는 것이 좋습니다.

package item6;

import java.util.regex.Pattern;

public class Item6Main {

    private static final Pattern ROMAN = Pattern.compile("^(?=.)M*(C[MD]|D?C{0,3})" + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$")

    static boolean isRomanNumeral(String s) {
        return ROMAN.matcher(s).matches();
    }
}

isRomanNumeral이 빈번히 호출되는 상황에서 성능을 상당히 끌어올릴 수 있습니다.
예를 들어 길이가 8인 문자열을 입력했을 때, 개선 전과 후는 6.5배 정도 성능 차이가 난다고 합니다.

성능 뿐만아니라, 코드 자체도 좀 더 명확해진 것을 알 수 있습니다.
Pattern 인스턴스를 따로 빼서 만들어, ROMAN이라는 이름을 주어 좀 더 명확해졌기 때문입니다.

개선된 이 클래스는 메서드를 한 번도 호출하지 않는다면 ROMAN 필드는 쓸데없이 초기화된 꼴일 수 있습니다.
지연 초기화(lazy initialization, item. 83)로 불필요한 초기화를 없앨 수는 있지만, 코드를 복잡하게 만들고 성능은 크게 개선되지 않아 권고하진 않습니다. (item. 67)


만약 객체가 불변임을 보장할 수 있다고 합시다.
그럼 이 객체는 재사용해도 안전합니다. 하지만 훨씬 덜 명확하거나, 심지어 직관에 반대되는 상황도 있습니다.

어댑터(view)의 경우 실제 작업은 뒷단 객체에 위임하고, 자신은 제2의 인터페이스 역할을 해주는 객체입니다. 어댑터는 뒷단 객체만 관리하면 됩니다. 즉, 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 만들어지면 충분합니다.

또한, Map 인터페이스의 keySet메서드는 Map 객체 안의 키 전부를 담은 Set 뷰를 반환합니다. keySet를 호출할 때마다 새로운 Set 인스턴스가 만들어지리라 생각할 수 있지만, 사실은 매번 같은 Set 인스턴스를 반환할수도 있습니다.
반환된 Set인스턴스가 일반적으로 가변이더라도 반환된 인스턴스들은 기능적으로 똑같습니다. 즉, 반환한 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀝니다. 모두가 똑같은 Map 인스턴스를 대변하기 때문입니다.

정리하자면, keySet메서드가 뷰 객체를 여러 개 만들어도 상관은 없지만, 그럴 필요도 없고 이득도 없다는 것입니다.


불필요한 객체를 만들어내는 또 다른 예로, 오토박싱을 들 수 있습니다.
아시다시피, 오토박싱은 기본 타입과 박싱된 기본 타입을 섞어 쓸 때, 자동으로 상호 변환해주는 기능입니다.

오토박싱은 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 애매하게 하지만, 완전히 없애주는 것은 아닙니다.(item. 61)

아래 예시를 보겠습니다.

    static long sum() {
        Long sum = 0L;
        for (long i = 0; i < Integer.MAX_VALUE; i++) {
            sum += i;
        }
        return sum;
    }

결과를 제대로 반환하는 코드입니다. 하지만 제대로 구현했을 때보다 훨씬 느립니다.
겨우 문자 하나 때문에 말입니다, 찾으셨나요?

바로 sum 변수를 long이 아닌 Long으로 선언해서 불필요한 인스턴스가 약 231개나 만들어진 것입니다. (sum += i)
단순히 sum의 타입을 long으로만 바꿔주면 약 10배 이상 성능개선을 볼 수 있습니다.

박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 조심해야합니다.


책에서는, 이번 아티엠을 "객체 생성은 비싸니 피해야 한다."라고 오해하지 말라고 합니다.
특히나 요즘의 JVM에서는 작은 객체를 생성하고 회수하는 일이 크게 부담되지 않는다고 합니다.

프로그램의 명확성, 간결성, 기능을 위해서 객체를 추가로 생성하는 것이라면 일반적으로 좋은 일이라는 뜻입니다.

아주 무거운 객체가 아닌 다음에야 단순히 객체 생성을 피하고자 커스텀 pool을 만들 필요는 없습니다. 물론 DB의 Connection Pool처럼 생성 비용이 비싼 경우 재사용 하는 편이 나을 수 있지만, 자체 객체 풀은 코드를 헷갈리게 만들고, 메모리 사용량을 늘려 성능을 떨어뜨립니다.

-> 요즘 JVM 가비지 컬렉터는 상당이 잘 최적화되었다고 합니다 ㅎㅎ..

Item 50의 방어적 복사와 대조적이라고 하는데, 이번 아이템이 "기존 객체를 재사용해야 한다면 새로운 객체를 만들지 마라" 라면, Item 50은 "새로운 객체를 만들어야 한다면, 기존 객체를 재사용하지 마라"입니다.

방어적 복사가 필요한 상황에서 객체를 재사용했을 때의 피해가, 필요 없는 객체를 반복 생성했을 때의 피해보다 훨씬 크다는 사실을 기억합시다.

방어적 복사에 실패하면, 버그와 보안 구멍으로 이어지지만, 불필요한 객체 생성은 그저 코드 형태와 성능에만 영향을 줍니다.
(Item 50 포스팅에서 구체적으로 다루도록 하겠습니다.)


회고

오토박싱.. 아주 흥미로운 내용이 있었습니다.
말 그대로 기본 타입와 박싱 기본 타입을 자동으로 변환해주는 편리한 기능이라고 생각했는데(물론 편리한 기능입니다.) 남용하여 사용하는 일이 없어야겠고, 지금 당장 제 코드를 뜯어 고치러 가야겠습니다..

profile
날 것의 기술 '불'로그

0개의 댓글