똑같은 기능의 객체를 매번 생성하기보다는 객체 하나를 재사용하는 편이 나을 때가 많다. 재사용은 빠르고 세련된 방식이다. 특히 불변 객체는 언제든 재사용할 수 있다.
1 | String s = new String("bikini"); | cs |
이 문장은 실행될 때마다 String 인스턴스를 새로 만든다. 이 문장이 반복문이나 빈번히 노출되는 메소드 안에 있다면 쓸데없는 String 인스턴스가 수백만 개 만들어질 수도 있다.
1 | String s = "bikini"; | cs |
이 코드는 새로운 인스턴스를 매번 만드는 대신 하나의 String 인스턴스를 사용한다. 나아가 이 방식을 사용한다면 같은 가상 머신 안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다.
생성자는 호출할 때마다 새로운 객체를 만들지만, 팩토리 메소드는 전혀 그렇지 않기 때문에, 정적 팩토리 메소드를 제공하는 불변 클래스에서는 불필요한 객체 생성을 피할 수 있다. 불변 객체만이 아니라 가변 객체라 해도 사용 중에 변경되지 않을 것임을 안다면 재사용할 수 있다. 생성 비용이 아주 비싼 객체도 더러 있는데, 이런 '비싼 객체'가 반복해서 필요하다면 캐싱하여 재사용하길 권한다. 예를 들어 주어진 문자열이 유효한 로마 숫자인지를 확인하는 메소드를 작성한다고 해보자.
1 2 3 4 | static boolean isRomanNumeral(String s) { return s.matches("^(?=.)M*(C[MD]|D?C{0,3})" + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$"); } | cs |
이 방식의 문제는 String.matches 메소드를 사용한다는 데 있다. String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다. 이 메소드가 내부에서 만드는 정규표현식용 Pattern 인스턴스는, 입력받은 정규표현식에 해당하는 유한 상태 머신(finite state machine)을 만들기 때문에 인스턴스 생성 비용이 높지만, 한 번 쓰고 버려져서 곧바로 가비지 컬렉션 대상이 되기 때문이다.
성능을 개선하려면 필요한 정규표현식을 표현하는 불변인 Pattern 인스턴스를 클래스 초기화(정적 초기화) 과정에서 직접 생성해 캐싱해두고, 나중에 isRomanNumeral 메소드가 호출될 때마다 이 인스턴스를 재사용한다.
1 2 3 4 5 6 7 8 9 | public class RomanNumerals { private static final Pattern ROMAN = Pattern.compile( "^(?=.)M*(C[MD]|D?C{0,3})" + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$"); static boolean isRomanNumeral(String s) { return ROMAN.matcher(s).matches(); } } | cs |
이렇게 개선하면 isRomanNumeral이 빈번히 호출되는 상황에서 성능을 상당히 끌어올릴 수 있다. 또한 개선 전에서는 존재조차 몰랐던 Pattern 인스턴스를 static final 필드로 끄집어내고 이름을 지어주어 코드의 의미가 훨씬 더 잘 드러난다.
객체가 불변이라면 재사용해도 안전함이 명백하지만, 훨씬 덜 명확하거나, 심지어 직관에 반대되는 상황도 있다. 어댑터가 그 예인데, 어댑터는 실제 작업은 뒷단 객체에 위임하고, 자신은 제2의 인터페이스 역할을 해주는 객체다. 예컨대 Map 인터페이스의 keySet 메소드는 Map 객체 안에 키 전부를 담은 Set 뷰를 반환한다. keySet을 호출할 때마다 새로운 Set 인스턴스가 만들어지는 것이 아닌 매번 같은 Set 인스턴스를 반환하기 때문에, 반환된 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀐다. 따라서 keySet이 뷰 객체를 여러 개 만들어도 상관은 없지만, 그럴 필요도 없고 이득도 없다.
오토박싱(auto boxing)은 프로그래머가 기본 타입과 박싱된 기본 타입을 섞어 쓸 때 자동으로 상호 변환해주는 기술이다. 오토박싱은 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주지만, 완전히 없애주는 것은 아니다. 의미 상으로는 별다를 것 없지만 성능에서는 그렇지 않다.
1 2 3 4 5 6 7 | private static long sum() { Long sum = 0L; for (long i = 0; i <= Integer.MAX_VALUE; i++) sum += i; return sum; } | cs |
위 메소드는 long을 사용해 모든 양의 정수의 총합을 구하는 메소드이다. 이 프로그램은 정확한 답을 내기는 하나, 제대로 구현했을 때보다 훨씬 느리다. sum 변수를 long이 아닌 Long으로 선언해서 불필요한 Long 인스턴스가 약 231개나 만들어진 것이다(대략, long 타입인 i가 Long 타입인 sum에 더해질 때마다). 박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 주의하자.
똑같은 기능의 String 객체를 재사용할 때는 새로 생성하기보단 문자열 리터럴을 사용하고, 새로운 인스턴스를 생성자로 만드는 대신 정적 팩토리 메소드로 제공하자. 불필요한 객체를 만들어내는 어탭터와 오토박싱이 의도와 다르게 사용되는 것은 주의해야 한다. 핵심은 객체 생성은 비싸니 피해야 한다기보단, 기존 객체를 재사용해야 한다면 새로운 객체를 만들지 말아야 한다.