HashSet의 내부 동작 방식과 중복 제거 메커니즘

chaewon·2025년 4월 21일

[코드잇 스프린터] 위클리 페이퍼

목록 보기

4/16

Java에서 중복을 제거하고 싶을 때 가장 먼저 떠오르는 자료구조는 바로 HashSet이다.
내부적으로는 어떻게 동작할까?

HashSet은 데이터를 저장할 때 HashMap을 활용한다.
실제로는 다음과 같이 동작한다.


Set<String> set = new HashSet<>();
set.add("apple");  // 내부적으로는 map.put("apple", DUMMY_VALUE)

저장할 때, 값은 HashMap의 key로 저장됨

value에는 항상 동일한 더미 객체가 사용됨

두 단계로 중복 여부를 판단한다.

먼저 객체의 해시값으로 동일한 버킷인지 확인한다.

같은 버킷에 들어온 경우, equals()로 실제 같은 객체인지 비교한다.


Set<String> set = new HashSet<>();
set.add("hashtest");
set.add("hashtest");  // 중복이라 추가되지 않음

즉, hashCode가 같고 equals도 true인 경우 → 중복으로 간주해서 추가되지 않는다.

HashSet은 내부적으로 HashMap을 사용하여 구현됨

중복 제거 과정은 hashCode() → equals() 순서로 이루어짐

평균 시간 복잡도는 O(1) → 성능 우수