[Java] - Set / HashSet / TreeSet

janjanee·2021년 7월 22일

HashSet Java TreeSet java set 자바 set

Java

목록 보기

14/18

HashSet

Set 인터페이스를 구현한 가장 대표적인 컬렉션이다.
Set 인터페이스의 특징인 중복된 요소를 저장하지 않는다.
저장순서를 유지하고자 한다면 LinkedHashSet을 사용해야한다.

💡 HashSet은 내부적으로 HashMap을 이용해서 만들어졌으며, 해싱(hashing) 을 이용해서 구현했기 때문에 붙여진 것이다.

다음은 Set을 사용한 예제이다.

코드

Set<Integer> set = new HashSet<>();
set.add(1);
set.add(1);
set.add(1);
set.add(2);
set.add(2);
set.add(3);
System.out.println(set);

결과

[1, 2, 3]

결과를 보면 중복된 값은 저장되지 않는다.

코드

Set<Integer> set = new HashSet();

for (int i = 0; set.size() < 6; i++) {
    int num = (int)(Math.random() * 45) + 1;
    set.add(num);
}

List<Integer> list = new LinkedList<>(set);
Collections.sort(list);
System.out.println(list);

결과

[3, 12, 16, 26, 33, 44]

위는 HashSet의 특징을 이용해서 로또번호를 만드는 예제이다.
Math.random()을 사용했기 때문에 실행 시 결과는 매번 다르다.
번호를 크기 순으로 정렬하기 위해 list로 변경후 Collection.sort()를 사용했다.

코드

Set<Integer> set = new HashSet<>();
int[][] board = new int[5][5];

for (int i = 0; set.size() < 25; i++) {
    set.add((int)(Math.random() * 50) + 1);
}

Iterator<Integer> it = set.iterator();

for (int[] bo : board) {
    Arrays.stream(bo)
            .map(b -> it.next())
            .mapToObj(next -> (next < 10 ? "  " : " ") + next)
            .forEach(System.out::print);
    System.out.println();
}

결과

  2  3  8  9 10
 11 12 14 15 16
 21 22 23 26 27
 28 31 32 35 37
 39 44 46 48 49

1~50 사이의 숫자를 25개 골라서 '5x5' 빙고판을 만드는 예제이다.
Math.random()을 사용했기 때문에 실행할 때 마다 결과가 다르지만
여러번 실행해보면 같은 숫자가 비슷한 위치에 나오는 사실을 발견할 수 있다.
이유는 HashSet은 저장된 순서를 보장하지 않고 자체적인 저장방식에 따라 순서가 결정되기 때문이다.

코드

public class HashSetEx {
    public static void main(String[] args) {
        Set<Person> set = new HashSet<>();

        set.add(new Person("Lee", 20));
        set.add(new Person("Lee", 20));

        System.out.println(set);
    }
}

class Person {
    String name;
    int age;

    Person(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String toString() {
        return name + ":" + age;
    }
}

결과

[Lee:20, Lee:20]

위의 예제에서 name과 age가 같으면 두 인스턴스를 같은 것으로 인식해서 Set에 하나의 데이터를 넣고 싶다면 어떻게 해야할까?

-> equals()와 hashCode()를 오버라이딩 하면 된다.

class Person {
    String name;
    int age;

    ...

    @Override
    public boolean equals(Object o) {
        if (o instanceof Person) {
            Person tmp = (Person) o;
            return name.equals(tmp.name) && age == tmp.age;
        }
        return false;
    }

    public int hashCode() {
        return Objects.hash(name, age);
    }
}

오버라이딩을 통해 작성된 hashCode() 는 다음의 세 가지 조건을 만족해야한다.

실행 중인 애플리케이션 내의 동일한 객체에 대해서 여러 번 hashCode()를 호출해도
동일한 int값을 반환해야한다. 하지만, 실행시마다 동일한 int값을 반환할 필요는 없다.
(단, equlas 메소드의 구현에 사용된 멤버변수의 값이 바뀌지 않았다고 가정)
equals 메소드를 이용한 비교에 의해서 true를 얻은 두 객체에 대해 각각 hashCode() 를 호출해서
얻은 결과는 반드시 같아야 한다.
equals 메소드를 호출했을 때 false를 반환하는 두 객체는 hashCode() 호출에 대해 같은 int값을
반환하는 경우가 있어도 괜찮지만, 해싱(hashing)을 사용하는 컬렉션의 성능을 향상시키기 위해서는
다른 int값을 반환하는 것이 좋다.

TreeSet

이진 검색 트리(binary search tree) 라는 자료구조의 형태로 데이터를 저장
이진 검색 트리의 성능을 향상시킨 'Red Black tree'로 구현
중복된 데이터의 저장을 허용하지 않고, 정렬된 위치에 저장하므로 저장순서를 유지하지 않음
정렬된 순서를 유지 하기 때문에 단일 값 검색, 범위검색(range search)에 매우 빠름
저장위치를 찾아서 저장하고, 삭제할 경우 트리 일부를 재구성하므로 LinkedList보다 데이터 추가/삭제 시간이 더 소요
Array, LinkedList에 비해 검색과 정렬기능이 뛰어남

이진검색트리?

모든 노드는 최대 두 개의 자식노드를 가진다.

왼쪽 자식노드의 값은 부모노드 값보다 작고 오른쪽 자식노드의 값은 부모노드 값보다 크다.

노드 추가/삭제에 시간이 걸린다.

검색(범위검색)과 정렬에 유리하다.

중복된 값을 저장하지 못한다.

다음은 TreeSet을 사용한 예제이다.

코드

Set<Integer> set = new TreeSet<>();

for (int i = 0; set.size() < 6; i++) {
        int num = (int)(Math.random() * 45) + 1;
        set.add(num);
}

System.out.println(set);

결과

[2, 6, 13, 16, 23, 40]

위의 HashSet 로또예제와 다르게 TreeSet은 저장할 때 이미 정렬하기 때문에 따로 정렬할 필요가 없다.

코드

TreeSet<String> set = new TreeSet<>();

String from = "b";
String to = "d";

set.add("abc");
set.add("apple");
set.add("banana");
set.add("bowl");
set.add("box");
set.add("cat");
set.add("cow");
set.add("dry");
set.add("drill");
set.add("email");
set.add("entry");
set.add("file");
set.add("feed");

System.out.println(set);
System.out.println("range search: from " + from + " to " + to);
System.out.println("result1 : " + set.subSet(from, to));

결과

[abc, apple, banana, bowl, box, cat, cow, drill, dry, email, entry, feed, file]
range search: from b to d
result1 : [banana, bowl, box, cat, cow]

subSet() 메소드를 이용하여 특정 범위를 검색할 수 있다.
위의 예제는 b~d 범위를 검색하는데 d는 포함되지 않아서 b~c로 시작하는 문자열이 검색된다.

코드

TreeSet<Integer> set = new TreeSet<>();
int[] score = {88, 95, 70, 30, 50, 60, 100, 10, 47};

for (int s : score) {
    set.add(s);
}

System.out.println("60 미만 : " + set.headSet(60));
System.out.println("60 이상 : " + set.tailSet(60));

결과

60 미만 : [10, 30, 47, 50]
60 이상 : [60, 70, 88, 95, 100]

headSet() 메소드와 tailSet() 메소드를 이용해서 특정값 보다 크거나 작은 값을 구할 수 있다.

References

남궁성, 『자바의 정석』, 도우출판(2016)

janjanee

얍얍 개발 펀치

이전 포스트

[Java] - Iterator / Comparator / Comparable

다음 포스트