컬렉션 프레임워크(Collection Framework)

김수민·2023년 3월 12일
0

백엔드 부트캠프

목록 보기
20/52

컬렉션 프레임워크

  • 컬렉션: 여러 데이터의 집합.
  • 컬렉션 프레임워크: 컬렉션을 다루는 데에 있어 편리한 메서드들을 미리 정의해놓은 것
    - 특정 자료 구조에 데이터를 추가하고, 삭제하고, 수정하고, 검색하는 등의 동작을 수행하는 편리한 메서드를 제공해줌

컬렉션 프레임워크의 구조

  • List
    - 데이터의 순서가 유지되며, 중복저장이 가능한 컬렉션을 구현
    - Array List, Vector, Stack, LinkedList 등
  • Set
    - 데이터의 순서가 유지되지 않으며, 중복저장이 불가능한 컬렉션을 구현
    - HashSet, TreeSet 등
  • Map
    - 키(key)와 값(value)의 쌍으로 데이터를 저장하는 컬렉션을 구현
    - 데이터의 순서가 유지되지 않으며, 키는 값을 식별하기 위해 사용되므로 중복 저장이 불가능하지만, 값은 중복저장이 가능함
    - HashMap, HashTable, TreeMap, Properties 등

List와 Set는 서로 공통점이 많아 Collection이라는 인터페이로 묶임. 즉, 이 둘의 공통점이 추출되어 추상화된 것이 Collection이라는 인터페이스.

Collection 인터페이스

기능리턴 타입메소드설명
객체 추가booleanadd(Object o)/addAll(Collection c)주어진 객체 및 컬렉션의 객체들을 컬렉션에 추가함
객체 검색booelancontains(Object o)/containsAll(Collection c)주어진 객체 및 컬렉션이 저장되어 있는지 여부를 리턴
Iteratorierator()컬렉션의 iterator를 리턴
booleanequals(Object o)컬렉션이 동일한지 여부를 확인
booleanisEmpty()컬렉션이 비어있는지 여부를 확인
intsize()저장되어 있는 전체 객체 수를 리턴
객체 삭제voidclear()컬렉션에 저장된 모든 객체를 삭제
booleanremove(Object o)/removeAll(Collection c)주어진 객체 및 컬렉션을 삭제하고 성공 여부를 리턴
booleanretainAll(Collection c)주어진 컬렉션을 제외한 모든 객체를 컬렉션에서 삭제하고, 컬렉션에 변화가 있는지의 여부를 리턴
객제 변환Object[]toArray()컬렉션에 저장된 객체를 객체배열(Object [])로 반환
Object[]toArray(object[] a주어진 배열에 컬렉션의 객체를 저장해서 반환함

List

  • 배열과 같이 객체를 일렬로 늘어놓은 구조를 가지고 있음
  • 객체를 인덱스로 관리하기 때문에 객체를 저장하면 자동으로 인덱스가 부여되고, 인덱스로 객체를 검색, 추가, 삭제할 수 있는 등의 여러 기능을 제공
기능리턴타입메서드설명
객체 추가voidadd(int index, Object element)주어진 인덱스에 객체를 추가
booleanaddAll(int index, Collection c)주어진 인덱스에 컬렉션을 추가
Objectset(int index, Object element)주어진 위치에 객체를 저장
객체 검색Objectget(int index)주어진 인덱스에 저장된 객체를 반환
intindexOf(Object o)/lastIndexOf(Object o)순방향/역방향으로 탐색하여 주어진 객체의 위치를 반환
ListIteratorlistIterator()/listIterator(int index)List의 객체를 탐색할 수 있는 ListIterator 반환/ 주어진 index부터 탐색할 수 있는 LastIterator 반환
ListsubList(int fromindex, int toIndex)fromIndex부터 toIndex에 있는 객체를 반환
객체 삭제Objectremove(int index)주어진 인덱스에 저장된 객체를 삭제하고 삭제된 객체를 반환
booleanremove(Object o)주어진 객체를 삭제
객체 정렬voidsort(Comparator c)주어진 비교자(comparator)로 List를 정렬

List인터페이스를 구현한 클래스로는 ArrayList, Vector, LinkedSet, Stack 등이 있음.

ArrayList

  • ArrayList: List 인터페이스를 구현한 클래스로, 컬렉션 프레임워크에서 가장많이 사용 됨.
  • ArrayList에 객체를 추가하면 객체가 인덱스로 관리된다는 점에서 배열과 유사
    - 배열은 생성될 때 크기가 고정되며, 크기를 변경할 수 없음
    - ArrayList는 저장 용량을 초과하여 객체들이 추가되면, 자동으로 저장용량이 늘어나게 됨
    리스트 계열 자료구조의 특성을 이어받아 데이터가 연속적으로 존재함. (= 데이터의 순서를 유지함)
  • ArrayList에 객체를 추가하면 인덱스 0부터 차례대로 저장됨. 특정 인덱스의 객체를 제거하면, 바로 뒤 인덱스부터 마지막 인덱스까지 모두 앞으로 1씩 당겨짐
    -> 빈번한 객체 삭제와 삽입이 일어나는 곳에서는 ArrayList보다는 LinkedList를 사용하는 것이 바람직.

LinkedList

  • LinkedList 컬렉션: 데이터를 효율적으로 추가, 삭제, 변경하기 위해 사양함
  • 배열에는 모든 데이터가 연속적으로 존재하지만, LinkedList에는 불연속적으로 존재하며 이 데이터는 서로 연결(link)되어 있음

    LinkedList의 각 요소(node)들을 자신과 연결된 이전 요소 및 다음 요소의 주소값과 데이터로 구성되어 있음.
  • 데이터를 삭제하려면 삭제하고자 하는 요소의 이전 요소가 삭제하고자 하는 요소의 다음 요소를 참조하도록 변경하면 됨. (링크를 끊어주는 방식) 배열처럼 데이터를 이동하기 위해 복사할 필요가 없기 때문에 처리 속도가 훨씬 빠름.
  • 데이터를 추가할 때에도 새로운 요소를 추가하고자 하는 위치의 이전 요소와 다음 요소 사이에 연결해주면 됨. 즉, 이전 요소가 새로운 요소를 참조하고, 새로운 요소가 다음 요소를 참조하게 만드는 것.

ArrayList와 LinkedList 차이


ArrayList에서 데이터를 추가하는 상황을 나타낸 그림.

  • ArrayList의 강점
  1. 데이터를 순차적으로 추가하거나 삭제하는 경우
    • 순차적으로 추가한다는 것은 0번 인덱스에서부터 데이터를 추가하는 것을 의미
    • 순차적으로 삭제한다는 것은 마지막 인덱스에서부터 데이터를 삭제한다는 것을 의미
  2. 데이터를 읽어들이는 경우
    • 인덱스를 통해 바로 데이터에 접근할 수 있으므로 검색이 빠름
  • ArrayList의 약점
  1. 중간에 데이터를 추가하거나, 중간에 위치하는 데이터를 삭제하는 경우
    • 추가 또는 삭제 시, 해당 데이터의 뒤에 위치한 값을을 뒤로 밀어주거나 앞으로 당겨주어야 함.
  • LinkedList의 강점
  1. 중간에 위치하는 데이터를 추가하거나 삭제하는 경우
    • 데이터를 중간에 추가하는 경우, Prev나 Next의 주소값만 변경하면 되므로, 다른 요소들을 이동시킬 필요가 없음.

결론: 데이터의 잦은 변경이 예상된다면 LinkedList를, 데이터의 개수가 변하지 않는다면 ArrayList를 사용

Iterator

  • Iterator(반복자): 컬렉션에 저장된 요소들을 순차적으로 읽어오는 역할
  • Collection 인터페이스에 정의된 iterator()를 호출하면, Iterator 타입의 인스턴스가 반환됨
메서드설명
hasNext()읽어올 객체ㅏ 남아있으면 true를 리턴하고, 없으면 false를 리턴함.
next()컬렉션에서 하나의 객체를 읽어옴. 이 때, next()를 호출하기 전에 hasNext()를 통해 읽어올 다음 요소가 있는지 먼저 확인해야함.
remove()next()를 통해 읽어온 객체를 삭제함. next()를 호출한 다음에 remove()를 호출해야 함
ArrayList<String> list = ...;
Iterator<String> iterator = list.iterator();

while(iterator.hasNext()){        // 다음 객체가 있다면
	String str = iterator.next();   // 객체를 읽어오고,
	if(str.equals("str과 같은 단어")){ // 조건에 부합한다면
		iterator.remove();            // 해당 객체를 컬렉션에서 제거합니다. 
	}
}

Set

-Set: 요소의 중복을 허용하지 않고, 저장 순서를 유지하지 않는 ㅓㅋㄹ렉션
예. HashSet, TreeSet
-Set 인터페이스에 정의된 메서드

기능리턴 타입메서드설명
객체 추가booleanadd(Object o)주어진 객체를 추가하고, 성공하면 true를, 중복 객체면 false를 반환
객체 검색booleancontains(Object o)주어진 객체가 Set에 존재하는지 확인
booleanisEmpty()Set이 비어있는지 확인
IteratorIterator()저장된 객체를 하나씩 읽어오는 반복자를 리턴
intsize()저장되어 있는 전체 객체의 수를 리턴
객체 삭제voidclear()Set에 저장되어져 있는 모든 객체를 삭제
booleanremove(Object o)주어진 객체를 삭제

HashSet

  • Set 인터페이스를 구현한 가장 대표정인 컬렉션 클래스
  • Set 인터페이스의 특성을 그대로 물려받았으므로 중복된 값을 허용하지 않으며, 저장 순서를 유지하지 않음
  • HashSet에 값을 추가할 때 해당 값이 중복된 값인지 판단하는 방법
  1. add(Object o)를 통해 객체를 저장하고자 함
  2. 이 때, 저장하고자 하는 객체의 해시코드를 hashCode() 메서드를 통해 얻어냄
  3. Set이 저장하고 잇는 모든 객체들의 해시코드를 hashCode() 메서드로 얻어냄
  4. 저장하고자 하는 객체의 해시코드와, Set에 이미 저장되어져 있던 객체들의 해시코드를 비교하여 같은 해시코드가 있는지 검사함
    a. 이 때 만약 같은 해시코드를 가진 객체가 존재한다면 5번으로 넘어감
    b. 같은 해시코드를 가진 객체가 존재하지 않는다면, Set에 객체가 추가되며 add(Object o) 메서드가 true를 리턴함
  5. equals() 메서드를 통해 객체를 비교함
    a. true가 리턴된다면 중복 객체로 간주되어 Set에 추가되지 않으며 add(Object o)false를 리턴함
    b. false가 리턴된다면 Set에 객체가 추가되며, add(Object o)메서드가 true를 리턴함
import java.util.*;

public class Main {
    public static void main(String[] args) {

				// HashSet 생성
        HashSet<String > languages = new HashSet<String>();

				// HashSet에 객체 추가
        languages.add("Java"); 
        languages.add("Python");
        languages.add("Javascript");
        languages.add("C++");
        languages.add("Kotlin");
        languages.add("Ruby");
        languages.add("Java"); // 중복

				// 반복자 생성하여 it에 할당
        Iterator it = languages.iterator();

				// 반복자를 통해 HashSet을 순회하며 각 요소들을 출력
        while(it.hasNext()) {
            System.out.println(it.next());
        }
    }
}

입력한 순서대로 출력되지 않고, "Java"를 두 번 추가했지만 한 번만 저장됨.

TreeSet

  • TreeSet: 이진 탐색 트리 형태로 데이터를 저장. 데이터의 중복 저장을 허용하지 않고 저장 순서를 유지하지 않는 Set의 인터페이스의 특징은 그대로 유지됨
    - 이진 탐색 트리(Binary Search Tree)란 하나의 부모 노드가 최대 두 개의 자식 노드와 연결되는 이진 트리(Binary Tree)의 일종으로, 정렬과 검색에 특화된 자료 구조
    • 최상위 노드를 '루트'라고 함
    • 모든 왼쪽 자식의 값이 로트나 부모보다 작고, 모든 오른쪽 자식의 값이 루트나 부모보다 큰 값을 가지는 특징이 있음

import java.util.TreeSet;

public class TreeSetExample {
    public static void main(String[] args) {

				// TreeSet 생성
        TreeSet<String> workers = new TreeSet<>();

				// TreeSet에 요소 추가
        workers.add("Lee Java");
        workers.add("Park Hacker");
        workers.add("Kim Coding");

        System.out.println(workers);
        System.out.println(workers.first());
        System.out.println(workers.last());
        System.out.println(workers.higher("Lee"));
        System.out.println(workers.subSet("Kim", "Park"));
    }
}

요소를 추가하기만 했음에도 불구하고, 자동으로 사전 편찬 순에 따라 오름차순으로 정렬되었음. -> TreeSet의 기본 정렬 방식이 오름차순이기 떄문.

Map

  • Map 인터페이스: 키(key)와 값(Value)으로 구성된 객체를 저장하는 구조.
  • 이 객체를 Entry객체라고 하는데, 이 Entry 객체는 키와 값을 각각 Key 객체와 Value 객체로 저장함.
  • 키는 중복 저장될 수 없지만 값은 중복 저장이 가능함
    - 키의 역할이 값을 식별하는 것이기 때문
    - 기존에 저장된 키와 동일한 키로 값을 저장하면 기존의 값이 새로운 값으로 대치됨
  • Map 인터페이스를 구현한 클래스에서 공통적으로 사용 가능한 메서드
기능리턴 타입메서드설명
객체 추가Objectput(Object key, Obejct value)주어진 키로 값을 저장함. 해당 키가 새로운 키일 경우 null을 리턴, 동일한 키가 있을 경우에는 기존의 값을 대체하고 대체되기 이전의 값을 리턴함
객체 검색booleancontainsKey(Object key)주어진 키가 있으면 true, 없으면 false를 리턴
booleancontainsValue(Object value)주어진 값이 있으면 true, 없으면 false를 리턴
SetentrySet()키와 값의 쌍으로 구성된 모든 Map.Entry 객체를 Set에 담아서 리턴
Objectget(Object key)주어진 키에 해당하는 값을 리턴
booleanisEmpty()컬렉션이 비어 있는지 확인
SetkeySet()모든 키를 Set 객체에 담아서 리턴
intsize()저장된 모든 값을 Collection에 담아서 리턴
Collectionvalues()저장된 모든 값을 Collection에 담아서 리턴
객체 삭제voidclear()모든 Map.Entry(키와 값)을 삭제
Objectremove(Object key)주어진 키와 일치하는 Map.Entry를 삭제하고 값을 리턴

HashMap

  • HashMap: Map 인터페이스를 구현한 대표적인 클래스
  • 해시 함수를 통해 '키'와 '값'이 저장되는 위치를 결정하므로, 사용자는 그 위치를 알 수 없고, 삽입되는 순서와 위치 또한 관계가 없음
  • 해싱(Hashing)을 사용하기 때문에 많은 양의 데이터를 검색하는 데 있어서 뛰어난 성능
  • Map.Entry 인터페이스에서 사용되는 메서드
리턴 타입메서드설명
booleanequals(Object o)동일한 Entry 객체인지 비교
ObjectgetKey()Entry객체의 Key객체를 반환
ObjectgetValue()Entry 객체의 Value 객체를 반환
inthashCode()Entry객체의 해시코드를 반환
ObjectsetValue(Object value)Entry 객체의 Value 객체를 인자로 전달한 value객체로 바꿈

HashMap을 생성할 때에는 키와 값의 타입을 따로 지정해주어야 함.

HashMap<String, Integer> hashmap = new HashMap<>();
  • Map은 키와 값을 쌍으로 저장하기 때문에 iterator()를 직접 호출할 수 없음. 그 대신 keySet()이나 entrySet() 메서드를 이용해 Set형태로 반환된 컬렉션에 iterator()를 호출하여 반복자를 만든 후 반복자를 통해 순회할 수 있음.

Hashtable

Hashtable은 HashMap과 내부구조가 동일하며 사용 방법 또한 매우 유사. HashMap이 Hashtable의 새로운 버전.

import java.util.*;

public class HashtableExample {
    public static void main(String[] args){

        Hashtable<String, String> map = new Hashtable<String, String>();

        map.put("Spring", "345");
        map.put("Summer", "678");
        map.put("Fall", "91011");
        map.put("Winter", "1212");

        System.out.println(map);

        Scanner scanner = new Scanner(System.in);

        while (true) {
            System.out.println("아이디와 비밀번호를 입력해 주세요");
            System.out.println("아이디");
            String id = scanner.nextLine();

            System.out.println("비밀번호");
            String password = scanner.nextLine();

            if (map.containsKey(id)) {
                if (map.get(id).equals(password)) {
                    System.out.println("로그인 되었습니다.");
                    break;
                } 
                else System.out.println("비밀번호가 일치하지 않습니다. ");
            } 
            else System.out.println("입력하신 아이디가 존재하지 않습니다.");
        }
    }
}

컬렉션 클래스 정리

0개의 댓글