컬렉션(Collection)이란?
컬렉션(Collection)이란, 데이터의 집합, 그룹을 뜻합니다.
자바에서 컬렉션 프레임워크(collection framework)란 다수의 데이터를 쉽고 효과적으로 처리할 수 있는 표준화된 방법을 제공하는 클래스의 집합을 의미합니다.
즉, 데이터를 저장하는 자료 구조와 데이터를 처리하는 알고리즘을 구조화하여 클래스로 구현해 놓은 것입니다.
이러한 컬렉션 프레임워크는 자바의 인터페이스(interface)를 사용하여 구현됩니다.
다음은 Java 컬렌션 프레임워크의 상속구조를 나타내는 그림입니다.
컬렉션 프레임워크 주요 인터페이스
컬렉션 프레임워크에서는 데이터를 저장하는 자료 구조에 따라 다음과 같은 핵심이 되는 주요 인터페이스를 정의하고 있습니다.
-
List 인터페이스
-
Set 인터페이스
-
Map 인터페이스
이 중에서 List와 Set 인터페이스는 모두 Collection 인터페이스를 상속받지만, 구조상의 차이로 인해 Map 인터페이스는 별도로 정의됩니다.
따라서 List 인터페이스와 Set 인터페이스의 공통된 부분을 Collection 인터페이스에서 정의하고 있습니다.
- List<E> : 순서가 있는 데이터의 집합으로, 데이터의 중복을 허용함.
- 구현 클래스 : Vector, ArrayList, LinkedList, Stack, Queue
- Set<E> : 순서가 없는 데이터의 집합으로, 데이터의 중복을 허용하지 않음.
- 구현 클래스 : HashSet, TreeSet
- Map<K, V> : 키와 값의 한 쌍으로 이루어지는 데이터의 집합으로, 순서가 없음. 이때 키는 중복을 허용하지 않지만, 값은 중복될 수 있음.
- 구현 클래스 : HashMap, TreeMap, Hashtable, Properties
- 컬렉션 클래스
컬렉션 프레임워크에 속하는 인터페이스를 구현한 클래스를 컬렉션 클래스(collection class)라고 합니다.
컬렉션 프레임워크의 모든 컬렉션 클래스는 List와 Set, Map 인터페이스 중 하나의 인터페이스를 구현하고 있습니다.
또한, 클래스 이름에도 구현한 인터페이스의 이름이 포함되므로 바로 구분할 수 있습니다.
Vector나 Hashtable과 같은 컬렉션 클래스는 예전부터 사용해 왔으므로, 기존 코드와의 호환을 위해 아직도 남아 있습니다.
하지만 기존에 사용하던 컬렉션 클래스를 사용하는 것보다는 새로 추가된 ArrayList나 HashMap
클래스를 사용하는 것이 성능 면에서도 더 나은 결과를 얻을 수 있습니다.
Collection 인터페이스
List와 Set 인터페이스의 많은 공통된 부분을 Collection 인터페이스에서 정의하고, 두 인터페이스는 그것을 상속받습니다.
따라서 Collection 인터페이스는 컬렉션을 다루는데 가장 기본적인 동작들을 정의하고, 그것을 메소드로 제공하고 있습니다.
Collection 인터페이스에서 제공하는 주요 메소드는 다음과 같습니다.
- boolean add(E e) : 해당 컬렉션(collection)에 전달된 요소를 추가함. (선택적 기능)
- void clear() : 해당 컬렉션의 모든 요소를 제거함. (선택적 기능)
- boolean contains(Object o) : 해당 컬렉션이 전달된 객체를 포함하고 있는지를 확인함.
- boolean equals(Object o) : 해당 컬렉션과 전달된 객체가 같은지를 확인함.
- boolean isEmpty() : 해당 컬렉션이 비어있는지를 확인함.
- Iterator<E> iterator() : 해당 컬렉션의 반복자(iterator)를 반환함.
- boolean remove(Object o) : 해당 컬렉션에서 전달된 객체를 제거함. (선택적 기능)
- int size() : 해당 컬렉션의 요소의 총 개수를 반환함.
- Object[] toArray() : 해당 컬렉션의 모든 요소를 Object 타입의 배열로 반환함.
List
순서가 있는 데이터의 집합, 데이터의 중복을 허용
LinkedList
- 양방향 포인터 구조로 데이터의 삽입, 삭제가 빈번할 경우 데이터의 위치정보만 수정하면 되기에 유용
- 스택, 큐, 양방향 큐 등을 만들기 위한 용도로 쓰임
Vector
- 과거에 대용량 처리를 위해 사용했으며, 내부에서 자동으로 동기화처리가 일어나 비교적 성능이 좋지 않고 무거워 잘 쓰이지 않음
ArrayList
- 단방향 포인터 구조로 각 데이터에 대한 인덱스를 가지고 있어 조회 기능에 성능이 뛰어남
Set
순서가 없는 데이터의 집합으로, 데이터의 중복을 허용하지 않음.
HashSet
- 가장빠른 임의 접근 속도
- 순서를 예측할 수 없음
TreeSet
Map
키(Key)와 값(Value)의 한 쌍으로 이루어지는 데이터의 집합으로, 순서가 없음.
이때 키는 중복을 허용하지 않지만, 값은 중복될 수 있음.
Hashtable
- HashMap보다는 느리지만 동기화 지원
- null불가
HashMap
- 중복과 순서가 허용되지 않으며 null값이 올 수 있다.
TreeMap
- 정렬된 순서대로 키(Key)와 값(Value)을 저장하여 검색이 빠름
코테 하시면서 많이 쓰시겠네용 부러워요! 잘 읽고 갑니당~~~!!