상근이는 세계적인 소프트웨어 회사 기글에서 일한다. 이 회사의 가장 큰 특징은 자유로운 출퇴근 시간이다. 따라서, 직원들은 반드시 9시부터 6시까지 회사에 있지 않아도 된다.
각 직원은 자기가 원할 때 출근할 수 있고, 아무때나 퇴근할 수 있다.
상근이는 모든 사람의 출입카드 시스템의 로그를 가지고 있다. 이 로그는 어떤 사람이 회사에 들어왔는지, 나갔는지가 기록되어져 있다. 로그가 주어졌을 때, 현재 회사에 있는 모든 사람을 구하는 프로그램을 작성하시오.
첫째 줄에 로그에 기록된 출입 기록의 수 n이 주어진다. (2 ≤ n ≤ 106) 다음 n개의 줄에는 출입 기록이 순서대로 주어지며, 각 사람의 이름이 주어지고 "enter"나 "leave"가 주어진다. "enter"인 경우는 출근, "leave"인 경우는 퇴근이다.
회사에는 동명이인이 없으며, 대소문자가 다른 경우에는 다른 이름이다. 사람들의 이름은 알파벳 대소문자로 구성된 5글자 이하의 문자열이다.
현재 회사에 있는 사람의 이름을 사전 순의 역순으로 한 줄에 한 명씩 출력한다.
예제 입력
4
Baha enter
Askar enter
Baha leave
Artem enter
예제 출력
Askar
Artem
import java.util.*;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
int n = scanner.nextInt();
scanner.nextLine(); //개행 문자 처리
Set<String> setN = new HashSet<>();
for(int i=0; i<n; i++){
String name = scanner.next();
String state = scanner.next();
if(!setN.contains(name) && state.equals("enter"))
setN.add(name);
else if(setN.contains(name) && state.equals("leave"))
setN.remove(name);
}
//사전 역순으로 정렬하기 위해 List로
List<String> listN = new ArrayList<>(setN);
Collections.sort(listN, Collections.reverseOrder());
for(String names : listN)
System.out.println(names);
}
}
처음 이 문제를 풀 때는 무심코 List로 접근하였으나 결과적으로 시간 초과가 발생했다. 따라서 이번 포스팅에서는 시간초과 원인 분석과 HashSet 최적화 방법에 대해 정리하고자 한다.
List<String> listN = new ArrayList<>();
for (int i = 0; i < n; i++) {
String name = scanner.next();
String state = scanner.next();
if (!listN.contains(name) && state.equals("enter"))
listN.add(name);
else if (listN.contains(name) && state.equals("leave"))
listN.remove(name);
}
❗ 문제점
contains()와 remove() 모두 내부적으로 equals() 비교로 list를 처음부터 끝까지 훑어야 함
→ list.contains(name)와 list.remove(name)는 각각 O(n) 시간 소요
이걸 총 n번 반복 → 전체 시간복잡도는 O(n²)
n이 100만일 경우, 최대 10¹²번 연산 → 시간초과 발생
📌 포인트 요약
| 자료구조 | contains() / remove() 시간복잡도 |
|---|---|
| ArrayList | O(n) (선형 탐색) |
| HashSet | O(1) 평균 (해시 기반 탐색) |
Set<String> setN = new HashSet<>();
for (int i = 0; i < n; i++) {
String name = scanner.next();
String state = scanner.next();
if (!setN.contains(name) && state.equals("enter"))
setN.add(name);
else if (setN.contains(name) && state.equals("leave"))
setN.remove(name);
}
🧐 그럼 왜
HashSet만 바꿨는데 이렇게 큰 차이가 날까?
입력 범위가 최대 10⁶ (100만)이기 때문에:
List사용 시: 약 1,000,000 × 1,000,000 =10¹²번 연산 (시간초과)
HashSet사용 시: 약 1,000,000 × O(1) =10⁶번 연산 (1초 이내 가능)
✅ 개선된 점
| 연산 | ArrayList | HashSet |
|---|---|---|
| contains() | O(n) | O(1) |
| remove() | O(n) | O(1) |
| 전체 시간복잡도 | O(n²) | O(n) |
입력이 많은 경우, ArrayList 대신 HashSet 사용하면 성능 향상 효과가 크다.
HashSet은 탐색, 삽입, 삭제 모두 평균 O(1)로 동작한다.
알고리즘 문제 풀 땐 자료구조 선택이 곧 성능 최적화다!