왼쪽 그림: Hash Function의 역할. 임의 길이 데이터를 고정길이 데이터로 전환.
오른쪽 그림 : buckets라고 하는 칸에는 key인 사람의 전화번호(value)가 있다.
-> 즉, key값을 hash function에 넣어 얻은 hashes를 배열의 인덱스로 쓰는 테이블을 hash table이라고 한다.
- [key] -> [hash func] -> [hash(==h(key))] - [value(in bucket)] 라는 네 단계를 거친다.
충돌 : 서로 다른 key에 대해 동일한 hash값(index)이 부여된 상황
: 충돌 발생 시 동일한 key에 다른 value를 연결리스트로 연결해 충돌을 해결하는 방법
: 충돌 발생 시 테이블 공간을 탐사해 빈 공간을 찾아나서는 방식
ex) 배열과 해시 테이블 비교
: 10개의 배열에 데이터를 저장하고, 검색할 때 O(10)
: 10개의 데이터 저장공간을 가진 해시 테이블에 데이터를 저장하고, 검색할 때 O(1)
ex) 문제예시 (프로그래머스)
- 완주하지 못한 선수 : 선수이름 (String key) -> 완주여부(Bool value)
- 신고결과 받기 : 게시판 사용자 (String key) -> 신고자들의 목록 (Array value)
- 위장 : 옷의 종류(String key) -> 옵션 개수 (integer value)
문제설명
수많은 마라톤 선수들이 마라톤에 참여하였습니다. 단 한 명의 선수를 제외하고는 모든 선수가 마라톤을 완주하였습니다.
마라톤에 참여한 선수들의 이름이 담긴 배열 participant와 완주한 선수들의 이름이 담긴 배열 completion이 주어질 때, 완주하지 못한 선수의 이름을 return 하도록 solution 함수를 작성해주세요.제한사항
- 마라톤 경기에 참여한 선수의 수는 1명 이상 100,000명 이하입니다.
- completion의 길이는 participant의 길이보다 1 작습니다.
- 참가자의 이름은 1개 이상 20개 이하의 알파벳 소문자로 이루어져 있습니다.
- 참가자 중에는 동명이인이 있을 수 있습니다.
입출력 예
participant, completion > return
["leo", "kiki", "eden"]["eden", "kiki"] > "leo"
["marina", "josipa", "nikola", "vinko", "filipa"]["josipa", "filipa", "marina", "nikola"] > "vinko"
["mislav", "stanko", "mislav", "ana"]["stanko", "ana", "mislav"] > "mislav"입출력 예 설명
예제 #1
"leo"는 참여자 명단에는 있지만, 완주자 명단에는 없기 때문에 완주하지 못했습니다.
예제 #2
"vinko"는 참여자 명단에는 있지만, 완주자 명단에는 없기 때문에 완주하지 못했습니다.
예제 #3
"mislav"는 참여자 명단에는 두 명이 있지만, 완주자 명단에는 한 명밖에 없기 때문에 한명은 완주하지 못했습니다.
BEST CODE (해쉬사용)
def solution(participant, completion): answer = '' temp = 0 dic = {} # participant의 hash구조 만들기, hash sum구하기 for part in participant: dic[hash(part)] = part temp += int(hash(part)) # completion의 hash값 빼기 for com in completion: temp -= hash(com) answer = dic[temp] return answer