카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.
인재영입팀에 근무하고 있는 니니즈
는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?
물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.
즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.
[조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.
import copy
from bisect import bisect_left
import sys
sys.setrecursionlimit(10 ** 6)
key_dict={'cpp':['cpp','-'],'java':['java','-'],'python':['python','-'],
'backend':['backend','-'],'frontend':['frontend','-'],
'junior':['junior','-'],'senior':['senior','-'],
'chicken':['chicken','-'],'pizza':['pizza','-']
}
def make_keys(idx,key,score,info_dict):
key=copy.deepcopy(key)
if idx>3:
if tuple(key) not in info_dict:
info_dict[tuple(key)]=[]
info_dict[tuple(key)].append(score)
return
else:
origin=key[idx]
for i in range(2):
key[idx]=key_dict[key[idx]][i]
make_keys(idx+1,key,score,info_dict)
key[idx]=origin
def solution(info, query):
answer = []
info_dict=dict()
for i in range(len(info)):
split=info[i].split(' ')
key=[]
for j in range(len(split)-1):
key.append(split[j])
score=int(split[-1])
make_keys(0,key,score,info_dict)
for key in info_dict.keys():
info_dict[key].sort()
for q in query:
#문자열 자르기 처리
split=q.split(' and ')
string=split[-1].lstrip(' ').split(' ')
del split[-1]
split.append(string[0])
split.append(string[1])
score=int(split[-1])
key=[]
for i in range(len(split)-1):
key.append(split[i])
if tuple(key) in info_dict:
idx=bisect_left(info_dict[tuple(key)],score)
answer.append(len(info_dict[tuple(key)])-idx)
else:
answer.append(0)
return answer
java backend junior pizza 150
라는 지원자가 있다고 하면 java backend junior pizza
, - backend junior pizza
,java - junior pizza
,....- - - -
과 같은 경우의 수가 가능하다.
총 222*2=16가지이다.
조합 또는 재귀를 활용하여 위와 같은 문자열의 경우의 수를 만들 수 있다.
만든 문자열들을 딕셔너리의 키로하고, 점수를 밸류로 한다.
더 정확히 말하면, 문자열 키 하나에 대해 점수가 여러 개 있을 수 있으므로 점수의 리스트를 밸류로 한다.
import copy
import sys
sys.setrecursionlimit(10 ** 6)
key_dict={'cpp':['cpp','-'],'java':['java','-'],'python':['python','-'],
'backend':['backend','-'],'frontend':['frontend','-'],
'junior':['junior','-'],'senior':['senior','-'],
'chicken':['chicken','-'],'pizza':['pizza','-']
}
def make_keys(idx,key,score,info_dict):
key=copy.deepcopy(key)
if idx>3:
if tuple(key) not in info_dict:
info_dict[tuple(key)]=[]
info_dict[tuple(key)].append(score)
return
else:
origin=key[idx]
for i in range(2):
key[idx]=key_dict[key[idx]][i]
make_keys(idx+1,key,score,info_dict)
key[idx]=origin
def solution(info, query):
answer = []
info_dict=dict()
for i in range(len(info)):
split=info[i].split(' ')
key=[]
for j in range(len(split)-1):
key.append(split[j])
score=int(split[-1])
make_keys(0,key,score,info_dict)
하지만, 우리가 구해야할 것은 [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
이다.
예를 들어 - - - pizza 100
이라는 쿼리가 있다고 하자.
그리고 1.에서 만든 딕셔너리가 다음과 같다고 하자. info_dict[---pizza]=[5만개의 원소]
5만개의 자연수가 있을 때, x점 이상을 찾으려면 완전탐색 (O(n))보다는 이분 탐색(O(Log(n))이 훨씬 효율적인 방법이다.
특히 '하한'(lower bound)알고리즘을 적용하면, 찾는 값과 같거나 큰 값이 처음으로 나타나는 인덱스 (이상)를 얻을 수 있다.
단, 이분 탐색이기 때문에 미리 점수 리스트들을 정렬해 놓아야 한다.
from bisect import bisect_left
def solution(info, query):
answer = []
info_dict=dict()
for i in range(len(info)):
split=info[i].split(' ')
key=[]
for j in range(len(split)-1):
key.append(split[j])
score=int(split[-1])
make_keys(0,key,score,info_dict)
#이분 탐색을 위해 정렬
for key in info_dict.keys():
info_dict[key].sort()
for q in query:
#문자열 자르기 처리
split=q.split(' and ')
string=split[-1].lstrip(' ').split(' ')
del split[-1]
split.append(string[0])
split.append(string[1])
score=int(split[-1])
key=[]
for i in range(len(split)-1):
key.append(split[i])
if tuple(key) in info_dict:
idx=bisect_left(info_dict[tuple(key)],score)
answer.append(len(info_dict[tuple(key)])-idx)
#키가 없을 경우 예외 처리 (런타임 에러 방지)
else:
answer.append(0)
return answer
import copy
from bisect import bisect_left
import sys
sys.setrecursionlimit(10 ** 6)
key_dict={'cpp':['cpp','-'],'java':['java','-'],'python':['python','-'],
'backend':['backend','-'],'frontend':['frontend','-'],
'junior':['junior','-'],'senior':['senior','-'],
'chicken':['chicken','-'],'pizza':['pizza','-']
}
def make_keys(idx,key,score,info_dict):
key=copy.deepcopy(key)
if idx>3:
if tuple(key) not in info_dict:
info_dict[tuple(key)]=[]
info_dict[tuple(key)].append(score)
return
else:
origin=key[idx]
for i in range(2):
key[idx]=key_dict[key[idx]][i]
make_keys(idx+1,key,score,info_dict)
key[idx]=origin
def solution(info, query):
answer = []
info_dict=dict()
for i in range(len(info)):
split=info[i].split(' ')
key=[]
for j in range(len(split)-1):
key.append(split[j])
score=int(split[-1])
make_keys(0,key,score,info_dict)
for q in query:
#문자열 자르기 처리
split=q.split(' and ')
string=split[-1].lstrip(' ').split(' ')
del split[-1]
split.append(string[0])
split.append(string[1])
score=int(split[-1])
key=[]
for i in range(len(split)-1):
key.append(split[i])
if tuple(key) in info_dict:
info_dict[key].sort()
idx=bisect_left(info_dict[tuple(key)],score)
answer.append(len(info_dict[tuple(key)])-idx)
else:
answer.append(0)
return answer
정렬을 미리 했어야 했다. 정렬을 매 반복문 마다 실행하니 시간초과가 났었다.
이분탐색을 위한 정렬을 하는 것은 반복문 들어 가기 전에 미리 하는 게 효율적이다.
import sys
sys.setrecursionlimit(10 ** 6)
Lower Bound : 찾는 값과 같거나 큰 값이 처음으로 나타나는 위치 (이상)
Upper Bound : 찾는 값 보다 큰 값이 처음으로 나오는 위치 (초과)
bisect_left(list, data): 리스트에 데이터를 삽입할 가장 왼쪽 인덱스를 찾는 함수(리스트 내 정렬 순서를 유지) ←Lower Bound에 해당
bisect_right(list, data): 리스트에 데이터를 삽입할 가장 오른쪽 인덱스를 찾는 함수(리스트 내 정렬 순서를 유지) ← Upper Bound에 해당