[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]
카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.
인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?
물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.
즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.
* [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.
info
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"]
query
["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"]
result
[1,1,1,1,2,4]
지원자 정보를 표로 나타내면 다음과 같습니다.
언어 직군 경력 소울 푸드 점수
java backend junior pizza 150
python frontend senior chicken 210
python frontend senior chicken 150
cpp backend senior pizza 260
java backend junior chicken 80
python backend senior chicken 50
이번 문제를 처음 봤을 때에는 문자열을 리스트로 나누고, 모든 원소들을 체크하는 방식으로 구현하였다. 정확성 테스트는 모두 통과했지만, 효율성 테스트에서 모두 실패하였다. 다른 방식을 고민해보았지만 도저히 생각이 나지 않았다. 우선 초기에 작성한 코드이다.
def solution(info, query):
answer = []
for i in range(len(info)):
info[i]=list(info[i].split())
for i in range(len(query)):
tmp=[]
tmp1=list(query[i].split())
for j in range(len(tmp1)):
if tmp1[j]!="and":
tmp.append(tmp1[j])
query[i]=tmp
info.sort(key=lambda x:int(x[-1]), reverse=True)
for i in range(len(query)):
tmp=0
for j in range(len(info)):
chk=True
if int(info[j][-1])>=int(query[i][-1]):
for k in range(len(info[j])-1):
if query[i][k]=="-" or info[j][k]==query[i][k]:
continue
else:
chk=False
break
else:
break
if chk:
tmp+=1
answer.append(tmp)
return answer
구글링 결과 이분탐색으로 값을 찾아야 한다는 사실을 알게 되었다. 값들을 딕셔너리로 저장하고, 점수를 기준으로 정렬한 후에 이분탐색을 통해 값을 찾는 방식을 이용하여 문제를 해결하였다.
from collections import defaultdict
from itertools import combinations
def lower_bound(begin, end, target_list, target):
if begin>=end:
return begin
mid=(begin+end)//2
if target_list[mid]>=target:
return lower_bound(begin, mid, target_list, target)
else:
return lower_bound(mid+1, end, target_list, target)
def solution(info, query):
answer = []
dict=defaultdict(list)
for i in range(len(info)):
info[i]=info[i].split()
filter=info[i][:-1]
score=int(info[i][-1])
for j in range(len(info[i])):
case=list(combinations([0, 1, 2, 3], j))
for c in case:
tmp=filter.copy()
for idx in c:
tmp[idx]='-'
key=''.join(tmp)
dict[key].append(score)
for value in dict.values():
value.sort()
for q in query:
q=q.replace('and', '')
q=q.split()
target_key=''.join(q[:-1])
target_score=int(q[-1])
cnt=0
if target_key in dict:
target_list=dict[target_key]
idx=lower_bound(0, len(target_list), target_list, target_score)
cnt=len(target_list)-idx
answer.append(cnt)
return answer