카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.
인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?
물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.
즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.
[조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?
지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.
info 배열의 크기는 1 이상 50,000 이하입니다.
info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
query 배열의 크기는 1 이상 100,000 이하입니다.
query의 각 문자열은 "[조건] X" 형식입니다.
info : ["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"]
query : ["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"]
[1,1,1,1,2,4]
가장 처음 접근했던 방법은 map을 이용해서 각 조건에 따라 info의 index를 저장해주고 score를 별도의 배열에 순서대로 저장해주었다. query에서 조건을 각각 분리하고 점수도 따로 분리해준다음 전체 사람을 담은 배열 (ex) [0, 1, 2, 3, 4, 5])을 생성하고, 각 query에 포함되는 사람의 index을 intersection을 해준다. 예를 들어 backend에 해당하는 값이 [0, 1, 4]일 때, [0, 1, 2, 3, 4, 5]와 intersection을 하게 되면 [0, 1, 4]가 되게 될 것이다. 이를 모든 조건에 대해 intersection을 해주고 나온 결과 중에 score 조건에 일치하는 사람의 개수를 answer에 push 해주었다. 정확성은 100점이었지만, 효율성은 0점이었다.
문제에서 의도한 풀이는 이진 탐색을 이용해서 하는 풀이로, 전체적인 흐름은 다음과 같다. 조건과 점수로 분리한 info를 통해 각각 조건에 대한 조합을 생성해주고 해당 값을 key로 하고 value를 점수로 해서 map에 저장해준다. 예를 들어 "java backend junior pizza 150"인 경우, ["java", "backend", "junior", "pizza"]와 150으로 나누고, 각 조건들을 조합해서 key로 만들어준다. 이때 나올 수 있는 경우의 수는 최대 16개가 될 것이고, "javabackend", "backendpizza", "javajuniorpizza" 등이 나오게 될 것이다. 해당 값을 key로 하고 value를 [150]으로 해준다. 여기서 value를 배열로 처리한 이유는 같은 key를 가지는 사용자가 있다면, 해당 배열에 push해 최종적으로 [150, 230] 등과 같은 형태가 될 수 있도록 해줄 것이다.
이러한 방식을 info에 대해 전체적으로 처리해주면 어떠한 조건이 나오더라도 그에 해당하는 사용자를 key만을 이용해서 찾을 수 있다. 여기서 나온 value들을 전부 오름차순으로 정렬해준다. query에 해당되는 key의 값이 [50, 150, 260]이고 점수 ≥ 150가 조건일 경우, 이진 탐색을 이용해서 해당 조건에 일치하는 사람의 수를 찾을 수 있게 된다.
여기서 이진 탐색을 이용하지 않고 나온 결과에 조건을 해당하는 사용자를 count 해주면 되지 않을까? 라는 생각이 들어서 그에 맞춰서 제출했더니 효율성을 통과할 수 없었다. 그 이유는 배열을 매번 순회하며 점수를 확인하면, 시간 복잡도가 O(K)가 돼서 쿼리가 많거나 지원자 데이터가 많아지면, 전체 시간 복잡도가 급격히 증가한다. 하지만 이진 탐색을 이용하면 info 데이터가 많아도 각 조건 조합의 점수 배열은 정렬된 상태로 유지되고 시간 복잡도가 O(M log K)로 줄어들게 되기 때문이었다.
function solution(info, query) {
const answer = [];
const map = new Map();
const createCombinations = (array, score, start = 0, combination = []) => {
const key = combination.join('');
if (!map.has(key)) map.set(key, []);
map.get(key).push(score);
for (let i = start; i < array.length; i++) {
createCombinations(array, score, i + 1, [...combination, array[i]]);
}
};
for (let i = 0; i < info.length; i++) {
const parts = info[i].split(' ');
const score = Number(parts.pop());
createCombinations(parts, score);
}
for (const [key, scores] of map.entries()) {
scores.sort((a, b) => a - b);
}
for (let i = 0; i < query.length; i++) {
const parts = query[i].replace(/ and /g, ' ').split(' ');
const score = Number(parts.pop());
const key = parts.filter((v) => v !== '-').join('');
if (!map.has(key)) {
answer.push(0);
continue;
}
const scores = map.get(key);
let left = 0;
let right = scores.length;
while (left < right) {
const mid = Math.floor((left + right) / 2);
if (scores[mid] >= score) right = mid;
else left = mid + 1;
}
answer.push(scores.length - left);
}
return answer;
}
보통 이런 구현 문제는 정확성만 따지고 효율성에 대한 검사를 하지 않았는데 효율성 검사가 추가되니까 확실히 오답률이 늘어난 것 같다. 이 문제를 이진 탐색으로 풀지 않으면 효율성을 무조건 통과할 수 없을텐데... 이러한 유형이 나오면 이진 탐색을 생각해낼 수 있을지 살짝 걱정이 되긴 한다..