[알고리즘 문제풀이] 프로그래머스 순위 검색

고럭키·2021년 9월 5일
0

알고리즘 문제풀이

목록 보기
52/68

카카오 기출 뽀개기 ! 이번에 푼 문제는 카카오 2021 블라인드 채용 - 순위검색이다 ! 며칠 전에 풀었는데 요즘 프로젝트로 한창 바빠서 이제서야 포스팅을 해본댜..

문제 설명

[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

  • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
  • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
  • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
  • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.

예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.

코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

  • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
  • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
  • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
  • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

[조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?

문제

지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

제한사항

  • info 배열의 크기는 1 이상 50,000 이하입니다.
  • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
    • 개발언어는 cpp, java, python 중 하나입니다.
    • 직군은 backend, frontend 중 하나입니다.
    • 경력은 junior, senior 중 하나입니다.
    • 소울푸드는 chicken, pizza 중 하나입니다.
    • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
  • query 배열의 크기는 1 이상 100,000 이하입니다.
  • query의 각 문자열은 "[조건] X" 형식입니다.
    • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
    • 언어는 cpp, java, python, - 중 하나입니다.
    • 직군은 backend, frontend, - 중 하나입니다.
    • 경력은 junior, senior, - 중 하나입니다.
    • 소울푸드는 chicken, pizza, - 중 하나입니다.
    • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
    • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.

입출력 예

infoqueryresult
["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"]["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"][1,1,1,1,2,4]

풀이 방법

효율성이 있는 문제는 늘 어렵다. 효율성이 통과를 못 하면 사실 접근 자체가 잘못됐을 가능성이 높아서 처음부터 다시 풀어야하기에 시간도 부족하고, 처음 접근 방법이 이미 머리에 남아있어서 새로운 방법이 잘 안 떠오르기 때문이다.

우선 효율성을 위해서 info 전처리가 필요할 거 같다는 생각은 들었다. 처음 접근한 방법은 info를 4character로 변환하는 것이었다. cpp : 1 java : 2 이런 식으로 매핑을 하는 것이다. 그리고 query 검색을 할 때에도 똑같이 변환을 하되, 고려하지 않는 - 문자는 . 으로 변환하여 정규식 검색을 사용할 수 있도록 해서 검색을 해주었다. 하지만 역시나 효율성에서 통과를 못했다.

제한사항보면 지금처럼 query마다 각 info를 다 검색하는 건 검색 효율성을 아무리 높여봐야 각 사이즈가 50000, 100000이니까 둘을 곱한만큼 시간복잡도가 나오기 때문에 잘못된 접근이기는 하구나 싶었다. 그러면 전처리 후에는 info를 탐색할 필요가 없게끔 전처리를 해주어야 한다. 그렇기 때문에 지금 조건에서 각 info가 포함될 수 있는 모든 경우의 수를 구해주었다. 즉, java backend junior pizza 는 4가지 조건이 각 주어진 값인 경우와 고려하지 않는 경우로 해서 2^4 = 16 가지의 경우의 수가 나오는 것이다. 그렇게 16개로 변환된 4character 문자를 key로 하고 해당 경우에 해당하는 코딩테스트 점수들을 담고있는 리스트를 value로 하는 map을 사용해서 전처리해주었다. 즉, info들이 만족할 수 있는 모든 query 경우의 수에 해당하는 코딩테스트 점수들을 쭉 넣어준 것이다.

이후에 이제 query에 해당하는 4character를 key로 딱 바로 만족하는 지원자의 코딩테스트 점수들에 접근할 수 있다. 위에 말한 info를 다 탐색하지 않아도 되는 것이다 ! 이제 코딩테스트 점수 리스트에서 만족하는 점수들을 찾아야 한다. 처음부터 끝까지 탐색하는 것을 피하기 위해서 우선 리스트는 정렬을 해둔다. 이제 query에서 주어진 기준 이상인 값 중에 제일 작은 원소를 찾아내면 그 인덱스를 이용해서 명수를 바로 구할 수 있다. 그러므로 이분 탐색을 이용해서 해당 값의 인덱스를 구해주었고 이를 이용해서 명수를 바로 구해서 반환할 결과 배열에 넣어주었다.

해당 문제는 입력 문자열을 처리하고, 전처리 하는 과정에서 백트레킹을 이용해 조합을 구하고, 이를 효율적인 형태로 자료구조에 저장하고, 후에 이분탐색으로 명수를 빠르게 구하는 것까지 다양한 알고리즘이 쓰이고 꽤나 까다로운 문제였다. 대체 왜 레벨 2 ??????????

코드

import java.util.*;

class Solution {
    public static Map<String, String> languageMapper = new HashMap<>(){{
        put("cpp", "1");
        put("java", "2");
        put("python", "3");
    }};
    public static Map<String, String> jobMapper = new HashMap<>(){{
        put("backend", "1");
        put("frontend", "2");
    }};
    public static Map<String, String> careerMapper = new HashMap<>(){{
        put("junior", "1");
        put("senior", "2");
    }};
    public static Map<String, String> foodMapper = new HashMap<>(){{
        put("chicken", "1");
        put("pizza", "2");
    }};

    public static ArrayList<Map<String, Integer>> maps = new ArrayList(Arrays.asList(languageMapper, jobMapper, careerMapper, foodMapper));

    public static Map<String, ArrayList<Integer>> infoSet;
    public static boolean[] visited;

    public static String convert(String[] info){
        String result = "";
        for(int i=0; i<4; i++){
            if(!maps.get(i).containsKey(info[i])) result += "-";
            else result += maps.get(i).get(info[i]);
        }
        return result;
    }

    public static void combination(String info, char[] result, boolean[] visited, int r, int cur, int score){
        if(r == 0){
            String temp = new String(result);
            if(!infoSet.containsKey(temp)) infoSet.put(temp, new ArrayList<>());
            infoSet.get(temp).add(score);
            return;
        }
        for(int i=cur; i<info.length(); i++){
            if(!visited[i]){
                visited[i] = true;
                result[i] = info.charAt(i);
                combination(info, result, visited, r-1, i+1, score);
                result[i] = '-';
                visited[i] = false;
            }
        }
    }

    public static void addCased(String info, int score){
        for(int i=0; i<=4; i++){
            visited = new boolean[info.length()];
            combination(info, "----".toCharArray(), visited, i, 0, score);
        }
    }
    
    public int[] solution(String[] info, String[] query) {
        int[] answer = new int[query.length];
        infoSet = new HashMap<>();
        String[] eachInfo;
        for(String str : info){
            eachInfo = str.split(" ");
            addCased(convert(eachInfo), Integer.parseInt(eachInfo[4]));
        }
        Set<String> keys = infoSet.keySet();
        for(String key : keys){
            infoSet.get(key).sort(Comparator.naturalOrder());
        }
        int left, right, mid, score;
        ArrayList<Integer> target;
        String key, str;
        for(int i=0; i<query.length; i++){
            str = query[i];
            str = str.replace("and ", "");
            eachInfo = str.split(" ");
            key = convert(eachInfo);
            score = Integer.parseInt(eachInfo[4]);
            if(!infoSet.containsKey(key)) continue;
            target = infoSet.get(key);
            left = 0;
            right = target.size()-1;
            while(left < right){
                mid = (left + right) / 2;
                if(target.get(mid) < score) left = mid+1;
                else right = mid;
            }
            answer[i] = target.size() - left;
        }
        return answer;
    }
}

0개의 댓글