이진 탐색 - 4. 가사탐색

LEE ·2022년 5월 5일
0

알고리즘 기출문제

목록 보기
30/60
post-thumbnail

문제

[본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

친구들로부터 천재 프로그래머로 불리는 "프로도"는 음악을 하는 친구로부터 자신이 좋아하는 노래 가사에 사용된 단어들 중에 특정 키워드가 몇 개 포함되어 있는지 궁금하니 프로그램으로 개발해 달라는 제안을 받았습니다.
그 제안 사항 중, 키워드는 와일드카드 문자중 하나인 '?'가 포함된 패턴 형태의 문자열을 뜻합니다. 와일드카드 문자인 '?'는 글자 하나를 의미하며, 어떤 문자에도 매치된다고 가정합니다. 예를 들어 "fro??"는 "frodo", "front", "frost" 등에 매치되지만 "frame", "frozen"에는 매치되지 않습니다.

가사에 사용된 모든 단어들이 담긴 배열 words와 찾고자 하는 키워드가 담긴 배열 queries가 주어질 때, 각 키워드 별로 매치된 단어가 몇 개인지 순서대로 배열에 담아 반환하도록 solution 함수를 완성해 주세요.

가사 단어 제한사항

  • words의 길이(가사 단어의 개수)는 2 이상 100,000 이하입니다.
  • 각 가사 단어의 길이는 1 이상 10,000 이하로 빈 문자열인 경우는 없습니다.
  • 전체 가사 단어 길이의 합은 2 이상 1,000,000 이하입니다.
  • 가사에 동일 단어가 여러 번 나올 경우 중복을 제거하고 words에는 하나로만 제공됩니다.
  • 각 가사 단어는 오직 알파벳 소문자로만 구성되어 있으며, 특수문자나 숫자는 포함하지 않는 것으로 가정합니다.

검색 키워드 제한사항

  • queries의 길이(검색 키워드 개수)는 2 이상 100,000 이하입니다.
  • 각 검색 키워드의 길이는 1 이상 10,000 이하로 빈 문자열인 경우는 없습니다.
  • 전체 검색 키워드 길이의 합은 2 이상 1,000,000 이하입니다.
  • 검색 키워드는 중복될 수도 있습니다.
  • 각 검색 키워드는 오직 알파벳 소문자와 와일드카드 문자인 '?' 로만 구성되어 있으며, 특수문자나 숫자는 포함하지 않는 것으로 가정합니다.
  • 검색 키워드는 와일드카드 문자인 '?'가 하나 이상 포함돼 있으며, '?'는 각 검색 키워드의 접두사 아니면 접미사 중 하나로만 주어집니다.
  • 예를 들어 "??odo", "fro??", "?????"는 가능한 키워드입니다.
  • 반면에 "frodo"('?'가 없음), "fr?do"('?'가 중간에 있음), "?ro??"('?'가 양쪽에 있음)는 불가능한 키워드입니다.

입출력 예

입출력 예에 대한 설명

  • "fro??"는 "frodo", "front", "frost"에 매치되므로 3입니다.
  • "????o"는 "frodo", "kakao"에 매치되므로 2입니다.
  • "fr???"는 "frodo", "front", "frost", "frame"에 매치되므로 4입니다.
  • "fro???"는 "frozen"에 매치되므로 1입니다.
  • "pro?"는 매치되는 가사 단어가 없으므로 0 입니다.

구현코드

import java.util.ArrayList;
import java.util.Collections;

class Solution {
	
	public int lowerBound(ArrayList<String> arr, String target, int start, int end){
		while(start < end){
			int mid = (start + end) / 2;
			if(arr.get(mid).compareTo(target) >= 0){
				end = mid;
			}else {
				start = mid +1;
			}
		}
		return end;
	}
	
	public int upperBound(ArrayList<String> arr, String target, int start, int end) {
        while (start < end) {
            int mid = (start + end) / 2;
            // arr[mid]가 target보다 사전순으로 뒤에 있다면
            if (arr.get(mid).compareTo(target) > 0) end = mid;
            else start = mid + 1;
        }
        return end;
    }
	
	public int countByRange(ArrayList<String> arr, String leftValue, String rightValue){
		int rightIndex = upperBound(arr, rightValue, 0, arr.size()); 
		int leftIndex = lowerBound(arr, leftValue, 0, arr.size());
		return rightIndex - leftIndex;
	}
	
	// 단어의 길이별로 list 에 저장 , ? 가 접미사에 들어갈수도 있으니 reverse 도 선언
	public static ArrayList<ArrayList<String>>arr = new ArrayList<ArrayList<String>>();
	public static ArrayList<ArrayList<String>>reversedArr = new ArrayList<ArrayList<String>>();
	
    public int[] solution(String[] words, String[] queries) {
		// 결과값을 저장하는 list
		ArrayList<Integer> ans = new ArrayList<Integer>();
	
		// 단어의 길이가 10000 개 이하이기 때문에
		for(int i = 0; i < 10001; i++){
			arr.add(new ArrayList<String>());
			reversedArr.add(new ArrayList<String>());
		}
		
		for(int i = 0 ; i < words.length; i++){
			String word = words[i];
			arr.get(word.length()).add(word);
			word = (new StringBuffer(word)).reverse().toString();
			reversedArr.get(word.length()).add(word);
		}
		
		// 이진 탐색을 수행하기 위해 각 단어 리스트 정렬 수행
		for(int i = 0 ; i < 10001; i++){
			Collections.sort(arr.get(i));
			Collections.sort(reversedArr.get(i));
		}
		
		// 쿼리를 하나씩 확인하며 처리
		for(int i = 0 ; i < queries.length; i++){
			String q = queries[i];
			int res = 0;
			// 접미사에 ? 가 붙은경우
			if(q.charAt(0) != '?'){
				res = countByRange(arr.get(q.length()), q.replaceAll("\\?", "a"), q.replaceAll("\\?", "z"));
			}else{ // 접두사에 ? 가 붙은경우
				q = (new StringBuffer(q)).reverse().toString();
				res = countByRange(reversedArr.get(q.length()), q.replaceAll("\\?", "a"), q.replaceAll("\\?", "z"));
			}
			// 검색된 단어의 개수를 저장
            ans.add(res);
		}
		
		
        int[] answer = new int[ans.size()];
		for(int i = 0 ; i < ans.size(); i++){
			answer[i] = ans.get(i);
		}
        return answer;
    }
}

코드해석

이진탐색문제의 첫 번째 문제인 "정렬된 배열에서 특정 수의 개수 구하기" 문제와 푸는방식이 동일한 문제이다. 나는 첫 번째 문제를 다른방법으로 풀었지만 원래는 upper, lower, countByRange 를 이용한 방식으로 푸는 것이 맞는거같다.
upper, lower, countByRange 방식은 간단하다. 값의 범위를 이용하여 x 값과 y 값 사이에 있는 값이 몇개있는지 구하기 위해서 정렬을 먼저 시키고 y 값의 인덱스 - x 값의 인덱스를 해주게 되면 그 개수을 구할 수 있게되는 것이다. 근데 처음 문제를 푼다면 생각하기 쉽지않은 문제이다.

0개의 댓글

관련 채용 정보