[JAVA] 백준 (실버2) 12891번 DNA 비밀번호

AIR·2024년 4월 30일
0

링크

https://www.acmicpc.net/problem/12891


문제 설명

정답률 34.322%
평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”는 DNA 문자열이 아니지만 “ACCA”는 DNA 문자열이다. 이런 신비한 문자열에 완전히 매료된 민호는 임의의 DNA 문자열을 만들고 만들어진 DNA 문자열의 부분문자열을 비밀번호로 사용하기로 마음먹었다.

하지만 민호는 이러한 방법에는 큰 문제가 있다는 것을 발견했다. 임의의 DNA 문자열의 부분문자열을 뽑았을 때 “AAAA”와 같이 보안에 취약한 비밀번호가 만들어 질 수 있기 때문이다. 그래서 민호는 부분문자열에서 등장하는 문자의 개수가 특정 개수 이상이여야 비밀번호로 사용할 수 있다는 규칙을 만들었다.

임의의 DNA문자열이 “AAACCTGCCAA” 이고 민호가 뽑을 부분문자열의 길이를 4라고 하자. 그리고 부분문자열에 ‘A’ 는 1개 이상, ‘C’는 1개 이상, ‘G’는 1개 이상, ‘T’는 0개 이상이 등장해야 비밀번호로 사용할 수 있다고 하자. 이때 “ACCT” 는 ‘G’ 가 1 개 이상 등장해야 한다는 조건을 만족하지 못해 비밀번호로 사용하지 못한다. 하지만 “GCCA” 은 모든 조건을 만족하기 때문에 비밀번호로 사용할 수 있다.

민호가 만든 임의의 DNA 문자열과 비밀번호로 사용할 부분분자열의 길이, 그리고 {‘A’, ‘C’, ‘G’, ‘T’} 가 각각 몇번 이상 등장해야 비밀번호로 사용할 수 있는지 순서대로 주어졌을 때 민호가 만들 수 있는 비밀번호의 종류의 수를 구하는 프로그램을 작성하자. 단 부분문자열이 등장하는 위치가 다르다면 부분문자열이 같다고 하더라도 다른 문자열로 취급한다.


입력 예제

  • 첫 번째 줄에 민호가 임의로 만든 DNA 문자열 길이 |S|와 비밀번호로 사용할 부분문자열의 길이 |P| 가 주어진다. (1 ≤ |P| ≤ |S| ≤ 1,000,000)
  • 두번 째 줄에는 민호가 임의로 만든 DNA 문자열이 주어진다.
  • 세번 째 줄에는 부분문자열에 포함되어야 할 {‘A’, ‘C’, ‘G’, ‘T’} 의 최소 개수가 공백을 구분으로 주어진다. 각각의 수는 |S| 보다 작거나 같은 음이 아닌 정수이며 총 합은 |S| 보다 작거나 같음이 보장된다.

9 8
CCTGGATTG
2 0 1 1


출력 예제

  • 첫 번째 줄에 민호가 만들 수 있는 비밀번호의 종류의 수를 출력해라.

0


풀이

투 포인터와 유사한 알고리즘인 슬라이딩 윈도우 문제이다. 슬라이딩 윈도우는 2개의 포인터로 범위를 지정한 다음 범위를 유지한 채로 이동하며 문제를 해결한다.

일단 P와 S의 최대값이 10610^6이므로 O(n)의 시간 복잡도로 해결해야 한다. 다음과 같이 P인 윈도우를 지정하여 시작점부터 끝점까지 이동하면서 조건에 맞는지 탐색해간다. S의 길이만큼 탐색하면 되므로 O(n)이다.

입력값으로 주어진 문자열에 맞는 최소 개수를 HashMap으로 생성한다.

min = {A=2, C=0, T=1, G=1}

우선 첫번째 부분 문자열의 해당 개수를 동일하게 HashMap으로 생성한다.

partial = {A=1, C=2, T=3, G=2}

그리고 나머지 부분 문자열에 대해 탐색하는데 만약 일일이 해당 개수를 카운트한다면 이중 for문으로 O(n^2)가 된다. 부분 문자열은 한 칸씩만 이동하므로 처음과 마지막 문자열으로 인한 개수 변동만 있다. 그러므로 빠지는 문자와 새로운 문자열만 HashMap에 갱신해주면 된다.

//빠지는 문자열에 대해 카운트-1
partial.put(dropped, partial.get(dropped) - 1);
//추가되는 문자열에 대해 카운트+1
partial.put(added, partial.get(added) + 1);

코드

//백준
public class Main {

    public static void main(String[] args) throws IOException {

        System.setIn(new FileInputStream("src/input.txt"));
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StringTokenizer st = new StringTokenizer(br.readLine());

        int S = Integer.parseInt(st.nextToken());  //전체 문자열 길이
        int P = Integer.parseInt(st.nextToken());  //부분 문자열 길이
        int answer = 0;
        String str = br.readLine();  //문자열
        String[] strs = str.split("");  //문자열 배열

        //ACGT 최소 개수 초기화
        HashMap<String, Integer> min = new HashMap<>();
        String[] acgt = {"A", "C", "G", "T"};
        st = new StringTokenizer(br.readLine());
        for (int i = 0; i < 4; i++) {
            min.put(acgt[i], Integer.parseInt(st.nextToken()));
        }

        //부분 문자열의 ACGT 개수 카운트
        HashMap<String, Integer> partial = new HashMap<>();
        String first = str.substring(0, P);  //첫번째 부분 문자열
        for (int i = 0; i < 4; i++) {
            int index = i;
            long count = Arrays.stream(first.split(""))
                    .filter(s -> s.equals(acgt[index]))
                    .count();
            partial.put(acgt[i], (int) count);
        }
        if (compare(min, partial)) {
            answer++;
        }

        //나머지 부분 문자열에 대하여 반복
        for (int start = 1; start <= S - P; start++) {
            int end = start + P - 1;

            String dropped = strs[start - 1];
            String added = strs[end];
            //빠지는 문자열에 대해 카운트-1
            partial.put(dropped, partial.get(dropped) - 1);
            //추가되는 문자열에 대해 카운트+1
            partial.put(added, partial.get(added) + 1);

            if (compare(min, partial)) {
                answer++;
            }
        }
        System.out.println(answer);
    }

    //부분 문자열의 최소 개수 충족 여부 판단
    static boolean compare(HashMap<String, Integer> min, HashMap<String, Integer> partial) {

        boolean flag = true;
        for (String s : min.keySet()) {

            //부분 문자열의 개수와 비교
            if (min.get(s) > partial.get(s)) {
                flag = false;
            }
        }

        return flag;
    }
}
profile
백엔드

0개의 댓글