LCS(Longest Common Subsequence, 최장 공통 부분 수열)문제는 두 수열이 주어졌을 때, 모두의 부분 수열이 되는 수열 중 가장 긴 것을 찾는 문제이다.
예를 들어, ACAYKP와 CAPCAK의 LCS는 ACAK가 된다.
첫째 줄과 둘째 줄에 두 문자열이 주어진다. 문자열은 알파벳 대문자로만 이루어져 있으며, 최대 1000글자로 이루어져 있다.
첫째 줄에 입력으로 주어진 두 문자열의 LCS의 길이를 출력한다.
#dp
first = list(input())
second = list(input())
dp = [[0]*(len(second)+1) for _ in range(len(first)+1)]
for i in range(1, len(dp)):
for j in range(1, len(dp[0])):
if first[i-1] == second[j-1]:
dp[i][j] = dp[i-1][j-1] + 1
else:
dp[i][j] = max(dp[i-1][j], dp[i][j-1])
ans = 0
for row in dp:
ans = max(max(row), ans)
print(ans)
dp문제이지만 점화식이 떠오르지 않아 풀이를 참고하게 되었다.
2차원 배열을 두고, for문을 돌며 각 부분수열들의 LCS를 참고하여 점화식으로 확장시켜 나가는 형식의 문제였다.
예를 들어,
ACA, CPA 두 문자열의 LCS는 CA이며 길이는 2이다.
이를 구해보면
0 A C A
0 0 0 0 0
C 0 0 1 1
P 0 0 1 1
A 0 1 1 2
다음과 같은 배열로 풀어서 LCS가 2임을 알 수 있다.
최종적으로 점화식을 구해보면,
1) 비교하는 문자가 같다면
dp[i][j] = dp[i-1][j-1] + 1
2) 비교하는 문자가 다르다면
dp[i][j] = max(dp[i-1][j], dp[i][j-1])
로 배열을 확장시켜 나갈 수 있음을 확인할 수 있다.
dp문제는 문제 상황에서 어떻게 점화식을 짜야 할지 도출하는 게 매우 어려운 것 같다.
아직 알고리즘을 못하지만 제일 자신없는 부분을 꼽으라 하면 dp라고 생각한다.
dp 유형의 문제들을 많이 풀어 두어 빠르게 적응해 나가야 할 것 같다.