카카오에 신입 개발자로 입사한 "콘"은 선배 개발자로부터 개발역량 강화를 위해 다른 개발자가 작성한 소스 코드를 분석하여 문제점을 발견하고 수정하라는 업무 과제를 받았습니다. 소스를 컴파일하여 로그를 보니 대부분 소스 코드 내 작성된 괄호가 개수는 맞지만 짝이 맞지 않은 형태로 작성되어 오류가 나는 것을 알게 되었습니다.
수정해야 할 소스 파일이 너무 많아서 고민하던 "콘"은 소스 코드에 작성된 모든 괄호를 뽑아서 올바른 순서대로 배치된 괄호 문자열을 알려주는 프로그램을 다음과 같이 개발하려고 합니다.
'(' 와 ')' 로만 이루어진 문자열이 있을 경우, '(' 의 개수와 ')' 의 개수가 같다면 이를 균형잡힌 괄호 문자열
이라고 부릅니다.
그리고 여기에 '('와 ')'의 괄호의 짝도 모두 맞을 경우에는 이를 올바른 괄호 문자열
이라고 부릅니다.
예를 들어, "(()))("
와 같은 문자열은 "균형잡힌 괄호 문자열"이지만 "올바른 괄호 문자열"은 아닙니다.
반면에 "(())()"
와 같은 문자열은 "균형잡힌 괄호 문자열"이면서 동시에 "올바른 괄호 문자열"입니다.
'(' 와 ')' 로만 이루어진 문자열 w가 "균형잡힌 괄호 문자열"이라면 다음과 같은 과정을 통해 "올바른 괄호 문자열"로 변환할 수 있습니다.
1. 입력이 빈 문자열인 경우, 빈 문자열을 반환합니다.
2. 문자열 w를 두 "균형잡힌 괄호 문자열" u, v로 분리합니다. 단, u는 "균형잡힌 괄호 문자열"로 더 이상 분리할 수 없어야 하며, v는 빈 문자열이 될 수 있습니다.
3. 문자열 u가 "올바른 괄호 문자열" 이라면 문자열 v에 대해 1단계부터 다시 수행합니다.
3-1. 수행한 결과 문자열을 u에 이어 붙인 후 반환합니다.
4. 문자열 u가 "올바른 괄호 문자열"이 아니라면 아래 과정을 수행합니다.
4-1. 빈 문자열에 첫 번째 문자로 '('를 붙입니다.
4-2. 문자열 v에 대해 1단계부터 재귀적으로 수행한 결과 문자열을 이어 붙입니다.
4-3. ')'를 다시 붙입니다.
4-4. u의 첫 번째와 마지막 문자를 제거하고, 나머지 문자열의 괄호 방향을 뒤집어서 뒤에 붙입니다.
4-5. 생성된 문자열을 반환합니다.
"균형잡힌 괄호 문자열" p가 매개변수로 주어질 때, 주어진 알고리즘을 수행해 "올바른 괄호 문자열"로 변환한 결과를 return 하도록 solution 함수를 완성해 주세요.
p | result |
---|---|
"(()())()" | "(()())()" |
")(" | "()" |
"()))((()" | "()(())()" |
def is_proper_bracket_string(p):
stack = []
for bracket in p:
if not len(stack) or stack[-1] != "(" or bracket != ")":
stack.append(bracket)
else:
stack.pop()
return not len(stack)
def split_bracket_string(p):
for i in range(2, len(p) + 1):
if p.count("(", 0, i) == p.count(")", 0, i):
return p[0:i], p[i:]
def reverse_bracket(p):
reverse_bracket_string = ""
for i in range(len(p)):
if p[i] != ")":
reverse_bracket_string += ")"
else:
reverse_bracket_string += "("
return reverse_bracket_string
def solution(p):
answer = ''
if not len(p):
return p
if is_proper_bracket_string(p):
return p
u, v = split_bracket_string(p)
if is_proper_bracket_string(u):
answer += u + solution(v)
else:
answer += "(" + solution(v) + ")" + reverse_bracket(u[1:-1])
return answer
함수로 분할해도 총 4개나 나오는 정도의 긴 풀이다.
각 단계에 따른 작업 flow 그려보기
이번 문제는 문제만의 언어를 사용하기도 하고, 전반적인 문제 길이가 길기 때문에 작업의 flow를 그려보는 것으로 한 눈에 전체 흐름을 파악할 수 있도록 하는 것이 중요하다 생각했다.
그래서 공책에 solution 함수에 대한 전체적인 흐름을 그렸더니, 문제를 금방 해결할 수 있었다.
빈 문자열은 빈 문자열 반환하기
매개변수 p
가 빈 문자열이라면 빈 문자열을 반환해야 하므로, 해당 예외 처리를 먼저 solution 함수에 추가한다.
올바른 괄호 문자열은 그대로 반환하기
매개변수 p
가 "올바른 괄호 문자열"이라면 별도의 처리를 하지 않고 그대로 반환해야 한다. 해당 작업은 따로 함수로 분할하는 것이 좋다 생각하여 is_proper_bracket_string
함수를 만들었다.
이 과정에서 stack을 사용했다. 괄호가 있는 후위 연산식을 계산할 때 stack을 사용했던 기억이 나서 stack을 사용했다. stack에서 pop을 하는 기준은
이 기준을 만족할 때만 pop을 진행하고 나머지는 push한다. 이후, stack에 남은 요소가 없다면 그 문자열은 "올바른 괄호 문자열"이다.
문자열 나누기
만약 "빈 문자열"도 아니고, "올바른 괄호 문자열"도 아니라면 문자열을 나눠야 하므로 이를 진행하는 함수 split_bracket_string
를 만들었다.
나누는 기준은 해당 문자열의 첫 번째부터 이어붙일 때, "(" 문자와 ")"의 문자의 수가 같은 경우를 기준으로 한다.
그래서 string type의 count 메서드를 사용해서 두 문자의 수가 같은 경우를 찾았다. 어차피 문자열의 처음부터 검사해야 하므로 start는 0을 줬고, 이후 인덱스를 2부터 1씩 증가시켜 그 범위를 찾는다.
2부터 시작하는 이유는 count 메서드의 마지막 매개변수는 _end로, 해당 값 - 1만큼의 인덱스 범위까지 탐색하기 때문이다.
문자열 u가 "올바른 괄호 문자열"인가?
문자열 u가 "올바른 괄호 문자열"이라면, 자신과 v를 solution에 재귀한 결과를 answer
에 이어붙인다.
"올바른 괄호 문자열"이 아니라면, "(" + v를 solution에 재귀한 결과 + ")" + u의 첫 번째와 마지막 문자를 제거하고, 나머지 문자열의 괄호를 뒤집은 문자열
을 이어붙인다.
u의 첫 번째와 마지막 문자를 제거하는 것은 python의 인덱스 슬라이싱 기법을 사용하면 쉽게 구현할 수 있다. 또한, 괄호를 뒤집는 문자열을 만들기 위해 reverse_bracket
함수를 만들어서 사용했다.
def solution(p):
if p=='': return p
r=True; c=0
for i in range(len(p)):
if p[i]=='(': c-=1
else: c+=1
if c>0: r=False
if c==0:
if r:
return p[:i+1]+solution(p[i+1:])
else:
return '('+solution(p[i+1:])+')'+''.join(list(map(lambda x:'(' if x==')' else ')',p[1:i]) ))
다음과 같이 solution 함수 안에서 모든 것을 해결할 수도 있다.
반드시 "(" 문자와 ")" 문자가 같은 개수만큼 있어야 하기 때문에 c
변수를 통해 해당 값이 0일 때(지금까지 나온 문자열은 "("와 ")" 문자의 개수가 같다는 의미), solution 함수의 재귀를 돌린다.
재귀를 돌리기 전 c가 자연수라면 r
을 False로 변경하는데, 첫 문자가 ")"이면 "올바른 괄호 문자열"이 아니기 때문이다.
놀라운 건, map 함수의 첫 번째 인자로 lambda 함수를 사용했다는 것. 저런 생각은 대체 어떻게 하는 거지?