괄호 변환

신연우·2021년 1월 22일

목록 보기

15/58

문제 설명

카카오에 신입 개발자로 입사한 "콘"은 선배 개발자로부터 개발역량 강화를 위해 다른 개발자가 작성한 소스 코드를 분석하여 문제점을 발견하고 수정하라는 업무 과제를 받았습니다. 소스를 컴파일하여 로그를 보니 대부분 소스 코드 내 작성된 괄호가 개수는 맞지만 짝이 맞지 않은 형태로 작성되어 오류가 나는 것을 알게 되었습니다.

수정해야 할 소스 파일이 너무 많아서 고민하던 "콘"은 소스 코드에 작성된 모든 괄호를 뽑아서 올바른 순서대로 배치된 괄호 문자열을 알려주는 프로그램을 다음과 같이 개발하려고 합니다.

용어의 정의

'(' 와 ')' 로만 이루어진 문자열이 있을 경우, '(' 의 개수와 ')' 의 개수가 같다면 이를 균형잡힌 괄호 문자열이라고 부릅니다.

그리고 여기에 '('와 ')'의 괄호의 짝도 모두 맞을 경우에는 이를 올바른 괄호 문자열이라고 부릅니다.

예를 들어, "(()))("와 같은 문자열은 "균형잡힌 괄호 문자열"이지만 "올바른 괄호 문자열"은 아닙니다.

반면에 "(())()"와 같은 문자열은 "균형잡힌 괄호 문자열"이면서 동시에 "올바른 괄호 문자열"입니다.

'(' 와 ')' 로만 이루어진 문자열 w가 "균형잡힌 괄호 문자열"이라면 다음과 같은 과정을 통해 "올바른 괄호 문자열"로 변환할 수 있습니다.

  1. 입력이 빈 문자열인 경우, 빈 문자열을 반환합니다. 
  2. 문자열 w를 두 "균형잡힌 괄호 문자열" u, v로 분리합니다. 단, u는 "균형잡힌 괄호 문자열"로 더 이상 분리할 수 없어야 하며, v는 빈 문자열이 될 수 있습니다. 
  3. 문자열 u가 "올바른 괄호 문자열" 이라면 문자열 v에 대해 1단계부터 다시 수행합니다. 
    3-1. 수행한 결과 문자열을 u에 이어 붙인 후 반환합니다. 
  4. 문자열 u가 "올바른 괄호 문자열"이 아니라면 아래 과정을 수행합니다. 
    4-1. 빈 문자열에 첫 번째 문자로 '('를 붙입니다. 
    4-2. 문자열 v에 대해 1단계부터 재귀적으로 수행한 결과 문자열을 이어 붙입니다. 
    4-3. ')'를 다시 붙입니다. 
    4-4. u의 첫 번째와 마지막 문자를 제거하고, 나머지 문자열의 괄호 방향을 뒤집어서 뒤에 붙입니다. 
    4-5. 생성된 문자열을 반환합니다.

"균형잡힌 괄호 문자열" p가 매개변수로 주어질 때, 주어진 알고리즘을 수행해 "올바른 괄호 문자열"로 변환한 결과를 return 하도록 solution 함수를 완성해 주세요.

매개변수 설명

p는 '(' 와 ')' 로만 이루어진 문자열이며 길이는 2 이상 1,000 이하인 짝수입니다.
문자열 p를 이루는 '(' 와 ')' 의 개수는 항상 같습니다.
만약 p가 이미 "올바른 괄호 문자열"이라면 그대로 return 하면 됩니다.

입출력 예

p	result
"(()())()"	"(()())()"
")("	"()"
"()))((()"	"()(())()"

풀이

def is_proper_bracket_string(p):
    stack = []
    for bracket in p:
        if not len(stack) or stack[-1] != "(" or bracket != ")":
            stack.append(bracket)
        else:
            stack.pop()
    return not len(stack)


def split_bracket_string(p):
    for i in range(2, len(p) + 1):
        if p.count("(", 0, i) == p.count(")", 0, i):
            return p[0:i], p[i:]


def reverse_bracket(p):
    reverse_bracket_string = ""
    for i in range(len(p)):
        if p[i] != ")":
            reverse_bracket_string += ")"
        else:
            reverse_bracket_string += "("

    return reverse_bracket_string


def solution(p):
    answer = ''
    if not len(p):
        return p

    if is_proper_bracket_string(p):
        return p

    u, v = split_bracket_string(p)

    if is_proper_bracket_string(u):
        answer += u + solution(v)
    else:
        answer += "(" + solution(v) + ")" + reverse_bracket(u[1:-1])
    return answer

함수로 분할해도 총 4개나 나오는 정도의 긴 풀이다.

해결과정

각 단계에 따른 작업 flow 그려보기
이번 문제는 문제만의 언어를 사용하기도 하고, 전반적인 문제 길이가 길기 때문에 작업의 flow를 그려보는 것으로 한 눈에 전체 흐름을 파악할 수 있도록 하는 것이 중요하다 생각했다.

그래서 공책에 solution 함수에 대한 전체적인 흐름을 그렸더니, 문제를 금방 해결할 수 있었다.
빈 문자열은 빈 문자열 반환하기
매개변수 p가 빈 문자열이라면 빈 문자열을 반환해야 하므로, 해당 예외 처리를 먼저 solution 함수에 추가한다.
올바른 괄호 문자열은 그대로 반환하기
매개변수 p가 "올바른 괄호 문자열"이라면 별도의 처리를 하지 않고 그대로 반환해야 한다. 해당 작업은 따로 함수로 분할하는 것이 좋다 생각하여 is_proper_bracket_string 함수를 만들었다.

이 과정에서 stack을 사용했다. 괄호가 있는 후위 연산식을 계산할 때 stack을 사용했던 기억이 나서 stack을 사용했다. stack에서 pop을 하는 기준은
1. stack에 요소가 들어있어야 한다.
2. stack에 마지막으로 들어간 요소가 "(" 문자여야 한다.
3. 지금 가져온 문자가 ")" 문자여야 한다.
이 기준을 만족할 때만 pop을 진행하고 나머지는 push한다. 이후, stack에 남은 요소가 없다면 그 문자열은 "올바른 괄호 문자열"이다.
문자열 나누기
만약 "빈 문자열"도 아니고, "올바른 괄호 문자열"도 아니라면 문자열을 나눠야 하므로 이를 진행하는 함수 split_bracket_string를 만들었다.

나누는 기준은 해당 문자열의 첫 번째부터 이어붙일 때, "(" 문자와 ")"의 문자의 수가 같은 경우를 기준으로 한다.

그래서 string type의 count 메서드를 사용해서 두 문자의 수가 같은 경우를 찾았다. 어차피 문자열의 처음부터 검사해야 하므로 start는 0을 줬고, 이후 인덱스를 2부터 1씩 증가시켜 그 범위를 찾는다.

2부터 시작하는 이유는 count 메서드의 마지막 매개변수는 _end로, 해당 값 - 1만큼의 인덱스 범위까지 탐색하기 때문이다.
문자열 u가 "올바른 괄호 문자열"인가?
문자열 u가 "올바른 괄호 문자열"이라면, 자신과 v를 solution에 재귀한 결과를 answer에 이어붙인다.

"올바른 괄호 문자열"이 아니라면, "(" + v를 solution에 재귀한 결과 + ")" + u의 첫 번째와 마지막 문자를 제거하고, 나머지 문자열의 괄호를 뒤집은 문자열을 이어붙인다.

u의 첫 번째와 마지막 문자를 제거하는 것은 python의 인덱스 슬라이싱 기법을 사용하면 쉽게 구현할 수 있다. 또한, 괄호를 뒤집는 문자열을 만들기 위해 reverse_bracket 함수를 만들어서 사용했다.

다른 사람의 풀이

def solution(p):
    if p=='': return p
    r=True; c=0
    for i in range(len(p)):
        if p[i]=='(': c-=1
        else: c+=1
        if c>0: r=False
        if c==0:
            if r:
                return p[:i+1]+solution(p[i+1:])
            else:
                return '('+solution(p[i+1:])+')'+''.join(list(map(lambda x:'(' if x==')' else ')',p[1:i]) ))

다음과 같이 solution 함수 안에서 모든 것을 해결할 수도 있다.

반드시 "(" 문자와 ")" 문자가 같은 개수만큼 있어야 하기 때문에 c 변수를 통해 해당 값이 0일 때(지금까지 나온 문자열은 "("와 ")" 문자의 개수가 같다는 의미), solution 함수의 재귀를 돌린다.

재귀를 돌리기 전 c가 자연수라면 r을 False로 변경하는데, 첫 문자가 ")"이면 "올바른 괄호 문자열"이 아니기 때문이다.

놀라운 건, map 함수의 첫 번째 인자로 lambda 함수를 사용했다는 것. 저런 생각은 대체 어떻게 하는 거지?

신연우

남들과 함께하기 위해서는 혼자 나아갈 수 있는 힘이 있어야 한다.

괄호 변환

알고리즘

문제 설명

용어의 정의

매개변수 설명

입출력 예

풀이

해결과정

다른 사람의 풀이

가장 큰 수

예산

0개의 댓글

관련 채용 정보