카카오에 입사한 신입 개발자 네오
는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.
-
), 밑줄(_
), 마침표(.
) 문자만 사용할 수 있습니다..
)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다."네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id
라고 한다면,
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.
1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm"
→ "...!@bat#*..y.abcdefghijklm"
2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
"...!@bat#*...y.abcdefghijklm"
→ "...bat..y.abcdefghijklm"
3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm"
→ ".bat.y.abcdefghijklm"
4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm"
→ "bat.y.abcdefghijklm"
5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm"
→ "bat.y.abcdefghijklm"
6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm"
→ "bat.y.abcdefghi"
7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi"
→ "bat.y.abcdefghi"
따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 bat.y.abcdefghi 입니다.
신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, 네오가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.
new_id
는 길이 1 이상 1,000 이하인 문자열입니다.
new_id
는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id
에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/
로 한정됩니다.로 한정됩니다.
new_id | result |
---|---|
"...!@BaT#*..y.abcdefghijklm" | "bat.y.abcdefghi" |
"z-+.^." | "z--" |
"=.=" | "aaa" |
"123_.def" | "123_.def" |
"abcdefghijklmn.p" | "abcdefghijklmn" |
def id_alpha_lowper(new_id):
return new_id.lower()
def check_char_constraints(new_id):
for word in new_id:
if word in "~!@#$%^&*()=+[{]}:?,<>/":
new_id = new_id.replace(word, '')
return new_id
def compress_dot(new_id):
start_idx = 0
while new_id[start_idx:].count('.') > 1:
dot_count = 0
if new_id[start_idx] == '.':
for i in range(start_idx + 1, len(new_id)):
if new_id[i] != '.':
break
dot_count += 1
new_id = new_id[:start_idx] + '.' + new_id[start_idx + dot_count + 1:]
start_idx += 1
return new_id
def check_dot(new_id):
if len(new_id) and new_id[0] == '.':
new_id = new_id[1:]
if len(new_id) and new_id[-1] == '.':
new_id = new_id[:-1]
return new_id
def change_empty_id(new_id):
if not len(new_id):
return "a"
return new_id
def change_long_id(new_id):
if len(new_id) > 15:
new_id = check_dot(new_id[:15])
return new_id
def change_short_id(new_id):
if len(new_id) < 3:
last_word = new_id[-1]
new_id += last_word * (3 - len(new_id))
return new_id
def solution(new_id):
new_id = id_alpha_lowper(new_id)
new_id = check_char_constraints(new_id)
new_id = compress_dot(new_id)
new_id = check_dot(new_id)
new_id = change_empty_id(new_id)
new_id = change_long_id(new_id)
new_id = change_short_id(new_id)
return new_id
각 단계가 이미 문제에서 제시되었기 때문에 각 단계에 맞는 기능들을 순차적으로 만들어 적용시키기만 하면 되는 문제다.
id_alpha_lowper(new_id)
는 new_id
에 있는 알파벳 대문자를 모두 소문자로 변경하는 역할을 한다. python에서는 lower()
메서드로 간편하게 구현할 수 있다.
check_char_constraints(new_id)
는 new_id
에 사용할 수 없는 특수문자가 있다면 해당 문자를 제거하는 기능이다. 문제에서 처음 new_id
에 들어있을 수 있는 특수문자의 제한이 걸려있으므로 해당 문자만 검사하면 된다.
compress_dot(new_id)
은 .
이 반복되는 경우 하나로 압축하는 역할을 한다. .
문자가 자신 이후로 몇 개 연속으로 있는지 확인하여 해당 수를 토대로 인덱스를 적절히 조절한다.
check_dot(new_id)
은 맨 앞과 맨 뒤에 .
이 있는지 검사하는 함수이다. 이때 중요한 것은 매개변수로 전달된 new_id
가 빈 문자열이 아닌지 검사해야 한다. 전 단계에 의해 빈 문자열이 생성되면 인덱스 에러가 발생하기 때문이다.
change_empty_id(new_id)
는 빈 문자열이라면 "a"를 반환해주는 함수다.
change_long_id(new_id)
는 16자 이상이라면 15자까지 자르고, 마지막 문자가 .
이라면 제거하는 함수다. 인덱스 슬라이싱과 전에 만들었던 check_dot(new_id)
를 이용하면 쉽게 구현할 수 있다.
change_short_id(new_id)
는 2자 이하라면, 마지막 문자를 3자가 될 때까지 반복해서 붙여주는 기능이다. python은 문자열에 곱하기 기능을 사용하여 편하게 구현할 수 있다.
import re
def solution(new_id):
st = new_id
st = st.lower()
st = re.sub('[^a-z0-9\-_.]', '', st)
st = re.sub('\.+', '.', st)
st = re.sub('^[.]|[.]$', '', st)
st = 'a' if len(st) == 0 else st[:15]
st = re.sub('^[.]|[.]$', '', st)
st = st if len(st) > 2 else st + "".join([st[-1] for i in range(3-len(st))])
return st
다음과 같이 정규식을 통해 각 단계를 한 줄로 표현이 가능하다.
import re
def solution(new_id):
level4 = re.sub("^\.|\.$","",re.sub("\.+",".",re.sub("[^a-z0-9-_\.]","",new_id.lower())))
if len(level4) == 0: level4 += "a"
if len(level4) >= 16:
level4 = level4[:15]
if level4[14] == ".": level4 = level4[:14]
if len(level4) <= 2: level4 = level4.ljust(3,level4[-1])
return level4
혹은 다음과 같이 4단계까지는 정규식으로 한 번에 표현할 수 있다.