[Programmers] 신규 아이디 추천

MJ·2021년 5월 3일
0

1. 문제 설명

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#*..y.abcdefghijklm""...!@bat#*..y.abcdefghijklm"

2단계 '!', '@', '#', '' 문자가 제거되었습니다.
`"...!@bat#
..y.abcdefghijklm""...bat..y.abcdefghijklm"`

3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm"".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm""bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm""bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm""bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi""bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id"...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.

[문제]

신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

new_id는 길이 1이상 1,000 이하 문자열입니다.
new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

[입출력 예]

nonew_idresult
예1"...!@BaT#*..y.abcdefghijklm""bat.y.abcdefghi"
예2"z-+.^.""z--"
예3"=.=""aaa"
예4"123_.def""123_.def"
예5"abcdefghijklmn.p""abcdefghijklmn"

입출력 예에 대한 설명

입출력 예 #1
문제의 예시와 같습니다.

입출력 예 #2
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.

1단계 변화 없습니다.
2단계 "z-+.^.""z-.."
3단계 "z-..""z-."
4단계 "z-.""z-"
5단계 변화 없습니다.
6단계 변화 없습니다.
7단계 "z-""z--"

입출력 예 #3
7단계를 거치는 동안 new_id가 변화하는 과정은 아래와 같습니다.

1단계 변화 없습니다.
2단계 "=.=""."
3단계 변화 없습니다.
4단계 ".""" (new_id가 빈 문자열이 되었습니다.)
5단계 """a"
6단계 변화 없습니다.
7단계 "a""aaa"

입출력 예 #4
1단계에서 7단계까지 거치는 동안 new_id("123_.def")는 변하지 않습니다. 즉, new_id가 처음부터 카카오의 아이디 규칙에 맞습니다.

입출력 예 #5
1단계 변화 없습니다.
2단계 변화 없습니다.
3단계 변화 없습니다.
4단계 변화 없습니다.
5단계 변화 없습니다.
6단계 "abcdefghijklmn.p""abcdefghijklmn.""abcdefghijklmn"
7단계 변화 없습니다.

2. 해설

2020 하반기 카카오 공채 기출문제. 말 그대로 시키는 대로 구현하면 되는 문제인데, 당신이 정규 표현식을 알고 있다면 코드가 깔끔하겠지만 모른다면 아마 코드가 스파게티처럼 꼬여서 채용 담당자가 코드를 읽어본다면 너무 더러워서 기능이 제대로 동작한다고 해도 감점시킬지도 모를 일이다.

다행히 파이썬에는 re라는 정규 표현식을 지원하는 라이브러리가 있으니, 이걸 사용하여 단계별로 어떻게 풀어나가는지 설명해볼까 한다.

1단계: 대문자 -> 소문자 변환

string.lower()를 쓰면 대문자는 알아서 소문자로 변환이 된다.

2단계:"-_."를 제외한 특수 문자 제거

import re
new_id = "...!@BaT#*..y.abcdefghijklm"

new_id = re.sub('[^a-z\d\-\_\.]', '', new_id.lower())
print(new_id)

>>>'...bat..y.abcdefghijklm'

re.sub(정규 표현식, 대상 문자열, 치환 문자)는 치환 문자에서 정규 표현식에 해당하는 문자를 대상 문자열로 바꿔주는 함수다. 예제의 정규 표현식을 해석해보자면, 우선 []은 문자열 클래스로, 대괄호 안의 문자열을 찾겠다는 뜻이다. a-z는 소문자 a부터 z까지, \d는 숫자(integer)를, \-는 '-'라는 특수문자를 찾겠다는 거다. 그리고 앞에 붙은 ^ 기호는 문자열 클래스 안에서는 not 기호로 작동하는데, 결과적으로 new_id에서 소문자, 숫자, '-_.'를 제외한 모든 문자를 공백 문자로 치환, 즉 지우겠다는 것이다.

3단계: 마침표(.)가 2개 이상 연속된 부분을 하나로 치환

이것도 정규 표현식을 이용해서 풀어보자. '\.\.+'라는 정규표현식은 마침표가 2번 이상 반복('+' 기호)된 문자열을 찾는다는 뜻이다. 이걸로 3단계 해결!

4단계: 마침표(.)가 처음이나 끝에 위치한다면 제거

'^\.|\.$'는 문자열의 처음('^' 기호) 또는('|': or) 마지막('$' 기호)에 마침표가 오는지 확인한다. 앞서 문자열 클래스에서는 ^가 not으로 기능한다고 했는데, 이외의 상황에서는 문자열의 처음을 가리키는 기호로 사용됨을 알아두자.

5단계: new_id가 빈 문자열일 경우 "a" 대입

이건 쉬우니 넘어간다.

6단계: new_id의 길이가 16자 이상이면, 첫 15개의 문자를 제외한 나머지 문자 모두 제거. 만약 제거 후에 마침표가 끝에 위치한다면 마침표 제거.

첫 15자까지 슬라이싱은 new_id[0:15]를 하면 되고, 마지막에 마침표가 오는지 체크하는건 '\.$'라는걸 앞에서 다뤘으니 알고 있으리라 믿는다.

7단계: 길이가 2자 이하라면 마지막 문자를 길이가 3이 될 때까지 붙여주기

이것도 쉬우니 넘어가겠다.

이렇게 해서 코드를 짜주면...

3. 코드

import re

def solution(new_id):
    ans = re.sub('[^a-z\d\-\_\.]', "", new_id.lower()) #1단계 & 2단계
    ans = re.sub('\.\.+', ".", ans) #3단계
    ans = re.sub('^\.|\.$', "", ans) #4단계
    
    if ans == "": #5단계
        ans = "a"
    
    ans = re.sub('\.$', '', ans[0:15]) #6단계
    
    while len(ans) < 3: #7단계
        ans += ans[-1:]
    
    return ans

4. 문제를 풀고 나서

나도 처음엔 정규 표현식을 모르고 있어서 노가다로 짜다가 코드가 한없이 길어지는 것을 보고 이건 아니다 싶어 구글링해보니 정규 표현식을 써야 빨리 끝나겠구나 느꼈다. 확실히 카카오는 단순 알고리즘 지식뿐만 아니라 이런 CS지식도 알고 있어야 코테를 넘길 수 있는 것 같다.

profile
오늘보다 내일을 더 즐겁게

0개의 댓글