Programmers Coding Quiz #25 [카카오]신규아이디 추천

김기욱·2021년 2월 4일
0

코딩테스트

목록 보기
25/68
post-custom-banner

문제 설명

카카오에 입사한 신입 개발자 네오는 카카오계정개발팀에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. 네오에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.

다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

네오는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 newid의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(
), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

예를 들어, new_id 값이 ...!@BaT#*..y.abcdefghijklm 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#..y.abcdefghijklm" → "...!@bat#..y.abcdefghijklm"

2단계 '!', '@', '#', '' 문자가 제거되었습니다.
"...!@bat#
..y.abcdefghijklm" → "...bat..y.abcdefghijklm"

3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id가 ...!@BaT#*..y.abcdefghijklm일 때, 네오의 프로그램이 추천하는 새로운 아이디는 bat.y.abcdefghi 입니다.

제한사항

  • new_id는 길이 1 이상 1,000 이하인 문자열입니다.
  • new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
  • newid에 나타날 수 있는 특수문자는 -.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

입출력 예

nonew_idresult
예1"...!@BaT#*..y.abcdefghijklm""bat.y.abcdefghi"
예2"z-+.^.""z--"
예3"=.=""aaa"
예4"123_.def""123_.def"
예5"abcdefghijklmn.p""abcdefghijklmn"

풀이

def dot_eraser(proper_id):
    if proper_id[-1:] == ['.']:
        del proper_id[-1]
    if proper_id[:1] == ['.']:
        del proper_id[0]
    return proper_id

def compress_dot(proper_id):
    result = []
    for v in proper_id:
        if v == '.' and result[-1:] == [v]:
            continue
        result.append(v)
    return result
    
def solution(new_id):
    #허용되지 않은 대문자/특문 제거
    proper_id = [v for v in new_id.lower() if v.isalpha() or v.isdigit() or v in ('-', '_', '.')]
    
    # dot(.) 중복제거
    proper_id = compress_dot(proper_id)
    
    # 양 끝 dot(.) 제거
    dot_eraser(proper_id)
    
    if proper_id == []:
        proper_id.append('a')
    if len(proper_id) > 15:
        proper_id = proper_id[0:15]
        
    # 양 끝 dot(.) 제거
    dot_eraser(proper_id)
    
    if len(proper_id) == 2:
        proper_id = proper_id + [proper_id[-1]]
    if len(proper_id) == 1:
        proper_id = proper_id + [proper_id[-1], proper_id[-1]]
        
    return ''.join(proper_id)

순서에 맞춰서 차근차근 해결하시면 됩니다.

  1. 허용되지않은 대문자/특문이 제거된 '리스트'를 만들어줍니다.
  2. dot(.)중복제거를 해줍니다. 해당 로직은 같은 숫자는 싫어에서도 쓰였던 중복제거 로직입니다.
  3. 양 끝에 dot(.)을 제거해줍니다. 해당 과정은 두 번 필요합니다.
  4. 현 단계에서 빈 배열이면 'a'를 추가, 15보다 크면 슬라이싱을 해줍니다. 슬라이싱 과정에서 14번째 있었던 dot(.)가 맨 끝으로 가는 가능성이 존재합니다. 다시 한번 dot을 제거해줍니다.
  5. 3미만인 경우는 1,2뿐입니다. (빈 배열은 존재할 수 없습니다. 이미 'a'로 채웠기 때문이죠)
    그러므로 경우에 맞춰서 끝 문자를 두 번 혹은 한 번 넣어줍니다.
  6. 모든 과정이 끝났으면 리스트를 다시 문자열로 반환합니다.

다른풀이

import re

def solution(new_id):
    st = new_id
    st = st.lower()
    st = re.sub('[^a-z0-9\-_.]', '', st)
    st = re.sub('\.+', '.', st)
    st = re.sub('^[.]|[.]$', '', st)
    st = 'a' if len(st) == 0 else st[:15]
    st = re.sub('^[.]|[.]$', '', st)
    st = st if len(st) > 2 else st + "".join([st[-1] for i in range(3-len(st))])
    return st

정규식을 매우 잘 활용한 방식이네요. 이런거 볼 때마다 정규식 공부의 필요성을 여실히 느끼게 되네요. 😞
dot중복제거도 정규식을 써서 풀 수 있다는 걸 처음 알았네요.

profile
어려운 것은 없다, 다만 아직 익숙치않을뿐이다.
post-custom-banner

0개의 댓글