[프로그래머스 level3] 불량 사용자

mokomoko·2022년 2월 14일
0
post-custom-banner

1. 문제


개발팀 내에서 이벤트 개발을 담당하고 있는 "무지"는 최근 진행된 카카오이모티콘 이벤트에 비정상적인 방법으로 당첨을 시도한 응모자들을 발견하였습니다. 이런 응모자들을 따로 모아 불량 사용자라는 이름으로 목록을 만들어서 당첨 처리 시 제외하도록 이벤트 당첨자 담당자인 "프로도" 에게 전달하려고 합니다. 이 때 개인정보 보호을 위해 사용자 아이디 중 일부 문자를 '' 문자로 가려서 전달했습니다. 가리고자 하는 문자 하나에 '' 문자 하나를 사용하였고 아이디 당 최소 하나 이상의 '*' 문자를 사용하였습니다.
"무지"와 "프로도"는 불량 사용자 목록에 매핑된 응모자 아이디를 제재 아이디 라고 부르기로 하였습니다.

예를 들어, 이벤트에 응모한 전체 사용자 아이디 목록이 다음과 같다면

응모자 아이디
frodo
fradi
crodo
abc123
frodoc

다음과 같이 불량 사용자 아이디 목록이 전달된 경우,

불량 사용자
fr*d*
abc1**

불량 사용자에 매핑되어 당첨에서 제외되어야 야 할 제재 아이디 목록은 다음과 같이 두 가지 경우가 있을 수 있습니다.

제재 아이디
frodo
abc123

제재 아이디
fradi
abc123

이벤트 응모자 아이디 목록이 담긴 배열 user_id와 불량 사용자 아이디 목록이 담긴 배열 banned_id가 매개변수로 주어질 때, 당첨에서 제외되어야 할 제재 아이디 목록은 몇가지 경우의 수가 가능한 지 return 하도록 solution 함수를 완성해주세요.

제한 사항

  • user_id 배열의 크기는 1 이상 8 이하입니다.
  • user_id 배열 각 원소들의 값은 길이가 1 이상 8 이하인 문자열입니다.
    - 응모한 사용자 아이디들은 서로 중복되지 않습니다.
    - 응모한 사용자 아이디는 알파벳 소문자와 숫자로만으로 구성되어 있습니다.
  • banned_id 배열의 크기는 1 이상 user_id 배열의 크기 이하입니다.
  • banned_id 배열 각 원소들의 값은 길이가 1 이상 8 이하인 문자열입니다.
    - 불량 사용자 아이디는 알파벳 소문자와 숫자, 가리기 위한 문자 '*' 로만 이루어져 있습니다.
    - 불량 사용자 아이디는 '*' 문자를 하나 이상 포함하고 있습니다.
    - 불량 사용자 아이디 하나는 응모자 아이디 중 하나에 해당하고 같은 응모자 아이디가 중복해서 - 제재 아이디 목록에 들어가는 경우는 없습니다.
  • 제재 아이디 목록들을 구했을 때 아이디들이 나열된 순서와 관계없이 아이디 목록의 내용이 동일하다면 같은 것으로 처리하여 하나로 세면 됩니다.

- 키워드

  • itertools의 permutations을 활용해보자.
  • permutations은 중복이 있을 수 있으므로 체크 잘 할 것

2. 풀이


처음에 이 문제를 풀 때 어떻게 접근해볼까 생각을 해봤다.

user_id와 banned_id의 표본이 크지 않아서

permutations나 combinations를 활용할 수 있을 거 같았다.

combination의 경우 중복이 없다보니 간과하는 경우가 있어서 사용할 수 없으므로

permutation을 활용했다.

단, permutation을 활용할 경우 중복이 많으므로, answer를 저장할 때 잘 추려내야 한다.

예를 들어 테스트케이스로 나왔던 예제를 살펴보자

user_id : ["frodo", "fradi", "crodo", "abc123", "frodoc"]

banned_id : ["fr*d*", "*rodo", "******", "******"]

fr*d* : frodo, fradi

*rodo : frodo, crodo

****** : abc123, frodoc

으로 정리 할 수 있다.

결과 값은 3으로

(fradi, frodo, abc123, frodoc)
(frodo, crodo, abc123, frodoc)
(fradi, crodo, abc123, frodoc)

으로 정리 할 수 있다.

문제는 이것을 combinations를 활용하면,

경우의 수에서 (fradi, frodo, abc123, frodoc)를 배제하게 된다.

그러므로 permutation을 활용하도록 한다.

그렇다면 비교를 마치고 어떻게해야 중복을 피할 수 있을까?

나는 다음과 같은 방법을 선택했다.

  1. banned_id 조건에 부합하는 user_id 집합을 찾는다.

  2. user_id 집합을 정렬한다.

  3. user_id 를 하나의 문자열로 통합하고 answer에 저장한다.

이렇게 한다면 (fradi,frodo,abc123,frodoc) , (fradi,frodo,frodoc,abc123) 과 같은

중복 값들이 abc123fradifrodofrodoc , abc123fradifrodofrodoc 으로 변형되서

중복을 피할 수 있게 된다.

3. 소스코드


from itertools import permutations

def solution(user_id,banned_id):
	answer = []
	combi = list(permutations(user_id,len(banned_id)))
	for i in combi:
		is_user = True
		for user,ban in zip(i,banned_id):
			if len(user) == len(ban):
				for u,b in zip(user,ban):
					if u != b and b != '*':
						is_user = False
						break
			else:
				is_user = False
				break
			if not is_user:
				break

		if is_user:
			temp = list(i)
			temp.sort()
			temp = ''.join(temp)
			if temp not in answer:
				answer.append(temp)
	return len(answer)

if __name__ == "__main__":
	print(solution(["frodo", "fradi", "crodo", "abc123", "frodoc"],	["fr*d*", "abc1**"]))

4. 후기


문제 자체는 복잡한 연산을 요구한다기보다는 좀 껄끄러운 연산이라고 표현하는게 맞다고 본다.

itertools의 경우 표본이 작은 경우 편하다는 것을 느낄 수 있지만,

표본이 조금만 커지면 시간적/공간적으로 부담을 줄 수 있으니

다른 방법으로도 푸는 것을 권장한다.

다른 방법으로는 백트래킹이 적합할 거 같다.

리스트를 두고 banned_id의 길이만큼만 백트래킹을 하는 방법이 좋을거 같으나

이 역시 표본이 크다면 활용하기 어려울 거 같다.

요즘 자기소개서를 작성하는데 상당히 어려움을 겪고있다.

알고리즘 문제를 풀어도 생각을 풀어쓰는 시간을 갖지 못했다. 사실 멘탈이 나간게 제일크다

계속 하다보면 언젠가 내가 어떤 사람인지 쉽게 쓸 수 있는날이 올까...

post-custom-banner

0개의 댓글