해시 해킹
그린닷컴의 운영자 연두는 비밀번호를 평문 그대로 저장하는 과오를 뒤로하고, 이제부터 암호에 해시 함수를 적용해 저장하려고 한다.
연두가 아는 해시 함수라고는 알고리즘 문제 풀이에 많이 사용되는 롤링 해시 함수밖에 없기 때문에 이것을 응용하여 사용하기로 했다.
그린닷컴의 비밀번호 규칙은 꽤 특이한데, 길이가 정확히 이어야 하며, 비밀번호를 이루는 문자는 지정된 개의 문자 중 하나여야 한다.
따라서, 사용 가능한 각 문자를 부터 차례대로 정수에 대응시키면, 비밀번호를 길이가 N이고 모든 원소가 이상 이하인 배열
로 나타낼 수 있다.
이렇게 비밀번호를 배열 P로 나타낸 후, 미리 정해진 정수 A를 이용하여 다음과 같은 해시 함수 h를 적용한다.
예를 들어 배열
인 경우를 생각해보자. 이 경우
이다.
여기서 는 나머지 연산으로 이므로 이다.
따라서 해시값은 항상 이상 이하의 정수이다.
그린닷컴 관리자 계정의 비밀번호 해시값을 해킹한 재현이는, 이 해시값으로 실제 비밀번호가 뭐였는지 역추적해보려고 한다.
하지만 그린닷컴에서 사용 가능한 비밀번호는 개나 있고, 이 중 과연 알아낸 해시값과 일치하는 비밀번호는 몇 개나 될지 궁금해졌다. 여러분이 이것을 대신 구해주자.
입력
첫째 줄에 비밀번호의 길이 과 문자 종류의 개수 , 정수 가 주어진다.
둘째 줄에 재현이가 알아낸 해시값 정수 가 주어진다.
출력
주어진 해시값을 갖는 비밀번호의 개수를 출력한다. 출력하는 값이 너무 커질 수 있으므로, 이것을 로 나눈 나머지를 출력한다.
초반 1시간 정도는 해싱함수라는 키워드에 매몰되어서 해시맵을 이용해 풀이를 해보려 했으나 시간 초과가 발생했다. 해싱으로는 도저히 1초 안에 큰 숫자를 계산할 수 없어서 문제를 잘 살펴보니 다음과 같은 점을 발견했다.
import sys
MOD = 1_000_000_007
def count_passwords(N, M, A, H):
answer = 1
for i in range(N-1):
answer *= M
answer %= MOD # 오버플로우 방지를 위해 나머지를 미리 계산
return answer
# 입력 처리
N, M, A = map(int, sys.stdin.readline().split())
H = int(sys.stdin.readline().strip())
# 결과 출력
print(count_passwords(N, M, A, H))
>>>
5000000 5000000 5000000
1
73352076 # correct
오늘은 여기까지
-2025.01.23-
ps. 내일부터 해외여행으로 인해 Daily Algorithm은 2주 중단 후 2025.02.11에 다시 재개될 예정이다.