[BOJ/백준/Python] 20920번 영단어 암기는 괴로워

Song Chae Won·2024년 4월 15일

알고리즘

목록 보기

7/10

🧷 20920번 영단어 암기는 괴로워

(문제 링크: https://www.acmicpc.net/problem/20920)

🌸 문제
화은이는 이번 영어 시험에서 틀린 문제를 바탕으로 영어 단어 암기를 하려고 한다. 그 과정에서 효율적으로 영어 단어를 외우기 위해 영어 단어장을 만들려 하고 있다. 화은이가 만들고자 하는 단어장의 단어 순서는 다음과 같은 우선순위를 차례로 적용하여 만들어진다.

(1) 자주 나오는 단어일수록 앞에 배치한다.
(2) 해당 단어의 길이가 길수록 앞에 배치한다.
(3) 알파벳 사전 순으로 앞에 있는 단어일수록 앞에 배치한다

M보다 짧은 길이의 단어의 경우 읽는 것만으로도 외울 수 있기 때문에 길이가 M이상인 단어들만 외운다고 한다. 화은이가 괴로운 영단어 암기를 효율적으로 할 수 있도록 단어장을 만들어 주자.

🌸 입력
첫째 줄에는 영어 지문에 나오는 단어의 개수 N과 외울 단어의 길이 기준이 되는 M이 공백으로 구분되어 주어진다. 둘째 줄부터 N+1번째 줄까지 외울 단어를 입력받는다. 이때의 입력은 알파벳 소문자로만 주어지며 단어의 길이는 10을 넘지 않는다. 단어장에 단어가 반드시 1개 이상 존재하는 입력만 주어진다.

🌸 출력
화은이의 단어장에 들어 있는 단어를 단어장의 앞에 위치한 단어부터 한 줄에 한 단어씩 순서대로 출력한다.

🌸 풀이

# 길이가 목표 길이와 같은 단어들을 최소 출현 빈도가 높은 순으로 정렬
# 출현 빈도가 동일한 경우, 길이가 더 긴 단어가 앞에 위치
# 길이가 목표 길이와 같고, 출현 빈도도 동일한 경우, 사전 순으로 정렬

import sys

# 입력 받기 - 맨 끝의 \n까지 같이 입력받기 때문에 rstrip()을 추가
n, m = map(int, input().split())
words = [sys.stdin.readline().rstrip() for _ in range(n)]

# 단어의 길이와 단어가 나온 횟수를 저장할 딕셔너리(key-value) 생성
word_counts = {}

# 각 단어의 길이와 횟수를 계산하여 딕셔너리에 저장
for word in words:
    if len(word) >= m:
        word_counts[word] = word_counts.get(word, 0) + 1

# 정렬 기준에 맞게 정렬 (횟수 내림차순, 길이 내림차순, 사전 순)
sorted_words = sorted(word_counts.items(), key=lambda x: (-x[1], -len(x[0]), x[0]))

# 출력
for word, count in sorted_words:
    print(word)

⌛ 시간복잡도

sorted_words = sorted(word_counts.items(), key=lambda x: (-x[1], -len(x[0]), x[0]))

딕셔너리를 정렬하는 데에는 sorted() 함수를 사용하며, 정렬 키는 세 가지 조건에 따라 결정된다. 정렬에는 퀵정렬 알고리즘을 사용하며, 퀵정렬 알고리즘은 최악의 경우 시간 복잡도가 O(nlogn) 이다.

따라서 이 풀이의 시간복잡도는 O(nlogn)

📕 딕셔너리

딕셔너리는 키-값 쌍으로 이루어진 자료구조로, 각 키는 해당하는 값에 연결되어 있으며, 이를 통해 빠르게 값을 검색할 수 있다. 이 문제에서는 각 단어의 출현 횟수를 저장하기 위해 딕셔너리를 사용!

이진 탐색 알고리즘의 구현

word_counts = {}

for word in words:
    if len(word) >= m:
        word_counts[word] = word_counts.get(word, 0) + 1

이렇게 하여 word_counts 딕셔너리에는 길이가 목표 길이보다 큰 단어들의 출현 횟수가 저장된다. 이 출현 횟수를 바탕으로 정렬을 수행하여 최종 결과를 얻을 수 있다!

Song Chae Won

@chhaewxn

이전 포스트

[BOJ/백준/Python] 2512번 예산 - 이분탐색

다음 포스트