프로그래머스(Programmers) : 압축 - python 풀이

JISU LIM·2023년 8월 29일

Algorithm Study Records

목록 보기

48/79

🔴 문제 요약

주어진 LZW 압축 조건대로 문자열을 압축하여 출력하는 문제
LZW 압축은 다음 과정을 거친다.
1. 길이가 1인 모든 단어를 포함하도록 사전을 초기화한다.
2. 사전에서 현재 입력과 일치하는 가장 긴 문자열 w를 찾는다.
3. w에 해당하는 사전의 색인 번호를 출력하고, 입력에서 w를 제거한다.
4. 입력에서 처리되지 않은 다음 글자가 남아있다면(c), w+c에 해당하는 단어를 사전에 등록한다.
5. 단계 2로 돌아간다.

🟠 접근 방법

주어지는 문자열의 길이는 1000글자 이하이므로 문자열을 활용하는 로직은 O(N^2)까지 적용 가능하다.
색인 번호를 담을 해시 테이블을 만들어서 관리한다.
투 포인터(i, j)를 활용해서 색인을 참조할 문자열을 결정
- 기준 문자(i) 부터 (사전에 있는 단어 + 다음 단어)가 없을 때까지 j를 증가시켜 사전에 있는 단어는 출력, 없는 단어는 등록을 반복하면 된다.

🟡 풀이 코드

from typing import List, Dict

def solution(msg: str) -> List[int]:

    hash_table: Dict[str:int] = {ch:idx+1 for idx, ch in enumerate('ABCDEFGHIJKLMNOPQRSTUVWXYZ')}   # 길이가 1인 모든 사전 단어 초기화
    answer: List[int] = []
    i: int = 0
    count: int = 26     # 현재 사전에 26개 초기화 되어 있음

    while i < len(msg):                                     # 기준 문자(i)가 문자열 순회를 마칠 때까지
        j=i+1                                                   # j는 i+1로 초기화 / 'apple'을 예시 'apple'[0:1] -> 'a'

        while j < len(msg) and msg[i:j+1] in hash_table:    # (사전에 있는 단어 + 다음 단어)가 사전에 없을 때까지
            j+=1                                                # 'apple'의 경우 'a'는 사전에 있고, 'ap' 는 사전에 없으므로 j는 2까지 증가

        answer.append(hash_table[msg[i:j]])                 # 사전에 있는 단어는 출력 / 'a'는 출력
        count += 1
        hash_table[msg[i:j+1]] = count                      # 사전에 없는 단어는 count 증가 시켜서 사전에 넣기  / 'ap'는 사전에 다음 색인 번호로 인덱싱해서 추가
        i=j                                                 # 출력 다음 부분부터 다시 탐색 시작

    return answer

🙏 문제 접근 방법 및 코드에 대한 피드백과 질문은 환영입니다!

✏️ Algorithm Study

본 문제의 다른 풀이 및 피드백, 전체 문제 풀이 순서는 위 알고리즘 스터디 Repository에서도 확인 가능합니다.

JISU LIM

Grow Exponentially

이전 포스트

프로그래머스(Programmers) : 네트워크 - python 풀이

다음 포스트