데이터 처리 전문가가 되고 싶은 "어피치"는 문자열을 압축하는 방법에 대해 공부를 하고 있습니다. 최근에 대량의 데이터 처리를 위한 간단한 비손실 압축 방법에 대해 공부를 하고 있는데, 문자열에서 같은 값이 연속해서 나타나는 것을 그 문자의 개수와 반복되는 값으로 표현하여 더 짧은 문자열로 줄여서 표현하는 알고리즘을 공부하고 있습니다.
간단한 예로 "aabbaccc"의 경우 "2a2ba3c"(문자가 반복되지 않아 한번만 나타난 경우 1은 생략함)와 같이 표현할 수 있는데, 이러한 방식은 반복되는 문자가 적은 경우 압축률이 낮다는 단점이 있습니다. 예를 들면, "abcabcdede"와 같은 문자열은 전혀 압축되지 않습니다. "어피치"는 이러한 단점을 해결하기 위해 문자열을 1개 이상의 단위로 잘라서 압축하여 더 짧은 문자열로 표현할 수 있는지 방법을 찾아보려고 합니다.
예를 들어, "ababcdcdababcdcd"의 경우 문자를 1개 단위로 자르면 전혀 압축되지 않지만, 2개 단위로 잘라서 압축한다면 "2ab2cd2ab2cd"로 표현할 수 있습니다. 다른 방법으로 8개 단위로 잘라서 압축한다면 "2ababcdcd"로 표현할 수 있으며, 이때가 가장 짧게 압축하여 표현할 수 있는 방법입니다.
다른 예로, "abcabcdede"와 같은 경우, 문자를 2개 단위로 잘라서 압축하면 "abcabc2de"가 되지만, 3개 단위로 자른다면 "2abcdede"가 되어 3개 단위가 가장 짧은 압축 방법이 됩니다. 이때 3개 단위로 자르고 마지막에 남는 문자열은 그대로 붙여주면 됩니다.
압축할 문자열 s가 매개변수로 주어질 때, 위에 설명한 방법으로 1개 이상 단위로 문자열을 잘라 압축하여 표현한 문자열 중 가장 짧은 것의 길이를 return 하도록 solution 함수를 완성해주세요.
s | result |
---|---|
"aabbaccc" | 7 |
"ababcdcdababcdcd" | 9 |
"abcabcdede" | 8 |
"abcabcabcabcdededededede" | 14 |
"xababcdcdababcdcd" | 17 |
입출력 예 #1
문자열을 1개 단위로 잘라 압축했을 때 가장 짧습니다.
입출력 예 #2
문자열을 8개 단위로 잘라 압축했을 때 가장 짧습니다.
입출력 예 #3
문자열을 3개 단위로 잘라 압축했을 때 가장 짧습니다.
입출력 예 #4
문자열을 2개 단위로 자르면 "abcabcabcabc6de" 가 됩니다.
문자열을 3개 단위로 자르면 "4abcdededededede" 가 됩니다.
문자열을 4개 단위로 자르면 "abcabcabcabc3dede" 가 됩니다.
문자열을 6개 단위로 자를 경우 "2abcabc2dedede"가 되며, 이때의 길이가 14로 가장 짧습니다.
입출력 예 #5
문자열은 제일 앞부터 정해진 길이만큼 잘라야 합니다.
따라서 주어진 문자열을 x / ababcdcd / ababcdcd 로 자르는 것은 불가능 합니다.
이 경우 어떻게 문자열을 잘라도 압축되지 않으므로 가장 짧은 길이는 17이 됩니다.
import Foundation
func solution(_ s:String) -> Int {
var input = s.map {String($0)}
var result = [String]()
var strLength = [Int]()
// 1부터 문자열의 길이까지 반복하며 모든 경우를 확인한다.
for i in 1...s.count {
// while문 돌기 전에 미리 previeousStr 넣어놓기
// 이 둘을 비교해서 같으면 counting을 1씩 증가할 것이다.
var previousStr = input[0...i-1].joined() // 이전 문자열
var currentStr = "" // 현재 문자열
var counting = 1
// input 배열에서 이전 문자열 부분 삭제
input.removeSubrange(0...i-1)
// input 배열이 빈 배열이 될 때까지 반복
while !input.isEmpty {
// input의 길이가 i 보다 큰지 아닌지로 나눠서 구현
// → currentStr에 현재 문자열을 넣고 input 배열에서는 삭제할건데
// input의 index 범위가 맞지 않으면 에러가 발생하므로
if input.count >= i {
currentStr = input[0...i-1].joined()
input.removeSubrange(0...i-1)
} else {
let lastIndex = input.lastIndex(of: input.last!)!
currentStr = input[0...lastIndex].joined()
input.removeSubrange(0...lastIndex)
}
// 현재 문자열과 이전 문자열 비교
// 같으면 counting + 1
// 다르면 result 배열에 counting과 이전 문자열 넣고 counting 초기화
if currentStr == previousStr {
counting = counting + 1
} else {
result.append(String(counting))
result.append(previousStr)
counting = 1
}
previousStr = currentStr
} // while문 종료
// (예시) 이 부분이 없으면 result는 2a2ba3c 가 아닌 2a2ba
// input이 비었을 때, 3c까지 result에 넣는 것이다.
if input.isEmpty {
result.append(String(counting))
result.append(previousStr)
}
input = s.map {String($0)}
// 1은 제외
result.removeAll { $0 == "1" }
// strLength 배열에 result의 길이를 넣는다.
strLength.append(result.joined().count)
result = []
} // for문 종료
// strLength 중 최소값 return
return strLength.min()!
}
정확성 | 테스트 | 정확성 | 테스트 |
---|---|---|---|
테스트 1 〉 | 통과 (0.37ms, 16.6MB) | 테스트 2 〉 | 통과 (12.05ms, 16.3MB) |
테스트 3 〉 | 통과 (4.29ms, 16.5MB) | 테스트 4 〉 | 통과 (0.38ms, 16.5MB) |
테스트 5 〉 | 통과 (0.13ms, 16.3MB) | 테스트 6 〉 | 통과 (0.51ms, 16.5MB) |
테스트 7 〉 | 통과 (14.27ms, 16.5MB) | 테스트 8 〉 | 통과 (14.98ms, 16.6MB) |
테스트 9 〉 | 통과 (31.79ms, 16.4MB) | 테스트 10 〉 | 통과 (248.15ms, 16.6MB) |
테스트 11 〉 | 통과 (1.31ms, 16.5MB) | 테스트 12 〉 | 통과 (1.45ms, 16.6MB) |
테스트 13 〉 | 통과 (2.51ms, 16.7MB) | 테스트 14 〉 | 통과 (25.32ms, 16.2MB) |
테스트 15 〉 | 통과 (1.79ms, 16.6MB) | 테스트 16 〉 | 통과 (0.21ms, 16.6MB) |
테스트 17 〉 | 통과 (64.90ms, 16.6MB) | 테스트 18 〉 | 통과 (73.92ms, 16.7MB) |
테스트 19 〉 | 통과 (65.41ms, 16.7MB) | 테스트 20 〉 | 통과 (263.09ms, 16.5MB) |
테스트 21 〉 | 통과 (252.82ms, 16.7MB) | 테스트 22 〉 | 통과 (237.58ms, 16.4MB) |
테스트 23 〉 | 통과 (240.04ms, 16.6MB) | 테스트 24 〉 | 통과 (211.63ms, 16.7MB) |
테스트 25 〉 | 통과 (253.75ms, 16.6MB) | 테스트 26 〉 | 통과 (236.85ms, 16.6MB) |
테스트 27 〉 | 통과 (253.25ms, 16.8MB) | 테스트 28 〉 | 통과 (0.20ms, 16.5MB) |
import Foundation
func solution(_ s:String) -> Int {
return solve(input: s, len: 1).count
}
func solve(input :String, len:Int) -> String {
// 재귀함수 종료 구문
// len(문자를 자를 단위)이 input/2 보다 크면 input 반환
if len > (input.count / 2) {
return input
}
var count = 0
var curstr = "" // 현재 문자열
var result = "" // 반환할 문자열
// input 문자열을 len 단위로 자르고 그 각각을 str로 명칭하여 반복
for str in input.split(by: len) {
// str과 curstr이 같으면 count + 1하고
// 다르면 result 문자열에 resultString 함수 반환결과 넣기
if str != curstr {
result += resultString(input: curstr, count: count)
curstr = str
count = 0
} else {
count += 1
}
} // for문 종료
// for문이 끝나고 한번 더 해줘야 마지막 문자열이 들어간다.
result += resultString(input: curstr, count: count)
// len 값을 1 증가하여 재귀함수 실행
let result2 = solve(input: input, len: len+1)
if result2.count < result.count {
return result2
}
return result
}
// result 문자열에 넣어야 할 String 값을 반환하는 함수
@inline(__always) func resultString(input:String, count:Int) -> String {
if count > 0 {
return "\(count + 1)" + input
}
return input
}
// String 확장
extension String {
func split(by length: Int) -> [String] {
var startIndex = self.startIndex
var results = [Substring]()
while startIndex < self.endIndex {
let endIndex = self.index(startIndex, offsetBy: length, limitedBy: self.endIndex) ?? self.endIndex
results.append(self[startIndex..<endIndex])
startIndex = endIndex
}
return results.map { String($0) }
}
}
정확성 | 테스트 | 정확성 | 테스트 |
---|---|---|---|
테스트 1 〉 | 통과 (0.16ms, 16.2MB) | 테스트 2 〉 | 통과 (2.17ms, 16.4MB) |
테스트 3 〉 | 통과 (1.56ms, 16.5MB) | 테스트 4 〉 | 통과 (0.19ms, 16.4MB) |
테스트 5 〉 | 통과 (0.00ms, 16.4MB) | 테스트 6 〉 | 통과 (0.14ms, 16.1MB) |
테스트 7 〉 | 통과 (4.13ms, 16.3MB) | 테스트 8 〉 | 통과 (2.33ms, 16.4MB) |
테스트 9 〉 | 통과 (3.54ms, 16.2MB) | 테스트 10 〉 | 통과 (23.14ms, 16.9MB) |
테스트 11 〉 | 통과 (0.32ms, 16.4MB) | 테스트 12 〉 | 통과 (0.31ms, 16.2MB) |
테스트 13 〉 | 통과 (0.40ms, 16.4MB) | 테스트 14 〉 | 통과 (3.39ms, 16.4MB) |
테스트 15 〉 | 통과 (0.40ms, 16.4MB) | 테스트 16 〉 | 통과 (0.06ms, 16.3MB) |
테스트 17 〉 | 통과 (8.47ms, 16.7MB) | 테스트 18 〉 | 통과 (8.10ms, 16.7MB) |
테스트 19 〉 | 통과 (8.52ms, 16.6MB) | 테스트 20 〉 | 통과 (28.97ms, 16.7MB) |
테스트 21 〉 | 통과 (30.39ms, 16.8MB) | 테스트 22 〉 | 통과 (30.65ms, 16.8MB) |
테스트 23 〉 | 통과 (25.37ms, 17.2MB) | 테스트 24 〉 | 통과 (23.29ms, 16.7MB) |
테스트 25 〉 | 통과 (26.17ms, 16.7MB) | 테스트 26 〉 | 통과 (28.83ms, 16.9MB) |
테스트 27 〉 | 통과 (30.59ms, 16.7MB) | 테스트 28 〉 | 통과 (0.07ms, 16.4MB) |
목표 풀이 시간 : 1시간
실제 풀이 시간 : 2시간 18분
정답률 : 25.9%
실제 코딩 테스트였다면 망했다..
이 문제는 2020년 카카오의 신입 개발자 채용을 위해 출제된 문제로 테스트에는 총 7문제가 출제되었고, 5시간 안에 순서와 상관없이 문제를 해결해야 했다.
'문자열 압축'이 첫 번째로 배치된 가장 쉬운 문제다.
문자열을 다룰 수 있고, 아래 예시와 같이 문자열과 관련된 다양한 작업을 할 수 있는지 파악
참고
문자열 길이가 최대 1,000으로 제한이 크지 않기 때문에, 가능한 모든 방법을 탐색하면 됩니다. 문자열 길이가 N일 때, 길이가 N/2 보다 크게 잘랐을 때는 길이가 줄지 않습니다. 따라서 1 ~ N/2 길이로 자르는 방법을 모두 탐색한 후 그중 가장 짧은 방법을 선택하면 됩니다.
출제 의도를 보니 통과해도 기뻐할 수 없었다.
왜냐하면 나는 배열을 이용해 문제를 풀었기 때문이다..
문제에서 문자열에 대해 많이 언급해서 문자열로 풀어야 할 것 같았다.
그래서 처음에는 문자열로 풀이를 시도했지만, 부분 문자열 얻기나 문자열 자르기의 경우 라이브러리 함수를 이용해 문제를 해결할 수 없었다.
(extension으로 확장하면 됐었다..)
그래서 결국 배열로 문제를 풀었는데, 그러면 실행 시간이 오래 걸릴 것 같았다.
테스트 결과를 보면 확실히 다른 사람의 풀이가 더 빠르다.
역시 문자열로 풀었어야 했다..
‼️ 느낀 점 ‼️
1. 복잡한 풀이는 함수를 따로 만들자.
2. 문제가 원하는 대로 코딩하자.
3. extension을 활용하자.
4. 실행 시간 최소화를 고려하며 코딩하자.
5. 제일 큰 목표는 문제 풀이 시간 단축!