개인정보 수집 유효기간

Huisu·2023년 3월 13일
0

Coding Test Practice

목록 보기
3/119
post-thumbnail

문제

문제 설명

고객의 약관 동의를 얻어서 수집된 1~n번으로 분류되는 개인정보 n개가 있습니다. 약관 종류는 여러 가지 있으며 각 약관마다 개인정보 보관 유효기간이 정해져 있습니다. 당신은 각 개인정보가 어떤 약관으로 수집됐는지 알고 있습니다. 수집된 개인정보는 유효기간 전까지만 보관 가능하며, 유효기간이 지났다면 반드시 파기해야 합니다.

예를 들어, A라는 약관의 유효기간이 12 달이고, 2021년 1월 5일에 수집된 개인정보가 A약관으로 수집되었다면 해당 개인정보는 2022년 1월 4일까지 보관 가능하며 2022년 1월 5일부터 파기해야 할 개인정보입니다.당신은 오늘 날짜로 파기해야 할 개인정보 번호들을 구하려 합니다.

모든 달은 28일까지 있다고 가정합니다.

다음은 오늘 날짜가 2022.05.19일 때의 예시입니다.

약관 종류유효기간
A6 달
B12 달
C3 달
번호개인정보 수집 일자약관 종류
12021.05.02A
22021.07.01B
32022.02.19C
42022.02.20C
  • 첫 번째 개인정보는 A약관에 의해 2021년 11월 1일까지 보관 가능하며, 유효기간이 지났으므로 파기해야 할 개인정보입니다.
  • 두 번째 개인정보는 B약관에 의해 2022년 6월 28일까지 보관 가능하며, 유효기간이 지나지 않았으므로 아직 보관 가능합니다.
  • 세 번째 개인정보는 C약관에 의해 2022년 5월 18일까지 보관 가능하며, 유효기간이 지났으므로 파기해야 할 개인정보입니다.
  • 네 번째 개인정보는 C약관에 의해 2022년 5월 19일까지 보관 가능하며, 유효기간이 지나지 않았으므로 아직 보관 가능합니다.

따라서 파기해야 할 개인정보 번호는 [1, 3]입니다.

오늘 날짜를 의미하는 문자열 today, 약관의 유효기간을 담은 1차원 문자열 배열 terms와 수집된 개인정보의 정보를 담은 1차원 문자열 배열 privacies가 매개변수로 주어집니다. 이때 파기해야 할 개인정보의 번호를 오름차순으로 1차원 정수 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

제한 사항

  • today는 "YYYY.MM.DD" 형태로 오늘 날짜를 나타냅니다.
  • 1 ≤ terms의 길이 ≤ 20
    • terms의 원소는 "약관 종류 유효기간" 형태의 약관 종류와 유효기간을 공백 하나로 구분한 문자열입니다.
    • 약관 종류는 A~Z중 알파벳 대문자 하나이며, terms 배열에서 약관 종류는 중복되지 않습니다.
    • 유효기간은 개인정보를 보관할 수 있는 달 수를 나타내는 정수이며, 1 이상 100 이하입니다.
  • 1 ≤ privacies의 길이 ≤ 100
    • privacies[i]는 i+1번 개인정보의 수집 일자와 약관 종류를 나타냅니다.
    • privacies의 원소는 "날짜 약관 종류" 형태의 날짜와 약관 종류를 공백 하나로 구분한 문자열입니다.
    • 날짜는 "YYYY.MM.DD" 형태의 개인정보가 수집된 날짜를 나타내며, today 이전의 날짜만 주어집니다.
    • privacies의 약관 종류는 항상 terms에 나타난 약관 종류만 주어집니다.
  • today와 privacies에 등장하는 날짜의 YYYY는 연도, MM은 월, DD는 일을 나타내며 점(.) 하나로 구분되어 있습니다.
    • 2000 ≤ YYYY ≤ 2022
    • 1 ≤ MM ≤ 12
    • MM이 한 자릿수인 경우 앞에 0이 붙습니다.
    • 1 ≤ DD ≤ 28
    • DD가 한 자릿수인 경우 앞에 0이 붙습니다.
  • 파기해야 할 개인정보가 하나 이상 존재하는 입력만 주어집니다.

입출력 예

todaytermsprivaciesresult
"2022.05.19"["A 6", "B 12", "C 3"]["2021.05.02 A", "2021.07.01 B", "2022.02.19 C", "2022.02.20 C"][1, 3]
"2020.01.01"["Z 3", "D 5"]["2019.01.01 D", "2019.11.15 Z", "2019.08.02 D", "2019.07.01 D", "2018.12.28 Z"][1, 4, 5]

입출력 예 설명

입출력 예 #1

  • 문제 예시와 같습니다.

입출력 예 #2

약관 종류유효기간
Z3 달
D5 달
번호개인정보 수집 일자약관 종류
12019.01.01D
22019.11.15Z
32019.08.02D
42019.07.01D
52018.12.28Z

오늘 날짜는 2020년 1월 1일입니다.

  • 첫 번째 개인정보는 D약관에 의해 2019년 5월 28일까지 보관 가능하며, 유효기간이 지났으므로 파기해야 할 개인정보입니다.
  • 두 번째 개인정보는 Z약관에 의해 2020년 2월 14일까지 보관 가능하며, 유효기간이 지나지 않았으므로 아직 보관 가능합니다.
  • 세 번째 개인정보는 D약관에 의해 2020년 1월 1일까지 보관 가능하며, 유효기간이 지나지 않았으므로 아직 보관 가능합니다.
  • 네 번째 개인정보는 D약관에 의해 2019년 11월 28일까지 보관 가능하며, 유효기간이 지났으므로 파기해야 할 개인정보입니다.
  • 다섯 번째 개인정보는 Z약관에 의해 2019년 3월 27일까지 보관 가능하며, 유효기간이 지났으므로 파기해야 할 개인정보입니다.

아이디어

날짜는 2022년 03월 12일을 그냥 일렬로 붙여서 20220312라는 숫자로 표현하더라도 그 선후가 바뀌지 않는다. 2022년 03월 01일은 2022년 03월 02일보다 느린 날짜고, 이를 숫자로 바꾸어도 20220301 > 20220302 관계가 성립한다. 따라서 최후에 날짜끼리 비교할 때, 약관 유효 기간에 따라 업데이트된 만료 기간을 int 형으로 캐스팅하여 오늘과 비교하면 될 것이라고 생각하였다.

제출 코드 1 (실패)

def solution(today, terms, privacies):
    answer = []
    # today를 특수 문자 제거하고 int형으로 캐스팅
    today = int(today.replace(".", ""))
    
    for i in range(len(privacies)):
        #privacies의 아이템이 특수 문자 제거된 채 [2023, 03, 13, A] 형식으로 저장
        privacy = privacies[i]
        privacy = privacy.replace(".", " ").split()
        
        for term in terms:
            #terms의 아이템이 [A, 3] 형태로 저장
            term = term.split()
            #만약 약관 종류가 같다면
            if privacy[3] == term[0]:
                #달에다가 추가하기
                privacy[1] = int(privacy[1]) + int(term[1])
        #업데이트한 달이 12보다 크면 년을 올리고 달은 다시 1~12 범위로 설정        
        if privacy[1] > 12:
            privacy[0] = str(int(privacy[0]) + (privacy[1] // 12))
            privacy[1] = (privacy[1] % 12)
            #월이 10보다 작으면 0 추가 3 -> 03
        if privacy[1] < 10:
            privacy[1] = "0" + str(privacy[1])
        else:
            privacy[1] = str(privacy[1])
        #privacy 첫 항목에 str으로 날짜 저장
        privacy[0] = privacy[0] + str(privacy[1]) + privacy[2]
        #만약 오늘보다 늦었다면
        if int(privacy[0]) <= today:
            #답안에 index+1
            answer.append(i+1)
    return answer

실패 원인을 정확하게 찾지는 못했으나 아무래도 int와 str 사이에 수많은 캐스팅이 이루어지며 중간에 빠뜨린 부분이 있는 것 같다. 그리고 형변환 함수를 너무 자주 써서 시간복잡도가 안 그래도 높은데, 코드가 불필요하게 길어지고 비효율적인 느낌이 든다.

제출 코드 2 (성공)

def dateToDay(today):
    #[2023, 03, 13, A] 형식으로 저장
    #날짜수로 반환
    return int(today[0])*12*28 + int(today[1])*28 + int(today[2])

def solution(today, terms, privacies):
    answer = []
    #오늘의 날짜수 구하기
    #[2023, 03, 13, A] 형식으로 저장
    today = dateToDay(today.split("."))
    for i in range(len(privacies)):
        #[2019, 01, 01, D] 형태로 저장
        privacies[i] = privacies[i].replace(".", " ").split()
        for term in terms:
            #[Z,3] 형태로 저장
            term = term.split()
            if privacies[i][3] == term[0]:
                privacies[i][1] = str(int(privacies[i][1]) + int(term[1]))
                temp = privacies[i][0:3]
                temp = dateToDay(temp)
                if temp <= today:
                    answer.append(i+1)
    return(answer)

내가 처음 떠올린 방법은 스트링 그대로의 특징을 이용한 것이지만, 이 방법의 핵심은 날짜를 day (날의 수)로 바꿔 주는 함수를 적용한 것이다. (사실 볼드체로 한 달의 길이를 28일로 고정한다는 말을 보고 떠올렸어야 했다……)

모범 풀이

def to_days(date):
    year, month, day = map(int, date.split("."))
    return year * 28 * 12 + month * 28 + day

def solution(today, terms, privacies):
    months = {v[0]: int(v[2:]) * 28 for v in terms}
    today = to_days(today)
    expire = [
        i + 1 for i, privacy in enumerate(privacies)
        if to_days(privacy[:-2]) + months[privacy[-1]] <= today
    ]
    return expire

참고 사항

map function

year, month, day = map(int, date.split("."))

  • map(function, iterable) 형태로 사용한다
  • map 객체로 반환되기 때문에 보통 list, tuple 식으로 묶어서 활용하는 것이 일반적
    a = list(map(int, range(10)))
    
    >>> a [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
  • 위 에시 같은 경우 리스트로 묶어서 받지 않고 각각의 변수인 year, month, day 활용

Dinctionary

months = {v[0]: int(v[2:]) * 28 for v in terms}

  • key와 value 두 개가 쌍을 이뤄 하나의 entry
    • key는 immutable
    • value는 mutable
  • 순서가 없음
  • key를 inex처럼 사용
  • 중괄호 {}를 이용해 사용
  • 하나의 entry는 key:value로 입력
  • months라는 dictionary를 정의할 때 key로는 약간의 종류인 알파벳이, value로는 약관의 유효 기간 (날짜 기준)이 들어가도록 정의
    • 만약 v가 “A 3”이라면 key로는 v[0]인 “A”가, value로는 v[2:]인 “3”을 int로 바꿔 28을 곱한 3*28이 들어가게 됨
    • 따라서 months 안에 {”A”:88} 데이터가 하나 추가됨
    • 이 작업을 for 문이 끝날 때까지 반복하면 months라는 객체 선언 완료

enumerate

expire = [
        i + 1 for i, privacy in enumerate(privacies)
        if to_days(privacy[:-2]) + months[privacy[-1]] <= today
    ]
  • i, privacy가 privacies라는 iterable 변수를 순회하며 i는 index 값을, privacy는 요소를 나타내도록 한다
  • index와 요소 모두에 접근해야 할 때 유용하다
  • 만약 privacy의 뒤에서 세번째까지만의 str을 to_days 함수에 넣어 날짜수를 반환한 것에 months라는 dictionary의 key가 privacy의 마지막 글자인 약간 유형과 일치하는 값의 value를 더한 것이 오늘보다 작다면 index + 1의 값을 expire 에 넣게 되어 있다

0개의 댓글