신입사원 무지는 게시판 불량 이용자를 신고하고 처리 결과를 메일로 발송하는 시스템을 개발하려 합니다. 무지가 개발하려는 시스템은 다음과 같습니다.
다음은 전체 유저 목록이 ["muzi", "frodo", "apeach", "neo"]이고, k = 2(즉, 2번 이상 신고당하면 이용 정지)인 경우의 예시입니다.
유저 ID | 유저가 신고한 ID | 설명 |
---|---|---|
"muzi" | "frodo" | "muzi"가 "frodo"를 신고했습니다. |
"apeach" | "frodo" | "apeach"가 "frodo"를 신고했습니다. |
"frodo" | "neo" | "frodo"가 "neo"를 신고했습니다. |
"muzi" | "neo" | "muzi"가 "neo"를 신고했습니다. |
"apeach" | "muzi" | "apeach"가 "muzi"를 신고했습니다. |
각 유저별로 신고당한 횟수는 다음과 같습니다.
유저 ID | 신고당한 횟수 |
---|---|
"muzi" | 1 |
"frodo" | 2 |
"apeach" | 0 |
"neo" | 2 |
위 예시에서는 2번 이상 신고당한 "frodo"와 "neo"의 게시판 이용이 정지됩니다. 이때, 각 유저별로 신고한 아이디와 정지된 아이디를 정리하면 다음과 같습니다.
유저 ID | 유저가 신고한 ID | 정지된 ID |
---|---|---|
"muzi" | ["frodo", "neo"] | ["frodo", "neo"] |
"frodo" | ["neo"] | ["neo"] |
"apeach" | ["muzi","frodo"] | ["frodo"] |
"neo" | 없음 | 없음 j |
따라서 "muzi"는 처리 결과 메일을 2회, "frodo"와 "apeach"는 각각 처리 결과 메일을 1회 받게 됩니다.
이용자의 ID가 담긴 문자열 배열 id_list
, 각 이용자가 신고한 이용자의 ID 정보가 담긴 문자열 배열 report
, 정지 기준이 되는 신고 횟수 k
가 매개변수로 주어질 때, 각 유저별로 처리 결과 메일을 받은 횟수를 배열에 담아 return 하도록 solution 함수를 완성해주세요.
id_list
의 길이 ≤ 1,000id_list
의 원소 길이 ≤ 10id_list
의 원소는 이용자의 id를 나타내는 문자열이며 알파벳 소문자로만 이루어져 있습니다.id_list
에는 같은 아이디가 중복해서 들어있지 않습니다.report
의 길이 ≤ 200,000report
의 원소 길이 ≤ 21report
의 원소는 "이용자id 신고한id"형태의 문자열입니다.k
≤ 200, k
는 자연수입니다.id_list
에 담긴 id 순서대로 각 유저가 받은 결과 메일 수를 담으면 됩니다.id_list | report | k | result |
---|---|---|---|
["muzi", "frodo", "apeach", "neo"] | ["muzi frodo","apeach frodo","frodo neo","muzi neo","apeach muzi"] | 2 | [2,1,1,0] |
["con", "ryan"] | ["ryan con", "ryan con", "ryan con", "ryan con"] | 3 | [0,0] |
입출력 예 #1
문제의 예시와 같습니다.
입출력 예 #2
"ryan"이 "con"을 4번 신고했으나, 주어진 조건에 따라 한 유저가 같은 유저를 여러 번 신고한 경우는 신고 횟수 1회로 처리합니다. 따라서 "con"은 1회 신고당했습니다. 3번 이상 신고당한 이용자는 없으며, "con"과 "ryan"은 결과 메일을 받지 않습니다. 따라서 [0, 0]을 return 합니다.
function solution(id_list, report, k) {
var answer = new Array(id_list.length).fill(0);
const reportCount = new Array(id_list.length).fill(0);
const byeUser = [];
let splitReport = [];
for(let i = 0; i < report.length; i++){
if(report.indexOf(report[i]) === i) splitReport.push(report[i].split(" "))
}
for(let i = 0; i < splitReport.length; i++){
reportCount[id_list.indexOf(splitReport[i][1])]++
}
for(let i = 0; i < reportCount.length; i++){
if(reportCount[i] >= k) byeUser.push(id_list[i])
}
for(let i = 0; i < splitReport.length; i++){
if(byeUser.includes(splitReport[i][1])){
answer[id_list.indexOf(splitReport[i][0])]++
}
}
return answer;
}
필터링을 통해 중복값을 제거, split()
을 통해 문자열을 분리한 배열을 만들고, 그 배열을 돌면서 각 유저 별로 신고 당한 횟수를 구했다.
그 후 신고 당한 횟수가 k
와 같거나 높은 숫자의 유저를 따로 골라내 최초에 분리한 배열을 돌며 정지당한 사람을 신고한 유저의 카운트를 올린다.
해당 풀이는 시간초과로 실패했다. report
배열의 최대길이가 20만 이라서 초기 필터링에서 시간이 많이 걸리는 것이었다.
function solution(id_list, report, k) {
var answer = new Array(id_list.length).fill(0);
const reportCount = new Array(id_list.length).fill(0);
const reportLists = {};
let byeUser = [];
const splitReport = report.map(el => el.split(" "));
for(let i = 0; i < splitReport.length; i++){
if(reportLists[splitReport[i][0]] === undefined) {
reportLists[splitReport[i][0]] = [];
}
if(!reportLists[splitReport[i][0]].includes(splitReport[i][1])) {
reportLists[splitReport[i][0]].push(splitReport[i][1]);
}
}
for(let i = 0; i < id_list.length; i++){
if(!reportLists[id_list[i]]) continue;
for(let j = 0; j < reportLists[id_list[i]].length; j++){
reportCount[id_list.indexOf(reportLists[id_list[i]][j])]++;
}
}
for(let i = 0; i < reportCount.length; i++){
if(reportCount[i] >= k) byeUser.push(id_list[i]);
}
for(let i = 0; i < id_list.length; i++){
if(reportLists[id_list[i]] === undefined) continue;
for(let j = 0; j < reportLists[id_list[i]].length; j++){
if(byeUser.includes(reportLists[id_list[i]][j])) answer[i]++;
}
}
return answer;
}
필터링에 문제가 있다 생각해 필터링을 시작과 함께 하는게 아닌, 분리하며 필터링을 하는 방향으로 수정했다. 이를 수정하면서 기존에는 배열형식으로 풀었던 방식을 객체와 배열을 같이 쓰는 형식으로 변경 하였다.
split()
을 통해 각 인덱스의 값을 분리 해주었다. 그 후, 분리된 배열을 순회 하며, 신고자와 피신고자의 배열이 들어간 객체를 만들어 주었다. 그 후, 피 신고자의 배열을 돌며 정지 당한 사람의 리스트를 구했다.
최종적으로 신고자 리스트가 있는 배열을 돌며, 해당 신고자의 피신고자 리스트에 정지 당한 유저가 있을 경우 해당 배열에 카운트를 올린다.
해당 문제로 테스트를 진행했을 경우, 속도가 빠른 테스트 케이스는 별 차이가 없었으나, 시간이 오래 걸리는 테스트 케이스는 속도 차이가 많이 났다. 9000ms > 300ms로 줄었으니 필터링이 얼마나 속도 저하를 일으키는지 알 수 있다.
해당 문제는 한 명이 같은 사람을 계속 신고할 수 있지만, 신고 카운트는 누적시키지 않기 때문에 필터링이 필요하다.
이런 경우 나는 보통 필터링을 먼저 하고 나서 로직을 짜기 시작한다. 하지만 배열의 길이가 길어 질 수록 필터링으로 인한 속도저하는 기하 급수적으로 늘어난다.
이렇게 배열의 길이의 최대값이 높으며, 필터링이 필요 할 경우, 문제를 진행 시키면서 필터링을 거는게 훨씬 효율적으로 진행 된다.