H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.
과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
citations | return |
---|---|
[3, 0, 6, 1, 5] | 3 |
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.
def solution(citations):
citations = sorted(citations)
l = len(citations)
for i in range(l):
if citations[i] >= l-i:
return l-i
return 0
l-i
에 대해 한참 고민했는데,
if citations[i] >= l-i
는 주어진 h
번 이상 인용된 논문이 h
편 이상이라는 조건을 그대로 풀어쓴 것이었다.
citations[i]
는 i
번 논문이 인용된 횟수이고, l-i
는 인용된 논문의 개수를 최댓값부터 하나씩 줄여나간 것이다. (최댓값을 찾아야 하므로 가장 큰 값부터 시작)
그리고 리스트는 오름차순 정렬된 상태이므로 i
번째 이후는 모두 i
번째보다 큰 값을 가질 것이다.
Q) h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index
인용 횟수 배열을 정렬한다.
가장 큰 인용 횟수부터 차례대로 확인하면서 h의 최댓값을 찾는다.
citations[i] > answer인 경우, citations[i]>=answer+1이므로 h+1번 이상 인용된 논문이 h+1편 이상임을 의미한다. 따라서 h의 최댓값(answer)을 1만큼 증가시킨 후 다음 인용 횟수를 확인한다.
citations[i] < answer인 경우, h번 이상 인용된 논문이 h편이고 나머지 논문이 h번 이하 인용된 것으로 현재 answer이 h의 최댓값임을 알 수 있다.
citations[i] == answer인 경우, h번 이상 인용된 논문이 h+1편 이상인 것은 맞지만 h+1번 이상 인용된 논문은 h편보다 감소하므로 현재 answer이 h의 최댓값임을 알 수 있다.
import java.util.Arrays;
class Solution {
public int solution(int[] citations) {
int answer = 0;
Arrays.sort(citations); //오름차순 정렬
for (int i=citations.length-1;i>-1;i--) {
//인용수가 현재 h보다 크지 않은 경우
//현재 h가 h의 최댓값임
if (citations[i] <= answer)
break;
answer++;
}
return answer;
}
}
min: 현재 논문의 인용 횟수와 현재 논문보다 인용 횟수가 많은 논문의 개수 중 작은 값
max: 전체 논문을 확인하면서 가장 큰 min 값
인용 횟수 배열을 정렬해두었으므로 인용 횟수는 감소하고 인용 횟수가 더 많은 논문의 개수는 증가한다. 따라서 min은 증가하다가 감소하게 되는데 가장 큰 값이 되었을 때의 min값인 max가 h의 최댓값이다.
import java.util.*;
class Solution {
public int solution(int[] citations) {
Arrays.sort(citations);
int max = 0;
for(int i = citations.length-1; i > -1; i--){
int min = (int)Math.min(citations[i], citations.length - i);
if(max < min) max = min;
}
return max;
}
}
논문수 = 배열의크기 n
인용 횟수 h
인용횟수가 h 인 논문의 수가 h 이면 통과
반복 횟수 k
풀이 방향
작은수로 정렬
작은수를 기준으로 h 를 선정
k = 배열의 크기 - 기준인 h 의 인덱스
k < h 보다 작으면 증가
K >= h 일 때 까지 반복
가정 -1 문제
h가 바로 통과 함
그럼 내림차순으로 정렬하고 해보자
큰수로 정렬
큰수를 기준으로 h 를 선정
k = 배열의 크기 - 기준인 h 의 인덱스
k < h 보다 작으면 증가
K >= h 일 때 까지 반복
기준을 잘못잡았다.
k < h 보다 작으면 증가
K >= h 일 때 까지 반복 이 아닌 k <= h 면 그만둬야함
import java.util.Arrays;
public class HIndex {
public int solution(int[] citations) {
int answer = 0;
int length = citations.length;
int h = 0;
int k = 0;
Arrays.sort(citations);
for (int i = 0; i < citations.length; i++) {
h = citations[i];
k = citations.length - i;
if (k <= h) {
answer = k;
break;
}
}
return answer;
}
}
저는 알고리즘을 풀 때 어떤식으로 풀어야 쉽게 문제를 풀 수 있을지 생각하는 시간이 오래 걸렸습니다. 그래서 이번엔 가정을 새우고 그 가정에 따라 코드를 구현하고 반례가 있나 확인한 후 다시 가정을 수정하는 식으로 문제를 접근했더니 예전보다 코드구현 속도가 빨라진거 같았습니다. 문제를 해결할 때 이런식으로 접근하면 알고리즘 문제를 빠르게 풀 수 있을거 같다는 자신감을 얻었습니다.