[Java] 정렬_H-Index

EunBi Na·2022년 4월 1일

[Java] 알고리즘 코딩테스트

목록 보기

2/13

문제 설명

H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

제한사항

과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
논문별 인용 횟수는 0회 이상 10,000회 이하입니다.

입출력 예

citations	return
[3, 0, 6, 1, 5]	3

입출력 예 설명

이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.

[Python] 문제풀이

H-Index 이해하기
링크텍스트

def solution(citations):
    citations = sorted(citations)
    l = len(citations)
    for i in range(l):
        if citations[i] >= l-i:
            return l-i
    return 0

l-i에 대해 한참 고민했는데,
if citations[i] >= l-i는 주어진 h번 이상 인용된 논문이 h편 이상이라는 조건을 그대로 풀어쓴 것이었다.
citations[i]는 i번 논문이 인용된 횟수이고, l-i는 인용된 논문의 개수를 최댓값부터 하나씩 줄여나간 것이다. (최댓값을 찾아야 하므로 가장 큰 값부터 시작)
그리고 리스트는 오름차순 정렬된 상태이므로 i번째 이후는 모두 i번째보다 큰 값을 가질 것이다.

Q) h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index

[Java] 풀이

인용 횟수 배열을 정렬한다.
가장 큰 인용 횟수부터 차례대로 확인하면서 h의 최댓값을 찾는다.

citations[i] > answer인 경우, citations[i]>=answer+1이므로 h+1번 이상 인용된 논문이 h+1편 이상임을 의미한다. 따라서 h의 최댓값(answer)을 1만큼 증가시킨 후 다음 인용 횟수를 확인한다.
citations[i] < answer인 경우, h번 이상 인용된 논문이 h편이고 나머지 논문이 h번 이하 인용된 것으로 현재 answer이 h의 최댓값임을 알 수 있다.
citations[i] == answer인 경우, h번 이상 인용된 논문이 h+1편 이상인 것은 맞지만 h+1번 이상 인용된 논문은 h편보다 감소하므로 현재 answer이 h의 최댓값임을 알 수 있다.

import java.util.Arrays;

class Solution {
    public int solution(int[] citations) {
        int answer = 0;
        Arrays.sort(citations); //오름차순 정렬
        
        for (int i=citations.length-1;i>-1;i--) {
            //인용수가 현재 h보다 크지 않은 경우
            //현재 h가 h의 최댓값임
            if (citations[i] <= answer)
                break;
            answer++;
        }
        
        return answer;
    }
}

다른 사람 풀이

min: 현재 논문의 인용 횟수와 현재 논문보다 인용 횟수가 많은 논문의 개수 중 작은 값
max: 전체 논문을 확인하면서 가장 큰 min 값

인용 횟수 배열을 정렬해두었으므로 인용 횟수는 감소하고 인용 횟수가 더 많은 논문의 개수는 증가한다. 따라서 min은 증가하다가 감소하게 되는데 가장 큰 값이 되었을 때의 min값인 max가 h의 최댓값이다.

import java.util.*;

class Solution {
    public int solution(int[] citations) {
        Arrays.sort(citations);

        int max = 0;
        for(int i = citations.length-1; i > -1; i--){
            int min = (int)Math.min(citations[i], citations.length - i);
            if(max < min) max = min;
        }

        return max;
    }
}

조건

논문수 = 배열의크기 n
인용 횟수 h
인용횟수가 h 인 논문의 수가 h 이면 통과
반복 횟수 k
풀이 방향

가정 -1

작은수로 정렬
작은수를 기준으로 h 를 선정
k = 배열의 크기 - 기준인 h 의 인덱스
k < h 보다 작으면 증가
K >= h 일 때 까지 반복
가정 -1 문제
h가 바로 통과 함
그럼 내림차순으로 정렬하고 해보자

가정-2

큰수로 정렬
큰수를 기준으로 h 를 선정
k = 배열의 크기 - 기준인 h 의 인덱스
k < h 보다 작으면 증가
K >= h 일 때 까지 반복
기준을 잘못잡았다.
k < h 보다 작으면 증가
K >= h 일 때 까지 반복 이 아닌 k <= h 면 그만둬야함

import java.util.Arrays;

public class HIndex {
    public int solution(int[] citations) {
        int answer = 0;
        int length = citations.length;
        int h = 0;
        int k = 0;
        Arrays.sort(citations);

        for (int i = 0; i < citations.length; i++) {
            h = citations[i];
            k =  citations.length - i;
            if (k <= h) {
                answer = k;
                break;
            }
        }
        return answer;
    }
}

느낀 점

저는 알고리즘을 풀 때 어떤식으로 풀어야 쉽게 문제를 풀 수 있을지 생각하는 시간이 오래 걸렸습니다. 그래서 이번엔 가정을 새우고 그 가정에 따라 코드를 구현하고 반례가 있나 확인한 후 다시 가정을 수정하는 식으로 문제를 접근했더니 예전보다 코드구현 속도가 빨라진거 같았습니다. 문제를 해결할 때 이런식으로 접근하면 알고리즘 문제를 빠르게 풀 수 있을거 같다는 자신감을 얻었습니다.