[프로그래머스-레벨2]H-Index - python

iamjinseo·2022년 9월 15일

정렬 프로그래머스

문제풀이-Python

목록 보기

102/134

https://school.programmers.co.kr/learn/courses/30/lessons/42747#

문제 설명
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

제한사항
과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
논문별 인용 횟수는 0회 이상 10,000회 이하입니다.

입출력 예

citations	return
[3, 0, 6, 1, 5]	3

입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.

풀이

def solution(citations):
    res = len(citations) # [999, 1000]일때 h-index는 2
    citations.sort()
    
    for i in range(len(citations)): # case: [2,5,6,7] 
        if citations[i] < len(citations) : # citations[i]가 n보다 작은 2일 때 res는 2
            res = citations[i]
            try : #for 'index out of range' 
                for h in range(citations[i]+1, citations[i+1]+1):  # h는 3부터 5까지
                    if h <= len(citations)-(i+1): # 나머지 논문 수가 h이상인가?
                        res = h #그렇다면 res는 h
                    else : return res
            except : pass
    return res

citations의 길이를 최종변수 res에 저장한다. [5,6,7]과 같은 경우h는 3이 될 수 밖에 없다.
citations를 정렬한다.
citations의 원소를 순회하면서, n(길이) 보다 값이 작은 경우 원소를 res에 저장한다.
3-1. [2,5,6,7]의 경우 2때문에 h가 무조건 4가 되리라는 보장이 없다.
그리고 현재 원소+1부터 다음 원소만큼의 범위의 값을 생성한다.
범위 내의 값에서 순회하면서, citations에서 현재 원소를 제외한 나머지 원소들의 개수가 현재 범위의 값보다 큰지 판별한다. (h번 인용된 논문의 개수가 h편이상인지)
판별 후 h-index를 가려낸다.
if citations[i] < len(citations) :문에서 얻어걸리는 원소가 아무 것도 없었으면 결국 n을 리턴한다.

try-except는 index out of range오류때문에 넣었다. [0,0,0,0] <- 이 케이스가 있을 때 런타임 에러가 발생하기 때문이다.

결과

남의 코드

def solution(citations):
    citations.sort(reverse=True)
    answer = max(map(min, enumerate(citations, start=1)))
    return answer

자괴감이 드는 나이스한 코드다. 나는 왜 이런생각 못할까.

설명은 댓글에서 발췌

1) min(index,value) 부분은 가능할 수 있는 모든 h-index를 추출하는 부분
2) max(~) 값은 가능할 수 있는 모든 h-index 중 가장 큰 값을 추출하는 부분으로 생각하시면 됩니다.
예를들어 [6, 5, 4, 1, 0]의 경우에선 min~ 부분은 min(1, 6), min(2, 5), min(3, 4), min(4, 1), min(5, 0), 즉 해당 인용수 이상의 논문개수와 해당 논문의 인용수 중 더 작은 숫자를 고르는 작업을 하고(h-index로 가능한 숫자 추출),
max~부분은 앞에서 골라진 (1, 2, 3, 1, 0) 중 가장 큰 숫자를 뽑아 실제 h-index를 구하는 방법입니다.

그런데 난 아직도 min부분이 이해가 안된다 왜 두개를 비교해서 더 작은 걸 택하는 게 h-index 후보인지?
라고 생각했는데 댓글에 또 친절한 설명이....(참고: https://ssuamje.tistory.com/47)