H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.
citations | return |
---|---|
[3, 0, 6, 1, 5] | 3 |
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.
def solution(citations):
answer = len(citations)
citations.sort(reverse=True)
for i, v in enumerate(citations):
if v < i+1:
answer = i
break
return answer
주어진 citataions
를 내림차순으로 정렬 후 for문와 enumerate를 통해 값을 비교한다.
v
가 i+1
보다 작다면 i
번째 까지 값들은 모두 i
번째 값보다 크고 그 개수가 i
개라는 뜻이다.
예를 들면 citations
가 [3, 0, 6, 1, 5, 5, 1, 5]
일때, 이를 정렬하면 [6, 5, 5, 5, 3, 1, 1, 0]
이다.
i
는 0부터 시작.
i
가 3일 때, v == 5
. i+1 == 4
. 즉, v < i+1
성립되지 않음.
i
가 4일 때, v == 3
. i+1 == 5
. 즉, v < i+1
성립.
i
가 3일 때가 i+1
편 이상의 논문에서 i+1번 이상 언급된 케이스 중 가장 i+1
이 큰 경우이다.
만약 citations
의 모든 수가 citations
의 원소의 개수보다 큰 수일 경우에는 h의 최댓값은 citations
의 원소의 개수가 된다.
def solution(citations):
citations.sort(reverse=True)
answer = max(map(min, enumerate(citations, start=1)))
정말 짧지만 잘 짠 코드인 것 같다. 방법이 신기하다.
citations
가 [3, 0, 6, 1, 5, 5, 1, 5]
인 예시를 보이면 설명해보면, 내림차순 정렬했을 때 다음과 같다.
[6, 5, 5, 5, 3, 1, 1, 0]
이 리스트에서 enumerate(citations, start=1)
만 실행하게 된다면 다음과 같다.
[(1, 6), (2, 5), (3, 5), (4, 5), (5, 3), (6, 1), (7, 1), (8, 0)]
각각의 튜플에서 첫번째 원소는 순서, 두번째 원소는 인용된 횟수이다. 각 튜플별로 최솟값을 구해서 리스트를 만들면 다음과 같다.
[1, 2, 3, 4, 3, 1, 1, 0]
여기서 1~4는 첫번째 원소인 순서이고 그 이후부터는 인용된 횟수이다. 따라서 여기서 max를 써서 가장 큰 수를 가져오면 이것이 h값 중 가장 큰 값인 H-Index
가 된다.