H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.
citations return
[3, 0, 6, 1, 5] 3
입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.
처음에는 문제를 잘못 이해하여 H-Index가 무조건 인용수 중에서 결정된다고 생각하고 코드를 작성하였다. 결과는 처참했다. H-Index의 테스트 케이스를 찾아보니 인용수와 같지 않아도 조건에 만족한다면 H-Index로 취한다는 것을 알게 되었다. 예를 들면 9, 9, 9, 12가 인용수일 경우 H-Index는 4가 된다. 4번 이상 인용된 논문의 수가 4개 이상이기 때문이다.
이 조건을 분석해보면 우선 인용수를 오름차순으로 정렬한 뒤에 전체 길이 - 현재 인덱스
가 현재 인용수보다 크거나 같다면 answer는 현재 인용수가 된다. 반면에 전체 길이 - 현재 인덱스
가 현재 인용수보다 작다면 answer는 전체 길이 - 현재 인덱스
가 된다. 이 중에서 가장 큰 것을 결과로 취해야 하므로 이를 배열 형태로 모두 저장한 뒤에 마지막에 이 중 가장 큰 값을 반환하면 문제를 해결할 수 있다.
len함수의 경우 시간 복잡도가 O(1)이고 if문의 경우 시간은 소요되지만 시간 복잡도로 계산하지 않는다. 그러므로 이 문제는 for문 O(n)과 max함수 O(n)의 합인 O(n)의 시간 복잡도를 가진다.
def solution(citations):
answer = []
citations.sort()
for i in range(len(citations)):
if len(citations)-i>=citations[i]:
answer.append(citations[i])
elif len(citations)-i<citations[i]:
answer.append(len(citations)-i)
return max(answer)