[ Programmers / CodingTest / Python ] H-Index

황승환·2022년 1월 19일

coding test programmers python

Python

목록 보기

105/498

문제 설명

H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

제한사항

과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
논문별 인용 횟수는 0회 이상 10,000회 이하입니다.

입출력 예

citations	return
[3, 0, 6, 1, 5]	3

입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.

접근 방법

처음에는 문제를 잘못 이해하여 H-Index가 무조건 인용수 중에서 결정된다고 생각하고 코드를 작성하였다. 결과는 처참했다. H-Index의 테스트 케이스를 찾아보니 인용수와 같지 않아도 조건에 만족한다면 H-Index로 취한다는 것을 알게 되었다. 예를 들면 9, 9, 9, 12가 인용수일 경우 H-Index는 4가 된다. 4번 이상 인용된 논문의 수가 4개 이상이기 때문이다.

이 조건을 분석해보면 우선 인용수를 오름차순으로 정렬한 뒤에 전체 길이 - 현재 인덱스가 현재 인용수보다 크거나 같다면 answer는 현재 인용수가 된다. 반면에 전체 길이 - 현재 인덱스가 현재 인용수보다 작다면 answer는 전체 길이 - 현재 인덱스가 된다. 이 중에서 가장 큰 것을 결과로 취해야 하므로 이를 배열 형태로 모두 저장한 뒤에 마지막에 이 중 가장 큰 값을 반환하면 문제를 해결할 수 있다.

H-Index를 저장할 배열 answer를 선언한다.
citations를 오름차순 정렬한다.
citations의 길이만큼 반복하는 i에 대한 for문을 돌린다.
-> 만약 citations의 길이-i가 citations[i]보다 크거나 같을 경우,
--> answer에 citations[i]를 넣는다.
-> 만약 citations의 길이-i가 citations[i]보다 작을 경우,
--> answer에 citations의 길이-i를 넣는다.
answer에서 가장 큰 값을 반환한다.

len함수의 경우 시간 복잡도가 O(1)이고 if문의 경우 시간은 소요되지만 시간 복잡도로 계산하지 않는다. 그러므로 이 문제는 for문 O(n)과 max함수 O(n)의 합인 O(n)의 시간 복잡도를 가진다.

solution.py

def solution(citations):
    answer = []
    citations.sort()
    for i in range(len(citations)):
        if len(citations)-i>=citations[i]:
            answer.append(citations[i])
        elif len(citations)-i<citations[i]:
            answer.append(len(citations)-i)
    return max(answer)

황승환

꾸준함을 꿈꾸는 SW 전공 학부생의 개발 일기

이전 포스트

[ Programmers / CodingTest / Python ] 키패드 누르기

다음 포스트