https://school.programmers.co.kr/learn/courses/30/lessons/42747#
문제 설명
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.
제한사항
과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
입출력 예
citations | return |
---|---|
[3, 0, 6, 1, 5] | 3 |
입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.
def solution(citations):
res = len(citations) # [999, 1000]일때 h-index는 2
citations.sort()
for i in range(len(citations)): # case: [2,5,6,7]
if citations[i] < len(citations) : # citations[i]가 n보다 작은 2일 때 res는 2
res = citations[i]
try : #for 'index out of range'
for h in range(citations[i]+1, citations[i+1]+1): # h는 3부터 5까지
if h <= len(citations)-(i+1): # 나머지 논문 수가 h이상인가?
res = h #그렇다면 res는 h
else : return res
except : pass
return res
citations
의 길이를 최종변수 res
에 저장한다. [5,6,7]
과 같은 경우h
는 3
이 될 수 밖에 없다.citations
를 정렬한다.citations
의 원소를 순회하면서, n
(길이) 보다 값이 작은 경우 원소를 res
에 저장한다.[2,5,6,7]
의 경우 2
때문에 h
가 무조건 4
가 되리라는 보장이 없다.현재 원소+1
부터 다음 원소
만큼의 범위의 값을 생성한다. citations
에서 현재 원소
를 제외한 나머지 원소들의 개수가 현재 범위의 값
보다 큰지 판별한다. (h
번 인용된 논문의 개수가 h
편이상인지)if citations[i] < len(citations) :
문에서 얻어걸리는 원소가 아무 것도 없었으면 결국 n
을 리턴한다. try-except는 index out of range오류때문에 넣었다. [0,0,0,0]
<- 이 케이스가 있을 때 런타임 에러가 발생하기 때문이다.
def solution(citations):
citations.sort(reverse=True)
answer = max(map(min, enumerate(citations, start=1)))
return answer
자괴감이 드는 나이스한 코드다. 나는 왜 이런생각 못할까.
설명은 댓글에서 발췌
1) min(index,value) 부분은 가능할 수 있는 모든 h-index를 추출하는 부분
2) max(~) 값은 가능할 수 있는 모든 h-index 중 가장 큰 값을 추출하는 부분으로 생각하시면 됩니다.
예를들어 [6, 5, 4, 1, 0]의 경우에선 min~ 부분은 min(1, 6), min(2, 5), min(3, 4), min(4, 1), min(5, 0), 즉 해당 인용수 이상의 논문개수와 해당 논문의 인용수 중 더 작은 숫자를 고르는 작업을 하고(h-index로 가능한 숫자 추출),
max~부분은 앞에서 골라진 (1, 2, 3, 1, 0) 중 가장 큰 숫자를 뽑아 실제 h-index를 구하는 방법입니다.
그런데 난 아직도 min부분이 이해가 안된다 왜 두개를 비교해서 더 작은 걸 택하는 게 h-index 후보인지?
라고 생각했는데 댓글에 또 친절한 설명이....(참고: https://ssuamje.tistory.com/47)
심지어 속도도 비슷..ㅋ 내 코드가 테스트1~6에서 조금 더 빠르긴 한데 거의 비슷하다
테스트케이스를 여러 개 넣어야 돼서 골치아픈 문제였다. 실제로 푸는 데 3시간이 넘게 걸렸다. (그래도 구글링은 안함!)
테스트 9번과 16번에서 자꾸 틀렸는데, 마지막줄에 return res
를 넣어주니 테스트9번을 통과할 수 있었다. 마지막 16번은 런타임 에러였는데 try-except로 해결했다.