H-Index
문제 설명
H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.
어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.
어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.
제한사항
- 과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
- 논문별 인용 횟수는 0회 이상 10,000회 이하입니다.
입출력 예
citations return [3, 0, 6, 1, 5] 3 입출력 예 설명
이 과학자가 발표한 논문의 수는 5편이고, 그중 3편의 논문은 3회 이상 인용되었습니다. 그리고 나머지 2편의 논문은 3회 이하 인용되었기 때문에 이 과학자의 H-Index는 3입니다.
def solution(citations):
answer = 0
citations.sort()
for i in range(len(citations)):
if citations[i] <= len(citations[i:]) and len(citations[:i]) <= citations[i]:
answer = citations[i]
return answer
문제를 이해하기 너무 어려웠다,, 테스트케이스도 하나밖에 없고,, 결국에는 인용된 갯수가 인용된 횟수보다 크거나 같을 때 인용된 횟수를 정답으로 출력했다.
근데 거하게 틀림.
뭐지? 뭐가 문제지?
그리고 나는 11번이랑 16번만 맞았는데 사람들은 11번이랑 16번 케이스만 틀린 사람들이 많다고 해서 더 멘붕이 왔다. 흐엥
def solution(citations):
answer = 0
citations.sort(reverse=True)
for i in range(len(citations)):
if citations[i] >= i+1:
answer = i+1
return answer
이런식으로 푸니까 통과되었다. 하지만 왜.. i+1이 답이 되는지 잘 모르겠음. h-index 자체가 어려운 듯 하다. 어쨌든 그냥 정렬보다는 reverse로 정렬해서 위에와 같이 돌렸는데 citation[i]
로 하니까 답이 안됐는데 i+1
로 하니까 답이 됐다고 나오네,,
ㅜㅜ.. 다른것보다 저렇게 문제 자체가 이해하기 어려운 문제는 좀 안나왔으면 좋겠다,,
def solution(citations):
citations.sort(reverse=True)
answer = max(map(min, enumerate(citations, start=1)))
return answer
고인물 답변;;
enumerate()
함수를 적극적으로 활용해야겠다. index
와 value
를 한번에 사용해서 for
문을 돌리고 싶다면 까먹지 말기!!
저 코드의 풀이는
sort로 정렬해서 가장 큰값부터 작은값으로 정렬한후, enumerate로 (index, value)형태로 묶는다. 그리고 최댓값(start = 1)부터 각 value에 대해 최솟값 value의 값을 min으로 추출하고, 이 추출된 값은 enumerate가 끝나는 citations 리스트의 크기에 해당하는 갯수가 나온다. 이들을 map으로 묶으면, 한 value의 입장에서 보는 최솟값 value의 집합이 나온다. 즉 h값들의 집합이나온다. h값중 최대값을 max로 뽑아서 출력하면 된다.
1)min(index,value) 부분은 가능할 수 있는 모든 h-index를 추출하는 부분 2) max(~) 값은 가능할 수 있는 모든 h-index 중 가장 큰 값을 추출하는 부분으로 생각하시면 됩니다. 예를들어 [6, 5, 4, 1, 0]의 경우에선 min~ 부분은 min(1, 6), min(2, 5), min(3, 4), min(4, 1), min(5, 0), 즉 해당 인용수 이상의 논문개수와 해당 논문의 인용수 중 더 작은 숫자를 고르는 작업을 하고(h-index로 가능한 숫자 추출), max~부분은 앞에서 골라진 (1, 2, 3, 1, 0) 중 가장 큰 숫자를 뽑아 실제 h-index를 구하는 방법입니다.
이렇다고 하네요.. 댓글에서 가져왔슴다.
어떻게 저런 방법을 생각하는지,,, 대단하다