FunSearch는 2023년 12월 말에 나온 Deepmind 논문으로 Nature에 실렸다고 한다.
Open problem에 대해서 기존에 인간이 풀었던 방식 이외로의 해결방식을 제시했다. 이십 년 전에 멈춰있던 해결법에서 더 나은 해결법을 제시했다는 점에서 이런 논문지에 실릴 수 있지 않았을까?
FunSearch이 Function space search의 약자로 LLM을 사용해서 문제를 새롭게 풀어낼 수 있는 방법을 제시한다. 이 논문에서는 LLM 자체보다는 Evaluation, Program database를 어떻게 사용할지에 초점을 맞추었다.
Specification
Prompt
LLM
Evaluation
Programs database
결과적으로 이런 방법들을 통해서
특정한 정답을 가지고 있지 않는 문제(cat set problem)를 푸는 것을 넘어서 아래와 같이 그림에서 볼 수 있는 bin packing 문제도 풀었다.
"Islands model" in the context of genetic algorithms refers to a specific variation of the genetic algorithm (GA) that involves multiple populations, often referred to as demes, evolving in parallel.
예제로 만족하는 최적의 a, b를 구한다고 한다면
Random a, b를 몇 쌍 뽑아서 그 값과 57과의 차이를 fitness, 값을 통해서 사용한 예제들 중 얼마나 적합한지를 확인할 수 있는 적합도()를 구하게 된다.
Cross-over 위에서 구한 적합도를 기반으로 뽑아낸 쌍들 중 적합도를 기반으로 다시 쌍들의 구성을 변경하고(더 높은 점수를 가진 예제가 좀 더 많이 등장하게 된다.) 비트로 변환한 후 이 중 몇 개를 골라 shift 진행한다.
(우성인 경우에 많이 등장할 것이고, cross-over할 때에도 영향을 더 많이 줄 것이다.)
Mutation 특정 확률을 기반으로 바꿀지말지를 결정하게 된다.(0과 1뿐이므로)
하지만 항상 모든 유전자의 영향을 받을 수는 없기 때문에 약간의 변이가 생기게 된다는 것을 반영한다.
이렇게 계속해서 반복한다.
정지조건으로는 반복의 횟수를 정하거나, 적합도의 평균이 부모 세대보다 나아지지 않는 경우에 정지할 수 있다.
이 연구가 곱씹어볼수록 놀라운 점은 LLM은 다 외워서하는 앵무새만은 아닐 수 있다는 지점을 보여주기도 한다는 것이다.