
기존 LLM의 한계를 해결하기 위해서 최근에 Tool / API를 같이 활용하는 연구가 진행됨.
기존 Tool/API를 같이 사용하는 연구들은 다음과 같은 한계를 가지고 있음
따라서 이 Toolformer에서는 Self-supervised 기법을 통해 데이터를 만들고, 학습하고 5개의 tools를 같이 사용할 수 있도록 함
ToolFomrer 목표
위의 목표를 수행하기 위해서 1) Annotation -> 2) Filtering -> 3) FT(Fine Tuning)

여기서는 API calls을 다음과 같이 linearlize해서 나타냄
원래 데이터 셋 가 주어지면, 위의 표현 API calls로 Augmented 된 를 생성 후, 을 활용해 LLM을 FT
가장 첫번째 API를 언제 부를지 결정
Few-shot prompt(하단 참고)를 활용해서 input x에 대해 API call를 annotate

이때 모든 위치 에 대해서 모두 진행 (모든 API 종류에 대해서) 그 후 확률 값으로 필터링 진행 후 API 호출(최대 Top-k개)
API calls 위치에 최대 M개의 다른 API calls 생성




