현 시점, LLM을 사용하는 개발자가 알아야할 핵심
프롬프트
- n-샷 프롬프트를 사용하여 컨텍스트 학습을 강화하기.
- 사고의 연쇄(Chain-of-Thought, CoT): 모델이 답변을 내기 전에 사고 과정을 설명하게 하기.
- 관련 자료 제공: Retrieval-Augmented Generation (RAG)을 사용하여 모델의 응답을 구체화하기.
- 작은 단위의 프롬프트를 사용하여 특정 작업에 집중하기.
- 컨텍스트를 지속적으로 검토하고 불필요한 정보를 제거하여 프롬프트를 최적화하기.
RAG
- 정보가 정확해야함. 쓰레기에선 쓰레기가 나옴.
- 새로운 지식을 통합할 때 RAG를 우선적으로 사용하기.
최적화
- 다양한 출력이 필요한 작업에서 temperature 매개변수를 조정하기. 최근 출력 목록을 유지하고 중복 출력을 피하기.
- 캐싱을 사용하여 비용을 절감하고 지연 시간을 줄이기.
- 모니터링하며 보완하기