Instruction-tuned LLM
챗 GPT의 탄생
프롬프트 명령에 따르도록 훈련
명령을 미세조정하고 해당 명령을 따르려는 좋은 시도들
reinforcement learning human feedback
프롬프트 엔지니어링 하기 전 기본 사항
원칙1. 깔끔하고 구체적인 지시사항
전술1: 구분자를 사용한다.
Instruction injection: 요약하는 텍스트 안에 명령이나 지시가 있는 경우 앞의 명령은 잊고 텍스트안의 명령을 수행할 수 있음
전술2: 구조적인 응답을 요청한다.(자동화를 위해)
전술3: 모델에게 조건이 충족되는지 확인하라고 요청한다.
전술4: 성공적인 결과의 예시를 알려준다.
원칙2. 모델에게 생각할 시간을 주어라
Let's think step by step
전술1: 작업을 완료하는 데 필요한 단계를 지정해준다.
* Instruction과 context를 나눠야함.
전술2: 성급하게 결론을 내리기전에 모델이 자체 솔루션으로 해결하도록 지시