Originally published at: SteerLM: 추론 중에 LLM을 맞춤 설정할 수 있는 간단하고 실용적인 기법 - NVIDIA Technical Blog
최근 몇 년 동안 GPT-3, Megatron-Turing, Chinchilla, PaLM-2, Falcon, Llama 2와 같은 대규모 언어 모델(LLM)의 등장으로 자연어 생성에 괄목할 만한 발전이 이루어졌습니다. 그러나 사람과 유사한 텍스트를 생성할 수 있는 능력에도 불구하고 기초 LLM은 사용자 선호도에 맞춘 유용하고 미묘한 응답을 제공하지 못할 수 있습니다. 현재 LLM을 개선하기 위한 접근 방식은 사람의 데모에 대한 감독 미세 조정(SFT)과…