Skip to main content

2 docs tagged with "SFT"

View all tags

SFT 有监督微调训练指南

摘要:SFT 全称 Supervised Fine-Tuning(有监督微调),是目前大语言模型(LLM)从"续写小说"进化为"听懂指令的助手"的关键步骤。简单来说,SFT 就是给一个已经读过万卷书(预训练)但不懂规矩的"天才学生",发一本"标准问答习题集",手把手教它怎么正确回答问题。