优化多阶段语言模型程序的指令与示例

Posted on 六月 17, 2024

优化多阶段语言模型程序的指令与示例论文概述本文是一篇关于大语言模型的研究论文，由 Krista Opsahl-Ong 等7位研究者共同完成。本文解决了优化复杂多阶段语言模型程序的挑战,在这些程序中多个语言模型调用被串联在一起。现有方法孤立地优化单个提示,而本研究引入了 MIPRO 算法,可以联合优化程序中所有模块的自由格式指令和少样本示例。MIPRO 对优化问题进行因式分解,并引入了用于提出任务驱动指令和跨模块信用分配的新颖策略。使用一流的开源模型(Llama-3-8B),MIPRO 在七个不同多阶段语言模型程序中的五个上优于基线优化器,准确率最高提升13%。研究目标本研究的主要目标包括：引入 MIPRO 算法用于端到端优化多阶段语言模型程序联合优化指令和示例而非分别处理开发了程序感知和数据感知技术用于提出有效指令研究背景当前挑战参数优化：如何自动化地优化模型参数和...

阅读全文

大型语言模型是人类级别的提示工程师

Posted on 十一月 3, 2022

论文概述这项突破性工作引入了自动提示工程师（Automatic Prompt Engineer, APE）框架，能够自动为大型语言模型生成和选择指令。APE将指令视为程序，通过搜索LLM提议的候选指令进行优化，并在另一个LLM上评估零样本性能来选择最佳指令。该方法在24个NLP任务中的19个上超过了人工编写的提示，标志着自动化提示工程过程的重大进展。论文信息：发布时间：2022-11-03 作者：Yongchao Zhou, Andrei Ioan Muresanu, Ziwen Han等机构：University of Montreal, University of Oxford, UC Berkeley等研究方向：提示工程、LLM推理核心技术：自动提示工程（APE）研究背景提示工程通常需要大量人工尝试和专业知识，这限制了其应用范围和效率。本研究针对以下问题展开： ...

阅读全文