PROMST:多步骤任务中的提示优化——整合人类反馈与启发式采样

Posted on 二月 13, 2024

PROMST:多步骤任务中的提示优化——整合人类反馈与启发式采样论文概述本文是一篇关于提示工程的优化方法论文,由 Yongchao Chen 等6位研究者共同完成。 PROMST 解决了多步骤智能体任务提示优化的独特挑战,在这些任务中,提示更加复杂,单个步骤的影响难以评估,且用户偏好各异。与单步骤任务优化器不同,PROMST 融合了人类设计的反馈规则(自评规则)以自动提供直接的改进建议,并使用学习到的启发式模型来高效预测提示性能以进行采样。该方法在11个代表性多步骤任务上显著优于人工设计的提示和其他优化方法,在五种不同的大语言模型上平均提升10.6%-29.3%。研究目标本研究的主要目标包括: 引入专门为多步骤任务提示优化设计的 PROMST 框架开发自评规则机制,将人类反馈规则融入自动化优化实现对比过滤,使用学习到的启发式方法高效采样高质量提示候选研究背景当前挑战提示...

阅读全文