大型语言模型作为优化器

Posted on 九月 7, 2023

论文概述这篇里程碑式论文介绍了通过提示优化（Optimization by PROmpting, OPRO），这是一种利用大型语言模型作为各种任务优化器的突破性范式。与传统的基于导数的优化不同，OPRO 使用自然语言描述优化任务，并根据先前评估的候选项迭代生成新解决方案。该方法在提示优化上展示了显著的有效性，其中 OPRO 优化的提示在 GSM8K 上优于人工设计的提示最多 8%，在 Big-Bench Hard 任务上优于最多 50%。这项工作在 Hugging Face 上获得了 77 个点赞，表明了强大的社区认可。论文信息：发布时间：2023-09-07 作者：Chengrun Yang, Xuezhi Wang, Yifeng Lu等机构：Google DeepMind 研究方向：提示工程，大型语言模型推理核心技术：提示优化（Prompt Optimization）...

阅读全文