大型语言模型作为优化器

论文概述这篇里程碑式论文介绍了通过提示优化(Optimization by PROmpting, OPRO),这是一种利用大型语言模型作为各种任务优化器的突破性范式。与传统的基于导数的优化不同,OPRO 使用自然语言描述优化任务,并根据先前评估的候选项迭代生成新解决方案。该方法在提示优化上展示了显著的有效性,其中 OPRO 优化的提示在 GSM8K 上优于人工设计的提示最多 8%,在 Big-Bench Hard 任务上优于最多 50%。这项工作在 Hugging Face 上获得了 77 个点赞,表明了强大的社区认可。 论文信息: 发布时间:2023-09-07 作者:Chengrun Yang, Xuezhi Wang, Yifeng Lu等 机构:Google DeepMind 研究方向:提示工程,大型语言模型推理 核心技术:提示优化(Prompt Optimization)...

阅读全文

© 2025 Generative AI Discovery All Rights Reserved.
Theme by hiero