展示你的工作：使用语言模型草稿本进行中间计算

Posted on 十一月 30, 2021

论文概述这项来自Google Research的开创性工作引入了”草稿本”（scratchpad）技术，通过训练transformer输出中间计算步骤，极大地提高了它们执行复杂多步骤计算的能力。通过要求语言模型”逐步”展示其工作过程，该方法使LM能够解决从长加法到执行任意程序等以前难以处理的任务。论文信息：发布时间：2021-11-30 作者：Maxwell Nye, Anders Johan Andreassen, Guy Gur-Ari等机构：Google Research 研究方向：提示工程、LLM推理核心技术：思维链（Chain-of-Thought）研究背景语言模型在单步预测任务上表现出色，但在需要多步计算的复杂任务上遇到困难。本研究针对以下问题展开：现有问题语言模型难以执行需要多步骤的复杂计算模型的中间推理过程不可见，难以调试和理解长序列计算容易出错...

阅读全文