ReAct模式Agent中的工具调用历史管理与Token优化策略

问题背景在实现 ReAct(Reasoning + Acting)模式的 AI Agent 时,我们面临一个核心挑战:如何高效管理工具调用历史以优化 Token 使用? ReAct 模式的标准流程 初始化:将 MCP 的 tool 列表转换为 function calling 格式,传给 LLM LLM 推理:分析请求,决定调用哪些工具及参数 执行 Tool:调用对应的 MCP tool,获取返回结果 反馈循环:将结果添加到对话历史,再次发送给 LLM 迭代判断: 需要更多信息 → 继续调用工具 信息充足 → 生成最终回复 核心问题当 Agent 处理用户的下一个输入时,需要带上 history + 最新 input。那么: history 是否有必要带上历史 tool 调用信息? 这个看似简单的问题,实际涉及到: 上下文连贯性 vs Token 成本 多轮推理能力 vs 内...

阅读全文

© 2025 Generative AI Discovery All Rights Reserved.
Theme by hiero