问题背景在实现 ReAct(Reasoning + Acting)模式的 AI Agent 时,我们面临一个核心挑战:如何高效管理工具调用历史以优化 Token 使用?
ReAct 模式的标准流程
初始化:将 MCP 的 tool 列表转换为 function calling 格式,传给 LLM
LLM 推理:分析请求,决定调用哪些工具及参数
执行 Tool:调用对应的 MCP tool,获取返回结果
反馈循环:将结果添加到对话历史,再次发送给 LLM
迭代判断:
需要更多信息 → 继续调用工具
信息充足 → 生成最终回复
核心问题当 Agent 处理用户的下一个输入时,需要带上 history + 最新 input。那么:
history 是否有必要带上历史 tool 调用信息?
这个看似简单的问题,实际涉及到:
上下文连贯性 vs Token 成本
多轮推理能力 vs 内...