AI Agent 常用工作流模式及应用场景
来源: Claude.com Blog
发布日期: 2026-03-06
类型: 官方公告
概述
本文深入探讨了 AI Agent(智能体)开发中的三种核心工作流模式:顺序工作流、并行工作流和评估 - 优化工作流。文章基于 Anthropic 团队与数十个构建 AI Agent 的团队合作经验,系统性地分析了每种模式的适用场景、权衡取舍和实施策略。
在实际生产环境中,选择正确的工作流模式对于控制延迟、令牌成本与系统可靠性至关重要。顺序工作流适用于具有明确依赖关系的多阶段任务,通过将复杂问题分解为专注的子任务来提高准确性;并行工作流通过同时执行独立任务显著缩短完成时间,适合多维度评估和文档分析场景;评估 - 优化工作流则通过生成与评估的迭代循环,能够产出符合特定质量标准的高质量输出,适用于代码生成、专业文档和客户通信等场景。
文章强调了一个核心原则:从能够解决问题的最简单模式开始。默认选择顺序工作流,仅在延迟成为瓶颈且任务独立时转向并行模式,只有在能够衡量质量提升时才添加评估 - 优化循环。这三种模式并非互斥,可以根据实际需求嵌套组合使用,为 AI Agent 系统的架构设计提供了清晰的演进路径。
本文内容翻译自 Claude.com Blog 官方博客。
正文翻译
AI Agent 如何与工作流协同工作
如果你管理过团队,你已经理解工作流的概念。
想象一条制造装配线:每个站点都有一个熟练的工人针对特定任务做出决策,但整体流程是提前设计好的——即使单个步骤涉及动态决策(如路由或重试)。
Agent 工作流以同样的方式运行。
理解工作流与自主 Agent 的区别
工作流不会取代 Agent 的自主性,而是塑造 Agent 在何处以及如何应用自主性。
完全自主的 Agent决定一切:使用哪些工具、以什么顺序执行任务、何时停止。
工作流提供结构:它建立整体流程、定义检查点,并设定 Agent 在每个步骤中的操作边界,同时仍然允许在这些边界内进行动态行为。
工作流中的每个步骤仍然可以利用 Agent 的推理能力和工具使用能力,但整体编排遵循定义的路径。工作流模式让你在每个步骤中获得 Agent 智能,并在整个任务中获得可预测的流程。
AI Agent 工作流模式
在生产环境中,我们最常见到三种工作流模式。将它们视为构建模块而非僵化的模板——随着需求演变,你经常会组合或嵌套它们:
- 顺序工作流 — 用于按固定顺序执行任务
- 并行工作流 — 用于跨多个 Agent 同时运行独立任务
- 评估 - 优化工作流 — 用于需要迭代改进的输出
每种工作流类型解决特定问题,并在复杂性、成本和性能方面具有明确的权衡。
| 模式 | 解决的问题 | 何时使用 | 权衡 | 优势 |
|---|---|---|---|---|
| 顺序 | 任务具有依赖关系:步骤 B 需要步骤 A 的输出 | 多阶段流程、数据管道、草稿 - 审查 - 完善循环 | 增加延迟(每个步骤等待前一个步骤完成) | 通过让每个 Agent 专注于一件事来提高准确性 |
| 并行 | 任务独立但逐个执行速度太慢 | 多维度评估、代码审查、文档分析 | 成本更高(多个并发 API 调用)且需要聚合策略 | 可更快完成并在工程团队间实现关注点分离 |
| 评估 - 优化 | 初稿质量不够好 | 技术文档、客户通信、符合特定标准的代码生成 | 增加令牌使用和迭代时间 | 通过结构化反馈循环生成更好的输出 |
建议:从能够解决问题的最简单模式开始。默认选择顺序工作流。当延迟成为瓶颈且任务独立时转向并行模式,只有在能够衡量质量提升时才添加评估 - 优化循环。
顺序工作流 (Sequential Workflows)
顺序工作流按预定顺序执行任务。
每个阶段的 Agent 处理输入、做出决策、根据需要调用工具,然后将结果传递给下一阶段。结果是一个清晰的操作链,输出线性地流经系统。
.png)
何时使用
当任务自然地分解为具有清晰依赖关系的不同阶段时,顺序工作流表现最佳。你通过让每个 Agent 专注于特定子任务而不是试图一次性处理所有内容,用一些延迟换取更高的准确性。
在以下情况下使用顺序工作流:
- 多阶段流程,每个步骤依赖于前一个步骤的输出
- 数据转换管道,每个阶段添加特定价值
- 由于固有依赖而无法并行化的任务
- 迭代改进循环,如草稿 - 审查 - 完善流程
何时避免
当单个 Agent 可以有效地处理整个任务时,或者当 Agent 需要协作而不是顺序交接工作时,跳过顺序工作流。如果你强行将任务分解为顺序步骤而它不适合这种结构,你正在增加不必要的复杂性。
示例
顺序工作流在以下场景表现良好(每个步骤涉及真正不同的工作):
- 生成营销文案,然后将其翻译成多种语言
- 从文档中提取数据,根据模式验证,然后加载到数据库中
- 内容审核管道:提取内容、分类、应用审核规则,然后适当路由
专业建议:首先尝试将管道作为单个 Agent 实现,步骤只是提示的一部分。如果这样足够好,你已经解决了问题而无需增加复杂性。只有当单个 Agent 无法可靠处理时才拆分为多步骤工作流。
并行工作流 (Parallel Workflows)
并行工作流将独立任务分配给多个 Agent 同时执行。你无需等待一个 Agent 完成后再启动下一个,而是同时运行多个 Agent 并合并它们的结果。
当任务彼此不依赖时,这种模式可以提供速度提升。
.png)
这种方法类似于分布式系统中的扇出/扇入 (fan-out/fan-in) 模式。你将相同或相关的工作发送给多个 Agent,每个 Agent 独立处理,然后聚合或综合它们的输出。
Agent 不相互交接工作——它们自主操作并产生有助于整体任务的结果。
何时使用
当你可以将工作划分为受益于同时处理的独立子任务,或者当你需要对同一问题的多个视角时,并行化是有意义的。它还实现了关注点分离:不同的工程师可以独立拥有和优化单个 Agent,而它们的工作不会相互干扰。对于复杂任务,用单独的 AI 调用处理每个考虑因素通常优于试图在一次调用中处理所有内容。
考虑并行工作流用于:
- 分块方法,不同 Agent 处理不同方面(如一个处理查询,另一个筛查安全问题)
- 评估场景,每个 Agent 评估不同的质量维度
- 投票模式,多个 Agent 分析相同内容,你聚合它们的评估
何时避免
当 Agent 需要累积上下文或必须建立在彼此的工作之上时,不要使用并行工作流。当资源限制(如 API 配额)使并发处理效率低下,或者当你缺乏处理不同 Agent 矛盾结果的清晰策略时,跳过此模式。如果结果聚合变得过于复杂或降低输出质量,并行化就不值得。
示例
并行工作流在以下场景表现良好:
- 自动化评估(每个 Agent 检查不同的质量指标)
- 代码审查(多个 Agent 检查不同的漏洞类别)
- 文档分析是另一个强用例:并行提取关键主题、情感分析和事实验证,然后组合见解
专业建议:在实现并行 Agent 之前设计你的聚合策略。你会采用多数投票吗?平均置信度分数?委托给最专业的 Agent?制定清晰的综合结果计划可防止你收集冲突输出而无法解决它们。
评估 - 优化工作流 (Evaluator-Optimizer Workflows)
评估 - 优化工作流将两个 Agent 配对进行迭代循环:一个生成内容,另一个根据特定标准评估它,生成器根据反馈进行改进。这个过程持续到输出达到你的质量阈值或达到最大迭代次数。
关键洞察是生成和评估是不同的认知任务。将它们分开让每个 Agent 专业化——生成器专注于生成内容,评估器专注于应用一致的质量标准。
.png)
何时使用
当你拥有清晰的、可衡量的质量标准(AI 评估器可以一致地应用),并且当初试质量和最终质量之间的差距足够大以证明额外的令牌和延迟合理时,这种模式有效。
考虑评估 - 优化工作流用于:
- 具有特定要求的代码生成(安全标准、性能基准、风格指南)
- 语气和精确度很重要的专业通信
- 任何初稿质量持续低于要求的场景
何时避免
当初试质量已经满足你的需求时,跳过评估 - 优化工作流——你在浪费令牌进行不必要的迭代。不要将此模式用于需要即时响应的实时应用、简单的常规任务(如基本分类),或者当评估标准过于主观以至于 AI 评估器无法一致地应用时。如果存在确定性工具(如用于代码风格的 linter),请使用这些工具。当资源限制超过质量改进时,也要避免这种模式。
示例
评估 - 优化工作流在以下场景表现良好:
- 生成 API 文档(生成器编写文档,评估器检查代码库的完整性、清晰度和准确性)
- 创建客户通信(生成器起草邮件,评估器评估语气和策略合规性)
- 生成 SQL 查询(生成器编写查询,评估器检查效率和安全性问题)
专业建议:在开始迭代之前设置清晰的停止标准。定义最大迭代次数和特定质量阈值。没有这些防护措施,你可能会陷入昂贵的循环:评估器不断发现小问题,生成器不断调整,但质量在停止迭代之前早已趋于平稳。知道何时”足够好就是足够好”。
选择正确的工作流模式
正确的工作流模式取决于你的任务结构、质量要求和资源限制。
在选择模式之前,首先尝试将任务作为单个 Agent 调用执行。 如果这满足你的质量要求,你就完成了。如果不满足,找出它不足之处——这会告诉你应该选择哪种模式。
以下是一些帮助你决策的问题:
- 单个 Agent 能否有效处理此任务? 如果是,根本不要使用工作流。
- 任务是否有清晰的顺序依赖关系? 使用顺序工作流。
- 子任务能否独立同时处理,更快完成是否有帮助? 考虑并行工作流。
- 质量是否通过迭代改进有意义地提升? 考虑评估 - 优化模式。
选择模式后,考虑以下因素:
- 故障处理:为每个步骤定义回退行为和重试逻辑
- 延迟和成本限制:这些决定你可以运行多少 Agent 以及可以负担多少次迭代
- 衡量改进:使用单个 Agent 设置基线,这样你可以判断工作流是否真正有帮助
- 组合模式:这些模式并非互斥。你可以根据需要嵌套它们
- 评估 - 优化工作流可以使用并行评估,多个评估器同时评估不同的质量维度
- 顺序工作流可以在某些阶段包含并行处理,在移动到下一步之前执行多个独立操作
关键是将模式复杂性与实际需求相匹配。不要因为你可以而添加并行处理——仅在并发执行提供明确优势时添加。除非它们以可衡量的方式改善输出质量,否则不要实现评估 - 优化循环。
明智地演进你的工作流
我们最好的建议:从行之有效的最简单模式开始。 如果顺序工作流处理你的用例,不要添加并行化。如果初稿质量足够好,跳过评估 - 优化循环。
这三种模式为你提供了随着需求变化而清晰的升级路径。顺序工作流可以在瓶颈阶段整合并行处理。当质量标准收紧时,Agent 方法可以添加评估,由于这些模式是模块化的,你不需要完全重写。
有关实施指南、详细示例和包括混合方法在内的高级模式,请查阅完整白皮书:
构建高效 AI Agent:架构模式和实现框架
核心要点总结
工作流不是取代自主性,而是塑造自主性:工作流为 Agent 提供结构和边界,同时允许在边界内进行动态决策
三种核心模式:
- 顺序:适用于有依赖的多阶段任务
- 并行:适用于独立任务的同时执行
- 评估 - 优化:适用于需要迭代改进的高质量输出
选择原则:从最简单的可行方案开始,仅在必要时增加复杂度
模式可组合:三种模式可以嵌套使用,根据实际需求灵活搭配
实施前评估:先尝试单个 Agent 调用,确定不足后再选择对应模式
个人评价
这篇文章为 AI Agent 系统设计提供了实用且结构化的指导框架。以下是我的几点看法:
优点:
实践导向:文章基于 Anthropic 与数十个团队合作的真实生产经验,而非纯理论推导,三种模式的归纳具有很高的实用价值
清晰的决策框架:提供了明确的”何时使用”和”何时避免”指南,帮助开发者根据具体场景做出选择
渐进式设计理念:强调”从最简单模式开始”的原则,避免了过度工程化的常见陷阱
可组合性思维:三种模式可嵌套组合,为复杂系统提供了灵活的架构演进路径
局限与思考:
成本考量可更深入:文章虽然提到令牌使用和延迟,但没有给出具体的成本对比数据,实际决策时可能需要更多量化参考
错误处理细节不足:对于生产环境中至关重要的故障恢复、超时处理等只有简要提及
适用边界模糊:三种模式覆盖”绝大多数”用例,但对于更复杂的场景(如动态路由、条件分支等)没有涉及
实际应用建议:
对于正在构建 AI Agent 系统的团队,我建议:
- 先用单 Agent 方案验证核心功能可行性
- 在性能或质量不达标时,根据瓶颈类型选择对应模式
- 建立量化指标基线,确保每次架构升级都带来可衡量的改善
- 考虑将工作流模式抽象为可复用组件,降低后续迭代成本
总体而言,这篇文章为 AI Agent 工作流设计提供了一个优秀的起点框架,值得在实际项目中参考应用。