Claude Opus 4.6 在金融服务领域的应用

Claude Opus 4.6 在金融服务领域的应用

来源: Claude.com Blog
发布日期: 2026-03-06
类型: 产品更新

概述

Anthropic 于 2026 年 2 月 5 日正式发布 Claude Opus 4.6 模型,该模型代表了 AI 在金融服务领域的重大进步。Claude Opus 4.6 专为金融专业人士设计,能够在复杂分析任务中提供更精准的推理能力,生成更加精炼的初次交付成果,并引入了针对分析师实际工作场景的全新工具。

本次更新不仅带来了模型本身的升级,还同步推出了多项产品功能改进。Cowork 功能现在能够生成更加完善的财务模型和演示文稿;Claude in Excel 在处理长时间运行的复杂任务时表现更加出色,能够随着财务模型复杂度的提升保持专注和准确性;此外,Anthropic 还以测试预览版的形式发布了 Claude in PowerPoint,支持原生创建和迭代演示文稿。

根据 Anthropic 内部的”真实世界财务评估”(Real-World Finance evaluation)结果显示,Claude Opus 4.6 在约 50 个投资分析和财务分析用例上的表现相比几个月前的旗舰模型 Claude Sonnet 4.5 提升了超过 23 个百分点。这些用例涵盖电子表格、幻灯片演示和 Word 文档的生成与审阅,是投资银行、私募股权、公共投资和Corporate Finance 领域分析师日常执行的核心任务。

在外部基准测试方面,Claude Opus 4.6 同样表现卓越。在 Vals AI 提供的 Finance Agent 基准测试中(评估模型对上市公司 SEC 文件的研究能力),Opus 4.6 以 60.7% 的准确率达到业界领先水平,相比 Opus 4.5 提升了 5.47 个百分点。在 TaxEval 税务评估基准中,Opus 4.6 更是以 76.0% 的得分位居榜首。这些数据充分证明了 Claude Opus 4.6 在金融领域的专业能力和实用价值。


本文内容翻译自 Claude.com Blog 官方博客。

核心内容

研究、分析、创建:金融专业工作的三大维度

金融专业人士使用 AI 进行多源数据研究、支持财务分析以及创建可供团队和客户执行的交付成果。Claude Opus 4.6 在这三个维度上均达到了行业最佳水平。

在研究方面,Claude Opus 4.6 在 BrowseComp 和 DeepSearchQA 两个基准测试上均有显著提升。这两个基准测试用于评估模型从大量非结构化数据源中提取特定信息的能力。在实际应用中,这意味着用户可以向 Claude 提供一套密集文档,并获得具体、聚焦的答案,而不是简单的摘要。

在分析方面,Claude Opus 4.6 在 Finance Agent 基准测试中以 60.7% 的得分达到业界领先水平(相比 Opus 4.5 提升 5.47%)。Finance Agent 是由 Vals AI 提供的外部基准,用于评估模型对上市公司 SEC 文件的研究能力。Opus 4.6 在 Vals AI 提供的 TaxEval 税务评估基准中同样以 76.0% 的得分位居榜首。

在创建方面,Anthropic 使用 GDPval-AA 来衡量 Claude 在复杂知识工作方面的表现,同时结合内部”真实世界财务评估”结果。借助 Claude Opus 4.6,电子表格和演示文稿等结构化输出的首次生成准确率大幅提升。下方的对比输出展示了从 Claude Opus 4.5 到 Opus 4.6 的输出质量改进。这些示例展示了 Claude 在商业尽职调查任务(评估潜在收购)中的首次执行表现——这类工作通常需要高级分析师花费两到三周时间才能完成。

“借助 Claude Opus 4.6,创建曾经需要数小时的财务 PowerPoint 演示文稿现在只需几分钟。我们在细节关注、空间布局和内容结构方面看到了实质性的改进。”
—— Aabhas Sharma,Hebbia 首席技术官

“Claude Opus 4.6 带来的性能提升几乎令人难以置信。那些对 Opus 4.5 来说具有挑战性的实际任务突然变得轻松简单。这感觉是 Shortcut 上电子表格代理的分水岭时刻。”
—— Nico Christie,Shortcut AI 联合创始人兼首席技术官

更强的多任务处理和初稿生成能力

通过 Cowork 功能,可以轻松访问 Claude Opus 4.6 的金融能力。Cowork 是 Anthropic 桌面应用中的一种全新使用方式

在 Cowork 中,您可以让 Claude 访问您选择的桌面文件夹。Claude 能够直接在该文件夹中读取、编辑和创建新文件。对于金融团队而言,这意味着您可以同时启动多项分析,同时在 Claude 创建每个交付成果时引导其思考过程,以满足您的标准。

Cowork 还可以通过插件进行定制——这些插件是技能包(指定如何完成任务)和与其他平台数据连接的组合。例如,通过企业财务插件,Claude 可以立即了解如何完成常见工作流程,如日记账分录、差异分析和对账。您也可以构建自己的插件以匹配您的工作方式。

Cowork 作为仅限桌面的测试预览版,在所有付费 Claude 计划中可用(目前从 Mac 开始,Windows 版本即将推出)。

无需离开电子表格即可深入分析

Claude in Excel 将 Claude Opus 4.6 直接集成到您的电子表格中。现在它在规划和与用户澄清假设方面表现更佳,尤其是当任务变得更加复杂时。它还支持数据透视表编辑、图表修改、条件格式、排序和筛选、数据验证以及金融级格式设置。

此外,我们还添加了可用性改进,包括长对话的自动压缩和拖放多文件支持。这意味着您在标签页之间复制粘贴的工作量将大大减少。您可以在一个地方与 Claude 合作处理从财务模型到客户可用工作簿的各种任务。

“由 Claude Opus 4.6 驱动的 Claude in Excel 代表了重大飞跃。从尽职调查到财务建模,它已被证明是我们团队的强大工具——处理非结构化数据,通过最少的提示智能地工作,有意义地自动化复杂分析。这是 AI 以切实、节省时间的方式增强投资专业人员能力的绝佳例证。”
—— Lloyd Hilton,Hg Catalyst 负责人

“作为加拿大最大的机构投资者之一,我们不断创新,并将 AI 视为塑造未来的前沿。Claude Opus 4.6 在速度、精度和复杂任务处理能力(如 Claude in Excel 中的多标签分析)方面的提升,为我们的工作方式解锁了令人兴奋的可能性。”
—— Ben Letalik,数字转型与创新高级总监,BCI

直接与 Claude 完善演示文稿

Anthropic 还以测试预览版的形式推出了 Claude in PowerPoint。与 Claude in Excel 类似,它将 Claude 带入您的 PowerPoint 侧边栏,使其能够读取您现有的布局、字体和母版,然后内联创建新内容。Claude 可以根据客户模板构建演示文稿,对现有幻灯片进行针对性编辑,并从头开始生成出色的初稿演示文稿。

Claude in PowerPoint 现已作为研究预览版向所有 Max、Team 或 Enterprise 计划的用户开放。

开始使用

Claude Opus 4.6 和最新产品更新使各种新任务成为可能。但 AI 在金融领域的应用仍然是一个活跃的探索领域。用户应继续审查 Claude 的输出以确保符合其规范;特别是对于高风险工作,人工判断仍然至关重要。随着我们继续改进 Claude 的功能,我们的目标是为金融行业专业人士提供越来越强大的研究和分析工具,帮助他们专注于最重要的工作。

Claude Opus 4.6、Cowork 和 Claude in Excel 在所有付费 Claude 计划中可用。如需了解更多关于 Claude in Excel 的信息,请探索我们的指南视频教程,并在此处开始使用。Claude in PowerPoint 作为研究预览版向所有 Max、Team 和 Enterprise 用户开放,您可以在此处开始使用

要了解这些组织如何实际使用这些新功能,请注册参加我们的网络研讨会


关键要点总结

模型性能提升

  • 财务推理能力:在内部”真实世界财务评估”中,Claude Opus 4.6 相比 Claude Sonnet 4.5 提升超过 23 个百分点
  • SEC 文件分析:在 Finance Agent 基准测试中以 60.7% 得分领先业界(提升 5.47%)
  • 税务评估:在 TaxEval 基准中以 76.0% 得分位居榜首
  • 研究能力:在 BrowseComp 和 DeepSearchQA 基准测试中均有显著提升

产品功能更新

  1. Cowork(测试预览版)

    • 桌面应用中的全新使用方式
    • 支持读取、编辑和直接在选定文件夹中创建文件
    • 可同时启动多项分析任务
    • 支持通过插件定制(包括企业财务插件)
    • 适用于所有付费计划的 Mac 用户
  2. Claude in Excel

    • 集成 Claude Opus 4.6 模型
    • 支持复杂任务的规划和假设澄清
    • 新增功能:数据透视表编辑、图表修改、条件格式、排序筛选、数据验证
    • 可用性改进:长对话自动压缩、拖放多文件支持
  3. Claude in PowerPoint(测试预览版)

    • 侧边栏集成方式
    • 可读取现有布局、字体和母版
    • 支持客户模板构建、针对性编辑和从零创建
    • 适用于 Max、Team 和 Enterprise 计划用户

用户反馈亮点

  • Hebbia CTO:财务 PPT 创建从数小时缩短至数分钟
  • Shortcut AI CTO:性能提升”几乎令人难以置信”,是电子表格代理的”分水岭时刻”
  • Hg Catalyst 负责人:AI 以”切实、节省时间的方式”增强投资专业人员能力
  • BCI 数字转型总监:为机构投资者”解锁了令人兴奋的可能性”

个人评价

Claude Opus 4.6 的发布标志着 AI 在金融服务领域的应用进入了一个新的阶段。从技术角度来看,这次更新有几个值得关注的亮点:

第一,性能提升的实质性。 在内部评估中相比 Sonnet 4.5 提升 23 个百分点,在 Finance Agent 和 TaxEval 等外部基准测试中均达到业界领先水平,这些数据表明 Claude Opus 4.6 并非简单的迭代更新,而是在金融领域专业能力上实现了质的飞跃。尤其是 SEC 文件分析和税务评估这两个高度专业化的场景,能够取得如此成绩,说明模型在金融领域知识训练上投入了大量资源。

第二,产品整合的深度。 Anthropic 没有止步于模型本身的升级,而是通过 Cowork、Claude in Excel 和 Claude in PowerPoint 将 AI 能力深度整合到金融专业人士的日常工具链中。这种”嵌入工作流”的策略比单纯的 API 调用更加贴近实际使用场景,能够显著降低采用门槛。特别是 Excel 和 PowerPoint 这两个金融行业的核心工具,AI 的原生集成将改变分析师的工作方式。

第三,首次执行准确率的提升。 官方博客多次强调”first-pass deliverables”(首次交付成果)和”first-pass performance”(首次执行表现),这反映了 Anthropic 对用户痛点的深刻理解。金融行业的交付成果通常要求极高的准确性,如果 AI 需要多次迭代才能达到可用标准,其实际价值将大打折扣。Opus 4.6 在首次执行准确率上的提升,意味着它更可能直接产出可用的工作成果。

第四,企业级功能的完善。 通过插件系统支持定制化工作流程(如日记账分录、差异分析、对账等),以及多文件拖放、长对话自动压缩等可用性改进,都体现了 Anthropic 对企业用户需求的重视。这些功能可能不会在基准测试中体现,但对实际用户体验影响显著。

需要注意的方面:

  1. 人工审查仍然必要:官方博客明确指出,特别是对于高风险工作,人工判断仍然至关重要。这表明尽管 AI 能力大幅提升,但在金融这种对准确性要求极高的领域,AI 仍应定位为辅助工具而非替代方案。

  2. 测试预览版的限制:Cowork 和 Claude in PowerPoint 目前仍处于测试预览版阶段,且 Cowork 仅限 Mac 桌面使用。这意味着企业用户在大规模部署前仍需等待功能成熟和跨平台支持。

  3. 成本考量:所有高级功能均需要付费计划,对于小型金融机构或独立分析师而言,需要权衡投入产出比。

总体评价: Claude Opus 4.6 是 AI 在金融垂直领域专业化发展的重要里程碑。对于投资银行、私募股权、企业财务等场景的专业人士,这套工具组合有望显著提升研究效率和分析质量。建议金融行业的 AI 早期采用者积极评估这些新功能,从试点项目开始逐步探索最佳实践。


参考链接

© 2026 Generative AI Discovery All Rights Reserved.
Theme by hiero