Anthropic Claude Opus4.5发布：智能效率新高度

2025-11-25 09:02:36 AI动态 4 次阅读

Anthropic 公司隆重推出其最新旗舰模型 Claude Opus4.5，标志着人工智能在生产力领域的又一重大突破。根据官方详细说明，该模型在编码能力、智能代理操作及电脑使用等核心生产力场景中，已达到当前全球顶尖水平，同时在研究、演示文稿制作、电子表格处理等日常任务上展现出卓越的性能提升。

### 核心能力：编码、推理与长期任务管理

软件工程能力显著增强，Opus4.5在真实世界的软件工程测试中表现卓越。Anthropic 表示，该模型能够在复杂、多系统的 Bug 修复任务中独立推理出修复方案，无需过多人工引导。在 Terminal Bench 测试中，Opus4.5相较于前代 Sonnet4.5，性能提升了约15%。开发者反馈显示，Opus4.5在代码迁移和重构方面表现尤为出色，其推理路径更加复杂高效。此外，该模型支持长达200K tokens的上下文窗口，为处理长期任务提供了强大支持。

### 长期工作与自动化 Agent

Opus4.5引入了“effort参数”，允许开发者根据需求调整模型的计算强度：既可以降低“思考”强度以节省成本，也可以提升质量以追求最佳输出。在多智能体任务中，Anthropic的评估显示，Opus4.5在复杂agent系统中协调子agent的能力显著提升，从而大幅提高任务完成的质量与效率。

### 常规办公室与生产力工具能力增强

在Claude应用端，长对话不再容易触达上下文极限。模型会自动总结早期内容，确保对话的连续性。Chrome扩展首次全面开放给Max用户，此前仅处于试用阶段。Excel集成功能也得到更新，内部评估显示，Opus4.5在复杂财务建模和自动化任务上的准确率提升约20%，效率提升约15%。在Claude Code桌面版中，用户可并行运行多个会话（如调试、文档编写、测试等Agent任务），并且Plan Mode（规划模式）进一步增强：模型会在正式执行前提出可编辑的计划文件（如plan.md），并向用户澄清问题。

### 性能与效率改善：更强、更省、更灵活

Opus4.5在多项内部基准测试中表现优异，涵盖编码（SWE-bench）、agent能力（τ²-bench）、推理、数学和视觉等多个维度。在效率方面，新模型显著减少token使用。例如，在某些设置下，通过调节effort参数，Opus4.5可以在保持或超过Sonnet4.5性能的同时，输出token数减少达76%。此外，通过上下文压缩（context compaction）和memory管理提升，它能更稳健地长期运行，适合大型、持续性的agent工作流。

### 安全性：对齐与鲁棒性双重加强

Anthropic表示，Opus4.5是迄今为止对齐性（alignment）最强、最稳健的前沿模型之一。在抵抗恶意提示注入（prompt injection）攻击方面，Opus4.5的防御能力优于此前版本。Anthropic称其比行业内其他前沿模型更难被误导。安全评估覆盖范围广泛，包括主动和被动的风险路径。完整的评估结果与方法被记录在Opus4.5的“system card”中。

### 定价、可用性与开放平台

价格方面，通过Claude API调用Opus4.5的费用为每百万输入tokens5美元，每百万输出tokens25美元。该模型已在Anthropic自家的应用中上线，并通过API对开发者开放。同时，它可在三大云平台（Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry）使用。使用限制变更：对于拥有Opus访问权限的用户（如Max、Team Premium等），Anthropic已经移除以前对Opus模型的使用“封顶（cap）”限制，并提升了总体使用额度，以便更广泛地应用于日常工作。

### 影响工程师与开发者

Opus4.5在编码、调试、重构、大型多agent协作方面表现出色，可能显著提高软件开发效率，降低人工反复干预。企业与办公自动化：借助Excel、Chrome等工具集成，企业可以更轻松地将AI嵌入日常办公流程，加速分析与自动化。AI代理（Agent）生态：更强的长期推理能力与memory管理，有望推动复杂、长周期agent的落地（如流程自动化、客户服务、研发助理等）。安全可信：Anthropic强调对齐（alignment）和对抗攻击（robustness）的提升，有助于在高责任场景（如企业、关键任务）中增强信任。

Claude Opus4.5是Anthropic在AI能力与安全性方面的重大进展。它不仅在编码和智能代理任务上展现了领先能力，而且通过更高的效率、更灵活的资源使用方式，以及更稳健的对齐机制，为开发者和企业用户提供了更强大的生产力工具。随着其在云平台上的广泛可用性，Opus4.5有望成为推动下一代AI驱动工作流的中坚力量。