Anthropic Claude Opus4.5发布:智能效率新高度

Anthropic 公司隆重推出其最新旗舰模型 Claude Opus4.5,标志着人工智能在生产力领域的又一重大突破。根据官方详细说明,该模型在编码能力、智能代理操作及电脑使用等核心生产力场景中,已达到当前全球顶尖水平,同时在研究、演示文稿制作、电子表格处理等日常任务上展现出卓越的性能提升。

### 核心能力:编码、推理与长期任务管理

Anthropic Claude Opus4.5发布:智能效率新高度插图1

软件工程能力显著增强,Opus4.5在真实世界的软件工程测试中表现卓越。Anthropic 表示,该模型能够在复杂、多系统的 Bug 修复任务中独立推理出修复方案,无需过多人工引导。在 Terminal Bench 测试中,Opus4.5相较于前代 Sonnet4.5,性能提升了约15%。开发者反馈显示,Opus4.5在代码迁移和重构方面表现尤为出色,其推理路径更加复杂高效。此外,该模型支持长达200K tokens的上下文窗口,为处理长期任务提供了强大支持。

### 长期工作与自动化 Agent

Opus4.5引入了“effort参数”,允许开发者根据需求调整模型的计算强度:既可以降低“思考”强度以节省成本,也可以提升质量以追求最佳输出。在多智能体任务中,Anthropic的评估显示,Opus4.5在复杂agent系统中协调子agent的能力显著提升,从而大幅提高任务完成的质量与效率。

Anthropic Claude Opus4.5发布:智能效率新高度插图2

### 常规办公室与生产力工具能力增强

在Claude应用端,长对话不再容易触达上下文极限。模型会自动总结早期内容,确保对话的连续性。Chrome扩展首次全面开放给Max用户,此前仅处于试用阶段。Excel集成功能也得到更新,内部评估显示,Opus4.5在复杂财务建模和自动化任务上的准确率提升约20%,效率提升约15%。在Claude Code桌面版中,用户可并行运行多个会话(如调试、文档编写、测试等Agent任务),并且Plan Mode(规划模式)进一步增强:模型会在正式执行前提出可编辑的计划文件(如plan.md),并向用户澄清问题。

### 性能与效率改善:更强、更省、更灵活

Anthropic Claude Opus4.5发布:智能效率新高度插图3

Opus4.5在多项内部基准测试中表现优异,涵盖编码(SWE-bench)、agent能力(τ²-bench)、推理、数学和视觉等多个维度。在效率方面,新模型显著减少token使用。例如,在某些设置下,通过调节effort参数,Opus4.5可以在保持或超过Sonnet4.5性能的同时,输出token数减少达76%。此外,通过上下文压缩(context compaction)和memory管理提升,它能更稳健地长期运行,适合大型、持续性的agent工作流。

### 安全性:对齐与鲁棒性双重加强

Anthropic表示,Opus4.5是迄今为止对齐性(alignment)最强、最稳健的前沿模型之一。在抵抗恶意提示注入(prompt injection)攻击方面,Opus4.5的防御能力优于此前版本。Anthropic称其比行业内其他前沿模型更难被误导。安全评估覆盖范围广泛,包括主动和被动的风险路径。完整的评估结果与方法被记录在Opus4.5的“system card”中。

Anthropic Claude Opus4.5发布:智能效率新高度插图4

### 定价、可用性与开放平台

价格方面,通过Claude API调用Opus4.5的费用为每百万输入tokens5美元,每百万输出tokens25美元。该模型已在Anthropic自家的应用中上线,并通过API对开发者开放。同时,它可在三大云平台(Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry)使用。使用限制变更:对于拥有Opus访问权限的用户(如Max、Team Premium等),Anthropic已经移除以前对Opus模型的使用“封顶(cap)”限制,并提升了总体使用额度,以便更广泛地应用于日常工作。

### 影响工程师与开发者

Opus4.5在编码、调试、重构、大型多agent协作方面表现出色,可能显著提高软件开发效率,降低人工反复干预。企业与办公自动化:借助Excel、Chrome等工具集成,企业可以更轻松地将AI嵌入日常办公流程,加速分析与自动化。AI代理(Agent)生态:更强的长期推理能力与memory管理,有望推动复杂、长周期agent的落地(如流程自动化、客户服务、研发助理等)。安全可信:Anthropic强调对齐(alignment)和对抗攻击(robustness)的提升,有助于在高责任场景(如企业、关键任务)中增强信任。

Claude Opus4.5是Anthropic在AI能力与安全性方面的重大进展。它不仅在编码和智能代理任务上展现了领先能力,而且通过更高的效率、更灵活的资源使用方式,以及更稳健的对齐机制,为开发者和企业用户提供了更强大的生产力工具。随着其在云平台上的广泛可用性,Opus4.5有望成为推动下一代AI驱动工作流的中坚力量。

最新快讯

2025年11月25日

10:10
近日,不少消费者发现,在盒马App中悄然上架了Burberry等奢侈品牌的服装、鞋类、背包、短袖及披肩等产品。其中,原价万元以上的经典格纹披肩售价仅为2799-3188元,原价10250元的棕色双排扣棉服也大幅降至3450元。值得注意的是,这些奢侈品目前仅在线上销售,尚未登陆线下门店。这一举动标志着"买烤鸡时顺便买件奢侈品"的购物模式正逐渐从山姆、开市客等仓...
10:10
在电影《捕风追影》中,梁家辉饰演的“影子”在冷血杀手形象之外,还展现了一丝温情——为战友煮一碗充满港式风情的餐蛋面。这碗面里,一碗热气腾腾的方便面配上一个金黄的煎蛋和几片午餐肉,不仅勾起了无数港式茶餐厅的回忆,更成为当代年轻人追求生活仪式感的象征。艾媒咨询最新数据显示,预计到2026年,中国午餐肉行业市场规模将突破500亿元大关。 与海外市场对罐头食品的狂热...
10:10
小红书双11表现亮眼 成交额破千万商家数量翻倍 声明:本文来自于微信公众号 窄播,作者:庞梦圆,授权站长之家转载发布。这是《窄播Weekly》的第73期,本期聚焦小红书双11。本周小红书发布了双11期间的店铺、商家、买手、好货榜,对双11业绩做了全面总结。整体来看,成交破千万的商家数量是之前的2.4倍,千万级买手数量是之前的1.9倍。 此前小红书已宣布,买手...
10:10
11月25日,一则关于AI生成模特试穿视频的话题在微博上迅速引爆,引发网友热议。据多家媒体报道,有网友在网购时发现某女装店铺的商品详情页竟然使用了AI生成的模特试穿视频,这一现象立即引起了广泛关注。视频中,模特在转身时出现了头和脖子衔接处不自然的画面,整体效果显得十分诡异,令人难以置信。 面对网友的质疑,该店铺客服回应称,详情页的静态图片确实是模特实拍所得,...
10:10
微新创想11月25日专稿 当今社会,谁曾想那些平日里令人避之不及的"臭大姐",竟摇身一变成为餐桌上的抢手美味?据国内多家媒体近日报道,四川省乐山市大渡河畔出现了一道奇特的风景线——市民们纷纷扎堆捕捉这种被称为"打屁虫"的昆虫,将其制成一道备受推崇的冬季下酒佳肴,有市民戏称"冬天吃了要掀铺盖"。 据了解,这种拇指盖大小的昆虫在乐山当地市场异常火爆,其价格之...
10:07
字节跳动旗下创新力作“豆包输入法”正式揭开神秘面纱,安卓用户现已可通过官方网站或各大主流应用商店免费下载体验,iOS版本也即将在不久后与广大用户见面。这款输入法以豆包App同款尖端语音模型为核心,致力于为用户带来前所未有的语音识别精准度、语义理解深度,以及全方位的键盘输入效率提升。 官方特别强调,豆包输入法具备强大的语言适应性,不仅支持普通话,还能完美驾驭多...
10:07
微软近期推出了一款名为 Fara-7B 的创新计算机使用智能助手(CUA),这款拥有70亿参数的模型专为在用户本地设备上高效执行复杂任务而设计。Fara-7B 的独特优势在于其精巧的架构,成功解决了企业在数据安全方面的核心顾虑,使得用户能够安全地自动化处理敏感工作流程,例如管理内部账户或处理公司机密信息,而无需将数据传输至云端。这一突破性进展为数据隐私保护提...
10:07
加州联邦法院近日作出一项具有里程碑意义的裁决,批准了名人视频平台 Cameo 提起的临时限制令(TRO),正式禁止 OpenAI 在其视频生成应用 Sora 及所有宣传材料中使用 "Cameo" 字样。该禁令同时涵盖了 "Kameo"、"CameoVideo" 等近似拼写,旨在防止消费者产生混淆,保护 Cameo 的品牌权益。这一判决不仅涉及商标权争议,更触...
10:07
在人工智能技术的快速演进中,Anthropic公司近日正式发布了其最新一代基础模型——Claude Opus4.5,该模型现已全面登陆亚马逊Bedrock平台。亚马逊Bedrock作为一项先进的完全托管式服务,为用户提供了灵活选择全球顶尖AI公司高性能基础模型的强大能力,极大地推动了AI应用的普及与创新。 Claude Opus4.5的问世标志着AI系统综合...
10:07
在最近一场备受瞩目的行业活动中,OpenAI 首席执行官山姆奥特曼与苹果传奇设计师乔尼艾夫共同揭开了他们联手打造全新AI设备的神秘面纱。这款被寄予厚望的设备颠覆了传统形态,被定义为一款彻底的“无屏幕”便携式智能终端,其核心使命在于为用户构建一个远离数字喧嚣的宁静计算空间。 奥特曼在采访中透露,这款设备的创新理念源于他对现代科技生态的深刻反思。他指出,当前智能...
10:07
谷歌正式宣布与全球知名风险投资公司Accel达成战略合作,双方将联手启动"Atoms"项目,共同发掘并投资印度及印度裔的早期人工智能创业公司。这标志着谷歌人工智能未来基金(AI Future Fund)在全球范围内首次与顶级风投机构开展此类合作,展现了谷歌在人工智能领域的战略布局决心。 此次合作将聚焦于那些从一开始就专注于AI产品研发的创始人团队,两家机构将...
10:07
短视频行业的爆发式增长正让内容创作者面临前所未有的制作压力与竞争挑战。为破解这一困局,前MrBeast短视频内容主管杰伊·尼奥(Jay Neo)携手前Palantir工程师希瓦姆·库马尔(Shivam Kumar)与哈里·琼斯(Harry Jones)共同创立了Palo平台。这一创新平台致力于运用人工智能与深度分析技术,帮助创作者精准洞察有效内容,并智能生成...