Anthropic Claude Opus4.5发布:智能效率新高度

Anthropic 公司隆重推出其最新旗舰模型 Claude Opus4.5,标志着人工智能在生产力领域的又一重大突破。根据官方详细说明,该模型在编码能力、智能代理操作及电脑使用等核心生产力场景中,已达到当前全球顶尖水平,同时在研究、演示文稿制作、电子表格处理等日常任务上展现出卓越的性能提升。

### 核心能力:编码、推理与长期任务管理

Anthropic Claude Opus4.5发布:智能效率新高度插图1

软件工程能力显著增强,Opus4.5在真实世界的软件工程测试中表现卓越。Anthropic 表示,该模型能够在复杂、多系统的 Bug 修复任务中独立推理出修复方案,无需过多人工引导。在 Terminal Bench 测试中,Opus4.5相较于前代 Sonnet4.5,性能提升了约15%。开发者反馈显示,Opus4.5在代码迁移和重构方面表现尤为出色,其推理路径更加复杂高效。此外,该模型支持长达200K tokens的上下文窗口,为处理长期任务提供了强大支持。

### 长期工作与自动化 Agent

Opus4.5引入了“effort参数”,允许开发者根据需求调整模型的计算强度:既可以降低“思考”强度以节省成本,也可以提升质量以追求最佳输出。在多智能体任务中,Anthropic的评估显示,Opus4.5在复杂agent系统中协调子agent的能力显著提升,从而大幅提高任务完成的质量与效率。

Anthropic Claude Opus4.5发布:智能效率新高度插图2

### 常规办公室与生产力工具能力增强

在Claude应用端,长对话不再容易触达上下文极限。模型会自动总结早期内容,确保对话的连续性。Chrome扩展首次全面开放给Max用户,此前仅处于试用阶段。Excel集成功能也得到更新,内部评估显示,Opus4.5在复杂财务建模和自动化任务上的准确率提升约20%,效率提升约15%。在Claude Code桌面版中,用户可并行运行多个会话(如调试、文档编写、测试等Agent任务),并且Plan Mode(规划模式)进一步增强:模型会在正式执行前提出可编辑的计划文件(如plan.md),并向用户澄清问题。

### 性能与效率改善:更强、更省、更灵活

Anthropic Claude Opus4.5发布:智能效率新高度插图3

Opus4.5在多项内部基准测试中表现优异,涵盖编码(SWE-bench)、agent能力(τ²-bench)、推理、数学和视觉等多个维度。在效率方面,新模型显著减少token使用。例如,在某些设置下,通过调节effort参数,Opus4.5可以在保持或超过Sonnet4.5性能的同时,输出token数减少达76%。此外,通过上下文压缩(context compaction)和memory管理提升,它能更稳健地长期运行,适合大型、持续性的agent工作流。

### 安全性:对齐与鲁棒性双重加强

Anthropic表示,Opus4.5是迄今为止对齐性(alignment)最强、最稳健的前沿模型之一。在抵抗恶意提示注入(prompt injection)攻击方面,Opus4.5的防御能力优于此前版本。Anthropic称其比行业内其他前沿模型更难被误导。安全评估覆盖范围广泛,包括主动和被动的风险路径。完整的评估结果与方法被记录在Opus4.5的“system card”中。

Anthropic Claude Opus4.5发布:智能效率新高度插图4

### 定价、可用性与开放平台

价格方面,通过Claude API调用Opus4.5的费用为每百万输入tokens5美元,每百万输出tokens25美元。该模型已在Anthropic自家的应用中上线,并通过API对开发者开放。同时,它可在三大云平台(Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry)使用。使用限制变更:对于拥有Opus访问权限的用户(如Max、Team Premium等),Anthropic已经移除以前对Opus模型的使用“封顶(cap)”限制,并提升了总体使用额度,以便更广泛地应用于日常工作。

### 影响工程师与开发者

Opus4.5在编码、调试、重构、大型多agent协作方面表现出色,可能显著提高软件开发效率,降低人工反复干预。企业与办公自动化:借助Excel、Chrome等工具集成,企业可以更轻松地将AI嵌入日常办公流程,加速分析与自动化。AI代理(Agent)生态:更强的长期推理能力与memory管理,有望推动复杂、长周期agent的落地(如流程自动化、客户服务、研发助理等)。安全可信:Anthropic强调对齐(alignment)和对抗攻击(robustness)的提升,有助于在高责任场景(如企业、关键任务)中增强信任。

Claude Opus4.5是Anthropic在AI能力与安全性方面的重大进展。它不仅在编码和智能代理任务上展现了领先能力,而且通过更高的效率、更灵活的资源使用方式,以及更稳健的对齐机制,为开发者和企业用户提供了更强大的生产力工具。随着其在云平台上的广泛可用性,Opus4.5有望成为推动下一代AI驱动工作流的中坚力量。

最新快讯

2025年11月25日

11:49
声明:本文源自微信公众号 硅星人Pro,作者郭海惟,经站长之家授权转载发布。我曾向Articuler创始人Jason提问:若需用一句话概括贵公司,你会如何表述?他回答道:"职业社交领域的Tinder"。我追问:"(定语中)既无AI,也无Agent?"他坦言:"确实如此。用户根本不在乎平台是否运用了AI或BI。真正优秀的产品,用户感受不到任何技术痕迹。"尽管A...
11:44
18岁便加入MrBeast团队担任内容策略师,被誉为“巴黎法棍”现象级爆款视频背后的操盘手Jay Neo,如今携丰富实战经验,重磅推出AI短视频创作神器Palo。这款专为10万+粉丝量级创作者量身打造的智能工具,以每月250美元的订阅费,已成功斩获Peak XV与NFX等顶级投资机构的380万美元种子轮融资,开启短视频创作智能化新纪元。 Palo的核心功能体...
11:44
OpenAI 近期推出了一项创新购物研究工具,旨在为用户带来前所未有的便捷购物体验。这项功能在假日购物季正式上线,覆盖所有已登录的 ChatGPT 用户,致力于成为用户专属的智能购物顾问。与直接购物平台不同,该工具专注于商品筛选与推荐,通过深度理解用户需求,提供精准的产品匹配服务。 用户只需输入明确的购物需求,例如“寻找一款价格不超过1500美元、续航能力超...
11:44
Google与Accel携手宣布正式启动全球首支"AI Futures × Atoms"合作基金,该基金将专项支持印度及海外印裔创始人,为每个入选项目提供高达200万美元的联合投资,其中Google与Accel各出资100万美元,并额外配套价值35万美元的Google Cloud/Gemini/DeepMind算力与模型积分。这一创新合作旨在发掘并培育下一代...
11:44
ADI公司即将在2026年春季面向全球推出革命性的A2B 2.0技术,这一升级版解决方案基于其成熟的A2B 1.0平台进行深度优化,将带宽性能提升至惊人的4倍,为更先进的车载音频架构提供强大支持。此次发布将覆盖全球范围,重点面向汽车原始设备制造商(OEM)及一级供应商,共同推动汽车音响系统的革新。 此次技术升级的核心目标在于打造更智能化的座舱体验,通过突破传...
11:44
近日,航空工业特种飞行器研究所与浙江空域融合低空产业发展有限公司正式签署了18架AS700“祥云”载人飞艇的采购协议。这一重要合作将于2025年全面落地,标志着双方自2024年11月在中国航展上达成初步合作意向以来,实现了从单一产品购销向全链条战略合作的重大升级。 AS700“祥云”载人飞艇作为一款性能卓越的空中交通工具,主要应用于空中游览、观光旅游等领域。...
11:44
2025年11月25日,创新文档智能处理工具SoMark正式宣布成功完成千万级天使轮融资,由知名投资机构原子创投领投。此次融资不仅为SoMark的发展注入强劲动力,更彰显了市场对其技术实力的高度认可。SoMark的核心技术能够将PDF、PPT、图片等多种格式的文档快速转化为结构化数据,其处理效率令人瞩目,即便是百页文档也能在短短2秒内完成转换,为AI训练和R...
11:44
2025年11月25日,美国国家航空航天局NASA正式宣布,波音公司研发的"星际客机"Starliner-1的下一项任务将推迟至2026年4月执行,并确定此次任务为货运飞行。这一时间调整的决定,源于2024年6月进行的载人测试中出现的推进器故障,该故障导致飞船在任务执行过程中无法完成载人返回环节。 根据NASA与波音公司最新修订的合同条款,原定于2014年签...
11:44
AOC于11月21日震撼发布全新旗舰显示器Q27G4SMN,这款27英寸专业电竞巨作凭借其卓越的技术配置和出色的视觉表现,迅速成为业界焦点。作为一款Fast VA面板与全阵列直下式玻璃基Mini LED背光结合的杰作,Q27G4SMN在HDR显示效果上达到了行业顶尖水准。 该显示器搭载1152个精细控光分区,能够实现1200nits的HDR峰值亮度,同时保持...
11:44
2025年11月25日12时11分,备受瞩目的神舟二十二号飞船将择机在酒泉卫星发射中心启航,执行一项至关重要的太空任务。这艘飞船原本是为神舟二十一号任务预留的应急救援备份船,如今因突发状况将临危受命,接替原定返程座驾的角色。这一调整背后,是神舟二十号返回舱在轨执行任务期间遭遇太空碎片撞击导致轻微损伤的紧急情况。为确保航天员能够安全返回地球,中国航天科技集团迅...
11:44
2025年11月24日,昆山海菲曼科技集团股份有限公司正式宣布,其在北京证券交易所的首次公开募股(IPO)将于11月28日进入审核环节,申港证券担任本次发行的保荐机构。作为国内电声产品领域的知名企业,海菲曼凭借其旗下“HIFIMAN”品牌,在音频设备市场占据重要地位。公司近年来展现出强劲的增长势头,2022年至2025年上半年的营收数据持续攀升,累计营收已达...
11:43
2025年11月25日,深圳市地方金融管理局正式对外宣布一项重要决策——批准财付通小贷完成注册资本的显著增扩。据悉,该公司注册资本将从原有的105.263158亿元大幅提升至150亿元,此次新增资本高达44.736842亿元,增幅接近43%。这一资本结构的优化调整,不仅将极大增强财付通小贷的财务缓冲能力,更将为其在网络小额贷款业务领域注入强劲动力,显著提升服...