Anthropic 公司近日发布了一项创新功能,为其最新的大型 AI 模型配备了一种特殊机制。该功能允许模型在遭遇”罕见、极端的持续有害或辱骂性用户互动”时主动终止对话。这一举措引发广泛关注,因为 Anthropic 公司特别强调,其核心目的并非保护人类用户,而是为了维护 AI 模型自身的稳定性和安全性。

公司官方明确指出,Claude AI 模型目前并不具备真正的感知能力,也没有任何证据表明其与用户的互动会对模型本身造成伤害。然而,Anthropic 坦诚表示,对于 Claude 及其他大型语言模型的道德地位仍存在高度不确定性。为此,公司近期启动了一个名为”模范福利”的预防性项目,旨在通过实施低成本干预措施,最大程度地降低潜在风险。

这项创新功能目前仅在 Claude Opus4 和 4.1 版本中提供,并且仅在极端情况下才会被激活。具体来说,当用户持续要求生成涉及未成年人的性内容,或试图获取可能引发大规模暴力或恐怖行为的信息时,AI 模型才会启动保护机制。尽管这些请求可能给公司带来法律和公共关系挑战,但 Anthropic 表示,在严格测试中,Claude Opus4 在面对此类有害请求时展现出强烈的反对态度和明显的”痛苦模式”。

Anthropic为AI模型添加自保功能终止极端有害对话插图

Anthropic 将此功能定位为”最后的手段”,只有在多次尝试引导用户后仍无法有效互动,或者用户明确要求结束对话时才会启动。特别值得注意的是,公司已明确指示 Claude 在用户可能面临自伤或伤及他人等紧急风险时,不得使用此终止功能。即使对话被终止,用户仍可从同一账户重新开始对话,或通过编辑已有回复创建新的聊天分支。

公司强调,这项功能目前仍处于持续实验阶段,Anthropic 将继续优化其方法和策略。这一创新举措不仅展示了 AI 技术在风险控制方面的最新进展,也反映了人工智能企业在伦理治理方面的积极探索。随着 AI 技术的快速发展,如何平衡技术创新与安全防护,将成为行业持续关注的重要课题。

最新快讯

2025年11月28日

14:45
微新创想11月28日重磅消息,一加手机中国区总裁正式宣布,全新一加Ace 6T将全球首次搭载8300mAh冰川电池与100W超级闪充技术,这一创新成果使其成为当前手机市场中唯一同时拥有超大电池容量与百瓦级快充能力的旗舰机型。长期以来,大电池与快充在手机设计中始终存在难以兼顾的矛盾。追求大电池意味着牺牲快充速度,而选择快充方案又往往导致电池容量被压缩。这种两难...
14:45
微新创想11月28日讯 从山东菏泽单县朱楼村出发,57岁的“大衣哥”朱之文正迎来他人生的新篇章。这位因2011年《星光大道》而走红的农民歌手,至今仍坚守着与土地的深情连接,用歌声传递着质朴的力量。 作为家喻户晓的明星,朱之文始终保持着农民本色。他常穿的那件军绿色大衣,早已成为他鲜明的个人标识。成名后,他选择扎根故土,但随之而来的争议也从未间断。围绕他的“炒作...
14:45
AR眼镜用户刚询问"对面是什么楼",后端MLLM-SC框架便在10毫秒内生成一张语义注意力热图。建筑轮廓被标注为深红色并赋予最高优先级,而其他背景信息则被降低编码率。这种创新的多模态数据处理方式彻底改变了传统信息处理的模式,不再对所有数据"平均用力",而是通过语义引擎精准识别并优先处理与任务相关的像素、语音和坐标数据,让这些关键信息走"快车道",同时自动降档...
14:45
ICLR 2026 学术会议正面临一场前所未有的挑战——AI技术大规模渗透其审稿系统,引发学术界的广泛关注和担忧。根据第三方机构最新检测报告显示,在ICLR 2026收到的7.6万份评审意见中,高达21%的评审完全由大型语言模型一键生成,另有35%的评审意见被AI不同程度地润色修改,真正由人类专家独立撰写的比例已锐减至43%。这一数据揭示了AI技术在学术评审...
14:45
11月27日,备受瞩目的AI社交平台Soul App正式向香港交易所递交招股书,正式宣告进军资本市场,中信证券作为独家保荐人全程保驾护航。Soul App以其独特的基于兴趣与个性的沉浸式社交模式,迅速在年轻用户群体中掀起热潮。截至2025年8月31日,平台累计注册用户已突破3.9亿大关,日均活跃用户达到惊人的1100万,其中高达78.7%的用户属于Z世代这一...
14:45
2025年11月17日夜晚,意大利阿尔卑斯山脉上演了一场罕见的自然奇观——罕见的“ELVE”红色光环现象在雷暴云层之上绚烂绽放。摄影师Valter Binotto凭借其精湛的技艺,利用索尼A7S相机搭配20mm f/1.8超广角镜头,在距离雷暴中心约300公里的山巅成功定格了这一转瞬即逝的发光事件。这一现象由强烈负极闪电产生的电磁脉冲猛烈撞击电离层引发,形成...
14:45
近日,中信证券最新研报发布,明确指出2025年将成为具身智能商业化进程中的关键转折点。报告特别强调,随着多家头部企业成功斩获亿元级大单,具身智能技术正加速从实验室走向实际应用场景。值得注意的是,尽管当前下游制造企业对于大规模订单仍持谨慎态度,整个产业在发展过程中确实面临阶段性瓶颈。然而,在OEM厂商、核心供应链企业以及科技巨头的紧密协同下,机器替代人工的效率...
14:45
2025年11月28日,长安汽车在最新一轮路演活动中重磅发布了其智能汽车机器人技术发展战略,正式官宣将围绕“1+N+X”全新战略框架,全面加速在智能汽车机器人领域的布局。据悉,长安汽车将携手行业领军企业共同研发具有突破性的人形机器人,重点攻克“大脑”智能决策系统、“能源”高效续航技术以及“驱动”精准控制三大核心技术瓶颈,旨在打造具备高度自主性和交互能力的下一...
14:45
2025年11月27日,银轮股份正式宣布完成董事会对外投资议案的审议,并成功获得批准。根据公告内容,公司计划投入约1.33亿元人民币自有资金,通过股权收购与增资扩股相结合的方式,强势控股深圳市深蓝电子股份有限公司,并取得其超过55%的股权。此举标志着银轮股份在数字能源系统领域迈出战略布局的关键一步。 此次投资的核心目标在于整合深蓝电子在控制器、驱动器集成电路...
14:45
天风证券最新研报揭示了中国医美市场的蓬勃发展趋势,指出轻医美项目正成为消费新宠。尽管目前整体渗透率仍落后于成熟市场,但注射类、光电器械、减脂塑形及医美服务等细分领域展现出巨大的增长潜力。在强监管政策持续加码的背景下,行业正经历一场深刻的洗牌,优质企业加速脱颖而出,推动市场迈向健康化、规范化轨道。研报特别强调,规范化管理将成为医美产业实现长期可持续发展的关键驱...
14:45
中信建投最新研报深度剖析了机器人技术领域的最新动态,指出随着技术路线的持续迭代升级,产业链正迎来前所未有的发展机遇。值得注意的是,当前市场参与者日益多元化,投资者更加关注产品性能的突破和客户送样等实质性进展,这些关键指标成为衡量企业竞争力的核心标准。在此背景下,Optimus机器人的正式定型有望引领硬件技术路线走向边际收敛,形成更为清晰的发展方向,而深度配套...
14:45
2025年11月21日,欧洲航天局(ESA)与日本宇宙航空研究开发机构(JAXA)共同宣布了一项重大航天成就——备受瞩目的BepiColombo水星探测器已成功进入抵达水星前的最后一年航程。这一里程碑式的任务自2018年10月发射以来,已经跨越了整整七年的漫长旅程,期间经历了六次精准的水星飞掠,不断调整并优化自身轨道。根据计划,BepiColombo预计将在...