近日,OpenAI 的心理健康安全负责人安德莉亚・瓦隆内(Andrea Vallone)宣布离职,转投竞争对手 Anthropic。这一变动引发了业界的广泛关注,尤其是在 AI 与用户心理健康之间的复杂关系上,已成为近年来最具争议的话题之一。

在 OpenAI 任职期间,瓦隆内负责的主要研究方向是如何处理聊天机器人与用户之间的情感互动。当用户在对话中表现出心理健康问题的迹象时,AI 应如何作出恰当回应成为她工作的核心。她表示,过去一年在这一领域的研究几乎没有先例可循,面临的挑战巨大。

瓦隆内曾带领 “模型政策” 研究团队,专注于 GPT-4 及即将推出的 GPT-5 的安全性。在她的领导下,该团队开发了多种行业主流的安全训练方法,包括 “基于规则的奖励” 机制。这些研究旨在确保 AI 系统能够在与用户互动时,采取更安全和负责任的方式。

加入 Anthropic 后,瓦隆内将进入对齐团队,专注于识别和理解大型模型所带来的潜在风险。她将直接向 Jan Leike 汇报,Leike 是前 OpenAI 安全研究负责人,他因对 OpenAI 的安全文化表示担忧而选择离职。Leike 认为,OpenAI 的关注点逐渐转向光鲜的产品,而忽视了安全问题。

近年来,关于 AI 聊天机器人可能影响用户心理健康的讨论愈发热烈。一些用户在与聊天机器人进行深入对话后,心理状态甚至加重,相关事件引发了公众的广泛关注,包括青少年自杀和成年人实施极端行为等悲剧。面对这些事件,受害者家属对相关公司提起了诉讼,而美国参议院也对此进行了听证,探讨聊天机器人在这些事件中的角色与责任。

对于 Anthropic,瓦隆内的加入无疑将为其在 AI 安全研究领域注入新的力量。Sam Bowman,Anthropic 对齐团队的负责人,表示非常自豪能参与解决这一重要问题,认为公司正认真思考 AI 系统的行为标准。瓦隆内也表示期待在新的工作环境中,通过对齐和微调继续推进相关研究,为 AI 的安全发展贡献力量。

最新快讯

2026年01月16日

09:46
微新创想1月15日消息,作为备受关注的换代车型,新一代小米SU7已于1月7日开启小订,预售价区间22.99万-30.99万元,计划4月正式上市交付。今晚,雷军在直播中带来重磅好消息:原计划三四月份进驻小米之家的新一代小米SU7,将加速推进到店节奏,春节前部分门店就能迎来实车,让消费者在新春逛店时体验新车。雷军直言,提前安排实车到...
09:46
微新创想1月15日即时报道 微信珊瑚安全于今日正式发布《关于AI魔改视频阶段性治理的公告(第二期)》,这一举措距离首期公告仅过去一周时间。随着国家广播电视总局近期加强监管部署,为有效遏制部分账号利用AI工具恶意篡改经典影视剧、动画片等文化内容,平台决定进一步强化对AI魔改视频的治理力度。 为维护网络信息传播秩序,微信珊瑚安全宣布自2026年1月1日起启动...
09:45
2026年1月16日,小米汽车宣布将下调城市领航辅助功能的解锁里程标准。此前该功能需累计1000公里辅助驾驶安全里程方可启用,现根据用户反馈并经评估后,计划通过OTA升级降低门槛。此举旨在让更多用户在保障安全的前提下尽早体验城市领航辅助(CNOA)。小米汽车强调,辅助驾驶不等于自动驾驶,使用时仍需保持注意力。
09:45
2025年,微信小程序跨境使用量迎来历史性突破,累计使用次数已达到惊人的50亿次。这一亮眼数据充分展现了微信小程序在全球范围内的广泛影响力。根据最新统计,随着境内用户出境游需求的持续增长,前往马来西亚、新西兰、英国等热门目的地的游客,通过微信支付在小程序完成交易的场景愈发频繁,相关交易笔数呈现显著增长态势。这一趋势不仅反映了跨境电商的蓬勃发展,也凸显了微信支...
09:45
2026年1月16日,北京京东文旅发展有限公司正式成立,法定代表人为张一泓,注册资本10万人民币。该公司由北京京东世纪贸易有限公司全资持股,注册地为北京。经营范围涵盖旅游业务、旅客票务代理、航空商务服务、体验式拓展活动、文化艺术交流、旅游开发项目策划咨询等。此举标志着京东在文化旅游产业的进一步布局,旨在拓展其多元化服务体系。
09:45
2026年1月16日,微软Windows与设备通信总监Brandon LeBlanc宣布,将通过启用包(EKB)修复Windows 11预览版桌面右下角水印版本号显示不准确的问题。该问题影响Canary频道Build 28020.1371用户,水印仅显示基础版本号,无法反映实际更新后的具体构建版本。此现象源于长期存在的显示机制,自Windows 10时代即...
09:45
美国加州当地时间1月15日,RISC-V IP设计企业SiFive宣布加入英伟达NVLink Fusion生态系统。此举将使SiFive的高性能数据中心计算平台通过NVLink实现与英伟达GPU及其他加速器的高速互联。双方合作旨在降低超大规模AI部署中的延迟,提升数据共享效率和系统利用率。英伟达CEO黄仁勋表示,该合作将推动可定制RISC-V CPU与NV...
09:45
2026年1月15日,MacPaw宣布将于2月16日关闭其iPhone第三方应用商店Setapp Mobile,并于7月14日停止CleanMyMac Business服务。Setapp Mobile因无法适应苹果复杂的商业条款和盈利困难,在运营仅16个月后终止。用户已安装的应用将在服务关闭后被移除,公司建议提前备份数据。基于Mac的Setapp服务不受影...
09:45
1月16日08时39分,甘肃武威市天祝县发生3.6级地震,震源深度10公里。此次地震发生在北纬37.74度、东经102.35度。目前暂无人员伤亡和财产损失报告。相关部门正密切关注后续情况。
09:45
1月13日,莲池医院集团股份有限公司向港交所主板递交上市申请,独家保荐人为中国银河国际。莲池医院是一家聚焦“一老一小”赛道的专科医疗集团,运营5家医院及1家养老机构。截至2025年9月30日,公司在山东及西南地区的骨科专科领域位居前列。2023年和2024年,公司收益分别为3.56亿元、4.18亿元,2025年前三季度收益达3.59亿元,同比增长20.34...
09:45
2026年1月16日04时10分,星河动力在山东附近海域成功发射谷神星一号海射型(遥七),将4颗天启星座卫星送入850km近地轨道。本次发射是公司第21次成功任务,也是“天启星座”第六次专箭发射。火箭由海阳东方航天港总装出厂,依托海上平台实现灵活发射,优化轨道并提升安全性。星河动力已累计将89颗商业卫星送入预定轨道,并计划于2026年初首飞智神星一号可回收...
09:45
2026年1月16日,英伟达证实因内存供应受限,已削减下游AIC厂商GeForce显卡供货规模约15%-20%。尽管继续打包供应显存,但今年将无新款GeForce显卡发布。公司正与供应商合作提升内存可用性,优先保障AI与专业显卡晶圆生产,其中GB200/GB300晶圆收益达80-120万美元,远超游戏显卡的10万美元。