麻省理工新创公司OpenAGI推出AI代理Lux超越OpenAI与Anthropic

麻省理工学院旗下初创公司 OpenAGI 近期震撼登场,正式推出其革命性 AI 模型 Lux,在计算机操作领域实现重大突破。该模型不仅性能远超 OpenAI 和 Anthropic 的同类产品,更以惊人的成本优势仅为其十分之一,引发业界广泛关注。OpenAGI 首席执行官秦增义博士强调,Lux 是一款专为自动化桌面应用设计的基础模型,能够通过智能解析计算机截图,实现复杂应用操作的自主执行。

在最新发布的 Online-Mind2Web 基准测试中,Lux 以 83.6% 的卓越成功率遥遥领先,大幅甩开竞争对手。OpenAI 的 Operator 仅为 61.3%,而 Anthropic 的 Claude Computer Use 则跌至 56.3%。如此显著的性能差距不仅彰显了 Lux 的技术实力,更预示着 AI 代理领域的全新格局。与传统大型语言模型不同,Lux 创新性地采用 “Agent 主动预训练” 方法,专注于从计算机视觉和动作序列中提取关键信息,通过自我强化训练循环实现能力持续进化,大幅提升操作效率。

成本与性能的双重优势同样令人瞩目。OpenAGI 声称,Lux 的运营成本约为 OpenAI 和 Anthropic 前沿模型的十分之一,同时响应速度更快。更值得一提的是,Lux 并非局限于浏览器任务,而是能够全面掌控各类桌面应用程序,包括 Excel、Slack 等专业工具,极大地拓宽了 AI 代理的应用场景和市场潜力。为加速生态建设,OpenAGI 还发布了开发者 SDK,为第三方开发者提供基于 Lux 的应用开发平台。

在安全防护方面,OpenAGI 为 Lux 设计了多重内置安全机制。当模型检测到可能违反安全政策的请求时,会自动拒绝执行并向用户发出明确警告,这一特性在当前 AI 代理快速发展的背景下显得尤为关键。值得注意的是,秦增义博士拥有深厚的技术背景,曾深度参与多个知名 AI 模型的研发工作,其技术实力充分证明小型团队在 AI 领域同样能够实现突破与创新。

划重点:- 🚀 OpenAGI 推出的 Lux AI 代理在计算机操作基准测试中获得 83.6% 的成功率,远超 OpenAI 和 Anthropic。- 💡 Lux 采用独特的学习方式,通过计算机截图和动作序列进行训练,具有自我强化的能力。- 🔒 安全机制内置于 Lux 中,能够识别和拒绝潜在的危险请求,保障用户数据安全。

最新快讯

2025年12月02日

16:45
理想汽车与光学巨头蔡司正式达成战略合作,双方将携手开启全球范围内的技术共享与市场拓展新篇章。这一跨界合作标志着汽车行业与高端光学技术的深度融合,为消费者带来前所未有的智能穿戴体验。根据理想汽车官方发布的合作预告片,备受期待的AI眼镜产品Livis将率先采用蔡司定制镜头,这不仅提升了产品的光学性能,更彰显了双方在科技创新领域的雄心。 作为理想汽车首款智能穿戴设...
16:45
微新创想12月2日重磅消息,知名数码博主数码闲聊站通过独家爆料,透露了荣耀品牌一项颠覆性的电池技术突破。据博主透露,荣耀已成功试产出一块单电芯超大电池,其额定容量高达10000mAh,而典型值更是达到了令人惊叹的11000-12000mAh区间。这一创新成果意味着荣耀将成为全球首家实现万级电池量产的手机厂商,并且计划推出多款搭载该技术的旗舰机型。 据悉,荣耀...
16:45
微新创想12月2日讯 罗永浩近日通过微博分享了他的心路历程,透露出当年虽不情愿离开手机行业,却无法违逆消费者对更优质产品的期待。这一番话勾起了人们对这位科技界传奇人物的回忆。 罗永浩于2012年创立锤子科技,怀揣着改变手机行业的梦想。他曾放出豪言壮语:"我会努力把锤子做好,将来收购不可避免走向衰落的苹果,这是我余生义不容辞的责任"。这份自信让锤子科技一度被戏...
16:45
Chatbase创始人Yasser在X平台正式宣布其AI客服平台的惊人成就:年经常性收入(ARR)已突破800万美元,这一辉煌成绩完全依靠自筹资金实现,未向任何风险投资机构寻求分文。根据当前月续费率测算,Chatbase每30分钟即可新增约1.5万美元的订阅收入,全球付费企业客户数量已超过1万家,展现出强大的市场吸引力。 从副业到现金奶牛的蜕变之路-2021...
16:45
谷歌近日正式宣布,其尖端生成式人工智能模型Gemini3已在全球范围内实现大规模部署。自该模型首次亮相以来,谷歌仅用数周时间便迅速推进其全球推广计划,面向全球用户开放这一强大的AI搜索功能。此次扩展范围广泛,覆盖了包括美洲、亚太、欧洲、中东和非洲在内的120个国家和地区。只要身处支持区域,用户即可通过Google搜索体验Gemini3Pro的卓越性能。 最初...
16:38
2025年12月2日,江西省正式发布《江西省加快脑机接口技术和产业发展若干措施》,标志着该省在脑机接口领域迈出关键步伐。这一政策文件不仅为技术创新提供了政策保障,更明确了产业发展的具体方向,预计将推动江西在该前沿科技领域占据重要地位。 文件重点强调了对医疗机构的支持,明确鼓励建立脑机接口临床研究病房和队列,以加速该技术在医疗领域的实际应用。特别是在神经与精神...
16:38
2025年11月26日,索尼正式发布了备受期待的Alpha 7 IV(ILCE-7M4)相机的最新固件版本——Ver.6.00。然而,这一更新并未如预期般顺利,部分用户反馈升级后遭遇设备无法正常操作的问题,其中反复重启现象尤为突出。面对这一突发状况,索尼官方迅速响应,立即暂停了该版本固件的公开下载,并全面启动故障原因调查工作,力求尽快找到问题根源并制定解决方...
16:38
2025年12月2日,中国国际航空正式完成工商变更手续,标志着公司治理结构迎来重要调整。刘铁祥先生正式接任法定代表人及董事长职务,全面负责公司战略发展与日常运营;与此同时,原高管马崇贤先生卸任相关职务,开启人生新篇章。此次领导层更迭是公司优化管理架构、激发组织活力的关键举措,彰显了国航在新时代背景下的战略布局与人才战略。 此次工商变更中,公司注册资本实现显著...
16:38
12月2日,卓易信息通过官方互动平台正式宣布,其全资子公司南京百敖软件有限公司成功斩获英特尔官方授权,成为中国大陆地区唯一一家获得该资质的独立BIOS供应商。这一重要里程碑不仅彰显了百敖软件在BIOS技术领域的卓越实力,更意味着其已全面具备国际化的合规标准与技术能力,未来将为国内计算机硬件产业提供安全可靠的固件支持解决方案。 BIOS作为计算机系统的核心...
16:38
2025年12月2日,中国领先的医疗器械企业三友医疗(股票代码:688085.SH)正式宣布与韩国顶尖生物材料研发生产商细基生物株式会社达成战略合作,双方签署了《战略合作和经销协议》。根据协议条款,细基生物授予三友医疗在中国大陆地区独家经销其核心产品Novosis的授权,授权期限自产品获得中国国家药品监督管理局注册证之日起长达六年。这一合作标志着三友医疗在骨...
16:38
2025年12月2日,卡西欧计算机株式会社以一场盛大的新品发布会,向全球用户揭晓了精心打造的25款全新计算器系列。这一重要发布恰逢卡西欧台式电子计算器业务成立六十周年纪念,标志着品牌在持续创新中迈出的崭新步伐。此次推出的系列产品不仅延续了卡西欧一贯的精准可靠,更在视觉设计上大胆突破,采用丰富多彩的色彩搭配和前沿潮流的外观造型,充分彰显了品牌对个性化需求的深刻...
16:38
根据Kantar最新发布的《2025年媒体反馈报告》,亚太地区营销领域正迎来一场深刻的变革。报告显示,超过半数的营销从业者计划在2026年显著提升对在线视频、电子商务及网红内容的广告投入。这一趋势不仅反映了营销策略的调整,更揭示了消费者与品牌之间媒介互动模式的根本性转变。 这份年度研究深入剖析了亚太地区消费者与营销者的媒体偏好变化,其中最引人注目的发现是Ne...