微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年01月18日

15:00
2026年1月18日,曹操出行试点上线遗留物品自动报失功能。该功能依托定制车型与视觉大模型,可智能识别乘客遗留在车内的手机、电脑、背包等高价值物品,并在乘客下车后自动触发提醒。目前功能已覆盖全国超1300辆定制车辆。上线10天内,已成功识别并处理十余起手机遗失事件,有效帮助乘客挽回损失。此举提升了遗失物处理效率,优化了出行服务体验。
15:00
2026年1月18日,广东拓威天海科技股份有限公司正式宣布成功完成近亿元人民币C轮融资。此次投资由浙商创投与空天基金联合参投,为这家专注于全球中大件门到门AI物流服务的创新企业注入强劲动力。据悉,所获资金将全面用于两大核心领域——一是加速推进"拓威天海云™"数智履约平台的建设,二是加大在大件海外仓的布局投入。作为全球领先的中大件智能物流解决方案提供商,拓威天...
15:00
2026年1月16日,海外博主RandomGamingInHD发布视频,使用i7-4790K、32GB DDR3内存与RTX 2060 Super组合测试多款现代3A游戏。尽管仅花费40美元购得内存,但在《博德之门3》《赛博朋克2077》等游戏中,平均帧率接近60帧,部分游戏超100帧。然而,i7-4790K成为显卡性能释放的瓶颈,1% Low帧表现不佳,...
14:32
真我手机于1月18日发布重要消息,宣布旗下旗舰新机真我Neo8将于1月22日正式亮相。为预热新机发布,真我手机今日率先公布了真我Neo8的多项外围配置细节,并强调该机型将提供全方位的旗舰级体验,无任何短板。 真我Neo8在防护性能方面表现出色,支持IP66、IP68、IP69三重防护标准,达到行业顶级的防尘防水级别。这意味着用户无需担心日常使用中的雨水、...
14:32
微新创想1月18日消息,近日,小米中国区智能硬件市场负责人分享,小米运动健康App目前已接入了蚂蚁阿福。在睡眠、心率界面都可以直接点击让阿福分析数据,并支持通过AI给一些初步的健康建议。上个月,蚂蚁集团AQ品牌升级为蚂蚁阿福”后,还升级健康陪伴、健康问答、健康服务三大功能。其中,新增加的健康陪伴的功能板块,用户可以通过首页的健康...
14:32
红魔游戏手机于1月18日发布全新力作——红魔11 Air,这款机型将重新定义游戏手机的续航与散热标准。作为Air系列的最新旗舰,红魔11 Air首次搭载了7000mAh超大容量电池,刷新了Air系列历史纪录,为玩家带来前所未有的持久游戏体验。更令人惊喜的是,该机还支持120W快充技术,并创新性地采用旁路充电设计,通过绕过电池直接为主板供电,不仅实现了极速充电...
14:32
1月18日消息,据外媒报道,OpenAI日前宣布,未来几周内,计划在美国的免费层级和 Go 订阅层级中测试广告投放。但Plus、Pro、Business 和 Enterprise 订阅将不包含广告。此前,有很多外媒报道OpenAI考虑在ChatGPT中加入广告。OpenAI CEO阿尔特曼去年也曾报道,我觉得要让广告做得恰到好处...
14:29
2026年1月18日,阿布扎比——萝卜快跑与AutoGo宣布在阿联酋首都阿布扎比联合推出全无人驾驶出行服务。即日起,公众可通过AutoGo App在亚斯岛呼叫无人驾驶车辆,服务范围将逐步扩展至全市。这是萝卜快跑首次在海外落地面向公众的全无人驾驶商业化运营。此次合作旨在推动中东地区智能出行发展,提升城市交通效率与体验。车辆已通过本地化测试与安全验证,确保符合...
14:29
2026年1月17日,美国航天局NASA将执行"阿耳忒弥斯2号"任务的"猎户座"飞船与"太空发射系统"火箭顺利运抵佛罗里达州肯尼迪航天中心的发射台,正式标志着这一历史性任务进入了至关重要的准备阶段。作为人类航天史上的重要里程碑,此次任务将首次实现载人绕月飞行,计划搭载4名宇航员执行任务,预计最早将于2月6日择机发射。为确保任务万无一失,NASA将在发射前进行...
13:57
2026年铁路春运将于2月2日启动,3月13日结束,首日车票于1月19日开售。预计春运期间全国铁路将发送旅客5.39亿人次,同比增长5.0%。节前高峰日为2月13日,节后为2月23日。部分热门时段和线路客流集中,铁路部门将依托12306大数据动态调整票额。旅客可使用12306候补购票功能,最多选择60个“日期+车次”组合提升成功率。铁路部门提醒,12306...
13:27
2026年1月18日,理想汽车正式发布了备受瞩目的《理想辅助驾驶2025年出行报告》,全面展现了其智能驾驶技术在过去一年的发展成果与用户应用情况。报告数据显示,理想辅助驾驶系统累计用户规模已突破150.5万人,累计行驶里程高达60亿公里,充分印证了该技术的广泛普及与用户高度认可。 在2025年全年表现方面,理想辅助驾驶系统展现出惊人的活跃度与稳定性。全年辅助...
13:27
2026年1月19日起,琼州海峡将开售春运往返船票。据海南省交通运输厅消息,此次春运是海南全岛封关后的首个春运,预计客运量同比增长超12%。为保障过海秩序,所有旅客和车辆须提前通过线上平台购票,方可通行。此举旨在提升运输效率,应对客流增长压力。