微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年01月14日

12:17
在由中国科学院等权威机构联合发布的《 2025 中国AI智能体百强》榜单中,来自上海静安区的科技企业迈富时强势崛起,凭借其AI-Agentforce智能体中台3. 0 及全场景落地成果,高居榜单第四位,与字节跳动等互联网巨头并列,成为榜单中罕见的非平台型技术企业代表。这一突破性成绩的背后,是迈富时对AI智能体“落地难”这一行业痛点的精准破解。其AI-Agen...
12:17
近日,美国密苏里州圣路易斯市上演了一场“全城找猴”的闹剧。几只长尾黑颚猴在城市北部的一处公园附近意外出逃,然而比猴子踪迹更难捉摸的,是社交媒体上泛滥的AI生成图像。这些极具误导性的合成内容正严重干扰当地官方的搜寻工作。自上周四猴子首次现踪以来,当地社交平台便被各种流言与伪造图片“淹没”。不少网民为了博取关注,利用 AI 技术合成自己“捕获”猴子的虚假画面并发...
12:17
近日,唐钢正式推出一体化生产排程大模型,通过深度融合历史生产数据与智能优化算法,实现从订单接收到成品交付的全流程智能调度。该系统可实时分析产线状态、物料库存与设备负荷,动态生成最优生产路径,整体生产效率提升20%,同时显著降低库存水平、提高订单准时交付率。更关键的是,这一模型正向“绿色智造”演进。唐钢计划将能耗、碳排放、资源循环利用率等节能环保指标纳入排程优...
11:49
声明:本文来自于微信公众号 见实,作者:阿爽,授权站长之家转载发布。AI正在从“工具”,变成“员工”。不是辅助型员工,而是直接参与用户服务、影响成交结果的一线员工——这是朱雀AI在过去一年中反复验证过的结论。2025年,朱雀AI陪跑和服务了上百家企业,从私域客服、内容生产到设计与商品企划,为企业搭建了400多个智能体。在这些场景...
11:49
声明:本文来自于微信公众号 TopKlout克劳锐,作者:小羊,授权站长之家转载发布。零下二三十度的东北院子里,一个个晶莹剔透的大冰缸整齐排列,里面放着大葱、冻梨、粘豆包,甚至还有人在冰缸里装上灯带,打造出梦幻的“庭院水晶灯”。这个冬天,东北大冰缸登上抖音热榜,火遍全网。南方网友隔着屏幕“求代购”“求教程”,北方年轻人纷纷回老家...
11:48
2026年1月13日,雪佛兰确认科尔维特ZR1X成为当前加速最强的美国量产车。官方测试显示,该车在400米直线加速中跑出8.675秒,静止至96km/h仅需1.68秒,加速度峰值达1.75G。其搭载5.5L双涡轮V8发动机与前轴电机,综合输出1250马力,配备四驱系统及米其林Pilot Sport 4S轮胎。多次测试成绩均稳定在8.8秒内。通用汽车总裁称,...
11:48
2026年1月14日,阿斯利康宣布收购源自哈佛医学院和麻省总医院的生物医学人工智能公司Modella AI。该公司最初专注于病理学领域,致力于开发整合多模态生物标志物数据的人工智能模型,以提升疾病诊断、预后判断与治疗决策。此次收购将扩大双方已有合作,推动多模态AI基础模型及AI代理在阿斯利康全球肿瘤研发管线中的应用,加速人工智能在癌症诊疗中的创新落地。
11:48
2026年1月14日,金融基础设施平台VelaFi宣布完成2000万美元B轮融资。本轮融资由XVC和Ikuyo领投,Alibaba Investment、Planetree等跟投,老股东BAI资本继续加码,倚天资本担任独家财务顾问。截至目前,VelaFi总融资额超4000万美元。资金将用于扩展其全球支付网络,强化多币种、外汇及跨境支付能力。VelaFi为数...
11:48
韩国Novachips公司12日推出两款CFexpress 4.0 Type B存储卡,均支持2700MB/s读写速度。EXTREME CX4B系列采用pSLC+大OP设计,获VPG 400认证,提供600GB和1TB容量;EXPRESS CX4B基于高质量TLC NAND,容量达2TB与4TB。新品通过CFA协会VPG 800认证,满足高性能影像录制需求...
11:48
2026年1月13日,佳明发布旗舰级航海智能手表quatix 8 Pro,将于1月16日上市,售价1299.99美元(约合9085元人民币)。该手表集成inReach卫星技术与LTE网络,支持离岸80.5公里内的短信、通话及天气查询,并具备SOS紧急救援功能,可直连Garmin Response中心。其配备47mm钛金属表圈、蓝宝石镜面和1.4英寸AMOL...
11:48
2026年1月13日,在CES 2026展会期间,宜家发布新款Kallsup便携式蓝牙音箱,计划于2026年4月上市,售价10美元(约69.9元人民币)。该音箱采用70×70×70毫米立方体设计,提供亮粉色、亮绿色和白色三种配色,机身配备USB-C充电接口与蓝牙5.3技术。其支持“广播模式”,最多可无线连接100台设备以扩展声场。内置电池在50%音量下可持...
11:48
龙旗科技近日获得4.40亿港元基石投资。该投资由高通、江西国控、豪威、裕同科技、观澜投资和Endless Growth共同出资完成。龙旗科技是一家专注于智能产品研发设计、生产制造及综合服务的ODM企业,此次融资将用于加强其在智能产品领域的研发与制造能力,进一步拓展全球市场。