微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年02月05日

02:43
2026年2月5日,Stellantis公司因电池工厂产能不足,导致旗下标致品牌纯电动车型交付延迟。涉及车型包括标致3008和5008,交付周期最长延后八个月。事件发生于欧洲及全球市场,影响客户订单履约。公司正协调供应商并优化电池供应链以缓解延误。此次延迟凸显电动化转型中动力电池供给的关键瓶颈。
02:43
2026年2月5日,SpaceX在加州总部与多家非美国银行举行会晤,推进首次公开募股(IPO)筹备工作。公司计划于2026年内上市,1月中旬已组织欧洲及其他地区银行竞标IPO初级承销角色。此举发生在SpaceX宣布收购xAI之前,旨在拓宽国际资本市场合作渠道。马斯克旗下这家火箭与卫星制造商正加速资本化步伐,但尚未公布具体上市时间、估值或募资规模。
01:43
2026年2月5日,美国芯片制造商Cerebras Systems宣布完成H轮融资,成功募集10亿美元资金,公司估值达约230亿美元。本轮融资由多家全球知名投资机构领投,资金将主要用于加速AI大模型专用芯片的研发、扩大制造产能及拓展全球企业客户合作。该公司总部位于加州森尼韦尔,长期专注于开发超大规模晶圆级AI计算系统。此次融资标志着其在高性能AI硬件赛道的...
00:43
2026年2月5日,昌平实验室刘河生教授团队在《自然》发表研究,首次阐明帕金森病关键机制——‘躯体认知网络’与深部脑核团的病态增强连接。研究基于800余例人脑影像数据,解释了深部脑刺激及药物疗效原理,并研发出无创精准脑环路刺激系统。临床显示,新靶点干预两周有效率达55.5%,显著高于传统方案(22.2%)。该设备已获国家医疗器械注册许可。成果由昌平实验室联...
00:11
2026年2月4日,深圳水贝黄金市场出现金条、银条现货紧缺现象。受金价银价近期显著回调及春节消费旺季双重影响,下游零售端需求激增,但上游商户因前期高价囤货、当前惜售而选择“捂货待涨”,导致货源紧张。记者实地走访发现,多数档口已无常规规格金条、银条现货,零售金饰销售同样火爆,消费者排队选购。业内分析认为,短期金价或维持高波动震荡,但中长期上行逻辑未变。
00:11
2026年2月4日,瑞士银行(瑞银)宣布将美国超威半导体公司(AMD)股票目标价由330美元下调至310美元。此次调整发生于美国纽约,由瑞银全球研究部发布,主要基于对AI芯片市场竞争加剧及短期数据中心业务增长放缓的评估。下调反映机构对AMD未来12个月盈利预期的审慎修正,但维持“买入”评级。分析指出,调整不改变其长期技术竞争力判断,但强调需关注客户订单能见...
00:11
2026年2月4日,美国科技巨头亚马逊宣布将应用人工智能技术优化影视内容制作流程。此举旨在缩短剧本开发、视觉特效、剪辑及配音等环节周期,提升内容产出效率。项目由亚马逊影业与AWS人工智能团队联合推进,初期聚焦内部原创剧集与电影,暂不涉及AI生成最终播出内容。公司强调AI仅作为辅助工具,创意决策权仍归属人类创作者。该计划是流媒体平台应对内容竞争与成本压力的重...

2026年02月04日

23:41
2026年1月,realme官方确认将回归OPPO旗下;2月3日外媒报道称,realme印度已启动成本削减计划,首批裁撤销售执行人员及管理人员,多地员工收到4月30日为最后工作日的通知。德里员工证实OPPO已开始接管相关业务。此前,realme于2018年从OPPO独立,时隔八年再度整合。国内方面,realme Neo8发布会宣布,自2026年4月起,真我...
23:41
2026年2月4日,亚克系统(Arc System Works)在台北电玩展宣布推出《热血西游记:天竺奇谭》,为《国夫君》系列40周年纪念作。游戏由旗下UnitePlus团队开发,改编自中国古典名著《西游记》,采用热血系列标志性横版动作玩法。玩家将操控师徒四人(均由国夫一人分饰),踏上十万八千里西行之路。本作预定2026年登陆PC(Steam)、PS5及S...
23:41
2026年2月4日,追觅科技在《敢梦敢为·追觅之夜》演唱会上首次公开三款汽车SUV车型——星际T08、T08L和D09,品牌名为STAR MOTOR 星际穿越。T08定位全域硬派SUV,T08L为全地形硬派SUV,D09为六座奢华旗舰SUV。新车将搭载超级底盘技术、双向24度后轮转向、智能四擎独立驱动及全球首创自进化能量回收系统。发布会于北京举行,由撒贝宁...
23:41
2026年2月4日,重庆市经信委与财政局联合发布《重庆市促进实数融合推动“人工智能+制造”若干政策》。该政策面向工业企业及第三方机构,对研发工业领域垂类大模型、智能体并开展应用推广的主体,给予最高200万元奖励。政策覆盖数据集建设、可信数据空间构建、典型案例入选、创新载体建设等方向,单项最高奖补达500万元。此举旨在加速人工智能技术在制造业场景落地,强化本...
23:38
微新创想2月4日消息,《福布斯》实时富豪榜显示,埃隆`马斯克个人净资产达到8520亿美元(约合5.92万亿元人民币),成为人类历史上首位身家跨越8000亿美元里程碑的富豪。此次财富激增的直接原因是马斯克旗下火箭公司SpaceX完成对人工智能公司xAI的全股票收购,合并后新实体估值高达1.25万亿美元(其中 SpaceX 估值约 ...