微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年02月03日

09:00
智谱今日正式宣布并开源其专业级 OCR 模型 GLM-OCR,这一创新成果以仅0.9B的轻量化尺寸实现了跨级性能突破,在多项权威基准测试中表现卓越,成功登顶行业榜单,致力于解决复杂文档解析中的真实业务挑战。 核心性能:小尺寸下的 SOTA 表现 尽管参数规模仅为0.9B,GLM-OCR 的性能却令人惊叹。在权威文档解析榜单 OmniDocBench V1.5...
09:00
SpaceX 正式宣布完成对 xAI 的战略性收购,标志着全球航天与人工智能两大领域的领军企业实现历史性整合。埃隆·马斯克在内部全员信中描绘了一幅跨越地球与深空的宏伟愿景:通过将尖端火箭技术、天基互联网与前沿人工智能深度融合,打造一个前所未有的“垂直整合创新引擎”。 马斯克在备忘录中深入阐述了当前全球 AI 发展面临的挑战。他指出,随着人工智能技术的飞速...
08:59
近期,一款专为潮流玩具打造的微型服装——娃衣,在北美市场掀起了一股前所未有的销售热潮,部分高端定制款更是卖出高达两千元人民币的天价,引发广泛关注。这股热潮的兴起,源于中国浙江桐乡等地的传统女装厂,在行业淡季时意外转型生产仅十几厘米高的玩偶服装,却意外打开了全球市场。 据悉,浙江桐乡、义乌等地的产业带工厂,因LABUBU等潮玩娃衣订单激增,已全面进入满负荷生产...
08:59
近日,陕西西安一段令人震惊的视频在网络上迅速传播,引发社会广泛关注。视频中,一名4岁半的小男孩竟在游泳池边,用小水桶舀起池水大口饮用,这一行为立即引起了网友们的强烈讨论。据孩子父亲2月2日发布的回应称,这起事件发生在一家儿童游泳俱乐部内,事发当天孩子正在参加游泳课程,而家长则在外等候。 据了解,该男孩已经在这家游泳俱乐部学习游泳两年,具备一定的游泳基础。然而...
08:59
"16号集体洗头"这一网络热议话题,生动展现了春节传统习俗在当代社会的创新演绎。2月16日恰逢除夕,依据民间"大年初一洗头会洗走财运"的习俗,众多民众选择在这一天洗头,寓意着洗去旧岁尘埃,以焕然一新的姿态迎接新年。这种习俗的调整既保留了辞旧迎新的文化精髓,又体现了传统与现代的完美融合。 春节年俗自正月初一至十五环环相扣,蕴含着深厚的文化底蕴。除夕夜守岁之后,...
08:59
近日,一位网友在湖北恩施的一家服务区停车休息,原本计划补觉两小时后再继续赶路。然而,凌晨五点刚过,一阵急促的鸡鸣声突然将她从睡梦中惊醒。起初,她以为是自己的错觉,但没过几分钟,整个服务区就被此起彼伏的鸡叫声所笼罩,仿佛自带环绕音效,吵得人根本无法再入睡。无奈之下,她只好起身结束休息。被这尖锐的打鸣声惊醒的远不止她一人。在服务区停车休息的旅客们,几乎都被这突如...
07:51
2025年第四季度,美国智能手机市场展现出稳健的增长态势,整体销量同比增长1%,呈现逆势上扬的积极信号。在这一季度中,苹果公司凭借卓越的市场表现,市场份额强势攀升至69%,创下历史新高,彰显其在美国市场的领导地位。与此同时,三星电子的市场份额则出现明显下滑,从18%降至13%,反映出市场竞争格局的动态变化。 市场增长的主要驱动力来自AT&T、T-Mo...
07:51
2026年2月3日,自动驾驶巨头Waymo迎来里程碑式融资,Alphabet旗下这家创新企业成功斩获160亿美元巨额投资,估值飙升至令人瞩目的1260亿美元。此次融资由Dragoneer、DST全球和红杉资本联合领投,Alphabet依然保持控股地位,彰显了市场对其技术前景的高度信心。这笔巨额资金将专项用于年内将自动驾驶服务拓展至伦敦、东京等十余个全新城市,...
07:51
2026年1月30日,北京华电光大环境股份有限公司正式获得北京证券交易所的IPO上市申请受理,保荐机构为业内知名的开源证券。这家成立于2013年的创新型企业,总部位于北京昌平区,专注于新型催化材料的研发与产业化,凭借其卓越的技术实力和创新能力,成功入选国家级专精特新“小巨人”企业名单,彰显了其在细分领域的领先地位。 本次IPO计划募集资金2.6亿元人民币,资...
07:51
Adobe公司于2026年2月3日发布公告正式宣布,旗下经典2D动画软件Animate将于2026年3月1日起正式停止销售。这一决定引发了动画行业从业者的广泛关注,也标志着Adobe在动画创作领域的一次重要战略转型。 根据官方公告,目前所有现有Animate用户仍可继续使用该软件,普通用户的使用期限截止至2027年3月1日,而企业用户则可延长使用至2029年...
07:51
2026年2月3日,OpenAI首席执行官Sam Altman通过社交平台正式发声,公开表达了对英伟达的深厚合作情谊。他高度评价道:"我们非常珍视与英伟达的合作关系,他们所生产的AI芯片堪称全球顶尖。"同时,Altman更向外界传递出强烈的合作意愿,表示OpenAI希望长期成为英伟达的"超级大客户"。这一表态被视为对近期市场流传的"OpenAI可能转向自研芯...
07:51
2026年1月29日,全球知名投资巨头伯克希尔·哈撒韦公司在美国公开市场进行了一次引人注目的股票减持操作。该公司以每股约120.55美元的价格,成功出售了165.848万股德维特公司(DaVita)的普通股。这一交易由沃伦·巴菲特亲自掌舵的伯克希尔·哈撒韦公司发起,而买方则是一位市场匿名投资者,其身份并未公开披露。 此次减持被视为伯克希尔·哈撒韦公司对医疗保...