微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年02月06日

03:42
2026年2月6日,高盛发布预测称,2025至2030年间,欧洲TTF与亚洲JKM天然气现货均价将低于5美元/百万英热单位,较当前水平下挫超50%。分析指出,全球LNG供应增速将显著高于亚洲需求增速,供需格局转向宽松。该预测基于新投产液化项目加速释放产能,叠加亚洲部分经济体能源结构转型放缓需求增长。价格下行趋势或持续至2030年前后。
03:42
2026年2月6日,埃隆·马斯克在社交媒体上明确表示,SpaceX公司当前并未研发手机。该声明旨在回应近期外界关于SpaceX涉足消费电子领域的猜测。马斯克强调,公司核心聚焦于航天运输、星链(Starlink)卫星互联网及火星探索等任务。SpaceX总部位于美国得克萨斯州,其研发资源持续向火箭复用、星舰系统及低轨通信网络倾斜。此举有助于厘清市场误读,稳定公...
03:42
2月6日2时06分,印尼爪哇岛南部海域(南纬8.95度、东经111.05度)发生5.7级地震,震源深度50千米。此次地震由中囯地震台网正式测定,未通报人员伤亡及海啸预警。事发地位于印度洋板块与欧亚板块交界带,属地震多发区。当地有关部门已启动初步监测响应。
03:42
2026年2月6日,中国科学技术大学潘建伟、汪野、包小辉、张强、万雍等团队在合肥成功构建国际首个可扩展量子中继基本模块。该成果首次实现单原子节点间远距离高保真纠缠,并将器件无关量子密钥分发传输距离突破百公里,为远距离量子网络奠定核心基础。研究旨在解决量子通信中光子损耗导致的传输距离瓶颈,通过模块化设计提升网络可扩展性。相关论文当日同步发表于《自然》与《科学...
02:41
2026年2月6日,沙特阿美宣布下调3月份运往亚洲的阿拉伯轻质原油官方售价(OSP)30美分/桶。此次调整适用于销往亚洲市场的主力出口品种,反映其对区域供需及炼厂利润变化的评估。调整后价格将自3月1日起生效,影响范围涵盖中日韩及东南亚主要进口国。此举旨在增强价格竞争力,应对近期亚洲炼油 margins 收窄及替代供应增加的压力。
02:41
2026年2月5日上午,2029年亚洲冬季运动会举办城市签约仪式在意大利米兰举行。哈萨克斯坦阿拉木图正式签约成为本届亚冬会主办城市。此次签约标志着阿拉木图继2011年后第二次承办亚冬会,旨在推动中亚地区冬季运动发展与国际体育交流。亚奥理事会确认赛事将于2029年2月举行,具体日期及项目设置将后续公布。
02:41
2026年2月6日,美国科技公司Meta在其内部启动‘Vibes’短视频应用的独立测试。该应用面向部分员工及有限外部用户,聚焦AI驱动的个性化视频推荐与轻量创作功能。测试地点位于加州门洛帕克总部及远程协作环境,旨在评估产品稳定性、用户参与度及内容安全机制。此举标志着Meta在TikTok竞争背景下加速布局新一代短视频生态。测试周期暂定为8周,后续将视数据反...
02:41
2月6日,全球首台20兆瓦海上风电机组在福建闽南海域成功并网发电。该机组由三峡集团主导实施,是我国首次完成超大容量海上风电机组吊装、调试及并网全流程。机组采用国产自主研发翼型叶片,通过轻量化与数字化智能集成,单位兆瓦重量降低超20%,捕风与发电效率显著提升。此举标志着我国在超大容量海上风电研发制造、深远海施工及运营能力实现重大突破。
02:41
2026年2月6日,沙特阿拉伯国家航空公司正与波音、空中客车就采购至少150架窄体及宽体客机展开初步谈判。此举旨在支持沙特打造全球旅游中心的战略目标,拟用新机替换并扩充现役约200架机队。谈判尚未确定具体机型、数量及交付安排,亦未签署任何协议。目前仍处于早期评估阶段,交易存在不确定性。
02:41
2026年2月6日,OpenAI正式推出新平台Frontier,旨在帮助企业高效构建、部署和管理AI智能体(即‘AI同事’)。该平台提供统一的安全管控与数据权限配置能力,降低企业规模化应用门槛。此举意在强化OpenAI在高价值任务自动化领域的领导地位。当前,AI智能体正加速替代人工执行复杂工作,仅需少量干预。行业竞争加剧,Anthropic等头部公司亦同步...
01:11
2026年2月6日,大众汽车公司与美国汽车工人联合会(UAW)宣布达成协议,将对位于美国田纳西州查塔努加工厂的工人实施20%薪资上调。此次调整覆盖约1500名生产及维护岗位员工,自2026年3月起分阶段生效。协议旨在提升薪酬竞争力、稳定劳动力队伍,并回应近年UAW在美车企系列谈判中的核心诉求。双方未披露具体财务安排,但强调该协议不涉及新增工作岗位或产能扩张...
00:40
2026年2月6日至2月13日期间,Epic Games商城免费赠送冒险解谜游戏《波坦尼庄园》及射击游戏《Pixel Gun 3D》的‘剧毒复古套装’DLC。活动面向所有Epic账户用户,无需付费即可领取。《波坦尼庄园》设定于19世纪英格兰植物庄园,玩家扮演退休植物学家阿拉贝拉·格林开展植物研究;DLC则包含三款带中毒效果的复古风格武器。下周(2月13日起...