微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年01月17日

23:42
2026年1月17日,亚洲U23足球锦标赛1/4决赛的战火在赛场上激烈燃烧。中国U23男足与乌兹别克斯坦队展开了一场势均力敌的较量。经过90分钟的常规时间鏖战,双方球员都展现了极高的竞技水平,但场上比分始终紧咬,最终以0-0的平局进入加时赛。加时赛阶段双方继续展开激烈对抗,但依然未能打破僵局,比赛不得不通过残酷的点球大战来决出胜负。 在紧张刺激的点球对决中,...
23:42
2026年1月12日,一则来自游戏巨头育碧的内部评级消息引发了行业广泛关注。据多家媒体报道,育碧将旗下备受瞩目的《刺客信条:影》和《刺客信条:幻景》正式定位为"4A游戏"。这一评级由制作人Krasimira Yakovlieva亲自宣布,她特别强调,《幻景》作为首款原生支持苹果移动设备的4A游戏,开创了移动端游戏品质的新标杆;而《影》则实现了历史性突破,成为...
23:42
2026年1月17日,安徽芜湖星光璀璨,奇瑞汽车在此盛大举办AI之夜,向全球揭晓了其在人工智能领域的最新突破。当晚,奇瑞重磅发布了涵盖猎鹰智驾、灵犀智舱、飞鱼数智底盘及鲲鹏动力四大核心的AI技术进展,标志着中国汽车品牌在智能化浪潮中迈出了坚实一步。 猎鹰智驾系统迎来重大升级,猎鹰500车型新增城区导航辅助驾驶功能,让城市驾驶更加轻松自如。猎鹰700产品序列全...
23:42
2026年1月17日,科技界迎来重大突破——埃隆·马斯克的xAI公司宣布其为Grok人工智能模型打造的"Colossus 2"超级计算机正式投入运行。这款全球首个吉瓦级训练集群目前已具备1吉瓦的算力,并计划在4月份通过扩容升级至1.5吉瓦。这一尖端设施坐落于美国田纳西州孟菲斯市,占地面积广阔,相当于13个标准足球场大小,内部配备了20万块英伟达H100高性能...
23:41
2026年1月15日公布的最新日本游戏机销量报告揭示了市场格局的微妙变化。任天堂Switch 2凭借强劲势头再度称霸,在该统计周期内(2025年12月29日至2026年1月11日)销量高达313,838台,进一步巩固了其在便携式游戏领域的领导地位。值得注意的是,Switch 2自发布以来累计销量已突破409.79万台,显示出其持续的热销态势。 与此同时,索尼...
23:41
1月16日,中国铁建大桥局在江苏常州成功下线全球最大规格的打桩船启闭油缸,标志着我国超大超长油缸国产化技术取得重大突破。该油缸直径达2米,重量高达402吨,额定推力可达到5000吨,其举重能力相当于3500辆家用轿车的总重量,展现了我国高端装备制造业的强大实力。 作为"铁建大桥桩1"号打桩船的核心部件,该油缸特别配备了全球首创的闭式能量回收系统,通过先进技术...
22:40
2026年1月17日,美光科技宣布拟以18亿美元收购力积电位于中国台湾铜锣的P5晶圆厂设施。此举旨在扩充其存储芯片产能,交易预计于第二季度完成。美光计划分阶段提升该厂区的DRAM产量,并预计在2027年下半年实现显著晶圆产出。同时,双方将就晶圆后段封装与组装展开合作,美光亦将支持力积电的传统DRAM产品业务。
22:40
2026年1月17日,中国航发集团传来振奋人心的消息,其自主研发的"太行7""太行15""太行110"燃气轮机示范项目顺利通过国家能源局组织的评估验收。这一重大突破不仅彰显了中国在高端装备制造领域的强大实力,更标志着我国在燃气轮机全产业链上实现了从跟跑到并跑再到领跑的历史性跨越。 作为中国航空发动机集团的核心项目,此次通过验收的燃气轮机示范项目涵盖了自主研发...
22:40
2026年中央广播电视总台春节联欢晚会于1月17日完成首次彩排。本次春晚以“科技+艺术”为核心,融合智能技术与舞美设计,提升视听体验。彩排中,各类节目与技术创新、视觉效果初步整合,展现全新年味想象。继去年智能机器人表演扭秧歌引发关注后,今年机器人将再次亮相,通过创意编排展示我国科技发展成果。演出旨在以科技范和新颖形式营造新春氛围。
22:40
2026年1月16日,罗永浩在朋友圈证实其微博账号被禁言15天,并称将此“善意解读为保护”。此前,他与西贝董事长贾国龙因预制菜话题公开争执,双方微博账号随后均被禁言。罗永浩表示个人不再回应此事,未来若有重大谣言将由公司发布合规澄清声明。微博CEO王高飞同日发文强调,网络名人不得组织约架论战,应通过媒体采访方式表达争议,以减少网络戾气。
22:07
2026年1月17日,绿联在海外市场发布MagFlow二合一Magsafe充电宝。该产品支持Qi2无线充电,内置20000mAh电池,配备数显屏显示电量与功率。正面磁吸面板最高输出25W,内置小充电板可为TWS耳机充5W电,上盖可调角度便于查看手机。自带USB-C编织线支持100W输出,可为笔记本快充,自充最高达65W。机身含USB-A和USB-C接口,A...
22:07
2026年1月13日,CD Projekt确认旗下《巫师》系列游戏全球销量已超8500万份。其中《巫师3:狂猎》达6000万份,居系列首位。《巫师2》和《巫师1》分别售出1500万、1000万份。数据由波兰记者Michał Król披露,公司CEO随后转发确认。此次更新展示了CD Projekt旗下多款游戏的强劲市场表现。