微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年03月07日

10:39
微新创想:3月5日20时45分,武汉绕城高速发生一起交通事故。司机谢某在快车道行驶时过度依赖智能驾驶辅助系统,车辆以近100公里/小时速度冲入施工区,撞飞30米反光水马后撞停。事故未造成人员伤亡,仅致车损及设施损坏。 警方调查发现,谢某事发时犯困且未及时接管车辆。这起事故再次引发对智能驾驶技术安全性的关注。尽管智能驾驶辅助系统在日常驾驶中能够提供便利,但在某...
10:39
微新创想:绿联(UGREEN)于3月6日在海外市场正式推出Maxidok系列雷电5扩展坞,该系列包含两款产品:17合1与10合1版本。两款扩展坞均基于雷电5协议打造,为用户提供了强大的接口扩展能力。 17合1版扩展坞特别加入了M.2 NVMe SSD插槽,满足用户对高速存储的需求。同时,该版本还配备了2.5GbE网络接口,支持更高的数据传输速度。此外,它还附...
10:39
微新创想:2026年3月7日,手机壳厂商ThinBorne官网提前上架了Pixel 11 Pro XL的保护壳并附上了早期渲染图。这一举动引发了广泛关注,显示出市场对这款新机的期待。 该机的尺寸与Pixel 10 Pro XL基本一致,但其相机模组的开孔边缘明显更低,暗示后置摄像头的凸起可能有所降低,使得手机背部更加平整。这一设计变化不仅影响外观,也可能对手...
10:39
微新创想:2026年3月7日,京东产发与西邮物流正式签署出海战略合作协议。此次签约标志着双方在推动中国企业国际化进程方面迈出了重要一步。根据协议内容,双方将以全球化仓网与供应链能力建设为主线,在英国莱斯特园区启动首个合作项目。莱斯特园区地处物流产业黄金三角区,具备优越的地理位置和完善的物流配套体系,为双方合作提供了坚实的基础。 合作内容涵盖海外基础设施布局、...
10:39
微新创想:英特尔新款桌面处理器酷睿Ultra 5 250K Plus近日出现在PassMark基准平台的测试名单中。这款处理器采用了18核18线程的设计架构,其中包含4个能效核心,旨在兼顾性能与能效的平衡。其最高加速频率达到了5.3GHz,展现出强劲的单核处理能力。 测试数据显示,酷睿Ultra 5 250K Plus在单核性能方面获得了4854分,相较于前...
09:57
微新创想:2025年第四季度,AMD在PC GPU整体市场中的份额有所提升,增加了2.6个百分点。然而,在AIB(独立显卡)市场中,其市场份额却下降了1.6个百分点。这一季度全球PC独立显卡的出货量达到了1148万块,相比去年同期增长了36.0%。不过,这个数字仍然低于过去十年的平均水平,差距为10.82%。 JPR分析指出,导致AMD在AIB市场表现下滑的...
09:57
微新创想:3月5日 网页开发者Sören Hentzschel发布博文 首次公开Mozilla内部代号为“Nova”的Firefox新版UI 该设计采用大幅圆角标签页与地址栏 柔和色彩及浮动“岛”式元素 并引入类似Material You的动态取色机制 可依据系统壁纸实时调整主题色 垂直标签页模式下 视觉风格趋近Arc浏览器 下载面板 站点保护等核心组件亦全...
09:57
微新创想:2026年3月7日,OpenAI正式推出Codex Security AI工具,面向开发者提供代码安全审计服务。这一创新工具结合了前沿的人工智能推理技术与自动化验证机制,能够以高置信度识别多种常见代码漏洞,例如SSRF(服务器端请求伪造)等。 微新创想:Codex Security不仅能够精准检测潜在的安全问题,还能为开发者生成可直接执行的修复方案...
09:57
微新创想:2026年3月7日,西贝主品牌CEO职务发生变动:贾国龙春节前已卸任,原CEO董俊义重新履职,公司暂未对外正式回应。这一人事变动引发业内广泛关注,反映出西贝在战略调整与管理优化方面的积极尝试。 同期,西贝启动大规模组织调整。总部员工数量由超过500人裁减至约200余人,显示出公司在精简内部架构、提高运营效率上的决心。门店方面,原计划在1月份关闭10...
09:57
微新创想:微软近日为Windows、macOS及Web端用户推出了新版PowerPoint,其中Windows版本为v2510,macOS版本为v16.104。此次更新的一大亮点是内置了图像编辑器,为用户提供了更加便捷的图片处理功能。该工具具备一键去背景、消除杂物、无损放大、自动增强画质以及添加特效文字等多项实用功能。 用户只需在幻灯片中选中图片,然后点击“...
09:57
微新创想:微软近期传出消息,计划推出Microsoft 365 E7企业订阅版。据外媒2月末报道,这一新版本将在现有E5订阅基础上,引入更多人工智能相关功能,包括Microsoft Copilot和Agent 365智能体控制平面。这些AI工具将进一步提升企业在日常运营中的生产力和效率。 Microsoft 365 E5目前的月费为57美元每用户,而Copi...
09:57
微新创想:3月7日,长征八号甲遥八运载火箭在海南商业航天发射场实施转运,即将择期发射。该火箭由中国运载火箭技术研究院研制,是长八系列的重要改进型。2025年2月11日,长征八号甲完成了其首飞,标志着这一新型运载火箭正式进入实战应用阶段。 微新创想:长征八号甲具备700公里太阳同步轨道7吨的运载能力,这一性能指标使其能够胜任高密度、快速组网的发射任务。相较于之...