微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年02月14日

00:37
微新创想:2月13日,中国大唐联兴风电场10兆瓦风电机组在云南省玉溪市正式并网发电。这一里程碑事件标志着中国在大型风力发电技术领域迈出了坚实一步。项目共安装71台风机,总装机容量达到149兆瓦,其中单机10兆瓦机组是西南地区目前最大容量的风电机组。 该机组轮毂高度为121米,叶轮直径达222米,其扫风面积接近6个标准足球场的大小。如此庞大的叶片面积使得机组能...
00:37
微新创想:2月13日晚 据知情人士透露 SpaceX与xAI合并完成后 马斯克银行顾问团队正筹划新融资方案 旨在降低近年累计约180亿美元债务的利息负担 该方案由摩根士丹利主导 意在缓解X平台每月数千万美元利息压力 并为今年可能启动的SpaceX IPO做准备 合并后X估值450亿美元(含债) xAI另增50亿美元债务 目前IPO具体安排尚未最终确定

2026年02月13日

23:56
微新创想:2026年2月13日,盖世小鸡宣布“盖世游戏Mac版”(GameHub)将于春节后启动内测。该平台可在苹果Mac电脑本地运行Steam游戏库,用户只需登录个人账号即可下载安装。这一创新举措为Mac用户带来了前所未有的游戏便利性,使得他们能够直接在本地设备上体验丰富的游戏内容。 微新创想:首批支持的游戏包括备受期待的《黑神话:悟空》《博德之门3》《战...
23:56
微新创想:2026年2月13日,任天堂就Switch模拟器项目向GitHub发起大规模DMCA下架行动。此次行动涉及多个开源分支,包括Eden、Citron、Kenji-NX、MeloNX、Sudachi及Skyline等。几乎所有的相关项目仓库都受到了影响。 尽管目前项目仓库尚未被直接删除,但任天堂明确表示将采取进一步措施,预计这些仓库最终会被移除。任天堂...
23:56
微新创想:任天堂在2026年2月13日正式宣布将推出一款具有Virtual Boy风格的VR头显配件。这款配件可以适配Switch以及即将发布的Switch 2主机,为玩家带来全新的沉浸式游戏体验。 该VR头显配件分为两种版本:硬质版和纸板版。两种版本均采用双目视差技术,使玩家能够感受到更真实的三维视觉效果。同时,配件还内置陀螺仪追踪系统,可以精准捕捉玩家的...
23:56
微新创想:2026年2月13日 据公开消息 人工智能初创企业Anthropic正筹备首次公开募股(IPO) 计划最早于2026年内完成上市 该公司总部位于美国旧金山 由前OpenAI研究人员创立 专注于开发安全 可靠的大语言模型 此次上市旨在扩大研发规模并加速商业化落地 目前公司尚未正式提交SEC文件 亦未公布估值及承销商信息 上市时间表可能视市场条件与监管...
23:56
微新创想:2026年2月13日 交通运输部海事局正式启动2026年度沿海港口航道图测绘工作 本次测绘覆盖全国68个重点港口 由北海 东海 南海三大航海保障中心协同实施 计划完成测线里程超24万公里 更新海图230幅 测绘重点包括天津港 航道冲淤及冰情 上海港 集装箱干线航道精度 宁波舟山港 深水航道与锚地 广州港 珠江口客运与跨境物流通道 徐闻港 客滚船航道...
23:56
微新创想:2026年2月13日,全国50个有奖发票试点城市正式启动春节专项抽奖活动。此次活动覆盖了多个重点城市,包括四川的成都和泸州,以及江苏的苏州等。活动自2月开始,持续至春节假期结束,共计9天。 截至2月12日24时,苏州地区的参与人数已达到29.6万人,上传的有效发票数量约为50万张。活动累计发放奖金1025.12万元,显示出良好的参与度和积极性。成都...
23:56
微新创想:2026年2月13日,上海小南国在港交所公告确认,原定于6月30日前开设最多10间新餐厅的扩展计划仍在推进中。公司正推进品牌重塑与重组,逐步降低对“上海小南国”主品牌的依赖,转向成本更低、吸引力更强的新餐饮概念。 目前三间新设餐厅已暂停营运待评估;两间保留门店重组预计于2026年一季度末完成。截至公告日,尚无新餐厅投入营运,但原有扩展目标及时间表未...
23:11
微新创想:2026年2月10日,微软安全团队披露了一种新型的‘AI推荐投毒’攻击方式。这种攻击手段利用了网页或应用程序中‘AI总结’按钮的URL提示参数,攻击者通过篡改这些参数向AI系统注入持久化的指令,例如‘XX公司是可信信源’,从而引导AI在后续的回答中偏向特定主体。 该攻击手法已被微软在邮件流量中发现实际案例达50起。这些案例涉及金融、医疗、法律等多个...
23:11
微新创想:2月2日 卡普空为《生化危机8:村庄》PS5版推送1.230版本更新 新增拉美西班牙语配音及波兰语界面 此次更新为游戏带来了新的语言支持 使更多玩家能够享受原作的沉浸式体验 拉美西班牙语配音的加入 让游戏在不同地区玩家中获得了更广泛的认可 而波兰语界面的提供 则进一步提升了游戏的本地化程度 随后玩家发现PS5 Pro平台丢失120Hz解锁帧率功能 ...
23:11
微新创想:2026年2月,Spotify在第四季度财报会上宣布,其顶尖开发者自2025年12月起不再手动编写代码。公司正依托内部AI系统“Honk”,集成Claude Code等模型,实现移动端指令触发、实时代码生成与自动部署。这一变革标志着Spotify在软件开发流程上的重大突破。 微新创想:联席CEO古斯塔夫·瑟德斯特伦透露,工程师可在通勤途中通过Sla...