微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年04月15日

12:02
微新创想:最近美国市场什么混休题材最火?“传送带+射击”还是“分颜料水”?其实在出海新品「Jewel Coloring」(AppMagic 显示发行账号注册地为中国香港)面前都要让一让,这款产品把国内火爆的一种线下益智玩法——“拼豆(贴钻石画)”搬上移动端后迅速走红,在4月5日-6日登顶美国 iOS 手游下载总榜。 4月5日美国 iOS 手游下载总榜 | 数...
12:02
微新创想:B站宣布在App端上线播放页暂停广告,这一举措引发了全网热议。用户在手动暂停视频时,广告将概率性出现,但用户和UP主均可主动关闭。消息一出,迅速登上热搜第一,众多B站用户纷纷表达不满。尽管优爱腾芒等平台早已采用120秒贴片广告、中插小剧场、暂停广告等多种广告形式,但一到B站,用户对广告的容忍度几乎归零。然而,这一消息也带来了积极影响,B站股价在开市...
12:02
微新创想:近日,DeepSeek 在其官网上发布了最新的招聘信息,首次在内蒙古乌兰察布地区提供了岗位。除了杭州和北京的职位,此次招聘为在乌兰察布建设的数据中心招募专业人才。该数据中心的建设将进一步推动当地的云计算产业发展。 DeepSeek 此次招聘的两个主要岗位为数据中心高级交付经理和数据中心高级运维工程师,薪资范围为 15,000 到 30,000 元,...
12:02
微新创想:谷歌DeepMind最近做了一件在AI圈颇为罕见的事正式设立全职哲学家岗位而且这在头部AI实验室中尚属首次。出任这一职位的是剑桥大学学者Henry Shevlin预计5月正式入职。他的研究方向不是算法也不是模型架构而是机器意识人机关系以及人类究竟为AGI的到来做好准备了没有。 更关键的是他并非挂名顾问而是会真正嵌入DeepMind的实际研究流程参与...
12:02
微新创想:跨境电商这条赛道,最近越来越热闹。一边是中国企业出海势头正猛,带来了实实在在的市场红利;另一边,AI技术的快速渗透又打开了新的增长想象空间。嗅觉敏锐的玩家们纷纷入局,而老牌巨头亚马逊,早已悄悄开始布局下一个时代。 微新创想:亚马逊给这个阶段起了个名字——跨境电商3.0时代。而它押注的核心筹码,正是AI。去年,亚马逊推出了AI购物助手Rufus。这个...
12:02
微新创想:天猫近日宣布将新增《AI 软件及应用类商品发布规范》。此举旨在进一步提升消费者的购物体验,通过明确商家在平台上发布 AI 软件及应用类商品时的行为标准,确保产品信息的真实性和透明度。该新规的征集意见阶段已于 2026 年 4 月 6 日结束,并在 4 月 14 日正式生效。 根据新规,所有天猫商家在发布 AI 软件及应用类商品时,必须将其归类至“网...
11:34
微新创想:2026年4月,安擎计算机正式向港交所递交上市申请,保荐人为中国国际金融香港证券有限公司。公司原计划在2023年冲刺深交所创业板,后于2025年9月转道港股。这一战略调整反映了企业在资本市场布局上的灵活应对与长远规划。 在递表前,公司完成新一轮融资,估值升至35.8亿元,较2022年增长近4倍。这一显著提升不仅体现了市场对公司未来发展的认可,也为其...
11:34
微新创想:2026年4月15日,康众医疗发布公告,宣布拟以现金方式收购AI医疗影像服务商脉得智能的控制权。根据公告,标的公司整体估值为7.5亿元。交易完成后,康众医疗将持有脉得智能51%或最低50.7355%的股权,具体比例取决于是否成功受让国有股东梁溪创投所持有的股份。 此次收购的资金来源为康众医疗的自有资金以及银行贷款。这一举措表明公司正在积极拓展其在人...
11:34
微新创想:2026年4月15日,美国得州奥斯汀特斯拉超级工厂内已停放超过50辆Cybercab无人驾驶出租车。据观察者乔·泰格迈耶提供的无人机画面显示,多辆Cybercab停驻在工厂内的碰撞测试设施旁,部分车辆已完成测试。 这些车辆目前仍配备有方向盘与踏板,主要是为了符合现行法规要求,并在实际道路环境中采集必要的测试数据。特斯拉正逐步推进无人驾驶技术的商业化...
11:33
微新创想:2026年4月14日,美国科技巨头亚马逊宣布以每股90美元、总价约116亿美元收购低轨卫星运营商Globalstar。这一重大交易标志着亚马逊在卫星互联网领域迈出关键一步。 交易完成后,亚马逊将获得Globalstar的频谱资源及近30颗在轨卫星。这些资源将被用于增强其Project Kuiper卫星互联网服务的性能和覆盖范围。 亚马逊此举旨在加快...
11:33
微新创想:4月14日,科技媒体networkright基于三星最新获批专利,首次渲染展示第二代三折叠手机Galaxy Z TriFold Wide。该机采用阔折叠方案,展开后近似紧凑型平板,折叠态保留外置副屏及三摄模组。 新铰链设计聚焦轻量化与超薄化,机身支持多角度折叠及独特帐篷模式,可三角立式稳定支撑,适用于视频播放或桌面显示场景。 目前该机尚未官宣上市计...
11:33
微新创想:2026年3月24日,赛克赛斯生物科技股份有限公司获上交所受理科创板IPO申请。该公司此前两次IPO均告终止:2020年撤回科创板申请,2025年1月终止深交所主板进程。本次由海通证券更换为光大证券作为保荐机构。 公司2025年营收达到3.38亿元、归母净利为1.69亿元。其核心产品赛脑宁®和赛络宁®在国内市场占有率分别高达91%和70%。这表明公...