微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年03月18日

06:35
微新创想:2026年3月18日,澳大利亚矿业巨头必和必拓集团宣布,Brandon Craig将自2026年7月1日起出任首席执行官,接替现任CEO Mike Henry。这一人事变动标志着公司进入新的领导阶段。 Craig目前担任公司铁矿石业务负责人,拥有超过25年的矿业管理经验。他的丰富背景和深厚行业知识使其成为接任CEO的理想人选。 此次任命是公司董事会...
06:35
微新创想:3月18日,据公开消息,人工智能公司OpenAI正积极推进上市筹备工作,目标于2026年底前完成。该公司总部位于美国旧金山,由山姆·阿尔特曼等人联合创立。此次上市旨在拓展资本实力,加速大模型研发与商业化落地。目前OpenAI尚未公布具体交易所、估值及承销商等细节,相关进程将视监管审批与市场条件而定。
06:35
微新创想:亚马逊近日宣布了一项重要的物流战略调整计划,旨在提升配送效率并优化运营成本。根据官方消息,亚马逊计划在2025年秋季前,将通过美国邮政投递的包裹数量减少至少三分之二。这一决定主要针对美国本土的零售订单,不涉及国际物流业务。 亚马逊表示,此次调整的核心在于加强自建物流体系的建设,包括扩大Amazon Logistics的运力规模以及提升区域履约中心的...
05:28
微新创想:2026年3月18日,加拿大运动服饰品牌LULULEMON公布2025财年第四季度业绩。公司当季净营收达36.4亿美元,高于分析师预期的35.8亿美元。这一成绩显示出品牌在市场中的强劲表现和消费者持续的关注。 微新创想:同时,LULULEMON预计2026财年净营收为113.5亿至115亿美元,略低于市场普遍预期的115亿美元。尽管营收指引略显保守...
05:28
微新创想:2026年3月18日,中国卫星导航系统管理办公室宣布北斗系统将实施在轨升级,优化部分卫星工作状态。此次升级旨在进一步提升系统的稳定性和服务能力,为各行业提供更加精准的时空信息支持。 目前北斗在轨卫星数量已达到50颗,空间信号精度优于2米。这一技术指标不仅体现了北斗系统的成熟度,也标志着其在全球导航卫星系统中的竞争力不断增强。 北斗系统的高精度时空服...
03:53
微新创想:3月18日 据市场消息 联合利华正评估分拆其食品业务的可能性 该业务涵盖调味品 汤品及酱料等品类 全球年营收超百亿美元 分拆旨在聚焦高增长个护与美容板块 提升运营灵活性与股东回报 公司尚未作出最终决定 亦未指定时间表或具体架构方案 此举若落实 将成为联合利华近年来最大规模战略重组之一
03:52
微新创想 近日高铁二等座B座因空间局促进出不便被网友戏称为尴尬座三等座相关话题引发热议 针对不想坐B座怎么办的疑问12306官方给出明确回应可选择退票再次购买也可乘车后协商换座 铁路部门介绍目前12306为G/D/C字头动车组提供优先选座功能旅客购票时可选择靠窗或过道偏好系统会在有余票情况下优先分配A/F靠窗C/D靠过道座位 但在车票紧张时系统仍...
03:52
微新创想 脂肪肝正成为现代人体检报告上的高频词,也常常被贴上亚健康的标签。然而,脂肪肝并非胖人的专利,越来越多看起来并不胖的年轻人,正被检出瘦人脂肪肝。南京市第二医院脂肪肝诊疗中心主任医师冯艳红介绍,这类人群往往脸和四肢看起来都不胖,唯独肚子圆鼓鼓的,堆积着不少脂肪。大多是久坐的办公族,看着不胖,一查却是脂肪肝。 不久前门诊就来了一位这样的年轻姑娘。她因为体...
03:52
微新创想:今年春节期间,西南医科大学附属医院收治了一名特殊的中毒患者。69岁的杨某逸因听说吃鱼胆对身体有好处,在做年夜饭时生吞了一尾4斤重草鱼的鱼胆,随后中毒休克,被紧急送入ICU抢救。据家属回忆,生吞鱼胆四五个小时后,刚吃过年夜饭的杨某逸开始上吐下泻,呕吐物中伴有鲜红色血丝,整个人几乎虚脱。送往当地医院时,他已处于休克状态。 入院检查显示,他的转氨酶飙升至...
03:52
微新创想 OPPO Find N6今日晚间正式亮相。在新品发布会上,OPPO首席产品官刘作虎首先谈及了折叠屏手机长期以来存在的一个核心问题,即屏幕折痕。自2018年首款折叠屏产品问世以来,折痕问题始终困扰着行业的发展。尽管技术不断进步,但如何彻底消除这道不平整的痕迹,依然是技术研发领域难以攻克的难题 为了解决这一行业痛点 OPPO Find N6彻底重新...
03:52
微新创想 近日苹果AI研究团队发布了一项重大突破,推出了名为LiTo的表面光场标记化大模型。这一创新技术成功攻克了3D重建领域的核心难题,使得仅凭一张平面图像即可重建出完整的3D对象。不仅如此,LiTo还能高度还原多视角下的光影效果,彻底打破了传统3D重建需要多角度图像输入的限制。 LiTo模型的核心突破在于其创新应用了潜在空间技术,并首创了一种统一的3...
03:15
微新创想 今日晚间备受期待的OPPO Find N6正式亮相。OPPO官方介绍Find N6是全球首款通过德国莱茵60万次折叠测试的产品。不仅如此它还获得了德国莱茵久用测试认证被评为全球最平整的折叠手机再次刷新了行业纪录 在正式发布前OPPO特别发起了一项名为折叠漂流计划的活动邀请了7位平整见证官进行接力测试。现场展示的样机在经历超过10万次真实折叠后屏...