微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年03月21日

13:31
微新创想:2026年3月20日,自然资源部宣布四川牦牛坪稀土矿深部找矿取得重大成果。这一发现不仅标志着我国在稀土资源勘探领域迈出了重要一步,也为战略性矿产资源的可持续开发提供了坚实基础。 该矿新增稀土氧化物储量达966.56万吨,使保有总量突破1040.8万吨。这一数据表明,牦牛坪稀土矿在资源潜力方面具有极高的价值,进一步巩固了其在我国稀土产业中的地位。 同...
13:31
微新创想:美国东部时间3月20日凌晨,NASA将执行“阿耳忒弥斯2号”载人绕月任务的“太空发射系统”火箭与“猎户座”飞船,从佛罗里达州肯尼迪航天中心装配大楼运抵39B发射台。整个运输过程耗时约11小时,标志着任务进入最后准备阶段。 任务团队正在对火箭和飞船进行最后的测试与检查,确保所有系统均处于最佳状态。目前,发射计划最早于北京时间4月1日(美东时间3月31...
13:31
微新创想:截至2026年3月21日,中国石化在全国范围内运营的车用LNG加气站已达到1150座,构建起覆盖广泛、功能完善的加注网络,成为全国规模最大的车用LNG加注体系。这一网络不仅提升了清洁能源车辆的使用便利性,也为我国交通行业的绿色转型提供了坚实支撑。 微新创想:自“十四五”规划实施以来,中国石化累计为各类车辆加注LNG超过1700万吨。这一庞大的能源供...
12:23
微新创想:2026年3月21日,月之暗面Kimi官方微博正式确认,Cursor最新发布的Composer 2编程模型基于Kimi K2.5构建。这一消息在技术界引发了广泛关注,因为Composer 2的推出标志着Cursor在智能编程领域迈出了重要一步。 该模型通过Fireworks AI提供的强化学习与推理平台接入,属于双方之间的授权商业合作。这种合作模式...
12:23
微新创想:2026年3月21日,YS NET工作室正式发布了《莎木3增强版》的首支预告片。此次公布的预告片不仅展示了游戏的全新面貌,也引发了玩家对这款经典作品回归的热烈期待。 新作将登陆PS5、Xbox Series X|S、Switch 2以及PC平台,为不同设备的玩家提供更广泛的体验机会。游戏将支持简体中文字幕与用户界面,进一步提升中文玩家的游戏体验。 ...
11:45
微新创想:2026年3月份上海个人客车额度拍卖即将举行 3月28日(星期六)上午10:30至11:30,上海市将开展本月个人客车额度的拍卖活动。此次拍卖由上海国拍公司负责组织,共投放3710个额度,为市民提供购车指标的宝贵机会。 本次拍卖的警示价设定为92900元,与上月保持一致。警示价的设置旨在防止竞拍者出现非理性报价,确保拍卖过程的公平与有序。一旦有标书...
11:45
微新创想:3月19日 步步高电子创始人段永平在雪球平台发文称“确实没必要比较” 就OPPO 3月17日Find N6发布会上与三星Galaxy Z Fold 7的折痕对比视频作出回应 该对比未直接点名 但通过机身形态可辨识为三星折叠机型 段永平表示将就此情况“反映一下” 有用户指出 苹果历史上也曾进行竞品对比 如乔布斯发布MacBook Air时对比索尼超薄...
11:45
微新创想:2026年3月21日,机械革命宣布面向游戏本及轻薄本产品线推出官方延保服务。用户可在原厂标准保修期满后,额外获得1年整机硬件故障免费保修。这一服务的推出,旨在为消费者提供更全面的售后保障,提升产品使用体验。 服务覆盖非人为导致的硬件性能故障及电气元件损坏,提供免费检测、维修及原厂备件更换。用户无需承担任何人工与备件费用,即可享受专业维修支持。这一举...
11:45
微新创想:2026年3月21日,一项研究揭示了全球约有10%的慢性肾脏病(CKD)患者面临JC病毒激活的风险。JC病毒广泛存在于90%的人群体内,通常处于潜伏状态,对人体无害。然而,当慢性肾脏病导致免疫系统功能下降,出现所谓的‘免疫瘫痪’时,该病毒可能被激活并转化为具有致病性的形式。 微新创想:这种激活的病毒会攻击脑部的少突胶质细胞,进而引发一种名为进行性多...
11:45
微新创想:2026年3月20日,摩尔线程正式发布v330.140版显卡驱动。该版本首次集成MTVSR实时视频超分技术,支持2至4倍视频分辨率实时提升,需配合VLC播放器使用;同时优化存储效率。 微新创想:在专业软件方面,此次更新修复了Enscape闪退及休眠唤醒异常的问题,提升了软件的稳定性和用户体验。对于游戏用户,驱动优化带来了显著的性能提升,特别是在《明...
11:12
微新创想:2026年3月21日,加州大学洛杉矶分校(UCLA)团队分析了NASA“毅力号”火星车所携带的RIMFAX雷达数据。他们发现,在耶泽罗陨石坑的西部三角洲下方35米以上的深度,存在一个形成于约42亿至37亿年前的古老地下河口三角洲。 该结构由顶积层、前积层和底积层组成,显示出明显的沉积特征。其倾角在3到15度之间,表明这一区域曾有长期稳定的河流注入湖...
11:12
微新创想:3月21日,大湾区首艘甲醇动力船“粤创盈002”在广东清远顺利完成试航。该船搭载潍柴6WH17甲醇船舶动力系统,由国内相关单位联合研制。此次试航不仅是一次技术上的重要突破,更是推动绿色航运发展的重要一步。 微新创想:试航过程中,涵盖了码头系泊、低速操控、全速航行、机动回转及倒车制动等多个关键环节。这些测试全面验证了纯甲醇动力系统在不同工况下的运行稳...