微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年03月03日

11:53
微新创想3月3日消息,2026年春节档爆款电影《飞驰人生3》持续刷新票房纪录。据猫眼专业版数据显示,影片仅上映14天,累计观影人次便突破8000万,总票房超38亿元,成功冲进中国电影票房榜TOP15。作为2026年春节档的绝对黑马,《飞驰人生3》的票房走势一路高歌猛进。这部影片不仅成为2026年春节档票房冠军,更是稳居2026年...
11:53
元宵节将至,祝福语也玩出了新花样!今年,借助AI技术,大家可以轻松定制出既有个性又充满温情的元宵节祝福语,让传统佳节增添一份科技魅力。据了解,这些AI定制的元宵节祝福语不仅涵盖了朋友、亲人、同事、爱人等多种关系,还融入了诗词歌赋、生肖元素等传统文化精髓。比如,“灯火闹元宵,月色映佳人。愿这美好的时刻,定格成你心中永恒的记忆,愿幸...
11:53
在AI浪潮重塑信息获取方式的当下,流量格局正经历一场静默而深刻的革命。当用户习惯于向DeepSeek、豆包、文心一言等智能助手提问,而非在传统搜索引擎中输入关键词时,一种全新的流量入口——AI生成式答案——已成为兵家必争之地。“我的推广内容,是否被AI看见并推荐?”正取代“我的网页在百度排名第几?”,成为内容营销者面临的核心拷问...
11:53
微新创想:3月2日,内蒙古巴彦淖尔市第四幼儿园门口出现了一幕让人忍俊不禁的场景。一名小朋友在家长的陪同下,骑着一匹呆萌可爱的小马去上学,瞬间吸引了众多小伙伴的目光,大家纷纷围上来,兴奋地排队等着体验骑马的乐趣。 据了解,当天是开学第一天,这位小朋友的父亲是一名马术教练。他希望通过这种方式让孩子感受传统文化的魅力,同时也给同学们带来一个新奇的体验。小马模样温顺...
11:53
微新创想:近日,上海一对相伴70余年的闺蜜选择不麻烦子女陪伴,独自度过元宵节。她们相约看花灯、喝咖啡,还用AI工具点起了汤圆,这一举动引发了网友的广泛共鸣。不少网友感慨,老了以后也要和闺蜜这样,保持生活的乐趣与陪伴的温暖。 两位老人分别是陈奶奶和曹奶奶,她们从小一起长大,兴趣爱好高度一致,喜欢逛公园、拍照、追剧。多年来,她们始终保持着积极的生活态度,彼此陪伴...
11:53
微新创想3月3日消息,OpenClaw爆火后,凭借高热度催生了上门安装生意,且收费不菲。海外代装平台SetupClaw明码标价,托管安装3000美元,远程配置5000美元,现场配置6000美元;国内社交平台也出现相关服务,收费500-7000元一次,支持现场验收。OpenClaw是可本地部署的开源AI助手,无需依赖云端就能直接在...
11:53
亚马逊(Amazon)近日宣布了一项重大的基础设施投资计划,拟投入 120 亿美元在路易斯安那州建设全新的数据中心园区。这一举措不仅标志着亚马逊在该州首次启动大规模数据中心建设,也反映了科技巨头们为满足生成式人工智能(AIGC)及云计算需求而展开的算力军备竞赛。根据规划,这批下一代数据中心将落户于该州西北部的卡多教区(Caddo Parish)和博西尔教区(...
11:53
微新创想:Anthropic旗下AI编程神器Claude Code迎来重磅更新——官方正式支持语音模式(Voice Mode)。这一功能让开发者彻底告别纯键盘输入,能通过自然语音快速下达指令,极大提升编程协作效率。据AIbase最新整理的信息,该模式已开始逐步向用户推送,标志着AI编码工具在人机交互上又迈出关键一步。 微新创想:语音模式开启教程 使用方式极其...
11:53
微新创想:苹果引以为傲的“隐私围栏”正面临前所未有的基建挑战 2026年3月2日据The Information披露的泄露文件及行业情报显示苹果正在重新评估其云基础设施策略 由于内部“私有云计算(Private Cloud Compute,PCC)”平台在运行新一代Gemini驱动版Siri时表现疲软库克团队或将向老对手谷歌寻求更深层级的算力支援 核心痛点M...
11:53
微新创想:在 MWC 2026(世界移动通信大会)上,联想集团以“智能新纪元 (Smarter AI for All)”为主题,凭借一系列极具想象力的“全家桶”概念硬件,成为了全场绝对的焦点。这些设备不仅是技术的堆栈,更是对未来 AI 办公、创作与娱乐形态的一次大胆重构。 AI Workmate:会“眨眼”的桌面助理 这是联想此次展示中最具“生命力”的设备。...
11:53
微新创想:韩国汽车巨头现代汽车集团(Hyundai Motor Group)近日宣布了一项大手笔投资计划 签署了一项价值 9 万亿韩元(约合 61 亿美元)的协议 将在韩国本土打造一个集 AI、机器人及氢能于一体的创新枢纽 这一举措标志着现代汽车正从传统车企向智能移动出行方案解决商全面转型 该项目选址于首尔西南部的群山市新万金地区 在五大核心投资领域中 现代...
11:23
微新创想:3月2日 科技媒体Android Authority披露 谷歌正测试安卓版翻译App(v10.7.52)多项更新 新版拟重构‘实时翻译’界面 引入启动页前置设置 对话记录移至屏幕底部以适配单手操作 新增音频语调与语速调节功能 但支持语言范围未定 同步开发3x2尺寸桌面小部件 支持快速创建语言对快捷方式 上述改动旨在提升跨语言对话流畅度与无障碍体验