微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年02月28日

02:08
微新创想:2026年2月28日,德国联邦机动车运输管理局(KBA)宣布宝马启动全球召回。此次召回涉及2022年至2025年间生产的五款车型,包括i7、i5、5系、7系以及M5。受影响的车辆总数达到337,374辆,其中德国境内有29,441辆。 此次召回的主要原因是部分车辆的电子控制单元存在软件异常的潜在风险。这种异常可能在车辆行驶过程中导致动力系统突然中断...
00:55
微新创想:截至2月27日,美国2026年已报告麻疹病例至少1136例。这一数字远超往年同期水平,显示出麻疹疫情正在迅速蔓延。疫情已经波及全美多个州,主要集中在未接种疫苗的人群以及与国际旅行输入相关的地区。 疾控中心指出,仅在前八周内,病例数就已经达到了过去一年平均值的六倍。这一数据表明,免疫空白区域的扩大和跨境传播风险的增加是当前疫情失控的重要原因。专家分析...
00:23
微新创想:2026年2月27日,芬兰HMD Global正式推出新款智能手机Luma。这款手机在设计和功能上延续了HMD一贯的风格,同时在细节方面也进行了优化。Luma搭载了紫光展锐T615处理器,为用户带来稳定的性能体验。配备4GB运行内存和128GB或256GB存储空间,支持microSD卡扩展,满足不同用户的存储需求。 该机采用了一块6.67英寸的HD...

2026年02月27日

23:48
微新创想:2026年3月27日起,LPL赛区14支战队将展开电竞世界杯《英雄联盟》项目预选赛。此次赛事是通往全球总决赛的重要一步,吸引了众多顶尖战队参与。首阶段比赛时间为3月27日至29日,由种子排名第7至14的队伍进行单败淘汰赛。胜出的队伍将与排名前六的战队共同进入第二阶段。 第二阶段比赛从3月30日持续到4月28日,采用双败淘汰赛制。这种赛制不仅增加了比...
23:48
微新创想:2026年2月27日,宝可梦官方正式宣布了对战新作《宝可梦:冠军》的发布计划。该游戏将于4月登陆任天堂Switch平台,并在夏季推出Android和iOS的手游版本。这一消息让众多宝可梦粉丝感到振奋,因为《宝可梦:冠军》不仅延续了系列一贯的竞技对战特色,还带来了全新的玩法体验。 《宝可梦:冠军》主打竞技对战玩法,游戏内支持两种对战格式和三种战斗模式...
23:48
微新创想:2026年2月27日,美国国家航空航天局(NASA)宣布取消太空发射系统(SLS)火箭的升级计划,决定将重点转向简化设计和降低复杂性,以提高发射频率。这一决策标志着NASA在推进其深空探索战略上的重要调整。 此举旨在加速‘阿耳忒弥斯’登月计划的实施进程,确保未来任务能够更加高效地进行。NASA特别提到,将在宇航员登月之前增加一次航天器在轨对接测试任...
23:48
微新创想:2026年2月27日,碧桂园发布公告称,截至1月31日,公司合并范围内较2025年12月31日净新增违约债务38.61亿元。同期新增标的超5000万元的未决诉讼、仲裁案件14宗,涉案金额合计约32.68亿元。 上述债务违约及诉讼主要因流动性持续承压所致,涉及境内公开市场债券及非标融资。公司表示正积极推进债务重组与资产处置工作,以缓解当前面临的财务压...
23:48
微新创想:别克品牌宣布全新至境世家MPV纯电版将于2026年3月正式上市 这款全新车型在设计上采用了哑光灰双拼色车漆以及高定涂装工艺展现出独特的时尚感与高级质感 基于900V纯电架构打造该车不仅具备出色的能效表现还拥有更强的性能输出 新车搭载双电机四驱系统CLTC最大续航里程达到632公里满足长途出行需求 车身尺寸为5260×2023×1835mm轴距长达3...
23:48
微新创想:2026年2月27日,绿联在海外市场推出FineTrack Slim追踪器。这款产品专为iPhone用户打造,具备多项实用功能,包括支持苹果Find My网络、IP68防水防尘等级、100dB蜂鸣提醒以及远程定位等。这些功能让用户能够更便捷地追踪丢失的设备,提升日常使用的安全性与可靠性。 最大升级在于支持通用无线充电。这一改进让用户无需携带专用充电...
23:11
微新创想:一项发表于《Nature Medicine》的独立研究显示,OpenAI推出的ChatGPT Health功能在60个真实临床案例中,51.6%未能识别需立即就医的紧急状况,如哮喘危象、窒息等,反而建议居家观察或预约门诊 研究团队由伦敦大学学院等机构参与,共分析近1000条AI回复。研究结果表明,尽管ChatGPT Health旨在为用户提供医疗建...
23:11
微新创想:2026年2月27日,OpenAI在最新版ChatGPT(v1.2026.055)中发现未公开的‘Naughty Chat’成人模式代码。这一功能的出现引发了广泛关注,因为它允许18岁以上用户在主动请求时使用更具挑逗性、成人主题的语言。OpenAI表示,该功能的引入是基于对成年人的尊重与信任,旨在为成熟用户群体提供更加个性化和符合其需求的对话体验。...
23:11
微新创想:2026年4月,宝马将在德国莱比锡工厂启动人形机器人试点项目,首次在欧洲部署该类设备。这一举措标志着宝马在智能制造领域迈出了重要一步。 机器人将参与装配线作业及高压电池生产,每周工作5天、每天10小时,承担高精度、高强度任务。这些机器人不仅能够提升生产效率,还能在复杂环境中执行精细操作,确保产品质量。 此举旨在降低人工成本、改善员工工作环境,并补充...