微新创想(Idea2003.com)6月21日 消息:DeepMind联合创始人Mustafa Suleyman在其即将出版的著作《即将到来的浪潮:技术、权力和21世纪最大的困境》中,对传统的图灵测试提出了颠覆性观点。他认为这一经典测试已无法适应人工智能发展的现实需求,并创新性地提出了”人工智能可行性”(ACI)这一全新基准。该基准的核心在于评估AI独立完成复杂任务的能力,而非仅仅停留在语言交互层面。

Suleyman设计的ACI测试极具实践性:将ChatGPT、Google Bard等先进聊天机器人置于”现代图灵测试”环境中,赋予其10万美元的初始资金,要求在规定时间内将其增值至100万美元。这一测试不仅考察AI的语言能力,更关键的是检验其商业决策、市场分析、产品策划、供应链整合等多维度综合能力,从而更全面地评估其逼近人类智能的水平。他预测,这一里程碑将在未来两年内被AI突破,届时自主创造并销售产品将成为AI的常规能力,对全球经济格局产生深远影响。

在书中,Suleyman系统性地驳斥了传统图灵测试的局限性。他指出,该测试”不清楚这是否是有意义的里程碑”,因为它无法有效衡量AI系统的真实能力层级,更无法判断其是否具备人类特有的复杂内心独白和抽象时间规划能力——这些正是人类智能的核心要素。图灵测试由艾伦·图灵于20世纪50年代提出,其初衷是通过语言交互判断机器是否具备人类智能。测试中,人类评估者无法分辨对话对象是真人还是机器,若机器能通过这一测试,即被视为通过。

Suleyman的创新之处在于,他建议停止将AI智能与人类进行直接比较,而是转向更务实的评估方式——为AI设定短期具体目标,并观察其能否在极低人类干预下独立完成。这种”人工智能可行性”(ACI)评估模式,更符合当前AI技术发展的实际阶段。为实现ACI,Suleyman详细阐述了测试流程:AI需在限定时间内完成电子商务项目的全周期操作,包括市场调研、产品策划、寻找制造商、建立销售渠道等关键环节。他强调:”我们不仅关心机器可以说什么,还关心它可以做什么”,这一理念标志着AI评估标准进入了一个全新的发展阶段。

最新快讯

2026年02月05日

10:20
2026年2月4日至5日,美股标普500软件与服务指数连续六个交易日下跌,累计下挫近13%,市值蒸发约8300亿美元。抛售由Anthropic推出Claude法律智能体插件触发,凸显大模型向企业级应用渗透加剧。投资者担忧AI将颠覆金融、法律、编程等核心软件业务,导致估值逻辑重构。汤森路透、励讯集团等数据服务商单日暴跌超14%。分析指出,AI虽带来威胁,但专...
10:20
2026年2月,英国伦敦AI语音公司ElevenLabs宣布完成5亿美元融资,估值升至110亿美元。该公司成立于2022年,主营AI语音生成、语音转文字、音乐合成及对话式AI等技术,服务企业语音助手部署与创作者音频本地化需求。本轮融资由红杉资本领投,Andreessen Horowitz、Iconiq Capital等老股东跟投,新增Lightspeed ...
10:20
2026年2月4日,名创优品在香港联交所回购公司普通股5.26万股,总金额189.72万港元,每股价格介于35.60至36.58港元。此次回购系公司根据股东大会授权实施的股份回购计划的一部分,旨在优化资本结构、提升股东回报。回购股份将用于未来员工激励或注销。交易于当日完成,不涉及内幕交易或市场操纵行为。
10:20
2026年2月5日,隆华科技在互动平台披露,其靶材产品已广泛应用于HJT、BC及钙钛矿等新型光伏电池领域。公司作为国内先进靶材供应商,依托材料研发与工艺技术积累,为高效太阳能电池量产提供关键溅射材料支撑。此举旨在响应国家新能源战略,加速光伏技术迭代升级。目前相关产品已实现批量供货,客户覆盖多家头部光伏企业。
10:20
2026年2月4日,博睿康技术(上海)股份有限公司在上海证监局完成上市辅导备案,拟首次公开发行股票。公司主营脑机接口技术研发与应用,辅导机构为中信证券。胥红来直接及间接合计控制公司23.3332%股份,为控股股东。此次辅导标志着该公司正式进入A股上市进程。
10:20
2月5日早盘,A股影视板块大幅上涨,横店影视连续6个交易日中5次涨停,浙文影业封板,幸福蓝海、博纳影业等跟涨。此次行情源于春节档影片密集定档:截至2月4日,灯塔专业版数据显示,共7部电影确认上映,其中6部定于2月29日(大年初一)集中放映。市场预期票房回暖带动影视公司业绩与情绪共振,资金快速流入相关标的。
10:20
2026年2月5日早盘,A股太空光伏概念板块大幅下挫,钧达股份、金辰股份双双跌停,连城数控、拉普拉斯等跟跌。事件发生于北京,涉及多家光伏设备及技术企业。中国光伏行业协会执行秘书长刘译阳2月4日公开表示,太空光伏技术仍处探索验证初期,技术路径尚不明确。市场受此预期影响快速回调,反映短期炒作退潮与理性回归。
10:20
2026年1月,海南离岛免税购物金额达45.3亿元,同比增长44.8%。同期购物人数56.0万人次、商品数量336.7万件,分别增长21.0%和14.0%。数据由海口海关统计,反映离岛免税新政深化及海南自贸港封关运作启动后的积极效应。其中,离境旅客消费1831.6万元,“即购即提”模式下岛内居民消费1438.9万元。
10:20
2026年2月5日,京东方A披露,其第8.6代AMOLED生产线已于2025年12月30日提前点亮,较原计划提前5个月。该产线位于成都,由京东方自主建设运营,聚焦中尺寸OLED面板。预计2026年下半年正式量产,主要面向笔记本电脑、平板等IT终端高端显示需求。此举将提升公司在高端显示领域的技术转化效率与客户响应能力,强化全球显示产业竞争力。
10:20
2026年2月4日,YouTube在其官方博客宣布AI自动配音功能正式向全球用户全面开放。该功能支持中文等27种语言,其中8种语言配备富有表现力的语音合成技术。用户可在播放器栏手动调整配音语言,创作者可选择关闭该功能。平台已部署智能过滤器识别不适宜配音内容,并正测试唇形同步技术以提升自然度。此举旨在提升多语种内容可及性与观看体验。
10:20
人工智能公司 Anthropic 近日宣布,其最新的 Claude 对话功能将不再包含广告。这一举措在 AI 行业引起了广泛关注,特别是在用户体验日益受到重视的当下,Claude 的推出无疑为用户带来了更为纯粹的对话体验。Claude 作为 Anthropic 的旗舰产品之一,旨在提供高效、智能且自然的对话服务。与其他一些平台不同,Claude 的无广告策略...
10:20
2月4日,微软确认发生全球性服务故障,导致发往美国服务器托管的Microsoft 365租户邮件中德语变音符号(如Ä、Ö、Ü)显示为问号。故障已持续超一周,根源在于系统对德语字符编码处理异常。用户可通过Outlook设置将首选编码改为UTF-8临时修复约90%的手动邮件问题,但第三方软件(如DocuWare)自动生成邮件仍无效。微软升级团队正紧急分析修复。