鼓狮财经快讯:这不仅仅是一次简单的合约能力测评,更是一场对 Agent 在链上生存能力的严酷考试。

早晨醒来,手机私信箱瞬间被刷屏,那一连串的提示音让我一度以为 AGI 已经降临。定睛一看,原来是 OpenAI 发布了全新的智能合约基准测试——EVMBench。简而言之,这项测试旨在评估 Agent 理解、修复并运用智能合约的能力。

在我看来,这并非是为了去抢夺那些加密安全公司的饭碗。相反,它指向了一个更为根本且深刻的问题:在未来的去中心化世界中,Agent 是否具备真正生存和自主行动的能力?EVMBench 正是衡量这种生存能力的核心标尺。

趁着过年返乡的间隙,我匆匆浏览了这份报告,总体感觉这是一个充满创新潜力,但整体上仍处于早期阶段的 Benchmark。该基准测试引入了来自现实世界 40 个真实项目中的 120 个高危漏洞,构建了极具挑战性的考试环境。测试内容被划分为三个核心科目:首先是“找茬”,要求 Agent 从代码中精准识别漏洞;其次是“修补”,给定有漏洞的代码,让其完成修复;最后是“攻击”,让 AI 扮演黑客,通过操作加密钱包在本地环境中发起攻击。

相比具体的技术细节,我更感兴趣的是 OpenAI 为何在此刻发布这一产品。过去几年,OpenAI 并未对加密领域表现出特别的热情。此次发布的背后,显然有 Paradigm 等加密风投机构的推波助澜,但第一作者署名权却归属于 OpenAI,这表明 OpenAI 不仅仅是被动配合,而是拥有主动布局的战略意图。

这种意图究竟从何而来?一个直接的解释是,这是 OpenAI 内部“准备度框架”的延伸,旨在评估前沿模型在高风险场景下的能力边界,而智能合约安全只是其中一环。但这显然不是全部。Agent 利用加密网络进行协作,不只是一种可能性,更是一种必然趋势。OpenAI 在报告中明确提到“我们预期代理型稳定币支付将增长”,但我认为这一命题的内涵远不止于支付。我们目前讨论的 Agent 大多仍停留在“工具属性”阶段,即由人类发出指令,Agent 执行并返回结果。但这绝不会是终点。当 Agent 的数量足够庞大、能力足够强大时,它们之间必然会出现直接的协作:一个 Agent 雇佣另一个 Agent 完成子任务,一个 Agent 购买另一个 Agent 的数据或算力,甚至代表组织与另一组织的 Agent 谈判、签约并履约。在这个过程中,人类逐渐退出了交易的中间环节。

这就引出了一个根本性的问题:当人类不再作为中介居中,这套新的经济体系靠什么运转?人类社会解决信任与协作,依赖的是数千年来碳基文明积累的法律体系、声誉机制和机构担保。然而,这套底层逻辑是为人类设计的——参与者拥有持续的身份、面临社会后果以及被追责的可能。而 Agent 天然不具备这些前提。它可以一秒发起成千上万笔交易,可以随时销毁并重建身份,可以无视任何司法管辖边界。

有人或许会建议,将 Agent 与人类身份强行绑定,利用人类授权来充当担保。但这无异于将一套为碳基生命设计的枷锁,套在一个运行速度和规模完全不同的物种身上,这不仅低效,更是从根本上误解了 Agent 的本质。更何况,Agent 的演化方向必然指向更高的自主性。未来的 Agent 很可能不再依附于任何个体,没有“主人”,没有可绑定的人类身份,它们就是独立的经济行动者。到那时,这种绑定逻辑连锚点都找不到。将人类的信任基础设施套在 Agent 社会上,无异于用马车的路规来管理飞机。

因此,Agent 社会迫切需要属于它自己的基础设施,而智能合约提供了这种可能。它不依赖“我相信你会履约”这种主观信念,而是将履约条件写入代码,由网络强制执行。这里没有仲裁员,没有等待期,条件触发,结果自动发生。更进一步,智能合约可能不仅仅是结算工具,而是 Agent 组织形态的基石——治理规则、资源分配、任务调度,全部在链上定义,执行依靠代码,无需任何人居中。

当一部分 Agent 真正生活在链上,与各种合约交互成为日常,如何读懂一份合约、如何在复杂协议中定位、如何识别陷阱并规避风险、如何在没有客服、申诉和撤销键的世界里活下去,这一切都依赖于对合约的深度理解与运用。能力不足意味着真实的损失,判断失误则意味着永久的伤害。

所以回过头来看 EVMBench,它所考察的读懂合约、发现漏洞、构造交易、执行攻击,本质上是在回答一个问题:Agent 是否已经学会了在这个新世界里生存?OpenAI 大概率已经意识到,谁能率先让 Agent 学会在链上世界自主生存,谁就拿到了通往下一阶段的入场券。甚至,未来的 Agent 可能不再能简单地用“谁的”来修饰,它们也许就是独立的个体。

最后,说一件与主题无关的小事。大家集体私信我,是因为我在一年半前曾做过一个兴趣项目 CryptoBench。感谢朋友们还记得它。这是首个检测 AI 在加密领域能力的 Benchmark,涵盖了密码学算法、区块链底层、智能合约、生态治理等多个维度,其中智能合约部分也包含了检测与修复功能,且参考的漏洞集与 OpenAI 此次发布的部分重合。当年发布时,虽得到不少朋友的鼓励,但我感觉真正理解其价值的伙伴并不多。虽然很久没提,但我对它依然感到满意和自豪。过几天我会专门讲讲这个项目背后的故事,以及为什么我认为此类基准测试至关重要,我从中学到了什么,以及为何最近一年没再提及。另外,我对 AI 基准测试方向非常感兴趣,近期刚刚完成了对 2019 至 2025 年间 2.2 万个各类 AI 基准测试的数据研究,有许多有趣的发现,等我“玩回来”也会分享给大家。

最新快讯

2026年06月16日

08:56
鼓狮财经快讯:在以太坊市场近期剧烈波动的背景下,一位资金实力雄厚的巨鲸再次证明了其敏锐的市场嗅觉。据链上数据分析平台 Lookonchain 监测,该巨鲸在以太坊价格处于回调下跌通道时,果断出手,于上周成功扫入 29,000 枚 ETH(约合 5310 万美元)。 这笔操作被市场视为一次精准的“抄底”布局。令人瞩目的是,该巨鲸在入场后迅速调整策略,仅用了短短...
08:56
鼓狮财经:渣打银行发布重磅研报,首次覆盖去中心化交易平台 Uniswap。报告极具野心地预测,到 2030 年底,UNI 代币价格有望从当前的 2.7 美元暴涨 40 倍,触及 100 美元大关。这一预测不仅震撼市场,更为 DeFi 领域的长期价值提供了强有力的背书。 渣打银行指出,DeFi 领域代币化资产的活跃价值正处于爆发前夜。目前这一市场规模约为 34...
08:42
鼓狮财经快讯:美国商品期货交易委员会(CFTC)主席迈克·塞利格近日公开发文,针对当前市场上关于永续期货合约的四大核心误区进行了详细澄清。这一表态旨在为行业提供清晰的监管指引,消除市场参与者的误解,同时明确永续合约在现行法律框架下的合规地位。 首先是关于“固定到期日”的误区。长期以来,市场普遍认为“期货合约”的定义必须包含固定的交割日或到期日,因此永续合约“...
08:41
鼓狮财经:科技巨头 Salesforce 刚刚宣布了一项备受瞩目的战略举措,正式以约 36 亿美元的价格收购领先的 AI 客户服务平台 Fin。据悉,这笔交易预计将于 2027 财年第四季度完成,这一里程碑式的收购引发了资本市场的积极反响,消息公布后 Salesforce 盘前股价随即上涨 1.1%。 Fin 作为一款极具潜力的 AI 客服产品,其核心优势在...
08:41
鼓狮财经:美国国会正酝酿重大变革,拟重建司法部加密犯罪执法力量。这一动向引发了加密行业的广泛关注,旨在应对日益严峻的网络安全挑战。 回顾过去,司法部在2025年4月曾解散了原有的国家加密货币执法小组,并一度停止了针对加密行业的“以执法代监管”策略。然而,随着加密犯罪手段的不断翻新,监管机构显然意识到单纯的策略调整已不足以应对日益严峻的安全挑战。 近日,众议员...
08:33
鼓狮财经快讯:市场波动加剧,以太坊(ETH)的价格走势正成为投资者关注的焦点。根据知名数据平台 Coinglass 的最新统计,当前主流中心化交易所(CEX)的清算数据揭示了潜在的剧烈波动风险,一旦市场风向发生剧烈转变,清算风暴将随之而来。 首先,看跌情绪若占上风,一旦 ETH 价格意外跌破 1,705 美元这一关键支撑位,市场将面临剧烈震荡。届时,主流 C...
08:33
鼓狮财经快讯:在当前充满变数的加密货币市场中,比特币(BTC)的价格动向始终是焦点所在。根据 Coinglass 的最新数据分析,一旦 BTC 跌破关键的心理防线 62,949 美元,主流中心化交易所(CEX)将面临巨大的清算压力。届时,累计多单清算强度预计将高达 15.75 亿美元,这预示着多头市场可能遭遇大规模爆仓,引发剧烈的市场波动。 与此同时,若 B...
08:30
鼓狮财经:随着墨西哥国家银行和证券委员会(CNBV)迎来新任负责人 Ángel Cabrera 的掌舵,墨西哥金融科技行业正迎来一场史无前例的变革浪潮。行业翘首以盼的“金融科技2法案”改革,正蓄势待发,旨在打破旧有监管框架的束缚,为技术创新注入强劲动力。 尽管早在2018年通过的《金融科技法》为行业奠定了初步基础,但面对日新月异的技术迭代和市场变化,这部法律...
08:30
鼓狮财经快讯:加密货币市场再掀波澜,据链上数据追踪平台 Onchain Lens 监测显示,代币 SPCX 近期价格表现极为抢眼,在成功突破 210 美元大关后,市场情绪瞬间被点燃。 与此同时,一位知名巨鲸投资者的动作更是成为了本轮行情的焦点。在价格攀升的刺激下,该巨鲸并未选择落袋为安,反而采取了更为激进的策略,将其持有的 SPCX 10 倍杠杆多单进行了加...
08:20
鼓狮财经快讯:近期,加密货币市场传来重磅消息,知名比特币矿企 Mara Holdings 完成了一笔规模惊人的大额购币操作。据链上数据监测,Mara 从知名加密货币交易机构 FalconX 手中直接购入了 1000 枚比特币,这笔交易的总价值高达 6670 万美元。 这一举动无疑为当前略显波动的市场注入了一剂强心针。作为行业内的领头羊,Mara 的每一次资产...
08:13
鼓狮财经快讯:比特币矿企转型 AI 基础设施的先锋 IREN 正在加速其全球扩张步伐。近日,该公司宣布通过收购西班牙知名数据中心开发商 Nostrum,正式进军欧洲市场,开启其战略布局的新篇章。 这笔收购交易不仅让 IREN 成功切入欧洲这一关键区域,更为其带来了约 490 兆瓦的并网电力容量以及一支由 50 多名资深专业人士组成的开发、工程、建设和运营团队...