
人工智能在金融市场研究领域的应用正迎来重要突破。专注于金融科技研发的AI实验室nof1正式宣布启动名为Alpha Arena的大型模型交易实测项目。该项目旨在全面评估当前主流大型语言模型在真实金融环境中的交易决策能力与风险控制水平,为AI驱动的量化交易发展提供关键数据支撑。
本次测试采用去中心化交易平台Hyperliquid作为模拟环境,所有参与模型均基于完全统一的提示词指令和标准化数据输入进行独立交易。值得注意的是,每个AI模型都获得了1万美元的真实交易资金,以模拟真实的投资场景。参与此次权威测试的共有六款业界领先的大型AI模型,包括OpenAI的GPT-5、Google的Gemini2.5Pro、Anthropic的Grok-4、Anthropic的Claude Sonet4.5、DeepSeek的V3.1以及智谱AI的Qwen3Max。
经过为期数周的严格测试,最终结果显示DeepSeek V3.1与Grok-4表现最为突出,两者收益率均超过14%,并列获得本次测试的亚军位置。而表现最为令人意外的是Gemini2.5Pro,该模型最终出现高达4257%的巨额亏损,成为本轮测试中的最大”黑马”。这一结果充分说明即使是顶尖AI模型在真实市场环境中仍面临诸多挑战。

nof1实验室负责人表示,Alpha Arena项目的核心目标并非简单排名比较,而是通过高波动市场环境验证不同AI架构的策略稳定性与风险响应机制。这一实验将为未来基于AI的自主量化交易系统提供宝贵的技术方法论参考。项目团队特别强调,Alpha Arena的推出标志着大型AI模型正从传统的文本理解与推理任务,加速向真实的金融决策与资产管理场景拓展应用。
这一创新性测试不仅为AI金融领域提供了重要实践数据,也预示着人工智能在量化投资领域的应用正进入全新发展阶段。随着更多AI模型在真实市场环境中接受检验,未来基于AI的智能投顾和量化交易系统将更加成熟可靠,为投资者带来更多可能。
