Mistral开源Devstral2:123B编码神器SWE-bench 72.2分 免费API CLI炸裂

欧洲AI独角兽Mistral AI近日重磅出击,正式推出新一代专为编码场景打造的开源模型家族Devstral2,为开发者带来革命性体验。该系列包含参数量高达123B的旗舰版Devstral2和轻量化的24B版Devstral Small2,并配套推出开源命令行工具Mistral Vibe CLI,实现端到端自动化编程。这一系列更新将开源编码Agent推向全新高度,Devstral2在权威基准SWE-bench Verified上取得72.2分的惊人成绩,逼近顶级闭源模型水平,同时API现阶段完全免费开放,堪称开发者不容错过的福音。

Devstral2家族登场,双尺寸模型全面覆盖企业级与本地化场景

Devstral2系列采用先进的密集Transformer架构,支持高达256K的超长上下文窗口,为复杂编码任务提供强大支持。具体来看:

– Devstral2(123B参数版):作为企业级主力模型,专精于工具调用、多文件编辑和复杂代码库探索。在SWE-bench Verified基准测试中达到72.2分的卓越表现,成为开源权重模型中的佼佼者。

– Devstral Small2(24B参数版):轻量高效的设计使其能够在消费级硬件上本地运行,同时支持图像输入功能,特别适用于隐私敏感或离线环境。

两大模型均采用开放许可模式,前者基于修改版MIT许可,后者则采用更宽松的Apache2.0许可,极大降低了开发者使用门槛。目前Devstral2已通过官方API免费开放,让开发者可以轻松上手体验。

SWE-bench Verified 72.2分,开源编码Agent新王者

Devstral2在真实GitHub问题解决基准SWE-bench Verified上取得72.2%的高分,显著超越多数开源竞品。值得注意的是,它仅用更少的参数量就实现了高效能输出,相比参数规模更大的闭源模型,成本效率高达7倍以上。这一特性特别适合大规模自动化编码任务,如代码重构、bug修复和多文件协同修改等场景。

Mistral Vibe CLI:终端里的全能编码Agent

Mistral开源Devstral2:123B编码神器SWE-bench 72.2分 免费API CLI炸裂插图1

由Devstral2驱动的开源CLI工具Mistral Vibe,支持开发者通过自然语言直接操作代码库,具体功能包括:

– 自动扫描项目文件结构和Git状态,提供精准上下文信息。

– 通过@引用文件、!执行shell命令、斜杠指令等方式实现自定义配置。

– 深度理解整个代码库,而不仅限于当前编辑文件。

– 配备持久对话历史、自动补全和可自定义主题,全面提升交互体验。

Mistral Vibe CLI可在终端独立运行,也可集成至IDE,真正实现”端到端自动化”,让开发者通过对话式指令完成探索、修改和执行全流程。

生态整合与开放策略,加速分布式智能发展

Mistral此次发布强调开放与实用,已与多家开源Agent平台深度合作,便于开发者快速接入。Devstral2系列不仅适用于企业级生产环境,还为个人开发者提供本地部署选项,推动AI编码工具的普惠化。Mistral AI的这次更新,进一步巩固了其在开源AI领域的领先地位。

AIbase分析师认为,Devstral2的高性价比和Vibe CLI的创新交互方式,或将加速”Vibe Coding”潮流,挑战闭源巨头的市场垄断。对这一系列更新感兴趣的开发者,可立即通过官方API或Hugging Face平台体验,更多实测对比敬请关注AIbase后续深度评测。

最新快讯

2025年12月12日

19:06
2025年12月12日,国家市场监督管理总局正式发布《汽车行业价格行为合规指南(征求意见稿)》,面向社会公开征求意见,旨在规范汽车生产及销售环节的价格行为,构建更加公平透明的市场环境。该指南全面覆盖了汽车行业价格管理的全流程,从定价机制到促销活动,再到售后服务收费,提出了系统性的合规要求,为行业健康发展提供明确指引。 指南的核心内容聚焦于价格行为的规范化管理...
19:06
2025年12月12日,工业和信息化部正式发布《元宇宙产业综合标准化体系建设指南(2026版)》征求意见稿,面向社会各界公开征集意见。这份重要文件明确将元宇宙定义为数字世界与物理世界深度融合的沉浸式互联空间,是推动数字经济与实体经济融合发展的关键形态。随着我国元宇宙产业的迅猛发展,相关关键技术持续融合创新,新产品与新应用在工业制造、医疗健康、智慧教育等领域的...
19:06
卡普空正式宣布,《怪物猎人:荒野》即将在12月16日推出备受期待的第四次免费更新,此次升级的核心目标在于全面提升全平台的稳定性和性能表现,为全球玩家带来更流畅的游戏体验。更新内容涵盖了CPU与GPU的深度优化,通过精准调校显著缩短了游戏处理时间,有效降低了系统负载,同时大幅减少了内存占用,从源头上解决了部分玩家遇到的卡顿问题。 在性能提升方面,官方进行了严格...
19:06
2025年12月12日,备受瞩目的冷加工果汁领军企业Buda Juice正式登陆纽约证券交易所,股票代码定为BUDA,标志着其在健康饮品赛道上的里程碑式突破。作为柑橘类饮品领域的创新者,Buda Juice专注于自有品牌与代工业务,凭借其独创的UltraraFreshTM Juice新品类,将冷加工柠檬基饮料推向市场,引领消费新风尚。公司以清洁标签为核心竞争...
19:06
2025年12月12日,德华安顾人寿保险有限公司传来重大喜讯,其15.45亿元人民币的增资方案已获得国家金融监督管理总局山东监管局的正式批准。此次增资行动彰显了安顾集团及其子公司对德华安顾未来发展的坚定信心,双方将共同出资10.0425亿元,占据公司65%的股权比例。与此同时,山东国投控股亦积极参与,出资5.4075亿元,持有公司35%的股份。这一战略投资不...
19:06
2025年12月12日,国家市场监督管理总局正式对外发布《广告引证内容执法指南(征求意见稿)》,向社会公开征求意见。这一全新指南的出台,标志着我国广告监管体系迎来重要升级,旨在进一步强化《广告法》的落地执行,为规范广告市场秩序提供更明确的操作依据。 该指南的核心目标在于有效遏制当前广告领域存在的突出问题。针对部分企业为追求眼球效应而进行的"行业第一"类虚假宣...
19:06
2025年12月12日,个性化数字礼品平台On Me成功斩获600万美元种子轮融资,这一里程碑事件标志着其在数字化礼品领域的创新探索再获资本市场的认可。本轮融资将专项用于强化其数字化礼品卡服务体系,同时加速推动个性化定制与可持续发展的深度融合。On Me通过革命性的平台模式,致力于将传统礼品卡升级为充满情感温度的个性化体验。用户可以在平台上基于自身兴趣爱好,...
19:06
ROBOT MALL合生汇快闪店于11月30日圆满落幕,为期31天的精彩活动吸引了超过30万游客莅临,日均客流稳定突破1万人次,展现出强大的市场号召力。活动现场精心展示的服务机器人、智能教育机器人等系列产品备受关注,成功促成600余笔销售订单,意向成交金额更是高达900余万元,充分印证了消费者对机器人产品的热烈追捧。 作为北京亦庄机器人公司倾力打造的重点运营...
19:06
2025年12月12日,生物制药公司BlossomHill Therapeutics成功完成总额高达8400万美元的B轮扩展融资,其现有投资者维梧资本等机构积极参投。此次融资进一步巩固了BlossomHill的资本实力,使其累计融资总额达到令人瞩目的2.57亿美元。 作为肿瘤与自身免疫疾病治疗领域的创新先锋,BlossomHill此次募集资金将重点投向两大核...
19:06
2025年12月12日,存储解决方案领军企业至誉正式发布重要公告,针对索尼Alpha 7 V相机用户反映的兼容性问题,特别为2024年1月之前出厂的Essential及Element系列CFexpress Type A存储卡提供全面的固件升级服务。这一举措旨在解决早期产品因固件版本较低,在A7M5相机上可能出现的功能异常或不兼容现象。经过严格的技术测试与验证...
19:06
2025年12月12日,本田汽车正式宣布一项具有里程碑意义的战略举措:将于2027财年率先在日本市场推出搭载尖端AI自动驾驶技术的混动及纯电车型。这一创新成果源于本田与美国领先AI初创企业Helm.ai的深度合作,双方共同研发了一套突破性的自动驾驶系统。该系统具备在复杂城市道路与广阔偏远地区稳定运行的能力,能够实现包括自动转向和加速在内的多项高级驾驶辅助功能...
19:06
2025年12月12日,隆盛科技正式宣布一项重大战略布局,计划斥资3.5亿元人民币,在无锡市滨湖区打造具身智能机器人创新中心项目。这一前瞻性项目将由隆盛科技及其控股子公司隆盛唯睿携手推进,其中公司主体将承担约2亿元人民币的土地购置与基础设施建设投资,而隆盛唯睿则负责约1.5亿元人民币的运营投入。 该项目将深度聚焦具身机器人在工业场景的应用研发与产业化进程...