
近日,备受瞩目的开源浏览器自动化项目BrowserUse正式推出其自主研发的首个大语言模型——BU-30B-A3B-Preview。这一创新成果迅速引发行业热议,被权威机构誉为”网页代理(Web Agent)领域的革命性标杆”。该模型凭借无与伦比的成本效益和实时响应速度,彻底打破了传统AI浏览器操作的门槛,为行业带来了颠覆性的变革。
模型架构创新:MoE设计实现”强大智能与高效运行”
BU-30B-A3B-Preview采用先进的混合专家(MoE)架构,总参数规模达到惊人的300亿,但在实际推理过程中仅激活30亿参数。这种创新设计使得模型在保持顶级智能水平的同时,资源消耗大幅降低,仅需单张消费级GPU即可实现流畅运行。该模型基于阿里云通义千问Qwen3-VL-30B-A3B-Instruct进行深度微调,专门针对浏览器自动化场景进行优化,支持多模态输入(视觉+文本),上下文长度高达32K tokens,能够轻松处理复杂的长网页内容。
核心能力:DOM理解与视觉推理的双重突破
BU-30B-A3B-Preview在浏览器操作任务中展现出卓越表现,具备全面的网页交互功能,包括精准元素定位、点击、滚动、表单填写等。其突出的DOM(文档对象模型)理解能力和视觉推理能力,让AI代理能够像人类一样”看懂”页面布局和截图,实现高度可靠的自动化执行。官方特别强调,该模型非常适合构建Web Agent应用场景,如自动化测试、数据采集、RPA流程等,已在内部基准测试中达到业内领先水平。

性能亮点:速度与成本的双重碾压
官方发布的对比数据显示,BU-30B-A3B-Preview在任务完成速度和经济性上远超主流商用模型:- 平均每步操作仅需1.2秒,整体任务完成时间大幅领先;- 成本效益惊人:每1美元计算资源可可靠完成约200个浏览器任务,是部分竞品模型的数十倍。由于模型体积相对较小(单GPU部署友好),开发者可轻松本地下载测试,无需高额云端费用。
开源意义:加速Web Agent生态发展
BU-30B-A3B-Preview已完全开源,模型权重上传至Hugging Face平台,任何开发者均可免费获取并集成到BrowserUse开源库中。这标志着浏览器自动化领域进入”高效开源时代”,有望推动更多创新应用落地。AIbase点评指出,BU-30B-A3B-Preview的出现完美解决了传统大模型在浏览器任务中”贵而慢”的痛点。对于需要大规模网页自动化的企业和开发者而言,这无疑是一款性价比极高的选择。未来,随着社区进一步优化,该模型有望成为Web Agent领域的标准配置。
感兴趣的读者可立即前往Hugging Face下载体验
地址:https://huggingface.co/browser-use/bu-30b-a3b-preview
