
阿里巴巴 **Qwen(通义千问)**团队近日重磅推出两款创新性小规模多模态模型:Qwen3-VL-30B-A3B-Instruct与Qwen3-VL-30B-A3B-Thinking。这两个模型虽然参数量仅为30亿个活跃参数,却承载着非凡的性能突破。据团队详细介绍,这两个新版本模型的目标直指行业顶尖水平,致力于在关键性能指标上超越GPT-5-Mini和Claude4Sonnet等前沿模型。在数学推理、图像识别、文本理解、视频处理以及代理控制等核心基准测试中,这两个模型均展现出令人瞩目的卓越表现。
这一系列创新模型不仅限于上述两款,还包括专为加速推理优化的FP8版本,以及Qwen3-VL-235B-A22B模型的FP8变体。所有模型均已全面开放获取,用户和开发者可以通过HuggingFace、ModelScope和GitHub等主流平台免费下载使用,同时支持通过阿里云API进行便捷调用。值得一提的是,Qwen团队还特别提供了一个可直接使用的网页聊天界面,让用户能够即时体验模型的强大功能。

此次发布充分彰显了Qwen团队在推动高效高性能小模型普及化方面的坚定决心和持续创新。通过这些轻量级但功能强大的多模态模型,Qwen团队正致力于打破传统大模型的性能壁垒,为更多开发者和用户带来前所未有的智能体验。这一系列举措不仅展现了阿里巴巴在人工智能领域的深厚技术积累,也为整个行业树立了新的标杆。
