阿里云开源Qwen3全模态AI系列模型支持多模态统一处理

2025-09-23 09:32:25 快讯 14 次阅读

阿里云近日震撼发布并正式开源其业界首创的原生端到端全模态大模型——Qwen3-Omni，这一突破性技术标志着多模态AI处理进入全新纪元。该模型实现了对文本、图像、音频及视频的统一高效处理，支持实时流式交互，为跨模态AI应用开辟了无限可能。在刚刚公布的36项音视频基准测试中，Qwen3-Omni更是以压倒性优势在22项测试中达到SOTA（State-of-the-Art）水平，其语音处理能力更是媲美业界顶尖的Gemini 2.5 Pro，展现出惊人的性能表现。值得注意的是，该模型全面支持119种文本语言，并具备强大的多语种语音输入输出能力，真正实现了全球化跨语言交互。

与此同时，阿里云还发布了革命性的Qwen3-TTS-Flash模型，在语音合成领域实现了速度与质量的完美平衡。该模型在保持业界领先合成质量的同时，将语音合成速度提升至全新高度，首包延迟低至惊人的97毫秒，远超主流竞品，为实时语音应用提供了无与伦比的性能保障。这一突破性技术将极大推动智能客服、在线教育等场景的智能化升级。

在图像处理方面，Qwen-Image-Edit-2509模型的推出同样令人瞩目。该模型通过创新算法显著提升了图像编辑的一致性，支持多图输入与ControlNet精细化控制，让图像编辑更加智能高效。无论是专业设计师还是普通用户，都能借助这一工具轻松实现复杂图像编辑需求，为AI创意设计领域注入了全新活力。

为了促进技术普惠，阿里云已将这一系列先进模型全面开源，并在Hugging Face、魔搭等主流AI平台上线，向全球开发者开放。这一举措不仅降低了AI技术的使用门槛，更为全球AI创新生态注入了强大动力。随着Qwen系列模型的广泛应用，我们有理由相信，AI技术将更快地渗透到各行各业，为人类社会带来更多智能化解决方案。

2026年02月12日

17:39

阿里云开源Qwen3全模态AI系列模型支持多模态统一处理

最新快讯

2026年02月12日

丽思卡尔顿Ilma号荣膺全球首艘五星级邮轮称号

Adyen推出个性化结账工具Personalize 助力商家提升支付效率

微软加大AI研发投入自研模型助力摆脱OpenAI依赖

国产生活模拟游戏《星砂岛》Steam抢先体验开启联名手柄限时优惠

Steam Machine发售延期价格或达700-1000美元未来市场表现待定

克莱斯勒中国召回22003辆牧马人因仪表软件问题存在排放隐患

美团升级问小团AI管家春节消费券助力本地生活智能化升级

DAR Global在阿曼AIDA推出首个尼克洛迪恩主题度假村

复星医药HLX15-SC多发性骨髓瘤临床试验获批研发进展

2026成渝智能体产业大会9月成都盛大启幕聚焦西部智能科技发展

从MOLLY到星星人，这个河南老板的IP“换代速度”比迪士尼还快

Google推出非洲语音数据集WAXAL 21种语言助力AI数据主权回归

阿里云开源Qwen3全模态AI系列模型 支持多模态统一处理

最新快讯

2026年02月12日

阿里云开源Qwen3全模态AI系列模型支持多模态统一处理