阿里云Qwen3-Omni开源 全模态AI模型引领跨媒体处理新纪元

阿里云重磅推出Qwen3-Omni模型,标志着全球首个原生端到端全模态AI技术的正式诞生,并且该突破性模型现已全面开源。Qwen3-Omni能够无缝处理文本、图像、音频和视频等多种输入类型,实现实时流式输出,无论是通过文本交互还是自然语音指令,都能提供闪电般的响应速度。这一创新模型在多个领域展现出卓越的跨模态性能,通过早期以文本为核心的预训练和混合多模态深度训练,成功构建了强大的多模态理解能力。特别是在音频和视频处理方面表现尤为突出,同时在文本和图像领域也始终保持行业领先水准。根据涵盖36项音频和视频的权威基准测试,Qwen3-Omni在22项测试中取得了当前最佳成绩,其自动语音识别和音频理解等核心功能已与行业标杆Gemini2.5Pro实现全面对标。

Qwen3-Omni支持119种文本语言和19种语音输入语言,并配备10种语音输出语言(包括英语、中文、法语、德语等主流语言),这一全球化的语言矩阵使其能够为全球用户提供无障碍的智能服务。其创新的架构设计融合了MoE(专家混合)系统与AuT预训练技术,不仅赋予模型强大的通用表征能力,更通过多码本设计实现了低延迟的实时音频视频交互,确保自然对话的流畅性。这一系列技术突破为用户带来了前所未有的跨模态智能体验。

除了Qwen3-Omni,阿里云还同步发布了Qwen3-TTS文本转语音模型,该模型提供17种丰富音色选择,在多项权威评估中全面超越竞品,尤其在语音稳定性和音色相似度方面表现惊艳。此外,新推出的Qwen-Image-Edit-2509工具专注于多图像编辑场景,通过创新的拼接编辑技术显著提升了图像处理的一致性和艺术效果,不仅支持单图像编辑,更能处理多图像的复杂编辑需求,为专业用户带来全新的创作可能。

阿里云Qwen3-Omni开源 全模态AI模型引领跨媒体处理新纪元插图1

GitHub:https://github.com/QwenLM/Qwen3-Omnihuggingface:https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe

划重点:
🌟 Qwen3-Omni是全球首个原生端到端全模态AI模型,实现文本、图像、音频和视频的统一智能处理
🌐 模型支持119种文本语言和19种语音输入,构建了覆盖全球的多语言服务网络
🖼️ 新发布的Qwen-Image-Edit-2509支持多图像编辑,大幅提升专业图像处理的一致性和创作自由度

最新快讯

2026年02月12日

14:17
微新创想:2026年2月11日,路虎在欧洲展开冬季测试,新款燃油版揽胜的路测照片被CarBuzz媒体意外曝光。此次改款是自2021年现款揽胜发布以来,燃油版本首次迎来重要的设计升级。新车整体轮廓依旧保持经典风格,但在细节上进行了显著调整。全新设计的大灯组更加锐利,前脸格栅与进气口也进行了优化,使整体视觉效果更具现代感。尾灯部分则采用了横向拉长的设计,增强了辨...
14:17
微新创想:2026年2月11日 宝马M5 Touring旅行版改款车型在欧洲开展冬季测试 新车由CarBuzz媒体抓拍证实 外观升级前脸垂直分割保险杠及优化尺寸的双肾格栅 并更新尾灯设计 为满足欧六E排放新规 欧规V8发动机功率下调约40马力 但通过强化电机输出 综合功率维持717马力不变 该车型预计年内发布
14:17
微新创想:2025年,万豪国际旗下福朋喜来登品牌在大中华区签约项目同比增长18%,成为集团签约数量最多的品牌。这一显著增长不仅体现了品牌在市场中的强大吸引力,也反映了消费者对高品质旅居体验的持续追求。 新签约项目覆盖北京国贸、深圳福田、广州长隆等一线城市核心商圈,以及成都、杭州、长沙等新一线重点城市。这些区域都是商业与旅游活动高度活跃的地方,福朋喜来登通过精...
14:17
微新创想:2月7日,安徽阜阳太和县的一场特别婚礼吸引了众多目光——31岁的农村小伙马先生与24岁的埃及姑娘马诺雅喜结连理,在安徽老家举办了一场充满传统韵味的中式婚礼。这段跨国恋情的故事,从社交平台开始,最终绽放出幸福的花朵。 据悉,马先生与马诺雅的相识颇具缘分。马先生原计划前往埃及考察,偶然间在社交平台上看到了马诺雅发布的中文学习帖,两人因此结缘。随后,马先...
14:17
微新创想:近日,贵州一名男子在春节返程途中遭遇了意想不到的趣事——他将两只活鸭作为年货放置在汽车后备箱,不料行车途中,两只鸭子竟“大打出手”,激烈争斗并相互啄咬。这一戏剧性场景被记录下来并上传至网络后,迅速引发网友热议。 据当事人描述,这两只鸭子本是为春节准备的特色年货,原本安静地待在后备箱中。然而,随着车辆行驶,不知何故,两只鸭子突然“情绪失控”,展开了一...
14:17
微新创想:小米Tag终于在欧洲多国正式上架,这款备受期待的智能追踪器自传出消息以来就引发了广泛关注。如今,它已在全球多个市场亮相,成为小米在智能穿戴和物联网领域的重要布局之一。 法国官网显示,小米Tag的单个产品售价为17.99欧元,约合人民币147.97元。四件套的售价为59.99欧元,约合人民币493.44元。价格方面,相比苹果AirTag,小米Tag更...
14:17
微新创想:2026年2月12日 字节跳动 Seed 团队正式发布新一代视频创作模型 Seedance2.0 该版本采用统一的多模态音视频联合生成架构 标志着 AI 视频生成从“单点突破”正式迈向“全能协作”的工业级应用阶段 核心技术跃迁 从“能画”到“懂物理”相比1.5版本 Seedance2.0在复杂交互与运动场景下的可用率大幅提升 模型通过出色的物理还原...
14:17
微新创想:国产大模型出海赛道再传重磅进展。据界面新闻援引第一财经报道,MiniMAX M2.5模型即将正式上线。这款备受期待的新一代大模型,目前已在海外版本的 MiniMAX Agent 产品中率先开启内测。 核心看点:国际化布局。MiniMAX选择首先在海外市场进行新模型的实战演练,显示出其加速全球化落地、角逐国际 AI 应用市场的雄心。这一策略不仅有助于...
13:14
微新创想:2026年2月12日,北京大学物理学院与电子学院联合团队宣布成功构建全球首个基于集成光量子芯片的大规模量子密钥分发网络——“未名量子芯网”。这一突破性成果标志着量子通信技术迈出了重要的一步。 该网络支持20个芯片用户并行通信,两两之间的通信距离可达370公里,成功突破了传统无中继通信的限制。这一能力不仅提升了量子通信的传输范围,也为构建更广泛的量子...
13:14
微新创想:2026年2月12日,加密借贷平台BlockFills宣布暂停用户提款及限制平台交易。该措施自2月5日起实施,至今仍在持续。暂停原因系比特币等主流加密资产价格近期剧烈波动,引发流动性压力。BlockFills未透露恢复时间表,仅表示正积极评估风险并优化资金管理。平台称此举旨在保障资产安全与运营稳定,受影响用户包括全球范围内的出借人及借款人。
13:14
微新创想:2026年2月12日,韩国个人信息保护委员会对路易威登、迪奥和蒂芙尼韩国公司分别处以213.85亿、122.396亿和24.192亿韩元罚款,合计逾360亿韩元,约合1.7亿元人民币。此次处罚源于三家企业在顾客信息管理方面存在严重漏洞,导致大规模个人信息泄露事件的发生。 路易威登涉及的个人信息泄露人数最多,达360万人。迪奥的泄露人数为195万人,...
13:14
微新创想:2026年2月12日,联想集团发布2025/26财年第三财季业绩报告。报告显示,截至2025年12月31日,联想集团的总营收达到1575亿元人民币,同比增长18%。这一成绩不仅展现了公司在全球市场的强劲竞争力,也标志着其在多个业务领域实现了稳步增长。 经调整后的净利润同比增长36%,进一步体现了联想集团在成本控制和盈利能力方面的显著提升。在三大核心...