Qwen3.5-Omni震撼发布 全模态215项SOTA引领AI全感官新时代

微新创想:通义实验室昨晚正式发布全新多模态大模型 Qwen3.5-Omni。相比前代,该模型在理解力、交互感与任务执行力上实现了跨越式进化,标志着 AI 正在从“屏幕内的助手”真正走向“理解物理世界的智能体”。

核心突破:全模态与215项 SOTA
Qwen3.5-Omni 采用原生的 “全模态”架构,能够无缝处理文本、图像、音频及视频输入。在涵盖音视频分析、推理、对话及翻译的测试中,该模型斩获了 215项 SOTA(业界最佳) 战绩。特别是在通用音频理解与识别领域,其表现已全面超越 Gemini-3.1Pro,而视觉与文本能力则保持了与同尺寸 Qwen3.5模型持平的顶尖水准。

Qwen3.5-Omni震撼发布 全模态215项SOTA引领AI全感官新时代插图1

技术深剖:Hybrid-Attention MoE 架构
模型延续了经典的 Thinker-Talker 分工模式,并进行了底层重构。Thinker(理解中枢):升级为 Hybrid-Attention MoE,支持 256K 超长上下文。这使其能处理长达 10小时的音频 或 1小时的视频,并利用 TMRoPE 技术精准抓取长时序中的细粒度信息。Talker(表达中枢):引入全新的 ARIA 技术 与 RVQ 编码,替代了沉重的 DiT 运算。这不仅解决了语音输出中常见的漏字、数字误读问题,还赋予了模型强大的实时语音控制能力。

场景落地:从 Vibe Coding 到音色克隆
Qwen3.5-Omni 的进化直接转化为了多个突破性的应用场景。自然涌现的 Vibe Coding:模型在未经过专门训练的情况下,展现出了惊人的代码理解与生成能力,能根据视频画面逻辑直接生成 Python 代码或前端原型。拟人化实时交互:支持语义打断。它能分辨咳嗽等杂音与真正插话的区别,并允许用户通过指令调节语气(如“开心的”)与音量。细粒度视频拆解:可生成带时间戳的结构化 Caption,精准识别视频中的人物动作、背景音乐变化及镜头切换。个性化音色克隆:用户仅需上传一段录音,即可定制具备高自然度、支持113种语言的专属“数字分身”。

目前,Qwen3.5-Omni 已在阿里云百炼平台上线,提供 Plus、Flash、Light 三种尺寸,并同步开放了实时对话(Realtime)API 及魔搭社区 Demo。

最新快讯

2026年03月31日

11:27
微新创想:2026年3月31日,天宇股份发布公告,宣布拟以现金方式收购上海星可高纯溶剂有限公司87.8173%的股权,交易金额为3.34亿元。此次收购标志着天宇股份在拓展高端溶剂供应链方面迈出重要一步。 上海星可高纯溶剂有限公司是一家专注于有机溶剂废液再利用以及高纯试剂研发生产的科技型企业。其产品涵盖梯度试剂、色谱试剂、制备试剂等多个领域,广泛应用于制药、科...
11:27
微新创想:高德地图宣布完成无网导航功能全面升级 3月31日高德地图正式推出无网导航功能的全面升级版本 此次更新涵盖了驾车、公交、货车、摩托车、骑行以及步行等多种日常出行方式 用户现在即使在没有网络连接的情况下也能顺畅使用导航服务 升级内容主要围绕离线地图数据的优化以及本地路径规划算法的增强 无需依赖实时网络连接即可完成路线计算、语音导航和实时避障功能 该功能...
11:27
微新创想:3月30日,飞依诺科技股份有限公司首次公开发行股票申请获深圳证券交易所正式受理,拟在创业板上市。公司计划发行不超过2700万股,占发行后总股本不低于25%,保荐机构为华泰联合证券。 飞依诺是一家专注于医学超声影像研发的创新企业。公司深耕超声技术领域,掌握了超分辨显微成像、超快软波束合成平台及核心换能器等多项关键技术。这些核心技术的突破,使飞依诺在超...
11:27
微新创想:2026年3月31日起,DHL全球货运正式启用夏季航班时刻表。此次调整不仅优化了现有航线,还在亚欧航线上新增了上海至莱比锡、香港至列日的每周定期货运航班。这些新增航线将由波音777F货机执飞,进一步增强了DHL在该区域的运输能力。 微新创想:新增的货运航班将有助于提升亚欧之间的物流时效性与运输可靠性。随着这些航线的开通,DHL能够为客户提供更加高效...
11:27
微新创想:2026年3月30日,日本东海理化旗下品牌ZENAIM宣布推出一款全新的ARCADE CONTROLLER LEVERLESS无摇杆街机格斗手台。这款手台专为追求极致操作体验的玩家设计,采用了先进的键程可调磁轴开关,提供0.75mm的按键行程,用户可根据个人习惯在0.10–0.65mm之间以0.05mm的步进进行精确调节。这种高度可定制的按键响应方...
11:27
微新创想:realme真我手机自2026年4月1日起正式全面接入OPPO售后服务体系。这一举措标志着realme品牌与OPPO的深度融合,为用户带来更加便捷高效的服务体验。 全国近千家OPPO服务中心将面向所有真我用户开放。用户可享受面对面维修服务,提升沟通效率与服务质量。同时,可视化寄修功能也将全面上线,用户可以通过线上平台实时查看维修进度,增强服务透明度...
11:27
微新创想:3月30日晚,联想集团在京发布YOGA AI Mini(消费级)和Think AI Tiny(企业级)两款AI Agent原生智能终端。这两款产品标志着联想在人工智能领域迈出了重要一步,为用户提供了全新的智能交互体验。 产品搭载自研DingOS操作系统,支持自然语言交互与多模态指令执行。这意味着用户可以通过语音或文字与设备进行高效沟通,同时也能通过...
11:27
微新创想:2026年3月31日,美国可持续运动鞋品牌Allbirds宣布,将由American Exchange以约3900万美元收购其全部知识产权及部分资产与负债。交易尚待交割,最终价格将依据条款调整。 Allbirds总部位于美国,主打新西兰美利奴羊毛等环保材料,不使用皮革,以Wool Runners等线上热销产品著称。此次出售聚焦知识产权,不涉及实体运...
11:27
微新创想:2026年3月31日,三元股份发布公告,计划出资约1.04亿元,联合其关联方共青城如星投资合伙企业,共同收购必如食品部分股权并进行增资。通过此次交易,三元股份将持有必如食品42%的股权,成为其参股子公司,而共青城如星则持股26.96%。这一合作标志着三元股份在乳制品行业进一步拓展其影响力。 必如食品是一家专注于乳制品研发与生产的新兴品牌,近年来凭借...
11:27
微新创想:2026年3月,ACCA(特许公认会计师公会)正式启动第23届全国就业力X未来商业创想大赛(JHC2026) 大赛面向全国高校学生,聚焦“AI赋能行业解决方案”和“企业出海战略”两大方向 初赛采用北森AI面试官开展线上“AI双语面试+英文笔试”,评估商业理解、语言表达及专业基础 晋级团队将围绕真实商业案例进行全英文分析、展示与答辩 赛事旨在提升财会...
11:27
微新创想:3月30日,中兴通讯在业绩说明会上宣布,正与字节跳动等生态伙伴深化合作,共同研发落地新一代豆包AI手机。这一合作标志着中兴在人工智能领域迈出了重要一步,致力于打造更智能、更便捷的移动终端体验。 公司坚持AI智能体深度融入操作系统,升级系统级AI能力,融合自研CoClaw智能调度技术,实现跨应用、跨生态协同及复杂场景自动化任务执行。通过这一技术的整合...
11:21
微新创想:近日,开源 AI 项目 OpenClaw 的创始人在技术峰会上语出惊人,预言 2026 年将正式开启“通用 AI 代理”的爆发纪元。他认为 AI 正在从单纯的聊天机器人,进化为能够自主处理复杂工作流的智能数字员工。这种转变意味着 AI 不再仅仅是信息的搬运工,而是具备了跨平台操作和逻辑拆解能力的执行者。 微新创想:在 OpenClaw 的技术蓝图中...