阿里开源通义万相Wan2.2:全球首款MoE架构视频生成模型震撼发布

阿里开源通义万相Wan2.2:全球首款MoE架构视频生成模型震撼发布插图1

阿里巴巴今晚震撼发布开源视频生成模型”通义万相Wan2.2″,这一里程碑式成果包含三款核心模型:文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-5B),标志着视频生成技术实现重大突破。业界首创MoE架构,计算效率提升50%通义万相2.2率先在视频生成扩散模型中引入MoE(Mixture of Experts)架构,创新性地解决了视频生成处理Token过长导致的计算资源消耗过大难题。其中文生视频和图生视频模型总参数量达27B,激活参数14B,均为业界首个采用MoE架构的视频生成模型。该架构由高噪声专家模型和低噪专家模型组成,分别负责视频的整体布局和细节完善。在同参数规模下,可节省约50%的计算资源消耗,同时在复杂运动生成、人物交互、美学表达等维度上实现显著提升。首创电影美学控制系统Wan2.2的一大亮点是首创的”电影美学控制系统”,在光影、色彩、构图、微表情等方面达到专业电影水平。用户通过输入”黄昏”、”柔光”、”边缘光”、”暖色调”、”中心构图”等关键词,模型可自动生成金色落日余晖的浪漫画面;而使用”冷色调”、”硬光”、”平衡图”、”低角度”的组合,则能生成接近科幻片的画面效果。消费级显卡即可部署的5B统一模型通义万相还开源了一款5B小尺寸的统一视频生成模型,单一模型同时支持文生视频和图生视频功能。该模型采用高压缩率3D VAE架构,时间与空间压缩比达到4×16×16,信息压缩率提升至64,均实现开源模型的最高水平。该模型仅需22G显存(单张消费级显卡)即可在数分钟内生成5秒高清视频,是目前24帧每秒、720P像素级生成速度最快的基础模型,大幅降低了AI视频生成的技术门槛。多渠道开放使用开发者可在GitHub、HuggingFace、魔搭社区下载模型和代码,企业可通过阿里云百炼调用模型API,普通用户还可在通义万相官网和通义APP直接体验。自今年2月以来,通义万相已连续开源文生视频、图生视频、首尾帧生视频和全能编辑等多款模型,在开源社区的下载量已超500万次,为AI视频生成技术的普及和发展做出重要贡献。开源地址:GitHub:https://github.com/Wan-Video/Wan2.2HuggingFace:https://huggingface.co/Wan-AI魔搭社区:https://modelscope.cn/organization/Wan-AI

阿里开源通义万相Wan2.2:全球首款MoE架构视频生成模型震撼发布插图2

阿里开源通义万相Wan2.2:全球首款MoE架构视频生成模型震撼发布插图3

最新快讯

2026年03月04日

08:08
微新创想:2026年3月4日,美国得克萨斯大学奥斯汀分校的研究团队在超薄二维磁性材料中,随温度降低依次观测到两种罕见的磁性状态。这一发现不仅填补了理论研究的空白,还为理解低维磁性系统提供了新的视角。 研究团队在原子级厚度的材料中进行了深入实验,成功揭示了在维度受限条件下磁序变化的新机制。这些磁性状态的出现与温度变化密切相关,表现出独特的物理特性,为后续的理论...
08:08
微新创想:2025年第四季度全球电视出货量达到6150万台,整体市场保持稳定态势。尽管整体表现平稳,但中国市场因受到补贴退坡以及前期消费透支的影响,电视出货量同比下降了25.3%。面对国内市场增速放缓的挑战,TCL与海信积极调整战略,将重点转向海外市场。在北美市场,这两家中国品牌实现了显著增长,合并市场份额提升至30.7%,比去年同期增长了2.1个百分点。 ...
08:08
微新创想:2026年3月3日,Anthropic宣布在其编程工具Claude Code中逐步推送全新语音模式。这一功能被内置于底层架构,使得拥有内测权限的用户能够在欢迎界面直接启用。用户只需长按空格键即可通过语音输入开发需求,松开按键后系统便会自动发送执行指令。这种方式大幅降低了传统文本输入的复杂性,提升了开发效率。 该语音功能的推出,标志着Claude C...
08:08
微新创想:3月4日 加拿大滑铁卢大学领衔的国际科研团队发布了一项新研究 提出了一种可增强大语言模型‘人类智慧’的训练方法 该方法聚焦于支持明智推理的新型模型架构 并配套构建了衡量AI智慧水平的评估基准 研究在《认知科学趋势》最新期刊发表 此举旨在突破当前AI在常识推理 价值权衡与情境适应等方面的局限 推动AI向更类人的认知能力演进
08:08
微新创想:3月4日,美国杰克逊实验室与麻省理工学院联合研发出新型微针贴片,可在皮肤表面无痛、无创采集人体关键免疫细胞。这项突破性技术无需抽血或活检,通过微米级可溶性针阵列穿透角质层,特异性捕获树突状细胞等免疫细胞。研究团队在临床前模型中验证了其有效性,为动态免疫监测和个性化疫苗响应评估提供了一种全新的工具。该成果发表于《自然·生物医学工程》,标志着免疫检测技...
08:08
微新创想:2026年3月4日8时 三峡南线船闸正式启动年度计划性停航检修 此次检修是自2003年三峡船闸通航以来的第9次计划性停航。检修工作将持续约35天 由长江三峡通航管理局统一组织与实施 检修工作主要集中在湖北省宜昌市三峡水利枢纽南线船闸区域 包括闸门 启闭机 电气系统以及助航设施等多个关键部分的全面维护和技术升级 通过此次检修 三峡南线船闸将全面提升通...
07:37
微新创想:3月11日,苹果将在美国旧金山举办的游戏开发者大会(GDC)上举行三场专题演讲,全面推动其游戏生态建设。首场演讲将聚焦苹果软硬件协同开发,深入探讨如何通过系统级优化提升游戏性能与用户体验。这一环节不仅展示了苹果在硬件与软件整合方面的技术实力,也为开发者提供了宝贵的参考和灵感。 次场演讲由CD Projekt Red带来,将详细解析《赛博朋克2077...
07:37
微新创想:河北维达康生物科技股份有限公司在2026年3月4日前于河北证监局完成IPO辅导备案 辅导机构为中信建投证券 公司成立于2021年 注册资本达到1.4亿元 注册地设在河北省保定市满城区于家庄镇 公司专注于膳食补充剂 天然色素 香料以及医药中间体等合成生物学产业化领域 作为国家认定的“专精特新”小巨人企业 公司在科技创新方面表现突出 牵头承担了河北省“...
07:37
微新创想:2026年3月3日晚,苹果公司正式发布全新Studio Display及Studio Display XDR显示器。两款产品专为Mac优化,普通版起售价11999元,XDR版24999元起。新显示器采用100%再生铝支架,标准版屏幕含80%再生玻璃,系苹果首次达成该环保指标;包装盒为可折叠全纤维设计,便于拆解回收。此举旨在降低运输与回收环节的环境负...
07:37
微新创想:2026年3月3日,谷歌正式推出Gemini 3.1 Flash-Lite模型,宣称为其速度最快、成本效益最高的Gemini 3系列轻量级模型。该模型即日起向开发者开放预览版,可通过Google AI Studio的Gemini API及企业级Vertex AI平台调用。这一发布标志着谷歌在大模型领域持续发力,进一步拓展其在AI应用中的影响力。 G...
07:36
微新创想:2026年3月3日晚,苹果正式推出Studio Display XDR专业显示器。这款27英寸的5K Retina XDR屏幕采用了先进的mini-LED背光技术,带来了卓越的显示效果。其HDR峰值亮度高达2000尼特,确保了在各种光照条件下都能呈现出细腻的色彩与高对比度。同时,该显示器支持120Hz自适应刷新率,为用户提供流畅的视觉体验。 微新创...
06:55
微新创想:3月4日,新闻集团与Meta Platforms宣布达成多年期人工智能内容授权协议。协议为期至少三年,自2026年起生效。该协议标志着两家公司在人工智能领域迈出了重要一步。 微新创想:根据协议内容,Meta将每年向新闻集团支付最高5000万美元。这笔费用将用于获取新闻集团旗下知名媒体如《华尔街日报》《泰晤士报》等的内容授权。这些内容将被用于AI模型...