生数科技Vidu Q1″参考生”功能革新视频制作告别分镜 - 微新创想

2025-07-27 10:44:20 AI动态 57 次阅读

在备受瞩目的WAIC2025世界人工智能大会上，生数科技携创新力震撼发布Vidu Q1″参考生视频”功能，以算法革新彻底颠覆传统视频制作模式，为视频生成领域注入革命性突破。这一突破性技术彻底改变了传统视频制作的繁琐流程，将创作效率提升至全新高度。

告别分镜，一键直出视频成为Vidu Q1″参考生视频”最耀眼的亮点。用户只需上传人物、道具、场景等参考图像，并配合文字提示，即可直接生成完整视频素材。制作流程从传统的”分镜生成——视频生成——剪辑——成片”精简为”参考图——视频生成——剪辑——成片”，极大降低了创作门槛。以”诸葛亮与丘吉尔、拿破仑在会议室讨论”为例，只需输入提示词并上传三位历史人物的参考图和会议室场景图，系统即可智能生成三人同框对话的完整视频，为创意表达开辟无限可能。

该功能的核心优势在于破解了视频模型商业化的关键瓶颈——主体一致性问题。Vidu Q1参考生目前支持最多七个主体同时输入并保持高度一致，据生数科技透露，这一能力已能满足绝大多数创作场景需求。生数科技CEO骆怡航指出，这种通用创作方式将全面赋能广告、动漫、影视、文旅、教育等多元商业领域，实现从线下拍摄到线上AI创作的根本性转变。

生数科技Vidu Q1″参考生”功能革新视频制作告别分镜插图

在技术路径与产业导向方面，生数科技采用先进的U-ViT架构，结合扩散模型与Transformer技术，并在此基础上持续优化算法模块。Vidu模型内置强大的多模态理解能力，已成功应用于视频生成领域。骆怡航强调，团队始终以产业落地为核心导向，暂未将理解与生成一体化作为优先级，”行业客户更关注内容实际效果而非技术路线本身”。

7月25日，清华大学与生数科技联合发布具身智能模型Vidar，通过”视频大模型+具身智能”创新路径实现低成本、少样本泛化。骆怡航详细解释，视频模型与具身智能在本质上都处理时空信息，采用相同的输入决策逻辑。团队基于Vidu视频大模型，仅需少量机器人实操视频训练，即可将虚拟视频智能转化为对应机械臂动作，有效解决传统VLA路线面临的数据稀缺难题。目前，Vidu仍以提升视频生成能力为最高优先级，将具身智能作为持续探索方向，为该领域开拓潜在商业市场空间。

2026年03月04日

05:07

Meta成立新AI应用工程组织推动元宇宙技术落地

微新创想：2026年3月4日，Meta宣布成立Meta Applied AI工程组织，该组织隶属于Reality Labs部门。这一举措标志着Meta在推动人工智能技术实际应用方面迈出了重要一步，旨在加快AI技术在现实场景中的工程化落地。微新创想：新成立的组织将专注于AR/VR、智能助手以及沉浸式应用等多个关键领域。通过整合公司内部不同部门的AI研发资源，...

02:34

OpenAI发布GPT-5.3即时版全面开放ChatGPT用户免费体验

微新创想：2026年3月4日，OpenAI正式推出GPT-5.3即时版网站。该版本即日起面向所有ChatGPT用户免费开放使用。此前的GPT-5.2即时版仍保留在旧版模型选择器中，仅限付费用户访问，为期三个月，将于2026年6月3日终止服务。此次升级旨在提升响应速度与多模态理解能力，无需额外订阅即可体验最新模型。OpenAI未披露具体技术参数，但强调其在实...

02:34

ASM国际2025年四季度财报超预期多项指标亮眼

微新创想：2026年3月4日，荷兰半导体设备制造商ASM国际发布2025年第四季度财报。当季营收达6.98亿欧元，略高于市场预期的6.976亿欧元。这一成绩表明公司在全球半导体市场中继续保持强劲的盈利能力。订单额为8.028亿欧元，显著高于预期的7.726亿欧元。这显示出客户对ASM国际产品的持续高需求，尤其是在高端制造领域。订单积压也达到了12.5亿欧元...

01:25

阿波罗CEO预警私募信贷市场将迎结构性洗牌

微新创想：2026年3月4日，阿波罗全球管理CEO Marc Rowan警示私募信贷市场面临结构性洗牌。当前软件公司贷款违约率上升，叠加人工智能潜在冲击软件行业，引发投资者对1.8万亿美元私募信贷资产质量的担忧。商业发展公司近期遭遇赎回潮，高管持续回应质疑。此次压力源于底层资产集中度高、估值透明度低及利率环境变化等多重因素。行业正加速分化，风控能力薄弱机构...

00:40

中兴MWC26首发AI原生手机努比亚M153及情感陪伴AI产品iMoochi

微新创想：3月2日，中兴通讯在西班牙巴塞罗那举行的2026年世界移动通信大会（MWC26）上，正式发布了其首款AI原生手机努比亚M153以及豆包手机助手预览版。这一发布标志着中兴在人工智能领域的重要突破。努比亚M153搭载了骁龙8至尊版芯片，具备强大的计算能力，能够支持自然语言跨应用的多步任务执行，为用户带来更加智能和高效的使用体验。微新创想：与此同时，中...

00:40

KDE Plasma 6.6.2正式发布稳定性修复与体验优化全面升级

微新创想：2026年3月3日，KDE团队正式发布桌面环境Plasma 6.6.2。该版本作为Plasma 6.6系列的第二个错误修复更新，主要针对显示子系统、远程桌面组件KRdp以及应用商店Discover进行了稳定性提升和交互优化。此次更新解决了多个关键问题，包括DRM后端崩溃、镜像输出异常、KRdp中的线程安全与死锁问题，同时改善了Discover的悬停...

2026年03月03日

23:48

李开复回应Anthropic指控中国AI蒸馏技术合规性争议

微新创想：3月3日，零一万物CEO、创新工场董事长李开复在微博视频中回应了Anthropic指控中国公司蒸馏其AI模型一事。他明确表示模型蒸馏是AI领域常见的技术手段，并不违反任何规则。李开复认为Anthropic对此事的反应过于激烈，质疑其立场存在偏颇。李开复还提到Anthropic曾因盗版数百万册图书被美国作家公会起诉，最终需赔偿15亿美元。其中涉及的...

23:07

三星Galaxy S26全系8Bit色深澄清 1600万色实测无断层

微新创想：2026年3月3日，三星就Galaxy S26系列屏幕色深问题作出澄清：S26 Ultra、S26+及S26标准版均搭载8Bit色深显示屏，非此前沟通会所称的10Bit。这一澄清迅速引发了消费者的关注与讨论。三星中国官网参数亦显示S26 Ultra屏幕色彩为“1600万色”，印证8Bit规格。尽管官方确认屏幕为8Bit色深，但部分用户在实际使用中...

23:07

郑州打造世界培育钻石之都加速产业价值跃升

微新创想：3月3日，河南省委常委、郑州市委书记安伟在郑州主持召开专题会议，研究培育钻石产业链发展。会议强调要全面落实省委、省政府的部署，聚焦延链补链强链，以开放合作和加工带动为路径，强化生态培育与科技支撑，推动产业由产能高地向价值高地跃升。微新创想：此次会议明确指出，郑州将致力于打造成为‘世界培育钻石之都’。这一目标不仅体现了对本地产业发展的高度重视，也展...

23:07

12306回应旅客躺座位下睡觉危险行为不建议

12306回应旅客躺座位下睡觉危险行为不建议

微新创想近日，在西安开往广州东的K731次列车上，发生了一件让乘客张先生意外的事情。一名大爷在车厢内站久了，因身体疲惫而蜷缩在座位下方睡着了。张先生回忆，当时车厢内十分拥挤，他无意中动了下脚，碰到了大爷的头，这才发现脚边躺着一个人，顿时感到惊讶和不知所措。微新创想针对这一事件，12306客服作出了回应。客服表示，持有无座票的旅客可以在无人座位上短暂休息...

23:07

蔚来ES9技术发布会4月9日开启 11年创新成果全面亮相

蔚来ES9技术发布会4月9日开启 11年创新成果全面亮相

微新创想：蔚来创始人、董事长、CEO李斌在元宵节直播中宣布，蔚来ES9技术发布会将于4月9日正式举行。李斌表示，这是今年市场上技术最先进的SUV，更是蔚来11年技术创新的集大成之作。据介绍，ES9搭载了首个获得国家量产许可的线控转向系统天行线控转向。这一技术的引入，标志着蔚来在智能驾驶领域迈出了重要一步。同时，新车还配备了全球首个集成式液压全主动悬架系统天...

23:07

巨型汤圆走红网络网友误认馒头古称与寓意揭秘

巨型汤圆走红网络网友误认馒头古称与寓意揭秘

微新创想：3月3日消息元宵佳节吃汤圆是各家各户必不可少的传统习俗最近一段关于巨型汤圆的视频走红网络博主乡村妈妈展示了自家制作的特大号汤圆其个头硕大如馒头普通瓷碗只能勉强装下一个许多网友在看到视频后纷纷留言表示第一眼看过去还以为是刚出锅的大馒头完全没想到这竟然是汤圆大家调侃道这么扎实的汤圆吃上一个恐怕得直接撑上一整天翻阅历史资料可以发现汤圆在古代有着非常丰...