生数科技Vidu Q1上线多图参考生图功能 支持同时输入7张

生数科技今日重磅宣布,其前沿视频大模型 Vidu 的 Q1 参考生图功能已正式面向全球用户开放。这一里程碑式的发布旨在攻克多主体一致性技术难题,实现 AI 图像生成与视频创作的商业生产链闭环,引领 AI 多模态创作迈入全新纪元。Vidu Q1 参考生图的推出聚焦于五大核心亮点,为创作者提供前所未有的创作自由度与精准控制力。

生数科技Vidu Q1上线多图参考生图功能 支持同时输入7张插图1

首先,Vidu Q1 支持同时导入多达7张参考图,显著提升创作过程的可控性。用户可通过多图参考实现更精细化的创作指导,确保最终成果与预期高度契合。其次,Vidu Q1 在多主体、多场景的生成能力上实现重大突破,无论重复生成多少次,人物和主体的面貌特征始终保持高度一致,确保了惊人的还原度与真实感。此外,该功能支持单图+提示词的自由组合,用户只需提供一张参考图和一句创意提示,即可实现服装与背景的任意更换,创作自由度大幅提升。

生数科技表示,Vidu Q1 参考生图的多图参考时代标志着一致性技术的革命性突破。这一创新允许用户在复杂场景下灵活创作,极大增强了图像生成的真实感与适用性。相较于传统 AI 创作工具主要激发灵感的功能定位,Vidu Q1 将 AI 扩展为内容生产的主导者,用户只需轻点鼠标即可完成创作监督,显著降低了内容生产的门槛。

生数科技Vidu Q1上线多图参考生图功能 支持同时输入7张插图2

在具体应用层面,Vidu Q1 提供合成、替换和变换三种生成模式。用户可将不同人物合成于同一场景,或将已有照片的背景一键更换为任意场景,轻松生成高度个性化的内容。该工具在服装设计、广告宣传、创意营销等领域的应用潜力巨大,能够帮助设计师和电商团队快速产出高质量素材,大幅提升工作效率。

生数科技的此次创新,标志着 AI 生图工具在商业化应用上迈入新里程碑。公司希望通过这一先进技术,推动行业内更多企业和个人用户开启多模态创作的新纪元,真正实现 AI 技术为生产力赋能的目标,为数字创意产业注入全新活力。

最新快讯

2026年01月14日

15:26
声明:本文来自于微信公众号 娱乐独角兽,作者:Mia,授权站长之家转载发布。免费短剧平台仍在一路狂奔中。根据QuestMobile发布的2025年在线视频APP月活用户规模TOP10统计,短剧类APP的爆发式增长尤为引人瞩目,其中河马剧场以月活5158万位列第七,同比增长99.4%,已经超过了咪咕视频等平台。截至12月17日的1...
15:26
声明:本文来自于微信公众号 窄播,作者:麦琦,授权站长之家转载发布。作为全年最集中的家庭消费决策场景,年货节从来都是商家的必争之地。在国人心中,年货既是春节刚需,也承载着远超商品本身的情感重量。谁能提供更具共鸣感的年货体验,谁就有机会抢占春节消费的卡位,由此带来的口碑与复购还会延续到节后的经营中。但如今的消费市场早已进入供给极大...
15:25
近日,白鲸出海公众号发布了一篇题为《教“美国人”学英语,单款产品月入千万?》的文章,揭示了教美国人学英语产品的惊人收入。短短一周后,另一款面向美国市场的语言学习产品Vocabulary异军突起,成功跻身美国iOS下载总榜Top100,一度位列教育分榜第二,仅次于Duolingo。这款产品不仅下载量表现亮眼,流水数据也呈现强劲增长态势。据ST数据显示,Voca...
15:25
当地时间2026年1月13日,Python软件基金会(PSF)宣布与AI公司Anthropic达成为期两年的合作,获得150万美元资助。资金将用于支持PSF运营,重点提升Python生态系统的安全性,包括对CPython解释器和PyPI包索引的关键安全改进。此举旨在应对人工智能领域潜在的供应链安全风险,保障全球Python用户的安全使用环境。
15:25
2026年1月14日,清华大学、中国人民大学、面壁智能与OpenBMB社区联合推出4B参数智能体模型AgentCPM-Explore。该模型在GAIA、HLE等多类评测中达到同尺寸SOTA水平,性能超越部分8B级模型,并比肩30B级以上及闭源模型,在Xbench-DeepResearch中表现优于OpenAI-o3和Claude-4.5-Sonnet。模型...
15:25
2026年1月14日,中国汽车工业经济技术信息研究所发布《2025城市NOA汽车辅助驾驶研究报告》。报告显示,2025年1至11月,我国搭载城市NOA功能的乘用车累计销量达312.9万辆,占乘用车上险量的15.1%。其中,起售价30万元以下车型中,搭载城市NOA的销量占比超68.9%,主流品牌中有28.8%以上已布局该功能。报告建议加快出台自动驾驶分级管理...
15:25
2026年1月14日,谷歌推出专为医疗场景设计的轻量化AI模型MedGemma 1.5 4B及语音识别模型MedASR。该模型可本地部署,支持文本与CT、MRI等三维影像数据的分析推理,准确率较前代提升。MedASR在医疗对话转录中错误率仅为5.2%,优于同类产品,并可与MedGemma系列集成。谷歌已免费开源MedGemma系列,助力开发者构建专业化医疗...
15:25
2026年1月14日,据最新报道,苹果计划于今年春季推出升级版Siri,借助Gemini技术支持实现更智能的交互。新版Siri将支持问答、讲故事、情感支持及预订行程等任务,并可在备忘录中生成食谱等文档。今年6月WWDC大会将公布更多功能,如记忆对话历史和基于日历主动建议。苹果已对Gemini模型进行微调,确保回应风格符合品牌要求。该功能预计随iOS 26....
15:25
2026年1月,DB-Engines发布最新数据库流行度排名,复盘2025年技术趋势。Oracle全年表现强势,蝉联榜首;MySQL和Microsoft SQL Server分列二、三。PostgreSQL成为增长最快的开源关系型数据库,位列第四。MongoDB在非关系型数据库中保持领先,Snowflake和Databricks在云原生分析与AI场景中快速...
15:25
2026年1月14日,文远知行正式推出“文远出行”微信小程序,用户无需下载App即可在广州、北京等运营区域呼叫无人驾驶出租车。该小程序依托微信平台,降低使用门槛,提升用户体验便捷性,进一步推动公众对无人驾驶技术的认知与信任。此举标志着文远知行在智慧出行服务领域的布局迈入新阶段。
15:25
2026年1月14日,北京——在“京东年菜年货节”启动仪式上,京东生鲜与云浮文旅集团、河北淳珍科技有限公司签署合作协议。此次合作由京东生鲜联合北京市新发地、北京中视完美国际传媒共同参与,旨在推动政企协作与产销对接,助力河北淳珍科技实现单日销售额破千万目标。合作将依托京东平台资源,提升地方优质农产品的市场流通效率与品牌影响力,进一步拓展年货消费市场。
15:25
2026年1月14日,惠科在CES 2026上推出全球首款峰值亮度达1800nit的36.5英寸8K Mini LED显示器。该产品采用2000级分区背光技术,支持100% DCI-P3色域,提升对比度并抑制光晕,专为创意设计领域打造。同时,惠科还展示了笔记本用ACR防眩光技术、低反射率屏幕、类自然光护眼方案及宽刷新率显示技术,展现其在显示领域的多项创新进...