8月30日,由微新创想倾力主办的2023AIGC技术应用大会在深圳盛大召开。本届大会以”元载万物·智启新界”为核心主题,旨在深度聚焦AIGC技术的创新应用,为行业同仁搭建一个探索AIGC产业落地实践的交流平台。会上,加拿大工程院外籍院士、HiDream.ai创始人兼CEO梅涛先生发表了题为《AIGC掀起未来创意无限可能》的主题演讲,其精彩观点如下:

1. 我们运用AI辅助动漫创作,并非意图取代传统电影工业,而是希望通过AI技术激发创作者的潜能与想象力,显著提升生产力,同时有效降低创作成本。

2. 预计在2025年至2026年间,AI辅助创作的图片和视频数量将超越人类自主创作的总量,这意味着整个数字创意领域将迎来AIGC的全面赋能。

3. 类似于自动驾驶技术分级,我们将AIGC的视觉创作能力划分为五个层级:纯人工编辑→创意创作工具→部分生产力创作工具→完全生产力创作工具→设计大师。目前行业仍处于从L2迈向L3的关键发展阶段,未来发展潜力巨大。

4. 在AIGC蓬勃发展的时代,我们期待与勇于创新的创业者携手,共同构建健康良性的产业生态,推动行业持续进步。

以下为演讲内容整理,由微新创想团队精心汇编:

非常荣幸参加微新创想精心组织的这场盛会,今天我将与各位探讨生成式人工智能在数字创意领域的无限可能及技术发展趋势。首先,我为大家呈现一部短片,这部作品是我们与北京电影学院教师团队联合创作,其中所有视频画面、运镜设计均由HiDream.ai的Pixeling创作工具独立完成,未使用任何第三方软件。通过人工智能生成一部完整影片的流程大致分为五个步骤:脚本创作→分镜设计→关键帧生成→镜头渲染→视频合成。相较于传统人工制作,借助AI工具完成影片创作的优势十分显著:一个人仅需一到两周即可完成;而若依靠人工团队完成同等作品,从选角、场景搭建到导演统筹等环节,至少需要一个月时间。

AIGC重塑创意世界

我们运用AI辅助动漫创作,并非意图取代电影工业,而是希望通过技术手段提升创作效率、降低制作成本、优化创作体验。今天我们重点探讨视觉AIGC话题,首先分享两个典型案例。第一个案例是去年登上美国著名时尚杂志封面的AIGC生成图片。在这张照片中,”在浩瀚宇宙中,一位女性宇航员在火星上,昂首阔步地走向广角镜头”这一完整场景被完美呈现,而人类艺术家绘制这样一幅作品,至少需要一两周时间。第二个案例是人工智能工具创作的油画作品,曾荣获柯罗拉多州州立美术大奖,尽管引发了不少争议。这两个案例都在传递一个明确信号:AI赋能艺术创作是大势所趋。

数据显示,文艺复兴时期人类创作了数十万幅绘画作品,但留存至今的不足十万幅。而如今,人类每天在社交平台上传的图片和视频数量已超过十亿。预计在2025年至2026年间,AI辅助创作的图片和视频数量将超越人类自主创作的总量,这意味着整个数字创意领域将迎来AIGC的全面赋能。以世界名画《戴珍珠耳环的少女》为例,17世纪荷兰画家约翰内斯·维米尔花费数月时间才完成这幅杰作。但在今天,AI可以将这位少女置身于厨房、咖啡店、沙滩等不同场景,极大丰富原作之外的画面想象力。

生成式人工智能艺术创作的发展现状及未来

类似于自动驾驶技术分级,我们将AIGC视觉创作能力分为五个层级:纯人工编辑→创意创作工具→部分生产力创作工具→完全生产力创作工具→设计大师。目前行业仍处于从L2迈向L3的关键发展阶段,未来发展潜力巨大。事实上,从创意素材产生到融入完整工作流,还有很长的探索之路要走。视觉生成领域要创造出令人惊艳的作品,仍面临诸多挑战。首先,在细节处理上,我们常遇到”恐怖谷效应”,特别是手指等部位的控制精度仍需提升。其次,如何设计有效的prompt以充分发挥大模型威力,是一个重要课题。第三,可控性问题包括IP保护、人物特征保持和SKU精准控制等。此外,视频制作中不同镜头间的连续性问题也是一大挑战。

那么,视觉AIGC未来的想象空间究竟有多大?有预测称,GPT-4的参数量已达1.2万亿个,而GPT-5可能更大。如果机器学习技术能在未来几年有效吸收和理解人类产生的高质量语言数据,这种增长可能将迎来新的发展天花板。目前视觉AIGC能力表现,无论是Imagen还是Stable Diffusion,模型参数基本在几十亿级别,仍处于GPT-2时代。我们致力于突破这一瓶颈,探索基于视觉的多模态底层大模型,让视觉AIGC从GPT-2时代跃迁至GPT-3时代。目前我们自研的基础模型数据量级已达60亿,相信很快将突破百亿模型目标。

Pixeling:掀起未来创意无限可能

HiDream的产品Pixeling工具基于自研的生成式视觉多模态基础模型开发,支持多种模态间的无缝转换,不仅支持文生图、文生视频、视频编辑,还将支持图片编辑、图生视频、图生3D等功能。以图片素材生产为例,涵盖品牌调性、版权图片、材质特写、模特换装、商品摄影等多种类型,目前提供16种不同图片风格选择。Pixeling还支持文本生成视频以及图片生成视频,包括影片中展示的宇航员在月球上行走的全景画面,还能实现转弯动作,这一技术难度较高。除了背景运动外,我们还实现了前景运动、人物运动和运镜功能。此外,我们的产品最近在学习镜头语言,包括镜头构图、运镜和剪辑技巧,旨在为从业者提供更高效、更节省时间的创作工具。

在电商领域,Pixeling能够根据用户提供的SKU图片,结合给定prompt和背景图生成与背景无缝衔接的商品图片;若用户未提供背景图,我们也可根据SKU图片结合多种prompt生成对应商品图,整个过程仅需几秒钟。产品问世不久,我们已参加香港中文大学发布的HPS v2文生图模型客观评测。该评测将包含绘画风格、概念艺术、动漫风格以及真实图片在内的3200个prompt分别放入不同文生图模型进行验证。Pixeling1.0版本的模型上线和训练仅用了约三个月时间,经过测试,目前在该数据集的文生图模型中排名第二。当然,Pixeling1.0版本的表现与顶尖竞品仍有差距,但它毕竟是个”三个月大的孩子”,我们有信心它未来会成长得更加完善。

我们十分认同其他嘉宾提出的AIGC”落地为王”观点,这也是我们今后持续努力的方向。在AIGC蓬勃发展的时代,我们期待与勇于创新的创业者携手,共同构建健康良性的产业生态,推动行业持续进步。再次感谢大家的聆听!

最新快讯

2026年02月11日

02:56
微新创想:2026年2月11日 美国科技巨头Alphabet在欧洲市场完成债券发售 累计募资110亿美元 此举使其2026年以来全球债券发行总额达300.1亿美元 发债地点为欧洲主要金融中心 发行主体为Alphabet Inc. 资金将用于一般公司用途 包括回购股票 偿还到期债务及营运资本补充 此次发债反映其在低利率环境下优化资本结构的战略意图 亦显示国际投...
01:51
微新创想:2026年2月11日 特斯拉宣布任命现任欧洲、中东和非洲区副总裁乔·沃德接任全球销售业务负责人 此次调整自即日起生效 公司表示此举旨在整合区域销售资源 强化全球市场协同与交付效率 乔·沃德自2019年起在特斯拉任职 历任英国 德国等多国销售高管 具备丰富的国际市场管理经验 公司强调此次任命不涉及组织架构大规模变动 原有区域销售团队保持稳定运行 以确...
00:13
微新创想:2026年2月10日,吉利银河全新插混SUV M7在意大利米兰正式亮相。该车为银河L7中期改款车型,车身加长60mm,风阻系数优化至0.27cd。采用“飞檐虎视”前脸、“旭日东升”尾灯等东方美学设计,彰显出中国智造的独特魅力。 搭载EM-i插混系统,该车型提供两种电池版本,纯电续航最高可达225km。满油满电综合续航达到1730km,大幅提升了用户...
00:13
微新创想:2026年2月,奥迪在中国市场启动入华以来规模最大的产品攻势,全年将推出8款全新及改款车型。此次布局覆盖燃油、插混、纯电三大动力形式,涵盖Q5L、A6L、A6L e-tron及纯电车型E7X等重点车型。 微新创想:行动旨在应对豪华车市场电动化转型趋势,延续油电并进策略,依托PPC燃油平台与PPE纯电平台,强化本土化智能座舱与驾驶辅助系统适配。 微新...
00:13
微新创想:据Insider Gaming编辑Tom Henderson在2月7日的播客中透露,R星可能在2026年8月初以“无预告突袭”的方式发布《GTA6》第三支预告片。这一举动不仅是为了吸引玩家关注,更旨在配合Take-Two当季的财报电话会议,通过预告片强化投资者对游戏未来的期待。 R星一直以来都以高调且富有创意的营销策略著称。此次选择在财报会议上发布...
00:13
微新创想:2026年2月10日 卡普空《生化危机5》Xbox Series版现身ESRB官网 标注含“内购”内容 暗示为完整重制版 2026年2月10日 卡普空宣布《生化危机5》Xbox Series版已出现在ESRB官网 并标注了“内购”内容 这一举动引发了玩家对游戏版本的猜测 认为可能是完整重制版 虽未列PS5版 但索尼定于2月13日举行State of...

2026年02月10日

23:12
微新创想:2026年2月10日,深圳第零智能科技股份有限公司正式向香港交易所递交上市申请。公司注册地及运营主体位于广东深圳,拟通过首次公开发行股票募集发展资金。本次IPO由民银资本独家保荐。 递表标志着该公司迈出港股上市关键一步,旨在拓展资本市场融资渠道,支持其在智能硬件与AI终端领域的研发及商业化进程。作为一家专注于智能硬件与AI终端技术的企业,第零智能近...
23:12
微新创想:2026年2月10日,摩根大通策略师Dubravko Lakos-Bujas团队指出,市场对AI短期颠覆软件行业的担忧不切实际,软件股正迎来反弹契机 该行认为,近期无差别抛售已导致板块估值处于历史低位,叠加持仓出清、悲观情绪过度及基本面稳健,风险平衡转向上行 建议投资者增配高质量、抗AI颠覆能力强的软件股 此次调整源于市场担忧AI工具冲击传统Saa...
23:12
微新创想:2026年2月10日,谷歌在美国正式推出升级版隐私搜索结果管理功能。这一更新旨在进一步增强用户对个人隐私的控制能力,让用户能够更方便地管理网络上的个人信息。 用户可以通过“关于你的搜索结果”页面,提交驾照、护照号、社安号(SSN)等敏感信息。系统会自动扫描互联网,查找包含这些信息的网页链接,并通知用户。用户可以申请移除对应的搜索结果,从而减少个人信...
22:38
微新创想:2026年2月10日,AOC爱攻正式发布24G4ZR与27G4ZR两款电竞显示器。这两款显示器分别采用了23.8英寸和27英寸的Fast IPS面板,为玩家带来更宽广的视野和更清晰的画质。它们的原生刷新率达到了240Hz,同时支持超频至260Hz,确保在高速游戏场景中流畅无拖影。 两款显示器的分辨率均为1920×1080,满足大多数玩家的日常使用和...
22:38
微新创想:2月6日,全国首单数字人民币智能合约在四川成都建筑行业工资发放场景成功应用。此次应用标志着数字人民币在实际场景中的深度落地,为农民工工资支付提供了全新的解决方案。 由中国人民银行数字货币研究所、四川省住房和城乡建设厅以及成都高新区管委会共同见证,一智科技与交通银行四川分行等机构携手推进,实现了对104名工人的精准薪酬发放,总金额超过100万元。所有...
22:08
微新创想:2025年春运期间,全国铁路运输迎来高峰。自2月2日春运正式启动至2月10日,全国铁路累计发送旅客已突破1亿人次。随着春节临近,返乡客流持续攀升,铁路部门不断加大运力投入以满足出行需求。 2月10日作为北方小年,预计全国铁路将发送旅客1395万人次。为应对客流高峰,铁路部门当天加开列车1363列,全力保障旅客出行。相比前一日,2月9日的发送量为14...