8月30日,由微新创想倾力主办的2023AIGC技术应用大会在深圳盛大召开。本届大会以”元载万物·智启新界”为核心主题,旨在深度聚焦AIGC技术的创新应用,为行业同仁搭建一个探索AIGC产业落地实践的交流平台。会上,加拿大工程院外籍院士、HiDream.ai创始人兼CEO梅涛先生发表了题为《AIGC掀起未来创意无限可能》的主题演讲,其精彩观点如下:

1. 我们运用AI辅助动漫创作,并非意图取代传统电影工业,而是希望通过AI技术激发创作者的潜能与想象力,显著提升生产力,同时有效降低创作成本。

2. 预计在2025年至2026年间,AI辅助创作的图片和视频数量将超越人类自主创作的总量,这意味着整个数字创意领域将迎来AIGC的全面赋能。

3. 类似于自动驾驶技术分级,我们将AIGC的视觉创作能力划分为五个层级:纯人工编辑→创意创作工具→部分生产力创作工具→完全生产力创作工具→设计大师。目前行业仍处于从L2迈向L3的关键发展阶段,未来发展潜力巨大。

4. 在AIGC蓬勃发展的时代,我们期待与勇于创新的创业者携手,共同构建健康良性的产业生态,推动行业持续进步。

以下为演讲内容整理,由微新创想团队精心汇编:

非常荣幸参加微新创想精心组织的这场盛会,今天我将与各位探讨生成式人工智能在数字创意领域的无限可能及技术发展趋势。首先,我为大家呈现一部短片,这部作品是我们与北京电影学院教师团队联合创作,其中所有视频画面、运镜设计均由HiDream.ai的Pixeling创作工具独立完成,未使用任何第三方软件。通过人工智能生成一部完整影片的流程大致分为五个步骤:脚本创作→分镜设计→关键帧生成→镜头渲染→视频合成。相较于传统人工制作,借助AI工具完成影片创作的优势十分显著:一个人仅需一到两周即可完成;而若依靠人工团队完成同等作品,从选角、场景搭建到导演统筹等环节,至少需要一个月时间。

AIGC重塑创意世界

我们运用AI辅助动漫创作,并非意图取代电影工业,而是希望通过技术手段提升创作效率、降低制作成本、优化创作体验。今天我们重点探讨视觉AIGC话题,首先分享两个典型案例。第一个案例是去年登上美国著名时尚杂志封面的AIGC生成图片。在这张照片中,”在浩瀚宇宙中,一位女性宇航员在火星上,昂首阔步地走向广角镜头”这一完整场景被完美呈现,而人类艺术家绘制这样一幅作品,至少需要一两周时间。第二个案例是人工智能工具创作的油画作品,曾荣获柯罗拉多州州立美术大奖,尽管引发了不少争议。这两个案例都在传递一个明确信号:AI赋能艺术创作是大势所趋。

数据显示,文艺复兴时期人类创作了数十万幅绘画作品,但留存至今的不足十万幅。而如今,人类每天在社交平台上传的图片和视频数量已超过十亿。预计在2025年至2026年间,AI辅助创作的图片和视频数量将超越人类自主创作的总量,这意味着整个数字创意领域将迎来AIGC的全面赋能。以世界名画《戴珍珠耳环的少女》为例,17世纪荷兰画家约翰内斯·维米尔花费数月时间才完成这幅杰作。但在今天,AI可以将这位少女置身于厨房、咖啡店、沙滩等不同场景,极大丰富原作之外的画面想象力。

生成式人工智能艺术创作的发展现状及未来

类似于自动驾驶技术分级,我们将AIGC视觉创作能力分为五个层级:纯人工编辑→创意创作工具→部分生产力创作工具→完全生产力创作工具→设计大师。目前行业仍处于从L2迈向L3的关键发展阶段,未来发展潜力巨大。事实上,从创意素材产生到融入完整工作流,还有很长的探索之路要走。视觉生成领域要创造出令人惊艳的作品,仍面临诸多挑战。首先,在细节处理上,我们常遇到”恐怖谷效应”,特别是手指等部位的控制精度仍需提升。其次,如何设计有效的prompt以充分发挥大模型威力,是一个重要课题。第三,可控性问题包括IP保护、人物特征保持和SKU精准控制等。此外,视频制作中不同镜头间的连续性问题也是一大挑战。

那么,视觉AIGC未来的想象空间究竟有多大?有预测称,GPT-4的参数量已达1.2万亿个,而GPT-5可能更大。如果机器学习技术能在未来几年有效吸收和理解人类产生的高质量语言数据,这种增长可能将迎来新的发展天花板。目前视觉AIGC能力表现,无论是Imagen还是Stable Diffusion,模型参数基本在几十亿级别,仍处于GPT-2时代。我们致力于突破这一瓶颈,探索基于视觉的多模态底层大模型,让视觉AIGC从GPT-2时代跃迁至GPT-3时代。目前我们自研的基础模型数据量级已达60亿,相信很快将突破百亿模型目标。

Pixeling:掀起未来创意无限可能

HiDream的产品Pixeling工具基于自研的生成式视觉多模态基础模型开发,支持多种模态间的无缝转换,不仅支持文生图、文生视频、视频编辑,还将支持图片编辑、图生视频、图生3D等功能。以图片素材生产为例,涵盖品牌调性、版权图片、材质特写、模特换装、商品摄影等多种类型,目前提供16种不同图片风格选择。Pixeling还支持文本生成视频以及图片生成视频,包括影片中展示的宇航员在月球上行走的全景画面,还能实现转弯动作,这一技术难度较高。除了背景运动外,我们还实现了前景运动、人物运动和运镜功能。此外,我们的产品最近在学习镜头语言,包括镜头构图、运镜和剪辑技巧,旨在为从业者提供更高效、更节省时间的创作工具。

在电商领域,Pixeling能够根据用户提供的SKU图片,结合给定prompt和背景图生成与背景无缝衔接的商品图片;若用户未提供背景图,我们也可根据SKU图片结合多种prompt生成对应商品图,整个过程仅需几秒钟。产品问世不久,我们已参加香港中文大学发布的HPS v2文生图模型客观评测。该评测将包含绘画风格、概念艺术、动漫风格以及真实图片在内的3200个prompt分别放入不同文生图模型进行验证。Pixeling1.0版本的模型上线和训练仅用了约三个月时间,经过测试,目前在该数据集的文生图模型中排名第二。当然,Pixeling1.0版本的表现与顶尖竞品仍有差距,但它毕竟是个”三个月大的孩子”,我们有信心它未来会成长得更加完善。

我们十分认同其他嘉宾提出的AIGC”落地为王”观点,这也是我们今后持续努力的方向。在AIGC蓬勃发展的时代,我们期待与勇于创新的创业者携手,共同构建健康良性的产业生态,推动行业持续进步。再次感谢大家的聆听!

最新快讯

2025年10月28日

22:52
10月28日最新报道,武汉一位63岁的退休大爷近日因一项独特的锻炼方式引发广泛关注。他每天头顶重达56斤的石磨进行骑车锻炼,这种近乎超乎常人的健身方式不仅令人惊叹,更展现了他对健康生活的极致追求。 这位坚持锻炼二十余年的大爷表示,自2000年开启顶石磨运动以来,他的目标始终如一——通过极限挑战强身健体。通过查阅过往报道,我们了解到大爷的日常锻炼计划堪称"重量...
22:52
微新创想10月28日重磅消息,据行业深度爆料,即将问世的iPhone 18 Pro系列将迎来颠覆性的影像系统双重升级,为用户带来前所未有的拍摄体验。首先是主摄像头的革命性突破,传闻iPhone 18 Pro系列将首次搭载支持可变光圈的镜头模组,这标志着苹果在移动影像领域迈出了历史性的一步。据悉,可变光圈技术通过精密的物理结构调节镜头光圈大小,从而实现对传感器...
22:52
微新创想10月28日重磅报道,鸿蒙智行今日正式官宣达成百万台交付里程碑,这一里程碑的达成,不仅彰显了其强大的市场号召力,更标志着智能出行领域的新篇章。与此同时,问界旗舰SUV车型M9也传来捷报,达成交付超25万台的辉煌成就,这一数据足以证明其卓越的市场表现。值得注意的是,M9的交付量已占据整个联盟的四分之一,而距离其正式上市仅过去了短短21个月,月均交付量突...
22:52
2025年10月28日,备受瞩目的溜溜果园集团股份有限公司再度扬帆起航,向香港交易所递交了新一轮的上市申请。此次备受市场关注的申请,将由中信证券与国元国际携手担任联席保荐人,共同为溜溜果园的资本市场之路保驾护航。作为一家在果品深加工领域深耕多年的企业,溜溜果园此前已多次尝试叩开资本市场的大门,此次重启上市计划,不仅彰显了其坚定的资本化决心,更体现了公司对未来...
22:52
2024年12月31日,津投城开正式宣布一项重大资产重组计划,拟以象征性的1元价格将旗下房地产开发业务的相关资产及负债整体转让给城运发展。值得注意的是,此次交易的标的资产评估值竟为-23,896.08万元,意味着津投城开实际上是在以1元代价“出售”一笔价值近24亿元(负值)的亏损资产包。这一创新性交易的核心目的在于通过剥离长期拖累公司业绩的房地产板块,实现战...
22:52
2025年10月28日,资本市场传来多家上市公司的最新业务动态,多领域展现出强劲的发展势头。协创数据在互动平台披露,当前云算力服务需求持续旺盛,旗下服务器出租率已攀升至高位,显示出市场对高性能计算资源的迫切需求。与此同时,腾景科技也透露,半导体设备订单量持续饱满,业务增长势头良好。值得关注的是,天准科技旗下苏州矽行的明场检测设备已成功应用于存储芯片制造领域,...
22:52
2025年10月28日,OpenAI传来重大动态,其创始人Sam Altman将在公司即将到来的盈利化重组中,被排除在股权分配之外。这一决策背后,是公司为加速商业化进程而进行的股权结构调整,但令人意外的是,作为OpenAI灵魂人物和CEO的Altman并未获得任何新股份。尽管如此,他仍将保留CEO职位,继续掌舵公司的技术战略与未来发展。这一安排或体现了Ope...
22:52
2025年10月28日,中国领先的科技企业京东集团与行业知名工业品制造商德力西电气有限公司正式达成战略合作,双方共同签署了全面合作框架协议。此次合作聚焦于工业品供应链的数字化智能化升级,将充分发挥京东在云计算、大数据、人工智能等领域的先进技术优势,与德力西电气深厚的工业品生产制造经验及全球服务网络形成互补,通过构建协同高效的数字化供应链体系,为工业品行业带来...
22:52
佳能中国正式官宣,备受瞩目的“2025 佳能影像嘉年华”发布会将于11月6日盛大举行,届时将揭晓备受期待的全新EOS R6 III相机以及RF45mm F1.2 STM镜头的详细规格。据多方消息透露,这款备受期待的EOS R6 III将搭载高达3200万像素的CMOS传感器,并配备先进的6.5级防抖系统,能够为用户带来更加稳定流畅的拍摄体验。此外,该相机还支...
22:18
2025年10月28日,金石资源在官方互动平台上发布重要信息,详细阐述了其下属企业江山新材料公司近期产能调整的背景与原因。据公司公告,由于前期六氟磷酸锂市场价格持续低迷,市场整体需求疲软,江山新材料公司为应对这一不利局面,主动对部分生产线进行了全面的技术改造升级。这一举措虽然短期内导致公司锂电材料产量有所下降,但长远来看,将有效提升生产效率,优化成本控制体系...
22:18
2025年10月28日,备受瞩目的医药行业消息传来,金城医药正式公告其子公司金城泰尔的瑞巴派特片以及金城金素的注射用头孢唑肟钠成功进入第十一批全国药品集中采购的候选名单。此次采购活动由国家药品集中采购和使用联合采购办公室牵头组织,覆盖全国多个省份的药品采购需求,标志着金城医药在医药领域的又一重要突破。 作为国内医药行业的领军企业,金城医药此次中选不仅彰显了其...
22:18
2025年10月28日,申菱环境通过官方互动平台正式宣布,其自主研发的高性能环境调控设备已成功应用于紧凑型聚变能实验装置(BEST)项目。该项目作为全球可控核聚变研究领域的重大突破,旨在通过模拟真实聚变环境,推动清洁能源技术的商业化进程。申菱环境此次提供的设备,在极端温度、高辐射等严苛工况下仍能稳定运行,为实验装置的精准调控提供了可靠保障。 此次合作不仅彰显...