AI赋能普通人圆导演梦

2025-09-25 12:01:48 互联网 32 次阅读

声明：本文源自微信公众号光子星球，作者郝鑫，经站长之家授权转载发布。当得知作品《小怪物》入围釜山电影节时，黎晓薇的第一反应是难以置信。这位几个月前才接触AI工具的年轻创作者，正代表了新一代AI影像创作者的幸运与突破。与黎晓薇同样闪耀的，还有徐文君、小文和MANYMANY团队，他们分别以《一目五先生》《权利童话》和《九宵》三部作品，在全球AI影像创作领域崭露头角。

“未来影像计划”由即梦AI联合火山引擎、上海电影及多位中韩电影界翘楚共同发起，旨在全球范围内甄选5部最能代表AI生成影像创作前沿的优秀作品，入选者及其主创将直接获得参加第30届釜山电影节的资格。9月22日，即梦AI、火山引擎与上海电影在釜山国际电影节InnoAsia平台举办“未来影像”AI电影国际峰会，入围创作者齐聚一堂，与中国导演梁鸣、韩国导演金泰勇、制片人李少伟、摄影指导夏永康、美术指导王竞等展开深度对话。

在这个时代，普通人微小的导演梦被意外照亮。黎晓薇们只是缩影，他们可能是你身边的同事、邻家宝妈，却凭借AI工具实现了影像创作的梦想。AI最大的意义在于平权化，让每个人都能讲述自己的故事。正如社会学家李银河在开篇致辞中所言：“这不仅是技术的进步，更是一次关于表达机会的重新布局。创作工具的普及，让更多原本被限制在影像叙事之外的人，有了讲述自己故事的可能性。”

他们与AI的故事充满灵感与坚持。“白雪公主为何这么蠢”，4岁儿子的一句无心之言，成为小文AI视频创作之路的起点。这位已经成为妈妈的小文发现，从小到大身边充斥着许多刻板印象：公主是美丽、单纯与善良的化身，不能反抗，只能等待白马王子拯救。这些耳熟能详的故事，早已不符合现下的价值观。为了打破这种叙事，小文在《权利童话》中塑造了一个截然相反的白雪公主形象——烈焰红唇、波浪卷发，目光锋利如刀，野心勃勃，酷似剧中的恶毒女二。

小文的团队由三人组成，除她之外，还有一位创作搭档和剪辑师。在没有技术背景的情况下，从抠脚本到一帧帧磨画面，前后推翻了四个版本，历经几次AI迭代，耗费半年时间才完成《权利童话》这部短片。

黎晓薇的内心深处也藏着一个无法磨灭的童心。《小怪物》的剧本原型是她在成年初期写的一个故事：一位孤独的都市女性，与她童年幻想中的小怪物重逢，并最终学会告别，这是一个关于童心深藏心底的治愈寓言。从初中起，黎晓薇就怀揣导演梦，却始终无法实现，直到遇见AI影视创作的机会。为了创作《小怪物》，她用了一年时间学习动画制作和电影视听语言，利用AI工具仅一个月就完成了视频创作。黎晓薇的团队只有两个人，一个人负责导演、编剧、分镜及生图生视频工作，另一个人负责剪辑和音效。

与AI磨合成为了家常便饭，黎晓薇的团队也逐渐积累起实战经验。AI生成视频的常见问题是“音画节奏错位”，一个镜头本该停留十几秒才够抒情，但AI生成内容自然断点却在十秒。黎晓薇的解决方案是，插入一段逐渐拉长的环境音，让观众主观感觉时间变慢，再额外生成一个慢速特写镜头作为过渡。

徐文君的《一目五先生》挑战了一个高难度的群像叙事。故事取材于中国志怪故事《子不语》，影片中一群人被要求每轮按标准投出一个人，在投票过程中出现了跟风、攻讦现象，最终只有良善之人得以存活。徐文君是一个业余影视爱好者，物流管理专业毕业后，反而根据兴趣爱好先后从事了影视策划、影视宣传、平面设计等工作，这也为后期创作打下了基础。从去年视频生成模型出来后，徐文君开始了AI视频创作，陆续通过参加比赛拿奖，获得了一些正向反馈。

创作一部AI片子需要多大规模的团队？目前似乎没有确定答案。《九宵》的创作团队偏向专业化，一部17分钟的片子背后是三位主创和二十个动画师、技术人员辅助。不过，徐文君向我们证明了，AI时代一个人就是一个团队，甚至是工作室。《一目五先生》这部短片从构思到成片，完全由她独立完成。据徐文君所说，该片制作总共花费了三个多月时间，前期花费了大量心血在剧本修改和风格测试上，“剧本几乎推翻了重写”。

即梦，让表达落地此次入选的片子各有亮点：《九宵》细腻的微表情流转和人物刻画，《权利童话》具有强烈色彩风格的画面和丝滑的转场，《一目五先生》群像和大场面动作戏，《小怪物》中的情感表达和密集对话。相较于上个阶段AI视频的“一眼假”和“漏洞百出”，现在的AI视频制作已经走向了精细化的方向，朝着观赏性和审美性发展。除去创作者自身的因素，其背后发展演进的一大动因便是技术。AI视频模型经历了从单帧生成到时序建模、从对抗博弈到概率扩散、从通用生成到多模态控制的关键性迭代。

据行业内的多名AI视频创作者反馈，他们在视频制作过程中普遍会遇到一致性、连贯性、逻辑性三大问题。看似简单，里面却是错综复杂。以一致性为例，就包含了角色一致性崩溃，表现为同一角色在不同镜头中出现“容貌漂移”；场景一致性瓦解，表现为光照突变、场景中的固定物体在镜头移动时位置偏移；风格一致性流失，表现为生成视频的整体风格波动，或局部元素风格割裂等。

入围选手在AI视频创作的不同环节遇到了上述问题，他们在与即梦AI的磨合过程中找到了解决之法。“小怪物”的角色贯穿了影片始终，是整个故事的灵魂所在。为了保持“小怪物”形象和角色定位的前后统一，黎晓薇做了大量的尝试。为“小怪物”设定关键表情，如开心、好奇、虚弱、期待，以及动态如笨拙奔跑、歪头、伸手等，然后使用即梦AI批量生成“标准件”，构建专属素材库。极大地保证了后续创作中角色表现的一致性。无论在何种场景下，“小怪物”的表情和动态都能保持统一的风格和特征，使角色形象更加鲜明和稳定。

黎晓薇认为，即梦AI对情绪指令的理解非常到位，能生成眼神光、柔软材质等高情感表现力的细节。加之“图生图”功能和固定参数，就能在不同场景中保持“小怪物”的核心特征高度统一。《一目五先生》是一个典型的中国故事，一般的AI工具在理解一些中式服饰、建筑等方面有所困难。徐文君测试后发现，即梦AI对这些中式概念的理解相对到位，而且对于语义理解比较准确，使得她能批量地把图片转化成视频，提升了视频创作的效率。徐文君很擅长去营造氛围，从远处的月亮推至房屋，从单人的独打镜头拉伸至整个群像场景，这里面都大量运用了即梦AI的运镜效果。这种自然流畅的运镜让观众能够毫无阻碍地跟随镜头进入不同的场景和氛围中，增强了观众的情感代入感，也强化了画面与画面之间的连贯性。

在《权利童话》中大量充斥着玫瑰花飘落、苹果腐烂、人物衰老这类考验逻辑性的画面。以人物衰老为例，即梦AI根据人体衰老的自然规律生成人物从年轻到衰老的过渡画面：先是头发逐渐变白，然后皮肤开始出现细纹，接着皱纹逐渐加深、增多，面部轮廓变得松弛，身体姿态也逐渐变得佝偻，整个过程都会体现不同年龄段的特征变化。

人人制作大片，不是梦现阶段，一款AI视频创作工具是否好用，取决于两个因素：产品能力和底层模型能力。据悉，此次活动要求参赛作品必须以AI工具为主要创作工具，且必须包括即梦AI。依托火山引擎Seedance1.0pro、Seedream4.0等字节跳动自研模型，创作者得以突破技术门槛，实现“创意即产出”。其中，Seedance1.0pro模型专为影像叙事优化，支持从分镜设计到动态运镜的全流程AI生成，能精准匹配电影级视觉美学。近期，即梦AI还上线了图像创作模型Seedream4.0，首次支持4K多模态生图，灵活支持文本、图像的组合输入，实现多图融合创作、参考生图、组合生图、图像编辑等核心能力。徐文君调侃，但凡4.0早上线几天，她就能省去了大量后期处理工作量。

当下好莱坞正处于对是否使用AI的激烈争论阶段。一方面，部分业内人士担忧AI的广泛应用会对传统影视行业造成巨大冲击，比如可能导致大量编剧、演员等从业者面临失业风险，破坏现有的创作生态和行业规则。另一方面，也有人看到了AI在提高创作效率、降低成本等方面的潜在优势。这种争论使得好莱坞在AI的应用探索上进展缓慢，各方陷入口水战，难以形成统一的方向和行动。反观中国，不少AI产品和影视公司，已经身体力行地在推动AI在影视产业的应用落地。

峰会现场，博纳影业集团影视制作副总经理曲吉小江介绍说，博纳已经将AI技术引入了剧本创意、前期筹备、拍前预演等多个环节，有效降低了试错风险，在开拍前做好可视化、可量化、可预判的工作。2023年底到2024年初，博纳正式成立了AIGC制作中心，并联合抖音、即梦AI推出了《三星堆:未来启示录》第一季AI科幻短剧集。该系列的第二季将打造为首部AI原生动画电影，深度应用火山引擎提供的Seendance、Seedream模型能力。此外，博纳影业还基于火山引擎多模态模型底座打造了“博卡短剧”平台，支持用户制作品质精良的短剧内容。依据博纳的实践经验，曲吉小江提出了未来影像创作的几个阶段目标。短期内，AI技术能够从随机生成变得更加精准可控，生成符合电影工业化标准的内容，并凭借低成本优势在预演、取景、拍摄、后期等环节取代传统流程；中期，影视公司可以利用AI工具生成可复用的数字资产，支撑更多项目快速推进。“比如，为《三星堆》设计的一个建筑，其他电影也可以复用，就像打造了一个虚拟的影视基地”。展望更远的未来，AI创作将更加普及，人人都能快速生成属于自己的影剧，既是主角也是导演。

AI作为工具以向上和向下两种方式延伸。向上纵深产业，追求降本增效。据行业内人士估测，目前整体AI素材的渗透率约在30%左右。在影视、短剧行业，AI的可用性尚未达到预期，大量集中在买量阶段。在拍摄和后期特效环节，AI渗透率还只有15%-20%。向下延伸，促进个人叙事的扁平化发展，进一步完善叙事结构。在过去，影视创作往往被专业机构和专业人士所垄断，个人创作者很难有机会表达自己的故事。而AI技术的普及使得创作门槛大大降低，每个人都可以利用AI工具轻松地进行影视创作。

峰会现场，火山方舟模型策略产品高级总监向凯介绍，火山引擎一直在保持技术领先和加速产业融合两方面持续发力，帮助电影从业者和有想法的普通人做出精彩的影视作品。“我们不是闭门造车，而是与博纳等专业伙伴深度共创，确保我们的技术能解决真实工业场景的痛点”，向凯说。即梦AI则在现场分享了最新功能数字人1.5的表现效果。该功能基于字节跳动自研模型omnihuman1.5，将视频模型与数字人模型有机融合，输入一张图、一段音频以及一段段提示词，就能让图中主体说话唱歌，并跟随提示词跑动。据悉，该功能将于9月底正式上线，今年以来，即梦AI已经相继上线了智能多帧、图片4.0等功能。借助这些功能，创作者能够一键生成自然流畅的长镜头、主体一致的多场景、能唱能跳的数字演员。即梦相关负责人在接受媒体采访时表示，未来即梦AI也将持续打磨产品能力，助力创作者更好地讲述属于自己的故事。

曾担任《卧虎藏龙》《英雄》等影片制片人的李少伟在峰会现场分享说：“工具在变，但我们讲述故事、讲述我们自己故事的渴望，是永恒的。”他认为，AI技术不是来取代电影人的，而是提供给电影人更多的创作自由。电影的未来不是人类对抗人工智能，而是两者的合作，电影人可以和AI一起以从未想象过的方式讲述故事。在李少伟看来，AI时代最优秀的电影创作者，能提出最关键的问题，拥有最好的审美品位，也能做出最明智的选择，“要学习工具，但更要精通叙事。”

AI打开了新的表达空间，也将创造更大的增量市场。随着越来越多的人能够参与到视频内容创作中来，视频的数量和种类将呈现爆炸式增长。这些丰富多样的内容将满足不同观众的需求，吸引更多的观众进入视频市场。在未来，人人制作大片，将不再是梦，每个人都是生活的导演。

AI赋能普通人圆导演梦

最新快讯

2025年11月16日

露营冰箱极限散热 RTX 5050超频破纪录登顶全球性能榜

全国铁路客运量创新高39.5亿人次便民服务持续升级

新疆首座储气库群今冬供气每日超500万方保障西北用气

刘金成：动力电池降本与极寒适应双突破

英特尔Arrow Lake Refresh系列处理器发布全系升级频率支持DDR5-7200

TikTok Shop东南亚双11GMV暴涨2.3倍创历史新高

全球首款实时摄像磁共振uMR Ultra亮相高交会突破医学成像

万元高端显卡模块化设计陷争议运输断裂报废维修难

MIT爱茉莉太平洋联手打造Skinsight电子皮肤监测肌肤健康

中大门携手泰国馆集团共建跨境O2O项目落地郑州

三星S26系列充电规格曝光标准版或超越iPhone 17

英伟达RTX 6090显卡2027年发布曝光