OpenAI于9月30日震撼发布视频生成模型Sora2及其配套社交应用Sora App,再次引爆全球人工智能行业。与前代相比,Sora2在物理模拟精度、画面逼真度及生成可控性上实现飞跃式提升,更实现了音频与人物对话的同步生成,让AI视频更逼真,视频生产更便捷。短短五天,Sora App下载量突破百万,首周iOS下载量达62.7万次,超越ChatGPT首周下载量,被赞为AI版的“TikTok”,有望成为下一个全球现象级应用。
在国内,Sora2同样掀起热潮。国庆期间,OpenAI CEO萨姆·奥特曼成为社交媒体流量担当,其开放个人肖像权引发创作狂潮,数字分身从商店偷GPU、与李小龙对打等病毒式传播短视频,加速了Sora2的出圈。
Sora2的发布也推动行业加速迭代。百度宣布旗下视频生成模型百度蒸汽机升级,支持AI长视频实时交互生成;谷歌发布Veo3.1与Veo3.1Fast,主打更丰富的音频与更强的叙事控制。创业团队同样全力以赴,多位AI视频创业者透露,他们正全力追赶Sora2的技术进度,甚至深夜才得空通话。
如今公众热度虽趋平稳,但AI行业内部的技术竞赛已全速展开。追赶Sora2的紧迫感弥漫,快手AI团队假期无休,国内AI视频创业团队纷纷进入“全员加班”状态,预测两个月内可能出现国产版Sora2类产品。好耶科技创始人吴杰茜证实这种紧迫氛围,其团队连轴工作测试拆解Sora2,既兴奋于技术突破,又焦虑于行业迭代速度。
谷歌于10月16日推出Veo3.1与Veo3.1Fast,被解读为正面迎战OpenAI。同日,OpenAI宣布Sora2两项升级:Pro用户可通过网页端使用“故事板”功能,全平台视频生成时长提升。普通用户可生成15秒视频,Pro用户网页端支持生成25秒内容,较此前显著延长。
Sora2的震撼来自三个技术突破:首先,物理世界拟真突破,能精准模拟水流、光影、重力与碰撞,极大提升人物动作连贯性与主体稳定性;其次,多模态融合,可直接生成同步音频,自动匹配环境声、动作音效与多语言对白,口音自然,口型精准;第三,理解“镜头语言”,将小说或剧本原文直接输入,生成的视频不仅画面契合,镜头运用、节奏把控等视听语言更达专业水准。
Sora2打破了AI视频创作瓶颈,用户只需文本指令,便能自动生成包含多镜头切换、剧情连贯推进的完整视频,初步具备导演的叙事逻辑与剪辑师的镜头调度能力。在丁一看来,Sora2已超越95%的市场AI视频软件,具备“智能体”雏形。
创作门槛坍塌,AI正在重写“专业”。但技术狂奔的另一面是行业秩序松动。当AI视频进入“后Sora时代”,曾依靠专业壁垒生存的人感到震动。丁一团队将Sora2深度嵌入工作流程,承担分镜头设计等前期工作,效率远超人工。等登等创作者也受到冲击,Sora2让分镜设计这一专业壁垒被抹平。

Sora2的出现引发对专业岗位的焦虑。丁一从分镜师到导演的经历让他明白,纯技术岗位空间缩小,AI生成内容仍需人把关,最终比拼的还是内容和创意。英伟达CEO黄仁勋曾警告,缺乏新创意的AI生产力提升将导致失业。
Sora2热度虽已降温,但作为创作工具的普及才刚开始。东莞证券研报认为,Sora2标志着AI视频生成与社交互动融合阶段,或迎来AI视频生成的ChatGPT时刻。回顾语言模型发展史,ChatGPT的出现是AI从实验室走向大众的转折点,Sora2也标志着视频生成领域从技术尝鲜迈向普遍应用。
但类似Sora2的产品成为全民表达工具仍需克服挑战。首先是版权迷雾。OpenAI初期采取的“选择退出”机制引发好莱坞等抵制,后转为“主动同意”模式,预示AI行业迈向付费许可与生态共建新阶段。一位好莱坞制片人评论:“未来影视公司可能更近于版权管理机构。”
其次是变现模式的拷问。目前Sora2主要使用场景仍以娱乐为主,难以支撑庞大成本,未来专业用户或高质量内容创作者的“付费模式”或将成为主流。如何在广告变现与用户体验间取得平衡,仍是所有AI视频厂商的共同考题。
这些现实疑问和战略调整,勾勒出AI视频行业从“野蛮生长”转向“理性发展”的轨迹。丁一认为,全球AI视频赛道正迈向更高维竞争阶段,各家模型厂商“卷”得更深,拼的将是创意与落地能力。
Sora2发布二十天后,世界或许并未立刻改变,但在每个AI视频创作者的电脑上,故事的生成方式已经悄然不同。
