声明:本文来自于微信公众号 白鲸出海,作者:张凯然,授权站长之家转载发布。
2026年元旦前后,多款 AI 视频生成 App 登上各国榜单,而这波集体增长的背后是一类题材的爆发,宠物/婴儿跳舞视频。

这次社媒风潮的起点是12月21日,一些博主开始在社媒上分享宠物/婴儿跳舞视频,截至目前,上图婴儿舞蹈的视频已经获得260万点赞,另有多条12月下旬发布的宠物舞蹈视频点赞量在1万-10万之间。
嗅到流量气息,大量产品迅速跟进,形成了开年 AI 视频 App 的集体增长,比如冲上过美国总榜 Top10的 AI Video 和 PoseAI。

1月10日美国iOS下载总榜|
图片来源:点点数据
而在这波风潮中,也有多家出海开发者的身影,许多舞蹈视频所采用的 Motion Control 功能的推出者,可灵,当仁不让,从12月1日到1月31日,完成了千万次下载。
除可灵外,一家我们此前并没有那么熟悉的出海 AI 图片视频生成初创公司智象未来,也取得了颇为惊艳的增长效果,根据点点数据,智象未来旗下的 AI 视频 App vivago.ai,近60天(12月1日-1月31日)拿下了1121万全球双端下载量,尤其是在1月中下旬,vivago.ai(下图黄色线)的下载量甚至压过了可灵。

Kling、vivago、AI Video和Pose
近60天全球双端下载量|
图片来源:点点数据
且智象未来告诉我们,他们并不是在相关视频爆火后快速调用 API,跟风增长,而是在这股社媒热潮掀起之前,预判趋势,提前优化自研模型,赶在元旦前上线了自研的“3D 特效”功能,抓住了这次增长机会。
从数据来看,vivago.ai 的起量时间仅比可灵晚4天,远早于纯套壳的 AI Video 和 Pose,且后劲十足,截止 2月1日,日下载量仍保持在30万+。
开脑洞“上马”新功能,
靠古老的“猫狗之争”吸引用户
在我们与智象未来的交流中得知,“3D 特效”的项目起始于12月8日,起初是算法团队日常训练模型时“开了脑洞”,做了一个3D 特效的 Demo,而团队发现,特效的运镜可以完全复刻参考视频,效果也更自然,远好于此前的效果,尤其是该 Demo 采用了“3D 原生架构”,不同于主流解决方案的“2D 架构”。因此,团队随即决定快速开发上线,试水一波。
而在技术团队做出 Demo 后,增长团队开始寻找应用场景。他们发现,TikTok 上一直有博主用自己的宠物做 AI 跳舞的视频,虽然点赞量普遍一般,但评论区互动活跃,主要是在询问制作工具。通过观察社媒,团队初步确定了“宠物舞蹈”的大方向,随后,为了验证 AI 宠物舞蹈是否真正有“爆火潜力”,团队采用“AB Test 策略”,通过小规模投放,测试多种题材。
回收的数据显示,动物舞蹈的数据远优于人类,而动物中,猫咪素材的互动率、转发率,又具有极大优势。12月中旬,团队坚定了宠物舞蹈方向,而此时,距离这波社媒风潮启动还有1周多的时间。利用这段时间,智象未来的技术团队迅速开发优化,将“3D 特效功能”赶在元旦前上线。

在上线之后,智象未来就开始了社媒增长,团队在 TT 平台上,采用了“制造情绪对立+链式传播”的打法。智象未来增长负责人表示,“猫狗派系之争”是自古以来就极具讨论度的话题,所以为了衬托互动效果最好的“猫跳舞”,团队也选择跟部分狗狗博主合作,并通过“到底是猫咪跳得好,还是狗狗跳得好?”的话题点引发观众讨论。
这种非好即坏的二元对立话题,成功撬动了大量普通用户的评论参与,根据智象未来公布的数据,优秀素材的互动率能达到20%左右,优于行业平均水平。

TikTok部分达人发布的与vivago
相关的素材|图片来源:智象未来
而在传播策略方面,智象未来会要求发布视频的达人在视频结束前“@”下一位达人,形成接力。当用户看完一个视频,看到 “@下一位挑战者 ”的提示,好奇心会驱使他点进去继续观看,这个主动点击行为会让算法判断 “ 用户对这个话题高度感兴趣 ”,从而持续向该用户推送相关内容。此外,这种链式传播还能分散单个视频的风险,即使某个达人的内容没有爆,下一位达人仍然有可能戳中用户的兴趣点,有概率延续话题热度,进一步延长 vivago.ai 的曝光。
这种打法是 “Tag Challenge”(标签挑战赛) 的变种。它不仅是利用好奇心,更利用了 TikTok 的协同过滤算法,当多个关联账号形成闭环,算法会认为这是一个“社区共识”的热点,从而推入更大的流量池。这种做法不仅分散风险,更重要的是提升了内容的“原生感”。用户看到 @,会觉得这是一个社区游戏,而非硬广,会有更强的互动意愿。
在第一轮“猫狗对抗”取得不错的增长成绩后,团队近期正在筹备第二波增长,相比第一波增长以单主体舞蹈为主,vivago.ai 今天(2月5日)上线了“多主体舞蹈”功能,依赖新功能,vivago.ai希望第二波增长以“人宠共舞”“多宠物共舞”为主要题材,将推广的核心从“舞蹈”引向“关系”。通过数据分析,智象未来团队计划让第一波增长中效果比较好的达人在第二波增长中“返场”,通过“玩法升级+核心达人返场”驱使用户从“新鲜感”向“社区粘性”转变。

Vivago.ai视频生成量(上),用户量(下)|
图片来源:智象未来内部数据
15天快速上线,一周迭代7版,
创业公司的“生死一月”
复盘 vivago.ai 的这次增长,发现爆款、社媒热度,以及有效的增长策略固然重要,但生成视频的效果、以及功能快速优化、快速上线、快速迭代等技术层面的工作,也颇为关键。
智象未来的技术团队告诉我们,他们自研模型生成的“舞蹈视频”,效果优于市面上的主流产品,而核心差异点是自研的“端到端原生3D 架构”。就“AI 舞蹈”视频来说,市面上的主流方案是“2D 姿态驱动方案”,也就是先识别图片的重要关节点(比如宠物的四肢、头、尾巴等),再按照预设轨迹将这些点动起来,然后添加皮毛、颜色等细节。但这个解决方案的问题在于,当出现遮挡、大幅度动作时视频容易失真、而且镜头也只能平视,无法完成推拉、摇移等镜头动作。
而智象未来使用的3D 解决方案则是在训练模型时就教会它每个主体在三维空间当中的位置、朝向、大小、与镜头之间的相对关系,这才能保证生成视频中,主体的动作和相对位置保持正确。很多时候,想让一个3D 角色动起来,最难的不是“动”,而是动得“合理”,要实现这个效果,首先是“动作脱壳”,先从模板主体剥离出3D 动作,使其不依附于任何主体,纯粹反映动作逻辑;然后,自适应迁移模型会将抽象的动作逻辑匹配给不同动物,无论是大猩猩、长颈鹿,还是小狗、猫咪,都能在这套逻辑下,跳出丝滑、自然的舞步。这个技术路径也是推动其能够围绕多主体舞蹈视频规划第二波增长的根本原因。
而3D 的技术路径选择,需要高质量的数据储备。智象未来的技术团队全网筛选并分析了数万条高质量舞蹈参考视频,并进行人工逐帧分析,以掌握“肢体关节轨迹”“节奏卡点”等细节。
在训练期间,团队累计完成了超200组核心参数的对比测试,在模型精度、生成速度与画面稳定性之间反复权衡;训练后的效果验证阶段,从最初动作卡顿、肢体穿模,到最终实现多主体同步舞蹈、风格自然切换,更是经历了上千次视频生成与迭代优化,赶在元旦前上线。
第一波热潮引发后,团队在元旦假期连续奋战,对线上问题进行快速定位与修复,高峰时段排队等待任务超过数十万个,团队共处理了10余次高优先级告警,共完成10次以上的扩容,逐步恢复稳定服务能力。
为了处理高并发需求,智象未来的团队引入 FP8量化、多卡分布式并行推理等技术,显著降低了模型推理所需的显存,也将推理耗时从2分钟降到了1分钟之内;另外,在调度方面,SQL 优化、代码优化、策略优化等方式,系统的整体调度能力提升了上百倍,可以更自如地应对高并发任务。最后,智象未来大量购买市面上的闲置算力,增加算力储备。
写在最后
纵观这次增长,作为一家创企,智象未来并没有大厂那么丰富的资源,但是靠着技术和对需求的敏感度,有效的增长打法,以及决策、执行力的相互配合,在社媒爆火后,快速上线、快速增长,抓住了“生死一月”,抓住了这波“泼天的流量”,实现了不输大厂的增长效果。
智象未来的团队告诉我们,与其考虑技术护城河和差异化的问题,不如更加务实地把眼前的事情做好,未来,团队也希望能够持续保持增长,不要成为用户玩完即走的“网红产品”。
