
快手近期宣布其AI视频生成器Kling完成重大升级,正式推出2.6版本,通过新增语音控制和动作控制两大核心功能,为AI视频创作领域带来革命性突破。此次更新不仅实现了原生音频生成技术,更在复杂动作处理精度上实现跨越式提升,标志着AI视频生成技术迈入全新阶段。

语音控制:打造沉浸式音频体验
Kling2.6的语音控制功能基于先进的同步视频音频生成技术,与Google Veo3和Sora2等前沿系统保持同步,能够智能匹配视频内容的音效、人声和音乐。该功能支持说话、对话、旁白、歌唱和说唱等多种人声类型,并具备卓越的环境噪音过滤和复合场景音效处理能力。最具创新性的是新增的自定义声音定制功能——用户可上传个人声音训练模型或音频文件,直接应用于文本转视频创作。这一突破显著提升了角色一致性,使生成视频中的人物能够使用统一、可辨识的声音进行表达,为跨视频片段构建连续角色叙事提供了可能。Kling AI展示的应用场景丰富多样,涵盖产品演示、生活方式视频博客、新闻广播、体育评论、纪录片、访谈节目、戏剧短片和音乐表演,甚至能够胜任复调合唱等复杂音频需求。
动作控制升级:实现毫秒级精准捕捉
第二项重大更新聚焦于动作控制系统的全面升级。Kling AI表示,新系统可精准捕捉全身动作,即便是武术或舞蹈等快速复杂的动作也能实现毫秒级准确处理。特别值得关注的是,系统在两个传统AI视频生成难点上取得显著突破:手部动作呈现前所未有的清晰度,面部表情和唇形同步保持自然流畅。用户只需上传3至30秒的动作参考片段,即可创建连贯的动作序列,同时可通过文本提示调整场景细节。社交媒体上已涌现大量惊艳案例,证明AI生成视频内容正迎来爆发式增长,创作者正积极把握这一商机,创作出无数富有创意的作品。

价格优势与市场布局
Kling2.6不仅限于自有平台服务,还通过Fal.ai、Artlist和Media.io等第三方平台提供便捷访问。API定价约为每秒生成视频0.07至0.14美元,价格根据生成速度、时长和分辨率动态调整,在市场上具备显著竞争力。Kling AI本身采用积分制计费模式。12月初,快手还发布了Video O1——被誉为”全球首款统一多模态视频模型”,可通过文字指令编辑现有视频,实现主角替换、天气变更或视频风格转换等功能。
在竞争激烈的AI视频市场,快手凭借Kling2.6和Video O1等创新产品,与Google、OpenAI、Runway等西方巨头,以及海罗、世达、维都等中国竞争对手展开激烈角逐。值得注意的是,快手运营着与TikTok规模相当的全球最大短视频平台之一快手(Kwai),这使其能够获取海量音视频和运动数据,为训练视频模型、实现声音同步和动作逼真提供了独特优势,为其在AI视频领域的持续创新奠定了坚实基础。
