
视频平台巨头Kaltura正经历一场深刻的转型,从传统的“内容容器”全面进化为“智能交互界面”。近日,这家纳斯达克上市公司以2700万美元战略收购以色列AI数字人公司eSelf.ai,将后者先进的实时对话型虚拟人技术深度融入其企业视频生态系统。这一举措不仅彰显了Kaltura对技术创新的执着追求,更标志着其不再局限于视频的存储与分发,而是坚定押注“视频即服务界面”(Video as an Interface)这一下一代企业交互范式。
eSelf.ai成立于2023年,由前Snap收购公司Voca创始人Alan Bekker与CTO Eylon Shoshan联合创立。尽管团队规模仅有15人,却专注于语音-视频生成、低延迟语音识别与屏幕理解三大核心技术领域。其虚拟人技术远超传统“会动的嘴”,实现了真正意义上的“看得懂、听得清、说得明”的AI代理。通过逼真唇形同步技术,结合屏幕内容实时理解能力,eSelf.ai能够在保险产品页面主动解释条款,在培训场景中根据学员操作界面动态调整讲解重点,为企业提供前所未有的交互体验。
Kaltura CEO Ron Yekutiel强调,此次收购的核心价值在于eSelf.ai具备真正的实时同步对话能力。与市面上常见的“预录语音+口型对齐”式伪交互不同,eSelf.ai能够实现双向、动态、上下文感知的深度对话。这种突破性的技术将彻底改变企业视频交互方式,让视频从单向传播变为双向互动。
作为全球领先的企业视频平台,Kaltura目前服务超800家全球企业客户,包括Amazon、Oracle、SAP、IBM等知名企业以及多家顶级金融机构与高校。其产品矩阵涵盖企业视频门户、虚拟课堂、网络研讨会系统及TV流媒体解决方案。收购eSelf.ai后,Kaltura将推出可嵌入销售、客服、培训等场景的独立AI代理,为企业提供“全栈式视频智能”解决方案。

具体而言,该解决方案采用三层架构:前端采用高拟真数字人作为交互入口;中台对接CRM、知识库、LMS等企业系统;后端基于用户行为与屏幕内容动态生成个性化响应。Yekutiel表示,Kaltura的愿景是让视频从“被动观看”转变为“主动服务”。公司始于视频,进阶至个性化视频,如今通过eSelf.ai,赋予AI以面孔、眼睛、耳朵和嘴巴,使其真正具备人类级表达与理解力。
尽管近期有媒体报道Kaltura正寻求以4亿至5亿美元估值出售,Yekutiel明确否认:“我们从未接近达成任何交易。”相反,此次收购是Kaltura第四次战略并购(此前包括Tvinci、Rapt Media、Newrow),充分彰显公司持续投入AI与视频融合的决心。Kaltura2024年营收约1.8亿美元,已实现Adjusted EBITDA与现金流双盈利,拥有600名员工。
随着eSelf团队全员并入,Kaltura计划在教育、金融、医疗、电商等高价值场景快速落地对话式AI代理。当企业客服不再只是聊天机器人,而是一个能“注视你、理解你、引导你”的数字专家,人机交互的临界点,或许正在到来。这一创新将彻底改变企业视频交互方式,开启视频即服务的新时代。
