当传统大语言模型仍局限于二维对话框的文本交互时,魔珐科技却以革命性的方式重新定义了AI的形态——直接生成具有真实骨骼、肌肉与声带的3D数字人。5月30日,这家创新企业正式发布了全球首个面向开发者的3D数字人开放平台“魔珐星云”,将AI的交互维度从“语言”拓展至“表情、手势与身体动作”。
平台的核心是一套突破性的3D多模态实时生成引擎。开发者只需输入任意文本,系统即可在毫秒级内同步生成语音、微表情及肢体动作,并针对手机、平板、车载系统、智能电视等多样化终端进行优化,确保刷新率始终保持在30fps以上,延迟控制在100毫秒以内。这一技术彻底颠覆了传统动画制作流程,无需预录复杂动画或依赖昂贵的高性能GPU,只需百元级入门级芯片即可实现本地驱动,云端则专注于模型推理与持续更新。
魔珐科技CTO李豫揭示其技术突破的关键在于“云-端拆分架构”。通过将计算密集型的几何建模与轻量级的渲染指令分离,终端设备仅需接收经过高度压缩的动作码流,其数据量仅为普通视频的十分之一,如同在线观看视频般流畅。这一创新不仅大幅降低了硬件门槛,更实现了高效能的分布式计算。
实际应用场景已远超概念演示范畴。在上海中心的一座智慧酒店,数字前台通过星云SDK接入平板设备,可实时解答入住咨询、开具发票、推荐周边餐饮等复杂服务;某省级政务大厅则利用该平台生成手语数字人,为听障人士提供无障碍导办服务;在招聘领域,星云与头部HR SaaS服务商合作推出AI面试官,候选人语音回答后,数字面试官能基于语义分析即时做出点头、记录、追问等互动反应,完整还原真实面试场景。

平台采用灵活的分层计费模式:基础模型提供免费调用,高级情绪控制、行业知识包按量付费,企业也可选择一次性买断私有化部署权限。平台上线首日,便吸引了超过2000名开发者申请内测,覆盖教育、医疗、零售、物联网四大领域。
魔珐科技CEO柴金祥表示,未来将开源部分动作驱动接口,并联合芯片厂商推出“星云Ready”认证标准。“我们的目标是在一年内让具身智能在10亿台中低端设备上普及,使真实交互成为主流,而非仅限于高端展示。”
