
微新创想:阿里今日发布了一款全新的可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)该产品基于原生多模态架构打造支持多模态理解与音视频联合生成技术
目前HappyOyster具备漫游和导演两大核心能力用户可以实时创建并互动于一个可探索、可演绎的AI数字世界用户生成的内容不仅能够被完整保存还能开放给其他用户进行二次创作
据悉HappyOyster由阿里ATH创新事业部团队研发与此前引发广泛关注的HappyHorse同属一个研发团队世界模型作为当前人工智能领域的前沿方向阿里的HappyOyster与谷歌的Genie3同属于世界模拟器流派
相比谷歌的Genie3HappyOyster采用了时间跨度更长的世界演化建模方式使得模型能够在长时间运行中保持高保真度和动态场景生成能力同时该产品设计了多样化的控制信号在统一的时序框架下实现生成质量长时序与实时可控性的协同优化
在产品功能方面HappyOyster不仅支持Wander漫游探索还独家提供Direct实时导演功能用户可以通过自然语言指令随时介入世界演化过程调度角色事件实现对场景的灵活控制
在视觉表现上HappyOyster的漫游模式画面质量更高风格泛化能力更强动态效果更加自然用户仅需一句话或一张图即可生成具备物理一致性的完整空间物体位置稳定场景持久存在视角与光照也能跟随第一人称视角持续移动
此外用户可以自由切换方向与镜头运动突破初始画框的限制体验无限延展的探索乐趣目前HappyOyster支持长达1分钟的连续实时位移与镜头控制并能实现多样化风格切换
在导演模式下用户可以在视频的任意节点通过文字语音或图像等多模态输入随时实现镜头切换剧情改写角色调度在充分的交互过程中生成一个光照重力角色动作与场景因果持续演化的数字世界并能自由选择题材风格
HappyOyster的导演模式目前支持连续生成3分钟以上的480p或720p实时画面为内容创作提供了全新的可能性
世界模型的发展仍处于早期阶段但HappyOyster已在实际应用中展现出改变传统内容创作模式和交互体验的潜力例如在游戏开发中开发者可以快速生成可玩原型在影视创作中导演只需用自然语言描述创意系统即可实时生成分镜画面并在视频任意节点进行修改
在文旅与教育领域用户可以以第一视角走进名画现场或历史文明在交互中探索因果关系改写故事走向
未来HappyOyster还可能应用于线下智能空间和娱乐场景例如与穿戴设备等智能硬件结合根据人的位置动作与语言动态实时生成沉浸式内容让数字世界与现实产生共鸣
