8月22日,备受瞩目的“骑到AI背上去”2023钉钉生态大会在上海盛大举行。在备受关注的数字员工专场分论坛上,钉钉副总裁、音视频事业部负责人赵加雨发表了题为《AI赋能音视频,构建智能化未来》的主题演讲,深入剖析了钉钉音视频在智能化领域的最新进展与应用实践,并基于钉钉AI PaaS平台,对视频会议场域的未来开放生态进行了前瞻性展望。赵加雨指出,钉钉自4月起便正式宣布全面接入大模型技术,启动智能化全面升级。随着AI与音视频技术的深度融合,钉钉会议已实现多项创新突破,不仅延续了实时翻译、字幕转写、智能摘要等经典功能,更首次发布了数字分身列席参会、自然语言操控会议、文生虚拟背景三大重磅功能。
数字分身功能能够在用户面临会议时间冲突时,作为虚拟代表列席会议,并能实时同步会议关键信息与决策结论。这一创新不仅解决了职场人士”会海”难题,更通过钉钉魔法棒的智能交互界面,支持用户预设关注话题、定时获取会议摘要,甚至可主动与数字分身进行多轮对话,实时掌握会议动态。赵加雨强调,未来钉钉音视频将持续扩大生态开放力度,与合作伙伴共同打造丰富多元的应用场景,显著提升用户工作体验与效率。同时,钉钉计划将音视频SDK深度嵌入各生态伙伴应用中,构建标准化、易部署的音视频解决方案,全方位满足不同行业与场景的定制化需求。
在谈及过去一年的发展时,赵加雨将”体验优化”与”智能化升级”视为音视频事业部的两大核心关键词。在体验层面,团队成立专项工作组,从用户界面到交互逻辑进行全面革新,使钉钉会议呈现出更美观的视觉设计、更流畅的操作流程和更具沉浸感的会议氛围。在技术架构层面,团队完成了从音视频采集、播放、编解码到网络传输、服务端的全方位优化。针对视频会议最基础的需求——确保会议声音清晰可闻,团队在音频算法和抗弱网技术方面取得突破性进展,显著提升了会议质量。赵加雨鼓励用户积极体验升级后的钉钉会议,称其已成为企业数字化转型的理想选择。
智能化升级方面,赵加雨指出视频会议领域在大模型技术出现前,已与AI技术深度结合。在视频算法层面,美颜、虚拟背景等AI应用已成为用户日常使用场景;在音频算法层面,AI技术助力降噪效果大幅提升,目前钉钉会议已能消除300余种常见噪音,包括汽车鸣笛、键盘敲击等,为用户创造更专注的会议环境。字幕功能作为AI技术的典型应用,在钉钉会议中全面接入阿里通义听悟平台,实现中英日三语实时互译,极大提升了跨国团队的协作效率。智能导播功能则通过蜂鸣鸟音频实验室的AI差分阵列技术,实现单设备10米范围精准拾音,能实时追踪发言人并自动放大其头像,确保每位发言者都能成为会议焦点,显著增强对话互动感。
随着大模型时代的到来,钉钉音视频团队积极探索AI技术在新场景中的应用。此次大会重点展示了基于钉钉AI PaaS平台的三大创新功能:数字分身通过AI虚拟人技术,可替代用户参与会议并实时获取关键信息;自然语言控制功能让用户通过语音指令就能完成会议操作,大幅降低使用门槛;文生虚拟背景功能则通过AI图像生成技术,让用户无需下载模板即可创建个性化虚拟背景。这些功能不仅提升了会议效率,更拓展了视频会议的应用边界。赵加雨表示,钉钉将持续开放AI PaaS平台,与合作伙伴共同构建智能化应用生态,未来将支持更多生态产品如面试助手、协作白板等嵌入钉钉会议,为用户创造更多价值场景。通过技术创新与生态合作,钉钉致力于在智能化时代为用户带来更丰富、更高效的数字化体验。