作为本届亚运会的重要办赛理念之一,”智能”贯穿于杭州亚运会的每一个细节之中。为助力正在举办的第19届亚运会,在北京大学黄铁军教授及仉尚航研究员的悉心指导下,北京大学庄棨宁学生团队依托多模态大模型的前沿研究,创新性地融合视觉、语言、语音等多种模态输入,成功研发出高速运动AI多语种解说系统,为全球观众带来前所未有的观赛新体验。这一突破性应用标志着多模态大模型技术首次在国际大型综合性体育赛事中实现落地,开创了智能科技服务体育赛事的新纪元。

与此同时,团队将目光投向具身智能研究领域,精心打造了基于多模态大模型的人工智能助理系统。该系统能够提供专业的导览引领、场景解说以及物品抓取等多元化服务,为残障人士和需要帮助的群体创造更加人性化的互动方式,营造友好的赛事环境。这一创新举措不仅彰显了科技的人文关怀,更体现了人工智能在提升社会服务方面的巨大潜力。

AI解说员:让体育赛事更生动

“除却君身三重雪,天下谁人配白衣。”东京奥运会上,当中国运动员杨倩身着白色领奖服夺得首金时,赛事解说员引用这句诗意的解说词深深触动了无数观众的心灵。事实上,一场精彩的体育赛事不仅取决于运动员之间的激烈角逐,解说员在其中的作用同样不可忽视。优秀的解说员不仅能够提供关于球队、运动员和比赛背景的专业信息,帮助观众深入理解比赛的重要性和背后的故事,还能通过精准的分析揭示比赛中的策略和技巧,让每一个比赛环节都充满观赏性。当比赛出现精彩瞬间,经验丰富的解说员更能够通过充满激情的解说传递情感,有效带动观众情绪,为赛事增添无限魅力,甚至成为被传颂的经典时刻。

然而,受限于人力成本和资源分配,并非每场体育赛事都能配备专业解说员。特别是在亚运会这类国际大型综合性赛事中,同一时间进行着众多比赛,且并非所有解说员都精通所有体育项目。许多相对小众的赛事往往缺乏专业解说,更难以想象一位解说员能够使用多种语言,面向不同语言的观众进行解说。针对这一痛点,北大庄棨宁学生团队专门针对乒乓球、跆拳道、跳水、体操等热门赛事,研发了高速运动AI解说系统。该系统可以辅助录播频道调用多模态大模型能力,精准理解视频内容,并实时生成中文、英语、藏语、阿拉伯语等多种语言的解说,让体育赛事的信息传递更加广泛和高效。

AI智能解说:技术赋能体育传播

庄棨宁介绍说,这一技术通过高速摄像机的脉冲信号检测场景中的物体和运动员,能够精准捕捉体育比赛中的关键时刻,并生成高质量的集锦和相关数据。基于多模态大模型算法和深度学习模型对这些运动数据进行分析,系统再根据分析结果生成个性化的实时解说服务,从而为不同语种的观众提供定制化的观赛体验。这种技术创新不仅提升了体育赛事的传播效果,也让更多人能够享受到精彩纷呈的体育盛宴。

智能爱心辅助:让科技更有温度

大型赛事活动通常会为东道主城市带来显著的经济、环境等影响,但由于人流量激增,城市公共区域会面临巨大压力。据预测,亚运会期间杭州将迎来近年来最密集的游客潮,外地游客量将超过2000万人次,加上来自亚洲45个国家和地区的12527名运动员,亚运期间杭州的人流量将大幅增加。为应对这一挑战,庄棨宁学生团队在杭州市公共区域打造了具身智能机器人软件服务系统,用于亚运会期间的导航指引与帮助服务。这套系统可以为观众提供专业的导览服务,协助视障人士进行引领和导航,解析视障人士的需求并完成相应任务,如帮助捡拾掉落的物品等。目前,在杭州市的一些亚运会志愿者服务点,已经有市民看到机器人外观的智能体在为视力障碍人士提供贴心服务。

图:杭州市民在体验庄棨宁学生团队的具身智能机器人软件服务系统

“很荣幸能够将我们的所学、所研转化为可以服务每个人的应用,让AI服务人们的普通生活。”庄棨宁表示,为本次亚运会打造的具身智能机器人软件服务系统,是基于团队自研的感知生成一体化多模态大模型,能够精准感知与理解场馆内外的视觉场景,生成准确、丰富的语言描述,并控制机器人执行智能志愿者服务任务。同时,团队将多模态大模型与具身智能相结合,使得人工智能能够更好地感知和理解物理世界,再做出更智能的决策,最终实现人工智能与物理世界的无缝交互。这一创新应用不仅提升了大型赛事的服务水平,也为人工智能技术的发展开辟了新的方向。

最新快讯

2025年11月01日

07:29
尽管开发商Rockstar Games已正式宣布《侠盗猎车手6》(GTA6)将于2026年5月正式发售,但广大玩家群体对于这款备受期待的作品是否会再次遭遇延期仍抱有诸多疑虑。近期,芬兰知名游戏工作室Remedy Entertainment发布的最新财务报告显示,《马克思·佩恩1+2》重制版项目"正按照既定计划稳步推进",这一消息意外地引发了业界对于Rocks...
07:29
科技媒体9to5Mac近日独家披露了一项重要发现,通过深度拆解M5 iPad Pro内部结构,iFixit团队注意到设备顶部麦克风区域存在明显预留空间,其尺寸与位置特征与第二个前置摄像头完美契合。这一关键证据直接印证了彭博社此前关于苹果可能为iPad Pro升级双前置摄像头的市场传闻。 尽管目前市售的M5 iPad Pro仍维持单摄前置设计,但内部工程师的布...
07:29
科技媒体9to5Mac于10月31日独家披露,苹果公司正酝酿一项重大产品革新,计划于2026年正式推出搭载内置红外摄像头的“AI版”AirPods。这款创新机型并非旨在取代现有的AirPods Pro 3,而是作为一款高端独立产品线独立推出,核心聚焦于AI驱动的“视觉智能”功能,为用户带来前所未有的沉浸式体验。 这一战略布局延续了苹果公司一贯的多元化产品策略...
06:58
知名数码博主@数码闲聊站近日爆出惊人消息,称苹果iPhone Air在首发周内的激活量仅为5万余台,直呼"市场表现相当疲软"。这一数据犹如一块巨石投入平静的市场湖面,瞬间激起千层浪,尤其与苹果CEO蒂姆・库克近期在分析师会议上对iPhone Air销量问题选择回避的态度形成强烈反差,更让外界疑窦丛生。 关于iPhone Air的产能调整,目前市场传言四起,呈...
06:58
11月1日08时至2日08时,我国部分地区迎来强降雪天气。西藏东北部、黑龙江中部及北部、吉林东部等地将出现大雪,局部地区更是可能出现暴雪,降水量高达10~15毫米。这场降雪不仅降水量大,还伴随着显著的积雪增长。上述地区新增积雪深度普遍在4~8厘米,局部地区积雪深度更是突破12厘米大关,形成厚重的雪被。气象部门特别提醒,相关地区需密切关注天气变化,做好防范措施...
06:58
2025年11月1日,全球知名制药巨头诺和诺德正式宣布完成对9000名员工的裁员通知,这一规模庞大的调整行动标志着公司战略转型的关键一步。此次裁员范围覆盖全球,是公司新任CEO Mike Doustdar在上月启动的全面重组计划的核心组成部分。根据诺和诺德的官方声明,此次重组的核心目标在于集中公司资源,全力推进新型减肥药的研发与商业化进程,以巩固其在生物制药...
06:58
2023年,中国地震局率先提出设立国际地震科考委员会的倡议,经过两年多的深入磋商与多边协调,这一由中国发起的全球性地震科学研究合作平台于2024年9月5日正式宣告成立。该委员会作为国际地震学与地球内部物理学协会(IASPEI)框架下的首个由中国倡议成立的专门委员会,将致力于推动全球地震科学考察领域的深度合作与资源共享。委员会的成立标志着我国在地震科学研究领域...
06:25
2025年11月1日,中国航天事业迎来又一历史性时刻,神舟二十一号航天员乘组成功入驻中国空间站“天宫”,标志着我国空间站建设与应用进入新阶段。此次任务从酒泉卫星发射中心发射升空后,经过精准控制与对接,航天员们顺利进入空间站,开启了为期六个月的科学探索之旅。执行本次任务的三名航天员将全面开展空间科学实验与技术试验,不仅将验证长期驻留支持技术的可靠性,还将推动空...
05:52
2025年11月1日,弗吉尼亚州州长正式宣布了一项具有里程碑意义的合作计划,携手全球制药巨头阿斯利康、礼来和默克共同打造先进的制药制造中心。根据协议,三方将联合投入高达1.2亿美元的私营领域资金,用于在弗吉尼亚州建设具有国际一流水平的制药生产基地。这一战略举措不仅将显著提升该州在生物医药制造领域的核心竞争力,还将为保障美国乃至全球的药品供应链安全提供坚实支撑...
05:52
2025年11月1日4时58分,中国航天事业迎来又一历史性时刻,神舟二十一号航天员乘组成功进驻中国空间站,与正在轨执行任务的神舟二十号航天员乘组实现“太空会师”。这一壮丽景象标志着我国载人航天工程进入新阶段,也是我国载人航天史上的第七次空间站交汇对接,彰显了我国航天技术的持续突破与卓越成就。 此次会师过程精彩纷呈,两乘组航天员在精准对接后,顺利打开舱门,互致...
04:12
2025年11月1日,中国航天再创辉煌时刻,神舟二十一号载人飞船与空间站组合体成功实现自主快速交会对接。这一壮丽篇章的开启,标志着我国载人航天事业迈入新纪元,为未来空间站长期驻留和深空探索奠定坚实基础。 此次对接任务的创新之处在于,飞船在入轨后完全依靠自主导航系统完成对接过程,无需地面控制中心实时干预。这一技术突破不仅大幅缩短了对接时间,更彰显了中国航天人在...
04:12
2025年11月1日凌晨3时22分,神舟二十一号载人飞船以惊人的速度成功对接于空间站天和核心舱前向端口,整个交会对接过程仅耗时约3.5小时,这一壮举不仅标志着我国载人航天技术的重大突破,更刷新了我国载人飞船与空间站交会对接的最快纪录,彰显了我国航天事业的蓬勃发展态势。 此次任务荣幸搭载张陆、武飞、张洪章三位优秀的航天员,他们将执行为期约6个月的在轨驻留任务,...