作为本届亚运会的重要办赛理念之一,”智能”贯穿于杭州亚运会的每一个细节之中。为助力正在举办的第19届亚运会,在北京大学黄铁军教授及仉尚航研究员的悉心指导下,北京大学庄棨宁学生团队依托多模态大模型的前沿研究,创新性地融合视觉、语言、语音等多种模态输入,成功研发出高速运动AI多语种解说系统,为全球观众带来前所未有的观赛新体验。这一突破性应用标志着多模态大模型技术首次在国际大型综合性体育赛事中实现落地,开创了智能科技服务体育赛事的新纪元。

与此同时,团队将目光投向具身智能研究领域,精心打造了基于多模态大模型的人工智能助理系统。该系统能够提供专业的导览引领、场景解说以及物品抓取等多元化服务,为残障人士和需要帮助的群体创造更加人性化的互动方式,营造友好的赛事环境。这一创新举措不仅彰显了科技的人文关怀,更体现了人工智能在提升社会服务方面的巨大潜力。

AI解说员:让体育赛事更生动

“除却君身三重雪,天下谁人配白衣。”东京奥运会上,当中国运动员杨倩身着白色领奖服夺得首金时,赛事解说员引用这句诗意的解说词深深触动了无数观众的心灵。事实上,一场精彩的体育赛事不仅取决于运动员之间的激烈角逐,解说员在其中的作用同样不可忽视。优秀的解说员不仅能够提供关于球队、运动员和比赛背景的专业信息,帮助观众深入理解比赛的重要性和背后的故事,还能通过精准的分析揭示比赛中的策略和技巧,让每一个比赛环节都充满观赏性。当比赛出现精彩瞬间,经验丰富的解说员更能够通过充满激情的解说传递情感,有效带动观众情绪,为赛事增添无限魅力,甚至成为被传颂的经典时刻。

然而,受限于人力成本和资源分配,并非每场体育赛事都能配备专业解说员。特别是在亚运会这类国际大型综合性赛事中,同一时间进行着众多比赛,且并非所有解说员都精通所有体育项目。许多相对小众的赛事往往缺乏专业解说,更难以想象一位解说员能够使用多种语言,面向不同语言的观众进行解说。针对这一痛点,北大庄棨宁学生团队专门针对乒乓球、跆拳道、跳水、体操等热门赛事,研发了高速运动AI解说系统。该系统可以辅助录播频道调用多模态大模型能力,精准理解视频内容,并实时生成中文、英语、藏语、阿拉伯语等多种语言的解说,让体育赛事的信息传递更加广泛和高效。

AI智能解说:技术赋能体育传播

庄棨宁介绍说,这一技术通过高速摄像机的脉冲信号检测场景中的物体和运动员,能够精准捕捉体育比赛中的关键时刻,并生成高质量的集锦和相关数据。基于多模态大模型算法和深度学习模型对这些运动数据进行分析,系统再根据分析结果生成个性化的实时解说服务,从而为不同语种的观众提供定制化的观赛体验。这种技术创新不仅提升了体育赛事的传播效果,也让更多人能够享受到精彩纷呈的体育盛宴。

智能爱心辅助:让科技更有温度

大型赛事活动通常会为东道主城市带来显著的经济、环境等影响,但由于人流量激增,城市公共区域会面临巨大压力。据预测,亚运会期间杭州将迎来近年来最密集的游客潮,外地游客量将超过2000万人次,加上来自亚洲45个国家和地区的12527名运动员,亚运期间杭州的人流量将大幅增加。为应对这一挑战,庄棨宁学生团队在杭州市公共区域打造了具身智能机器人软件服务系统,用于亚运会期间的导航指引与帮助服务。这套系统可以为观众提供专业的导览服务,协助视障人士进行引领和导航,解析视障人士的需求并完成相应任务,如帮助捡拾掉落的物品等。目前,在杭州市的一些亚运会志愿者服务点,已经有市民看到机器人外观的智能体在为视力障碍人士提供贴心服务。

图:杭州市民在体验庄棨宁学生团队的具身智能机器人软件服务系统

“很荣幸能够将我们的所学、所研转化为可以服务每个人的应用,让AI服务人们的普通生活。”庄棨宁表示,为本次亚运会打造的具身智能机器人软件服务系统,是基于团队自研的感知生成一体化多模态大模型,能够精准感知与理解场馆内外的视觉场景,生成准确、丰富的语言描述,并控制机器人执行智能志愿者服务任务。同时,团队将多模态大模型与具身智能相结合,使得人工智能能够更好地感知和理解物理世界,再做出更智能的决策,最终实现人工智能与物理世界的无缝交互。这一创新应用不仅提升了大型赛事的服务水平,也为人工智能技术的发展开辟了新的方向。

最新快讯

2026年02月11日

17:32
 据QuestMobile最新数据显示,2月7日,大模型应用千问的日活跃用户数(DAU)已正式突破7352万。在市场排名方面,千问App近期展现出极高的用户增长势头。根据苹果App Store实时数据,该应用已连续6天蝉联App Store免费榜第一名,持续领跑国内AI应用赛道。
17:32
法国 AI 领军企业 Mistral AI 正式发布了两款全新的语音转文字(Speech-to-Text)模型,旨在重新定义转录速度、隐私保护与性价比的行业标准。此次推出的模型包括 Voxtral Mini Transcribe V2 和 Voxtral Realtime,均隶属于 Voxtral Transcribe2体系。这两款模型可提供顶级的转录质量、...
17:32
据路透社昨日(2 月 10 日)报道,Autodesk 已于上周五向美国旧金山联邦法院提起诉讼,指控谷歌旗下的 AI 软件侵犯了其“Flow”商标权。Autodesk 在诉状中指出,公司早在 2022 年 9 月便开始在视觉特效、制作管理及相关产品线中使用 Flow 品牌。而谷歌则在 2025 年 5 月推出了同名 AI 软件,其目标用户群体——包括电影、电...
16:58
微新创想:2026年2月11日,网易股份有限公司发布截至2025年12月31日的全年及第四季度财报。2025年公司总营收达到1126亿元,营业利润为358亿元,同比增长21%。这一成绩展现了公司在多个业务领域的持续增长与稳健发展。 研发投入方面,网易全年投入达177亿元,连续六年超过百亿。这表明公司对技术创新的高度重视,为未来的产品升级和市场拓展奠定了坚实基...
16:58
微新创想:2026年春节前夕,北京、湖南、上海、河南等全国多个省市密集发放新春消费券。这一举措旨在通过刺激消费来提振节前市场活力,应对2025年人均消费增速低于收入增速的结构性放缓问题。数据显示,2025年人均消费增速为4.4%,而收入增速则达到了5.0%,消费增长动力有所减弱。 为确保消费券发放的公平性,北京和湖南采取了“在线报名+公证摇号”的方式,取代传...
16:58
微新创想:2026年1月29日,国产咖啡机头部企业格米莱控股有限公司正式向港交所主板递交上市申请,中信证券担任独家保荐人。公司自2011年成立以来,专注于意式咖啡机的研发与制造,凭借卓越的产品品质和市场表现,逐渐成长为行业的重要力量。 2024年,格米莱自建工厂正式投产,标志着公司在产能和供应链管理方面迈出了关键一步。目前,格米莱已成为中国市场第二大、第一大...
16:58
微新创想:2026年2月,AI编码工具提供商Entire宣布完成6000万美元种子轮融资。本轮融资由Felicis Ventures领投,陈嘉瑞、杨志明、Olivier Pomel、Dohmke、Basis Set Ventures及Madrona Venture Group跟投。公司总部位于美国,致力于构建全球下一代开发者平台。该平台旨在支持人类开发者与A...
16:57
微新创想:深圳第零智能科技股份有限公司于2024年2月10日向港交所主板提交了上市申请。作为一家专注于企业级AI智能体解决方案的科技企业,第零智能自2020年8月成立以来迅速成长。2024年,公司已位列国内该领域第五大供应商,市场占有率达到了3.0%。 第零智能的核心技术平台BlackZero具备独特优势。该平台结合了公开大模型与自研领域小模型,能够高效支撑...
16:57
微新创想:2026年2月11日,南极电商发布公告称,证券事务代表钱商勇因个人原因辞去职务,辞职报告已送达董事会并即时生效。钱商勇离任后不再担任公司任何职务,且未持有公司股份。公司董事会将依法依规尽快聘任新任证券事务代表。此次人事变动系正常履职调整,不影响公司信息披露及证券事务正常运作。
16:57
微新创想:2月10日,马斯克在xAI全员会议上宣布拟在月球建设工厂,利用“质量驱动器”弹射装置生产并发射AI卫星,以获取超量算力。该计划旨在支撑其外太空AI数据中心愿景,系xAI与SpaceX合并后战略延伸。 马斯克强调月球将作为火星移民跳板,并首提建立自给自足月球城市目标。这一愿景不仅涉及技术突破,更包含对人类未来探索与居住的深远考量。 目前尚无具体实施路...
16:57
微新创想:2026年2月11日 海特生物发布公告 拟以自有资金6201.90万元 受让君和企业等六方持有的北京沙东生物23.0816%股权 交易完成后 海特生物对北京沙东生物的持股比例将提升至98.8420% 北京沙东生物是一家专注于Ⅰ类基因工程抗肿瘤药物研发的生物科技企业 其核心产品已进入ⅡB期临床试验阶段 并且公司还拥有多个在研管线 正在推进不同阶段的临...
16:57
微新创想:2026年2月,美国医疗信息化服务商Garner Health宣布完成1.8亿美元D轮融资 本轮融资由Kleiner Perkins领投,Redpoint Ventures、Maverick Ventures等多家机构跟投 公司总部位于美国,依托大数据技术为雇主提供医疗保险索赔分析及医生网络匹配服务 支持员工自主选医,雇主承担自付费用 融资将用于拓...