2023年8月19日至20日,由中国人工智能学会主办、中国人工智能学会会士之家(杭州站)承办、浙江杭州未来科技城管委会协办的第三期人工智能创新技术讲习班——”多模态大模型技术前沿与应用”成功举行,活动采用线上线下相结合的形式,线上累计观看人次突破16万。本次讲习班聚焦人工智能领域热点话题”多模态大模型”,旨在深化学术交流、加速技术创新进程。复旦大学邱锡鹏教授与清华大学徐枫副教授共同担任本期讲习班学术主任,宋睿华副教授、代季峰副教授、孙天祥博士、王炳宁先生、赵俊博研究员、严明先生等6位在多模态大模型及相关领域具有深厚学术影响力的专家学者组成讲师团,为听众奉献了一场内容丰富的学术盛宴。

讲习班期间,听众反响热烈,互动频繁。浓厚的学术氛围不仅贯穿整个授课过程,更延续至课后,各位讲师耐心解答线上线下观众提问,现场交流气氛十分活跃。徐枫副教授在8月19日至20日的两天时间里,带领各位讲师以严谨缜密的学术态度和妙趣横生的授课风格,为线上线下学员和观众呈现了6场知识盛宴,内容涵盖理论研究到落地应用等多个维度。

第一堂课《多模态理解与人工智能创作》由宋睿华副教授主讲。授课伊始,宋睿华副教授深入浅出地阐释了”多模态”概念及其与多媒体的区别,并分析了该技术突然火爆的原因。随后,他详细介绍了文澜模型1.0至3.0的发展历程,分享了”多模态与文本预训练模型的文本嵌入差异研究”的完整研究过程及成果。授课最后,宋睿华副教授对多模态理解与创作的未来趋势进行了总结,鼓励听众勇于挑战学术难题。

第二堂课《视觉基础大模型》由代季峰副教授主讲。他指出通用大模型正在引领人工智能发展浪潮,围绕”超大规模视觉模型”及相关技术路线展开精彩讲解。代季峰副教授不仅描述了LLM(大规模语言模型)的强大功能,更称赞其为通用人工智能发展道路上的重要里程碑。

第三堂课《对话式大型语言模型》由孙天祥博士主讲。授课内容分为四个部分:预训练数据、自然语言基座模型、对话语言模型和OpenLMLab,系统性地介绍了对话式大型语言模型的构建方法。

第四堂课《大语言模型的训练和优化方法》由王炳宁老师主讲。他首先系统梳理了语言模型的发展历程,指出近年来语言模型发展呈现超线性增长趋势,发布频率不断加快。随后,他对大语言模型的基础框架及优化方法进行了详细阐述,并表达了对大语言模型的美好憧憬,以及为中文互联网大语言模型发展贡献力量的决心。

第五堂课《TableGPT——大模型的漫长落地之路初探》由赵俊博研究员主讲。授课前,他以风趣的方式解释了为何为课题名称加上”渡劫”二字,坦言研究过程充满挑战与挫折,希望激励处于研究瓶颈期的同行们。赵俊博研究员介绍了团队研究背景,阐述了从刚性LLM到选择”TableGPT”的决策过程。随后,他详细介绍了”TableGPT”的功能、落地过程及方案,并以幽默的比喻总结道:从通用LLM到领域LLM的转变堪比”文科生到理科生”的蜕变。

第六堂课《达摩院通义mPLUG多模态大模型技术与应用》由严明老师主讲。他首先回顾了多模态大模型技术发展历程,重点介绍了团队研究的两条路径:mPLUG模块化多模态预训练大模型技术系列,以及大小模型协同的Agent系统。最后,严明老师对”ModelScope”实战应用进行了详细讲解。

至此,第三期人工智能创新技术讲习班”多模态大模型技术前沿与应用”的6节课程全部结束。邱锡鹏教授在线上做结业总结,回顾了6位专家学者的精彩授课内容,指出这些前沿研究成果让听众耳目一新。他还表示,多模态大模型发展尚处起步阶段,未来机遇与挑战并存,本次讲习班为研究者们搭建了宝贵的交流平台,有助于各方在学术研究及落地应用层面共同探索、学习进步。

最新快讯

2025年08月10日

16:09
微新创想8月10日讯 OpenAI于8日凌晨正式发布了其迄今为止最强大的人工智能模型GPT-5。然而新模型上线后不久便遭遇了用户的大量吐槽,使用体验远未达到预期。本周OpenAI又发布了全新升级的GPT-5系列,同时宣布淘汰多款旧版AI模型,这一决定引发了部分用户的强烈不满和反弹。 在外国论坛Reddit的ChatGPT讨论区,不少用户表达了强烈不满。有人愤...
16:09
微新创想8月10日重磅消息,华为即将在8月12日举办的2025金融AI推理应用落地与发展论坛上,重磅发布AI推理领域的革命性技术突破。据行业深度消息透露,这一突破性成果有望从根本上降低中国AI推理对HBM(高带宽内存)技术的依赖,显著提升国内AI大模型推理性能,并完善中国AI推理生态的关键环节。 HBM(High Bandwidth Memory,高带宽内存...
16:09
2025年上半年,佰维存储的财务表现呈现出显著的盈利挑战。尽管公司营业收入实现了13.70%的同比增长,达到39.12亿元,但净利润却出现了大幅下滑,净亏损额度高达2.26亿元。这一数据揭示了公司在扩大营收规模的同时,盈利能力并未得到有效提升,经营状况仍面临较大压力。 从行业角度来看,佰维存储的营收增长表现尚可,但亏损扩大的情况不容忽视。这表明公司在成本控制...
16:09
北京时间8月10日14时59分,一场6.0级地震在堪察加半岛东南沿岸海域悄然发生,震源深度达到33公里。这一地质活动虽然释放了能量,但幸运的是并未对当地造成人员伤亡或财产损失。 据俄罗斯科学院‘统一地球物理局’堪察加分部发布的官方消息,此次地震发生在远离陆地的海域区域。专家分析指出,由于震源深度相对较浅,地震波在传播过程中能量有所衰减,这也是目前未观察到明显...
16:09
2025年8月10日,工业富联正式发布其备受瞩目的半年度财务报告,数据显示公司上半年经营表现亮眼。报告显示,工业富联实现营业收入高达3607.60亿元,相较于去年同期大幅增长35.58%,这一成绩彰显了市场需求的强劲复苏态势。在盈利能力方面,公司上半年净利润达到121.13亿元,同比增长率高达38.61%,创历史新高。这一显著的经营业绩提升,主要得益于两大核...
16:09
2025年8月10日,佳创视讯(股票代码:300264.SZ)正式发布重要公告,宣布公司控股股东陈坤江已与毛广甫、李莉夫妇签署《控制权变更框架协议》。根据协议内容,若相关交易顺利达成,佳创视讯的实际控制人将迎来重大转变,由陈坤江变更为毛广甫与李莉夫妇。这一变动不仅标志着公司股权结构的深刻调整,更可能对公司未来的战略发展方向和经营业绩产生深远影响。为配合此次控...
16:09
四川盆地近日强降雨持续不断,国家防汛总指挥部于8月10日14时紧急启动防汛四级应急响应,以应对严峻的汛情形势。据气象部门最新预报,8月10日至12日期间,四川盆地将迎来中到大雨天气,局部地区更可能出现暴雨乃至大暴雨的极端天气,中央气象台已于10日10时正式发布暴雨黄色预警,提醒公众做好防范准备。 此次防汛四级应急响应的启动,充分体现了国家防总对四川盆地汛情的...
16:09
2025年8月10日,清华大学计算机科学团队传来振奋人心的消息,他们成功突破了一项尘封四十年的最短路径算法纪录,这一里程碑式的成果为计算机科学领域带来了革命性的影响。最短路径问题作为计算机科学中的核心难题之一,在现实世界的应用场景极为广泛,从导航软件的路线规划到物流运输的路径优化,再到网络通信的数据传输,其高效解决方案都直接关系到行业效率的提升。此次突破不仅...
16:09
2025年8月,黑龙江省鹤岗市正以惊人的速度摆脱“白菜价”房源的标签,向高端楼市转型。这一转变在近日开售的向阳区新楼盘中得到了充分体现,该楼盘迅速引发广泛关注,吸引来自全国各地的游客前来选购。鹤岗的楼市复苏并非偶然,而是产业转型与生态价值双重推动的结果。当地新建的多个智慧社区,不仅提升了城市品质,更标志着鹤岗正迈向高质量发展之路。这一系列变化,不仅让鹤岗重新...
16:09
2025年8月10日,中国铁路乌鲁木齐局集团公司传来喜讯,最新数据显示,截至8月8日,霍尔果斯铁路口岸今年中欧(中亚)班列通行量已强势突破6000列大关,这一成绩不仅刷新了年度历史记录,更令人瞩目的是,相较于去年同期,通行时间整整提前了46天,展现出惊人的发展速度和效率。这一里程碑式的突破,不仅彰显了我国铁路运输体系的强大实力,也凸显了霍尔果斯口岸作为国际物...
15:05
8月10日,我国在隧道与地下空间领域迎来重大突破,首个垂直大模型正式问世。这一创新成果由中国中铁隧道局隧道掘进机及智能运维全国重点实验室自主研发,其技术体系建立在海量工程数据之上,依托773条工程线路和1200亿条建造数据,实现了对复杂地下环境的精准解析与智能建模。作为我国在该领域的里程碑式成果,该模型不仅填补了国内空白,更为全球隧道建设提供了全新的技术范式...
15:05
8月10日清晨7时25分,印尼北马鲁古省的杜科诺火山突然喷发,火山灰柱直冲高空约800米,喷发过程持续了整整62.38秒。这一突发性火山活动已将火山警戒级别提升至二级,意味着火山活动正处于活跃状态,存在进一步喷发的可能。根据火山监测部门的紧急通知,所有居民和游客被强烈建议远离火山口周边4公里半径的警戒区域,以避免火山灰、熔岩碎屑以及其他危险物质带来的潜在威胁...