2023年8月19日至20日,由中国人工智能学会主办、中国人工智能学会会士之家(杭州站)承办、浙江杭州未来科技城管委会协办的第三期人工智能创新技术讲习班——”多模态大模型技术前沿与应用”成功举行,活动采用线上线下相结合的形式,线上累计观看人次突破16万。本次讲习班聚焦人工智能领域热点话题”多模态大模型”,旨在深化学术交流、加速技术创新进程。复旦大学邱锡鹏教授与清华大学徐枫副教授共同担任本期讲习班学术主任,宋睿华副教授、代季峰副教授、孙天祥博士、王炳宁先生、赵俊博研究员、严明先生等6位在多模态大模型及相关领域具有深厚学术影响力的专家学者组成讲师团,为听众奉献了一场内容丰富的学术盛宴。

讲习班期间,听众反响热烈,互动频繁。浓厚的学术氛围不仅贯穿整个授课过程,更延续至课后,各位讲师耐心解答线上线下观众提问,现场交流气氛十分活跃。徐枫副教授在8月19日至20日的两天时间里,带领各位讲师以严谨缜密的学术态度和妙趣横生的授课风格,为线上线下学员和观众呈现了6场知识盛宴,内容涵盖理论研究到落地应用等多个维度。

第一堂课《多模态理解与人工智能创作》由宋睿华副教授主讲。授课伊始,宋睿华副教授深入浅出地阐释了”多模态”概念及其与多媒体的区别,并分析了该技术突然火爆的原因。随后,他详细介绍了文澜模型1.0至3.0的发展历程,分享了”多模态与文本预训练模型的文本嵌入差异研究”的完整研究过程及成果。授课最后,宋睿华副教授对多模态理解与创作的未来趋势进行了总结,鼓励听众勇于挑战学术难题。

第二堂课《视觉基础大模型》由代季峰副教授主讲。他指出通用大模型正在引领人工智能发展浪潮,围绕”超大规模视觉模型”及相关技术路线展开精彩讲解。代季峰副教授不仅描述了LLM(大规模语言模型)的强大功能,更称赞其为通用人工智能发展道路上的重要里程碑。

第三堂课《对话式大型语言模型》由孙天祥博士主讲。授课内容分为四个部分:预训练数据、自然语言基座模型、对话语言模型和OpenLMLab,系统性地介绍了对话式大型语言模型的构建方法。

第四堂课《大语言模型的训练和优化方法》由王炳宁老师主讲。他首先系统梳理了语言模型的发展历程,指出近年来语言模型发展呈现超线性增长趋势,发布频率不断加快。随后,他对大语言模型的基础框架及优化方法进行了详细阐述,并表达了对大语言模型的美好憧憬,以及为中文互联网大语言模型发展贡献力量的决心。

第五堂课《TableGPT——大模型的漫长落地之路初探》由赵俊博研究员主讲。授课前,他以风趣的方式解释了为何为课题名称加上”渡劫”二字,坦言研究过程充满挑战与挫折,希望激励处于研究瓶颈期的同行们。赵俊博研究员介绍了团队研究背景,阐述了从刚性LLM到选择”TableGPT”的决策过程。随后,他详细介绍了”TableGPT”的功能、落地过程及方案,并以幽默的比喻总结道:从通用LLM到领域LLM的转变堪比”文科生到理科生”的蜕变。

第六堂课《达摩院通义mPLUG多模态大模型技术与应用》由严明老师主讲。他首先回顾了多模态大模型技术发展历程,重点介绍了团队研究的两条路径:mPLUG模块化多模态预训练大模型技术系列,以及大小模型协同的Agent系统。最后,严明老师对”ModelScope”实战应用进行了详细讲解。

至此,第三期人工智能创新技术讲习班”多模态大模型技术前沿与应用”的6节课程全部结束。邱锡鹏教授在线上做结业总结,回顾了6位专家学者的精彩授课内容,指出这些前沿研究成果让听众耳目一新。他还表示,多模态大模型发展尚处起步阶段,未来机遇与挑战并存,本次讲习班为研究者们搭建了宝贵的交流平台,有助于各方在学术研究及落地应用层面共同探索、学习进步。

最新快讯

2026年03月11日

01:59
微新创想:波音公司于3月11日宣布,其与CFM国际公司合作供应的发动机订单已满足2026年全年及2027年第一季度的交付需求。这一进展有助于确保737 MAX系列飞机的生产能够保持稳定节奏。波音并未公布具体的订单数量和合同细节,但表示供应链的协调工作正稳步推进。 随着全球航空业逐步复苏,窄体客机的需求正在持续增长。波音公司正加快步伐,努力将737 MAX的月...
01:59
微新创想:2026年3月11日,美国国家航空航天局(NASA)监察长办公室发布报告指出,SpaceX正在研发的“星舰”月球着陆器项目已比原定计划延迟两年。这一消息引发了广泛关注,因为该着陆器是NASA阿尔忒弥斯III任务的核心组成部分,旨在支持首次载人登月行动。 微新创想:根据报告内容,SpaceX的“星舰”着陆器不仅在时间上落后,而且其后续开发阶段仍存在进...
00:45
微新创想:2026年3月10日,谷歌正式向AI Ultra订阅用户以及Gemini Alpha企业客户上线了Workspace中的Gemini AI新功能。此次更新主要集中在Docs、Sheets和Slides三款核心办公应用上,为用户提供更智能、更高效的办公体验。 在Docs中,用户可以通过云端硬盘、Gmail等平台获取上下文信息,Gemini AI将根据...
00:09
微新创想:3月10日,全球航运巨头马士基公司宣布将于近期实施临时应急燃料附加费。该费用适用于其全球集装箱运输服务,旨在应对近期国际燃油价格剧烈波动及供应不确定性。 微新创想:附加费具体生效时间、费率标准及适用航线将另行通知客户。公司表示,此举属短期应对措施,将持续评估市场情况并适时调整。 微新创想:马士基公司作为全球领先的航运企业,一直致力于在复杂多变的市场...
00:09
微新创想:2026年3月10日,德国BioNTech公司宣布,联合创始人乌古尔·沙欣与厄兹莱姆·图雷西将于年底前离职,共同创立一家独立mRNA技术公司。这一决定标志着他们将开启新的职业篇章,专注于推动下一代mRNA技术的研发。 新公司将致力于探索mRNA领域的前沿创新,涵盖疫苗、疗法及个性化医疗等多个方向。BioNTech将向新公司转让相关的知识产权和技术平...
00:09
微新创想:2026年3月10日晚英伟达举办GeForce On玩家发布会正式推出DLSS 4.5技术 新版本DLSS 4.5技术包含Super Resolution动态多帧生成及六倍多帧生成等特性显著提升4K路径追踪游戏帧率最高可达35% 多款热门游戏将原生支持DLSS 4.5技术包括《007:初露锋芒》《INDUSTRIA 2》《战争雷霆》《燕云十六声》等...
00:09
微新创想:2026年3月10日,realme UI产品经理康达Leo宣布系统将于3月启动更新。此次更新将覆盖GT Neo6 SE及更高型号的机型,包括GT8 Pro、GT8、Neo8、GT7系列、Neo7系列、GT5 Pro、GT6等,共计13款设备。更新的具体内容尚未公布,但据官方透露,此次系统升级将带来多项优化与改进。 此次系统更新的宣布,正值realm...
00:09
微新创想:3月13日至15日,唯卓仕EVO系列镜头将在英国伯明翰The Photography & Video Show摄影展上首次亮相。此次展出标志着该系列镜头正式进入国际市场,为摄影爱好者带来全新的视觉体验。 EVO系列镜头以先进的真APO复消色差技术为核心卖点,能够有效减少色散现象,呈现出更加纯净、真实的色彩表现。这一技术在高对比度场景下尤为突...

2026年03月10日

23:26
微新创想:2026年3月10日,Perplexity公司正式推出Comet浏览器iOS版,仅限iPhone设备使用。该版本要求设备运行iOS 18.0或visionOS 2.0及以上系统,用户可在国区App Store下载安装。 Comet浏览器以人工智能技术为核心,重新定义了现代网络浏览体验。它不仅是一款工具,更是一个能够主动协助用户的智能助手。通过AI驱...
22:50
微新创想:3月10日,集海黄金在港交所发布公告称,其位于山东烟台的中嘉露天矿场已正式复工复产。该矿场此前因安全整改及季节性因素临时停产,经监管部门验收合格后恢复作业。 复产将提升公司黄金自产供给能力,支撑年度产量目标。公司表示,此次恢复生产是基于全面完成安全整改工作,并通过相关监管部门的严格审查。 目前矿区人员、设备及运输系统均已正常运转,生产节奏正逐步回升...
22:50
微新创想:任天堂在3月10日马力欧日宣布,横版动作游戏《耀西与不可思议的图鉴》将于5月21日正式发售。该游戏将exclusively登陆Switch 2平台,为玩家带来全新的冒险体验。 玩家将扮演耀西,进入一个充满奇幻色彩的异世界,这个世界由会说话的《E先生百科全书》所构建。在游戏中,耀西可以通过踩踏、吞食等经典能力,探索这个神秘世界并发现各种奇特生物。 这...
22:50
微新创想:3月10日,杭州铜师傅文创(集团)股份有限公司正式通过港交所上市聆讯并更新聆讯后资料集。这一重要进展标志着公司在资本市场的布局迈出了关键一步。公司总部设立于浙江杭州,专注于高端铜艺文创产品的设计、研发与销售,凭借精湛的工艺和独特的文化价值,赢得了市场的广泛认可。 铜师傅作为国内知名的非物质文化遗产铜艺产业化代表企业,近年来不断加大在创新领域的投入。...