2023年8月19日至20日,由中国人工智能学会主办、中国人工智能学会会士之家(杭州站)承办、浙江杭州未来科技城管委会协办的第三期人工智能创新技术讲习班——”多模态大模型技术前沿与应用”成功举行,活动采用线上线下相结合的形式,线上累计观看人次突破16万。本次讲习班聚焦人工智能领域热点话题”多模态大模型”,旨在深化学术交流、加速技术创新进程。复旦大学邱锡鹏教授与清华大学徐枫副教授共同担任本期讲习班学术主任,宋睿华副教授、代季峰副教授、孙天祥博士、王炳宁先生、赵俊博研究员、严明先生等6位在多模态大模型及相关领域具有深厚学术影响力的专家学者组成讲师团,为听众奉献了一场内容丰富的学术盛宴。

讲习班期间,听众反响热烈,互动频繁。浓厚的学术氛围不仅贯穿整个授课过程,更延续至课后,各位讲师耐心解答线上线下观众提问,现场交流气氛十分活跃。徐枫副教授在8月19日至20日的两天时间里,带领各位讲师以严谨缜密的学术态度和妙趣横生的授课风格,为线上线下学员和观众呈现了6场知识盛宴,内容涵盖理论研究到落地应用等多个维度。

第一堂课《多模态理解与人工智能创作》由宋睿华副教授主讲。授课伊始,宋睿华副教授深入浅出地阐释了”多模态”概念及其与多媒体的区别,并分析了该技术突然火爆的原因。随后,他详细介绍了文澜模型1.0至3.0的发展历程,分享了”多模态与文本预训练模型的文本嵌入差异研究”的完整研究过程及成果。授课最后,宋睿华副教授对多模态理解与创作的未来趋势进行了总结,鼓励听众勇于挑战学术难题。

第二堂课《视觉基础大模型》由代季峰副教授主讲。他指出通用大模型正在引领人工智能发展浪潮,围绕”超大规模视觉模型”及相关技术路线展开精彩讲解。代季峰副教授不仅描述了LLM(大规模语言模型)的强大功能,更称赞其为通用人工智能发展道路上的重要里程碑。

第三堂课《对话式大型语言模型》由孙天祥博士主讲。授课内容分为四个部分:预训练数据、自然语言基座模型、对话语言模型和OpenLMLab,系统性地介绍了对话式大型语言模型的构建方法。

第四堂课《大语言模型的训练和优化方法》由王炳宁老师主讲。他首先系统梳理了语言模型的发展历程,指出近年来语言模型发展呈现超线性增长趋势,发布频率不断加快。随后,他对大语言模型的基础框架及优化方法进行了详细阐述,并表达了对大语言模型的美好憧憬,以及为中文互联网大语言模型发展贡献力量的决心。

第五堂课《TableGPT——大模型的漫长落地之路初探》由赵俊博研究员主讲。授课前,他以风趣的方式解释了为何为课题名称加上”渡劫”二字,坦言研究过程充满挑战与挫折,希望激励处于研究瓶颈期的同行们。赵俊博研究员介绍了团队研究背景,阐述了从刚性LLM到选择”TableGPT”的决策过程。随后,他详细介绍了”TableGPT”的功能、落地过程及方案,并以幽默的比喻总结道:从通用LLM到领域LLM的转变堪比”文科生到理科生”的蜕变。

第六堂课《达摩院通义mPLUG多模态大模型技术与应用》由严明老师主讲。他首先回顾了多模态大模型技术发展历程,重点介绍了团队研究的两条路径:mPLUG模块化多模态预训练大模型技术系列,以及大小模型协同的Agent系统。最后,严明老师对”ModelScope”实战应用进行了详细讲解。

至此,第三期人工智能创新技术讲习班”多模态大模型技术前沿与应用”的6节课程全部结束。邱锡鹏教授在线上做结业总结,回顾了6位专家学者的精彩授课内容,指出这些前沿研究成果让听众耳目一新。他还表示,多模态大模型发展尚处起步阶段,未来机遇与挑战并存,本次讲习班为研究者们搭建了宝贵的交流平台,有助于各方在学术研究及落地应用层面共同探索、学习进步。

最新快讯

2026年02月11日

04:29
微新创想:2026年2月11日,阿布扎比投资机构MGX据称正接近参与人工智能公司Anthropic的新一轮融资。该交易涉及阿联酋阿布扎比与美国加州(Anthropic总部所在地)之间的资本合作。MGX与Anthropic的合作将有助于推动中东地区在全球人工智能领域中的影响力。 此次投资被认为是对Anthropic现有业务模式的重要补充。Anthropic作为...
02:56
微新创想:2026年2月11日 美国科技巨头Alphabet在欧洲市场完成债券发售 累计募资110亿美元 此举使其2026年以来全球债券发行总额达300.1亿美元 发债地点为欧洲主要金融中心 发行主体为Alphabet Inc. 资金将用于一般公司用途 包括回购股票 偿还到期债务及营运资本补充 此次发债反映其在低利率环境下优化资本结构的战略意图 亦显示国际投...
01:51
微新创想:2026年2月11日 特斯拉宣布任命现任欧洲、中东和非洲区副总裁乔·沃德接任全球销售业务负责人 此次调整自即日起生效 公司表示此举旨在整合区域销售资源 强化全球市场协同与交付效率 乔·沃德自2019年起在特斯拉任职 历任英国 德国等多国销售高管 具备丰富的国际市场管理经验 公司强调此次任命不涉及组织架构大规模变动 原有区域销售团队保持稳定运行 以确...
00:13
微新创想:2026年2月10日,吉利银河全新插混SUV M7在意大利米兰正式亮相。该车为银河L7中期改款车型,车身加长60mm,风阻系数优化至0.27cd。采用“飞檐虎视”前脸、“旭日东升”尾灯等东方美学设计,彰显出中国智造的独特魅力。 搭载EM-i插混系统,该车型提供两种电池版本,纯电续航最高可达225km。满油满电综合续航达到1730km,大幅提升了用户...
00:13
微新创想:2026年2月,奥迪在中国市场启动入华以来规模最大的产品攻势,全年将推出8款全新及改款车型。此次布局覆盖燃油、插混、纯电三大动力形式,涵盖Q5L、A6L、A6L e-tron及纯电车型E7X等重点车型。 微新创想:行动旨在应对豪华车市场电动化转型趋势,延续油电并进策略,依托PPC燃油平台与PPE纯电平台,强化本土化智能座舱与驾驶辅助系统适配。 微新...
00:13
微新创想:据Insider Gaming编辑Tom Henderson在2月7日的播客中透露,R星可能在2026年8月初以“无预告突袭”的方式发布《GTA6》第三支预告片。这一举动不仅是为了吸引玩家关注,更旨在配合Take-Two当季的财报电话会议,通过预告片强化投资者对游戏未来的期待。 R星一直以来都以高调且富有创意的营销策略著称。此次选择在财报会议上发布...
00:13
微新创想:2026年2月10日 卡普空《生化危机5》Xbox Series版现身ESRB官网 标注含“内购”内容 暗示为完整重制版 2026年2月10日 卡普空宣布《生化危机5》Xbox Series版已出现在ESRB官网 并标注了“内购”内容 这一举动引发了玩家对游戏版本的猜测 认为可能是完整重制版 虽未列PS5版 但索尼定于2月13日举行State of...

2026年02月10日

23:12
微新创想:2026年2月10日,深圳第零智能科技股份有限公司正式向香港交易所递交上市申请。公司注册地及运营主体位于广东深圳,拟通过首次公开发行股票募集发展资金。本次IPO由民银资本独家保荐。 递表标志着该公司迈出港股上市关键一步,旨在拓展资本市场融资渠道,支持其在智能硬件与AI终端领域的研发及商业化进程。作为一家专注于智能硬件与AI终端技术的企业,第零智能近...
23:12
微新创想:2026年2月10日,摩根大通策略师Dubravko Lakos-Bujas团队指出,市场对AI短期颠覆软件行业的担忧不切实际,软件股正迎来反弹契机 该行认为,近期无差别抛售已导致板块估值处于历史低位,叠加持仓出清、悲观情绪过度及基本面稳健,风险平衡转向上行 建议投资者增配高质量、抗AI颠覆能力强的软件股 此次调整源于市场担忧AI工具冲击传统Saa...
23:12
微新创想:2026年2月10日,谷歌在美国正式推出升级版隐私搜索结果管理功能。这一更新旨在进一步增强用户对个人隐私的控制能力,让用户能够更方便地管理网络上的个人信息。 用户可以通过“关于你的搜索结果”页面,提交驾照、护照号、社安号(SSN)等敏感信息。系统会自动扫描互联网,查找包含这些信息的网页链接,并通知用户。用户可以申请移除对应的搜索结果,从而减少个人信...
22:38
微新创想:2026年2月10日,AOC爱攻正式发布24G4ZR与27G4ZR两款电竞显示器。这两款显示器分别采用了23.8英寸和27英寸的Fast IPS面板,为玩家带来更宽广的视野和更清晰的画质。它们的原生刷新率达到了240Hz,同时支持超频至260Hz,确保在高速游戏场景中流畅无拖影。 两款显示器的分辨率均为1920×1080,满足大多数玩家的日常使用和...
22:38
微新创想:2月6日,全国首单数字人民币智能合约在四川成都建筑行业工资发放场景成功应用。此次应用标志着数字人民币在实际场景中的深度落地,为农民工工资支付提供了全新的解决方案。 由中国人民银行数字货币研究所、四川省住房和城乡建设厅以及成都高新区管委会共同见证,一智科技与交通银行四川分行等机构携手推进,实现了对104名工人的精准薪酬发放,总金额超过100万元。所有...