身处大模型浪潮之中,AI的热度持续高涨,一波接一波。7月6日,2023年世界人工智能大会在上海盛大召开,一度冲上微博热搜榜。在5万平方米的会场内,400多家企业的展台员工热情讲解着新产品,参会者络绎不绝,一位观众感慨道:”脚都走麻了,但心情还是很澎湃。”现场,光锥智能观察到展台按行业划分,软件、硬件、芯片”一家人整整齐齐”地排列。阿里、百度、腾讯三巨头同台竞技,观众在5分钟内即可纵览全国最新大模型,边看边对比。作为国内最大的AI盛会,此次大会与往届不同,通用人工智能的曙光似乎触手可及,群雄逐鹿的战意感染了每一位见证者。

特斯拉创始人埃隆·马斯克连线开场,图灵奖得主、中国科学院院士、上海期智研究院院长姚期智主持讨论,大会集齐了百度文心、阿里通义、华为盘古、讯飞星火、商汤日日新等30余个海内外大模型,以及80余位国内外院士,特斯拉、微软、华为、阿里等50余位海内外大咖,学术界与科技界正合力推开时代厚重的大门。

最为基础的大模型层,技术平台迎来新的迭代升级,如何赋能千行百业,推进产业落地成为新阶段的探讨主题。AI infra结构虽然尚不成熟,但大模型的配套设施跟了上来,适应大模型计算存储的向量数据库成为热门赛道,保证大模型安全运行的AI安全监测平台顺势而生。应用落地抢在了大模型成熟的前面,软件应用渗透至各行各业场景,硬件端又催生了一批机器人新产品。

中国大模型跑出了中国速度,技术层、配套设施层、应用层同时在各个环节同步崛起,而不是等着底层大模型技术成熟后才慢慢跟上。一面继续夯实地基,一面遍地开花,整舰加速前进,衍生出更多的中国大模型模式。

大模型,两条腿走路

从3月如雨后春笋般冒头至今,短短4个月的时间,大模型正在从”通用型”走向”产业落地”。通用大模型是一场”赢家通吃”的大逃杀,把大模型用起来,比做出来更重要。在此次世界人工智能大会上,所有大模型升级的关键词都是”产业”。作为大模型的提供方,蚂蚁、腾讯、百度、阿里、华为、网易等大厂结合此前已有领域的经验优势,快速探索垂类场景应用。

阿里的通义千问大模型,就率先用在了智慧金融。通过将自然语言理解和生成能力与金融场景结合,通义千问与中金财富、杭州银行、恒生电子等合作,通过智能问答、智能外呼、智能助手,来帮助企业识别市场风险、理解客户需求。以游戏和教育为主的网易,则将大模型率先与这两个领域结合。在教育领域,网易有道自研了国内首个教育大模型”子曰”,在此次大会还发布了最新应用成果——虚拟人口语教练,可以1V1体验类似真人的口语私教。而在自动驾驶领域积累多年的百度,把大模型投入了汽车交通领域。在汽车制造领域,百度智能云为长安汽车提供了人工智能基础设施平台和数字人平台,与吉利汽车一起打造了汽车行业大模型,构建了工厂数字化大脑,帮助降低管理运维成本。

正如华为轮值董事长胡厚崑提到:”人工智能的发展关键是走深向实,着力点放在让人工智能为千行百业的生产活动服务,为科研创新服务。”不过,这波中国大模型们产业落地的姿势虽各不相同,但在优势领域站稳后,都开始一致向外扩展,比拼起了行业覆盖能力。以腾讯为例,目前,腾讯云已经为传媒、文旅等10余个行业提供了超过50个大模型行业解决方案;华为的盘古大模型则主要与金融、制造、医药研发、煤矿、铁路等行业相结合落地……

总体而言,智慧政务、智慧金融、智慧交通成为抢手垂类赛道。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:”通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。”为了提升行业大模型的竞争力,企业们需要深入垂类行业的具体场景,贴身肉搏真正考验技术的细节与效果。

作为持续进化的技术,大模型光能用起来还不够。正如每一个技术的发展,都需要两条腿走路,一条是实用性,一条是先进性,大模型的实用性,是借由产业侧落地逐步探索的,而先进性则体现在对跨模态难题的突破。参考ChatGPT从3.5到4.0的路径,生成式大模型的技术前进之路,是单模态到多模态的,从一开始同质化严重的文生文,正在一路向文生图、文生声、文生视频演进。在通义千问之后,阿里云此次宣布推出”通义大模型”新成员AI绘画”通义万相”,与文心一格、商汤秒画类似,文生图赛道已经拥挤起来。而在文生图之后,文生声、文生视频是接下来的赛点。以视频为例,作为文、声、图的结合体,文生视频也是生成式大模型的终极形态。目前,文生视频技术的难点在于连贯画面素材的生产。基于数字人的已有技术,文生视频最快在数字人场景实现。例如,商汤的如影大模型,能将文本文案,一键生成知识分享、品牌宣传、短视频带货、培训宣讲、热点资讯等各类数字人视频,以及3D内容生成平台”琼宇”(场景生成)、”格物”(物体生成),基于3D内容生成技术对空间和物体复刻与交互。

以往,技术往往都是先发展,后应用。而在这一波大模型浪潮下,技术的先进性、实用性同步发展,两条腿走路的大模型正在加速前进。

产业拼图,逐个补齐

大模型狂奔了4个月,产业的拼图,也在一块一块逐渐补齐。以大模型为核心的MaaS服务平台,是大模型飞机着陆的机场。大模型如何落地、落地速度,都与这个机场平台的建设成熟程度紧密相关。目前,百度文心千帆、阿里灵骏PAI平台、腾讯模型商店、火山引擎的火山方舟,虽然有细分的差别,但都是MaaS服务平台,帮助企业更好的精调、部署行业大模型,将大模型应用在产业中。WAIC中,MaaS平台的升级也是一大主要看点。会上,腾讯云公开了几大重点行业方向,包括金融风控、交互翻译、数智人等创新场景,下一步将布局AI for Science,持续通过AI大模型应用在天文探索、文化考古等领域。在不久前,火山引擎也发布了MaaS服务平台火山方舟,包括模型广场和模型工具两个重要模块,核心目的也是通过平台力量帮助企业更好的做应用落地。

而在发展的过程中,安全问题也逐渐暴露出来。无论是AI诈骗还是三星的员工数据泄露,模型安全一度成为了社会焦点。现阶段,解决问题的前提是发现问题,亮起安全红灯,才能有的放矢的解决。为此,蚂蚁推出了可信程度安全评测系统”蚁鉴2.0″,作为业内首个产业级支持文本、图像等全数据类型的AI安全检测平台,”蚁鉴2.0″新增AIGC安全性、AI可解释评测能力,可服务于金融、教育、文化、医疗、电商等领域10多个大规模复杂业务场景。另外,蚂蚁还将发布以隐私计算技术为核心的隐语开源框架1.0版本、”隐私计算安全对战”科普互动游戏,数字版权保护平台”鹊凿”等。蚂蚁的技术人员告诉光锥智能:”当面对多模型决策时,企业可以将大模型开放给蚁鉴平台进行评分,将有4个不同的评分标准,就像论文的查重系统,检测模型的安全指数并打分,为企业提供指导。”不过,据光锥智能了解到,目前,蚁鉴仅能检测问题,并不提供针对性解决数据安全问题的方案。还需要其他厂商共同完善产业链条。

另一方面,数据技术的发展也在突破大模型本身的限制。正如前文所讲,大模型正在经历从通用到行业的变迁,这个过程受到两个方面的限制:一是通用大模型只有”短期记忆”,无论是国内还是国外,OpenAI最新发布了GPT4的开源版本中也强调,有8k的Token限制;二是训练行业专有大模型,企业需要将私有数据与通用大模型进行结合,私有数据如何安全的接入大模型?如何更高效率、低成本的处理动态变化的数据?这也就是为什么,大模型火了之后,向量数据库随之火爆的原因。星环科技创始人孙元浩向光锥智能解释道:”向量数据库就像是大模型的外脑,能够帮助大模型拥有长期记忆,且私有数据可以通过向量化存储在向量数据库中,既能满足瞬时接入和输出,也保障企业私有数据不被泄露。”为此,腾讯云发布了云原生向量数据库Tencent Cloud VectorDB,支持10亿级向量检索规模,并将延迟控制在毫秒级。相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。星环科技发布了分布式向量数据库Transwarp Hippo。支持存储、索引以及管理海量的向量式数据集,提供向量相似度检索、高密度向量聚类等能力,有效地解决了大模型在知识时效性低、输入能力有限、准确度低等问题。向量数据库火爆的背后,是大模型带动着整个数据产业链向前发展。在训练大模型之前的数据准备(清洗、过滤、提纯)、数据处理(选型、质量、标注)在经历了数道工序后才能”喂”给大模型,而中国目前数据产业相对分散,导致数据在流通的过程中容易遇到安全问题,且效率不高。比如,需要先把复杂的非结构化数据通过向量化(embedding),处理统一成多维空间里的坐标值,才能够为大模型所用,但如Zilliz一类的向量数据库,并不帮企业完成向量化的过程。这就需要一个一站式的数据处理平台。和数据打了十几年交道的孙元浩,将经验凝结在了星环的Sophon LLMOps中,通过该平台,用户可以完成数据采集、知识沉淀、大模型迭代提升的完整闭环。同时将向量数据库与图数据库进行结合,能够更好的帮助大模型跨领域知识学习和调优,让大语言模型能更好的理解不同领域的专业术语、缩写、常见词汇和语法,承担统一的语义理解功能,解决业务领域性问题。

产业链的陆续补齐,是大模型发展的基石,同时也将带起诸多的产业链机会,共建一个完整的模型生态。

软件、硬件,两手抓

今年整个展览馆,素有”人气王”之称的机器人被数字人抢了风头。数字人展馆外人头攒动,围了一圈又一圈。商汤搭建如影数字人生成平台,现场演绎3D数字人生成过程;网易有道竖屏展示虚拟人口语教练,吸引了参展人上前互动;魔珐科技还原虚拟人试播间,虚拟人一上午连播三场。虽然,近期AI主播、AI数字人大规模涌入了短视频平台,掀起了一波讨论热度,但逛完一圈却发现没人展出2D数字人,显然相比其实用性,酷炫、好玩、互动性强的3D数字人更能抢夺人们的目光。

走进AI绘画平台的场馆,依然令人眼花缭乱。阿里打造巨屏展示其文生图效果,商汤使用超大卷屏演示其秒画功能。数字人、AI绘画,AIGC俨然成为大众最关心的事儿,也是大模型应用中跑得最快的方向。AIGC热度居高不下,成为了人们茶余饭后的谈资,不过更重要的是要推进产业落地。网易伏羲预训练及生成式人工智能平台负责人赵增告诉光锥智能,目前游戏是图像生成的核心应用场景之一。”游戏场景需要创作大量的内容,例如各种不同朝代的角色,世界各地的风景,通过文图功能可快速生成手稿,激发创意,提升游戏制作效率。”

光锥智能逛展过程中发现,相比于年初,市面上内容生成的类型变得丰富了起来。文生图几乎是各家的标配,除此之外,更多维度的多模态能力越来越完善。比如,腾讯利用文生音频技术,在音乐创作领域推出了XMusic生成式通用作曲框架。从最初的文生图,到现在的文生音频、图生图,生成内容的类型越来越多样化,呈现出从单模态走向多模态的趋势。但这还远远不够,参照国外Midjourney一类软件的发展,文生视频将是下一阶段的方向,而国内公司在这方面探索还处于特别早期。

“左手软件,右手硬件”,AIGC应用落地正在表现出”两手抓”的趋势。大会刚开幕,马斯克在发言中就提出:”未来人类将会有更多机器人产品,预计地球上的机器人数量将会超过人类数量。”据了解,今年现场共20余款机器人共同亮相,多款为首发,包括达闼搭载大模型对话能力的双足机器人、特斯拉人形机器人擎天柱、网易伏羲具身智能工程机器人、微创手术机器人、美团无人机V4、宇树四足机器人、科大讯飞机器狗、云深处绝影Lite3四足机器人等。

大模型让软件重做了一遍,但离实际应用到机器人行业还有很长的距离。长期以来,机器人一直面临前端需求不足、单体成本太高、无法规模化生产等难题。某机器人厂商市场负责人向光锥智能透露,几年间,我们的机器人成本降低到此前的三分之一,但于行业而言,在实际应用中还有很多未知问题需要磨合。上述负责人表示,理想状态下,大模型能够使机器人长出灵魂,让它自主做决策,跟实际环境去互动。但遗憾的是,目前还很难做到,机器人的边缘端资源有限,已有的算力带不动大模型部署,而部署了高昂的GPU又会继续拉高机器人的单价。对此,有创业者称,AI技术路线尚未走通,可能五年之内也难出现大规模人形机器人的产品形态应用。不过,包括马斯克在内的多位企业家都认为,机器人是人工智能的”具身智能”落地。在更长期的未来中,机器人的成熟会将人工智能的应用从信息产业,带向更深更大的实体世界中。

结语

中国大模型正处于一片欣欣向荣的态势。不过,行业热闹之中,我们也看到了大模型技术路径、产业落地、配套设施搭建、应用生态仍处于早期阶段。正如阿里云周靖人所说:”大模型领域你追我赶的过程刚刚开始,大家还是要有一些耐心。”

最新快讯

2025年11月23日

08:32
2025年11月21日,中国汽车制造业迎来重大突破,上汽集团正式宣布其与清陶动力合作的全固态电池产线在上海安亭成功贯通。这一里程碑意义的进展预示着新能源汽车技术将迎来革命性变革。据悉,该产线预计在年底前完成首批样件下线,为2026年的样车测试奠定坚实基础,并计划于2027年实现"光启电池"的量产交付,正式推向市场。 该固态电池技术展现出卓越的性能指标:能量密...
07:53
2025年11月22日,峰飞航空科技震撼发布全球首款“海空一体低空经济解决方案”,这一创新举措标志着低空经济进入全新发展阶段。该方案巧妙融合零碳水上机场与eVTOL垂直起降航空器,实现了陆地与水域运输的无缝衔接,具备极强的快速部署能力,可灵活应用于江河湖海等多样化地理环境。 水上机场作为方案核心,采用纯电动驱动技术,全面集成起降平台、光伏供能系统、智能调度平...
07:53
2025年11月23日,中国汽车产业迎来重大突破,广汽集团正式宣布其自主研发的大容量全固态电池产线已成功建成并进入小批量测试生产阶段。这条产线不仅标志着中国在全球固态电池技术领域取得领先地位,更将为中国新能源汽车产业的可持续发展注入强劲动力。 该产线具备60安时以上车规级电池的量产能力,其能量密度较现有电池技术提升近一倍,达到了惊人的水平。面容量最高可达7....
07:53
2025年11月22日,视觉(中国)文化发展股份有限公司联合其他两家公司,在其官方网站联合发布了一份正式声明,就摄影师戴建峰的著作权纠纷案公开致歉。声明中明确指出,其网站平台上展示并销售的《银河下的村庄》图片,系未经授权的第三方盗图行为上传,最终经法院审理认定,该侵权行为严重侵犯了戴建峰的署名权与信息网络传播权。视觉中国方面强调,在问题曝光后已第一时间采取行...
00:09
2025年11月22日,宾利汽车以创新科技重新定义奢华体验,正式推出支持定制动画的迎宾灯光系统。这项前沿技术允许客户自由创作最长11秒的独特动画效果,为每一次出行注入个性化魅力。据悉,该技术首次亮相于在罗马尼亚雅典娜神庙举办的特别活动中,通过车门下方精密投影装置,为宾客呈现令人惊叹的光影艺术。 该系统采用尖端光学设计,集成了三色光源、五个高精度镜头、两个特殊...

2025年11月22日

23:32
微新创想11月22日讯 谷歌近日震撼发布全新Gemini3系列大模型,凭借卓越性能强势超越OpenAI,成为当前AI领域的顶尖力量,其影响力更推动谷歌股价实现历史性飞跃。Gemini 3系列的崛起,离不开谷歌自研TPU生态的强大支撑,这一技术壁垒为谷歌在AI领域的持续领先奠定了坚实基础。展望未来,若想保持Gemini 4的领先地位,谷歌必须进一步强化算力基础...
23:32
近日,航天技术领域传来重大进展,Axiom Space与KBR公司成功联手完成了一项关键性的新型舱外机动单元航天服测试。此次测试的核心目标是为NASA备受瞩目的“阿尔忒弥斯”重返月球计划提供坚实的技术支撑。整个测试过程在模拟真空环境下严谨进行,重点聚焦于航天服在极端环境下的热性能表现以及先进材料的实际应用效果。 据研究员Russell Ralston透露,本...
23:32
2025年11月25日至12月2日,《战地6》将开启为期一周的盛大免费试玩活动,为广大玩家提供深度体验的机会。本次试玩内容丰富多样,涵盖征服、突破、破坏、团队死斗以及一种神秘未公布模式,让玩家可以在“东方木林”“布莱克韦尔农场”“开罗围城”三张精心设计的地图中尽情探索。这三张地图各具特色,从紧张刺激的战场到充满策略的据点争夺,将为玩家带来全方位的游戏体验。 ...
22:58
微新创想11月22日讯 小米集团于当晚隆重举办小米17与澎湃OS3庆功盛典,以"软硬融合 共赴巅峰"为主题,向全球用户展示其创新成果。卢伟冰在社交媒体上分享的菜单细节,堪称一场精心策划的感官盛宴,从"澎湃启航"到"卓越并肩",四个篇章精心呈现了18道精致菜品及各式主食水果,每道菜名均巧妙融入"初心"、"希望"、"开拓"等关键词,将产品理念巧妙地编织在宴席的每...
22:58
微新创想11月22日重磅消息,知名科技博主罗永浩在最新一期《罗永浩的十字路口》播客节目中,首次公开透露了锤子科技濒临倒闭时的关键决策。他坦言,若没有推出备受争议的TNT项目,锤子科技或许能多存活数年。罗永浩回忆道,当时他并不满足于传统的产品迭代,渴望进行颠覆性的创新,正是这种雄心壮志催生了TNT项目。 在节目中,罗永浩详细阐述了TNT项目的初衷和愿景。他认为...
22:58
微新创想11月22日重磅消息,知名分析师Jeff Pu在其最新发布的研究报告中透露,苹果将推出全新iPhone 17e机型,计划于2026年第一季度中期正式发售。相较于前代iPhone 16e,iPhone 17e最引人注目的核心升级在于搭载了前置1800万像素摄像头,该配置与万元旗舰iPhone 17 Pro Max看齐,预示着苹果在移动影像领域的再次突破...
22:58
微新创想11月22日讯 近期,百川智能创始人王小川在一场重要活动上发表了一场引人深思的主题演讲。在回顾自身职业发展历程的同时,他也清晰阐述了未来的宏伟愿景。他坦诚地表示,早在2021年将公司出售给腾讯时,告别信中便已明确写下自己的梦想——生命科学与大健康领域。面对外界的疑问,他强调自己并非在寻找方向,而是早已目标明确,只是在等待技术的成熟。"当时的技术尚未...