声明:本文源自微信公众号量子位(ID:QbitAI),作者明敏、鱼羊,经微新创想授权转载发布。大模型浪潮席卷而来,为与之相关的所有领域带来了前所未有的变革。人工智能/机器学习平台作为这场变革的核心参与者之一,与大模型趋势紧密相连,不仅直接反映各大云厂商的AI技术研发实力,更彰显其洞察前沿趋势的能力。究竟谁家实力更胜一筹?这一话题正成为业内热议的焦点。在技术风向剧变的当下,AI/ML平台也迎来了全新的评价标准。国际权威机构Forrester最新发布的《首份中国人工智能/机器学习平台报告》,恰逢其时地为我们提供了重要参考。Forrester Research作为一家独立的技术与市场调研公司,其发布的研究报告在中国乃至全球范围内都享有极高的市场认可度。其中,《Forrester Wave》系列报告两年发布一次,是Forrester最具影响力的报告类型。报告深入调研了国内14家主流云厂商,包括百度智能云、阿里云、华为云、腾讯云等,从产品能力、战略规划和市场表现三个维度进行全方位评估。基于25项细分标准的严格考核,Forrester将这14家厂商划分为四个象限:领导者、优秀表现者、竞争者和挑战者。接下来,让我们一同聚焦报告中的关键亮点。
新趋势催生新标准
首先来看报告的核心结论。在这张象限图中,横轴代表战略水平,纵轴代表产品能力,将厂商划分为领导者、优秀表现者、竞争者和挑战者四个象限,同时体现其市场表现。具体分布如下:领导者(2家)、优秀表现者(5家)、竞争者(4家)、挑战者(3家)。百度智能云和阿里云位居第一梯队,其中百度智能云表现尤为突出,荣获综合得分第一。第二梯队竞争激烈,5家厂商在象限图中的位置十分接近。这一结论是Forrester基于25项评估得出的,不仅梳理了当前中国AI/ML平台的市场格局,更提出了新的评估标准。Forrester认为,在生成式AI和大模型趋势的推动下,AI应用落地的重要性日益凸显,以提升生产力水平、加速业务创新。中国企业迫切需要能够在自身业务环境中解决复杂问题的AI/ML平台。而要满足这一需求,以下三点缺一不可:
1. **全面的工具链**
2. **易用的加速器**
3. **规模化的模型运营(ModelOps)**
为何如此?Forrester指出,企业需要AI/ML平台不仅关注模型构建和训练的关键工具,还应重视AI应用开发所需的工具,例如面向专业人员的AI框架、Notebook,以及面向业务人员的低代码、可视化工具。此外,数据管理工具对模型构建同样至关重要。
2. **易用的加速器**
国内市场多数企业既缺乏既懂AI算法又懂业务的工程师,难以根据自身需求定制算法。他们拥抱大模型趋势的方式,要么是微调大模型,要么是进行提示工程。因此,能够加速AI模型构建和应用开发的加速工具显得尤为关键,如可视化工具、低代码开发等,都能进一步推动创新。
3. **规模化的模型运营(ModelOps)**
模型运营(ModelOps)涵盖模型部署、监控、更新、自动化等方面,可解决模型漂移、性能下降、安全维护和模型更新等问题,提供A/B测试、自动调整、模型再训练等能力。在大模型趋势下,具备大规模模型运营能力的AI/ML平台能更好地帮助企业开发部署管理AI模型,助力企业数字化转型、降本增效。
总结来看,一个AI/ML平台若想在新时代脱颖而出,需要提供简单易用的工具、满足行业需求、并能加速企业应用AI。具体而言,需要具备以下能力:
如何跻身“领导者”象限?
在本次Forrester报告中,百度智能云的表现令人瞩目。作为唯二进入“领导者”象限的云厂商,百度智能云不仅获得综合得分第一,还在9项细分评分中位居榜首。产品能力方面,百度智能云在数据、训练、预测推理、应用四个细分领域均处于领先地位。战略维度和市场规模方面,百度也多次获得第一。Forrester评价百度智能云为“中国基础模型的先行者之一”:百度智能云将ERNIE系列基础模型嵌入到具有可靠产品路线图的产品组合中,其围绕PaddlePaddle的活跃生态系统能有效吸引人工智能开发人员共同创新。其核心能力来自百度AI平台,包括BML、EasyDL和百度智能云千帆大模型平台等。以百度智能云AI平台为例,我们可以更深入地分析AI/ML平台如何在市场中占据领先地位。
根据Forrester报告的划分维度,具体能力可从以下五个方面展开:数据、训练、预测推理、应用和架构。这也是AI模型开发应用过程中最核心的五大要素。
1. **数据能力**
百度AI平台可同时处理结构化、非结构化数据,支持65种以上的数据可视化,包括饼图、热力图、散点图、地图等。支持10+种过滤组件,用户只需简单配置和拖拽,即可实现实时数据监控、辅助决策。同时,平台支持30+种数据格式标注,大幅提升建模环节中人力密集的标注效率。值得一提的是,百度AI平台提供主动学习标注能力,系统可直接从数据集中分析图片模式,自动筛选出最关键的图片,提示有限标注。例如,有10000张图需要标注,系统会将有特点的图前置、有重复性的后置,只需标注前3000张,后7000张就能自动完成,平均可为企业节省70-90%的人力。此外,平台集成了专业级特征库管理能力,提供特征的增删改查、特征生产、特征共享、特征版本管理、数据验证等功能,支持批式、流式不同形式数据用于预测服务,确保模型训练和预测时特征一致,直接关系到模型的准确性。Forrester报告给百度AI平台的数据能力打分为5(满分),大幅领先于其他厂商。
2. **模型训练能力**
这是最新趋势中市场需求最明显的方面之一,不仅面向专业开发者,也服务于对AI算法不熟悉的业务人员,因此要求AI/ML平台足够易用和灵活。百度AI平台的做法兼顾“广度”和“深度”:
– **广度**:支持多种数据的建模和训练,如图像、视频、文本、语音等,建模方式灵活,包括Notebook/WebIDE开发、拖拽式可视化开发、脚本调参、自定义作业等,可面向不同专业水平人群完成高精度模型定制开发。
– **深度**:在飞桨算法团队的支持下,百度AI平台对大量场景算子进行深度优化,包括图像分类、物体检测、文本分类、序列标注等。例如,基于Paddle算子深度优化的PP YOLO,效果已超越目标检测领域标杆YOLO V3。
易用性也是一大重点。百度AI平台支持零代码建模和可视化建模,前者只需上传数据、选择类型即可开始建模;后者通过拖拽拼接组件、设置参数即可组配建模流程。此外,随着AI计算量每年至少10倍的增长,深度学习训练中调整任务资源的能力尤为重要。百度AI平台支持多机多卡分布式训练,并提供多种类型算力资源,加上百度在训练超大模型方面的丰富经验,在视觉大模型、生成式AI等方面整合了自身能力,如自动超参数搜索、不平衡数据自动处理、超大规模预训练等。平台还提供大量开发工具,提升编程效率。
3. **预测推理能力**
随着大模型趋势的发展,推理市场将进一步扩大甚至呈指数级增长,这对AI/ML平台提出了巨大挑战。百度AI平台主要关注开发效率、性能优化、灵活度和广泛度:
– **开发效率**:推理模块Model Serve支持16种AI框架,包括Paddle、TensorFlow、PyTorch等,以及Matlab/R、Xgboost等。
– **性能优化**:通过异步推理调度器实现推理Worker异构,将服务器性能和GPU利用率提高1倍以上,同时支持自动化批处理,将大小类似的任务编入同一batch以充分利用异构资源,效率再提升70%。
4. **应用能力**
报告中的应用主要考察各平台的应用效率,即如何利用现有资源快速将数据转化为企业生产力。百度AI平台提供从数据采集清洗到模型开发训练、模型管理,再到云端及离线推理服务管理等AI开发过程的全生命周期管理能力。值得一提的是,百度AI平台是国内首家达到信通院MLOps标准旗舰级的平台,已向金融、能源、交通等行业输出能力,服务浦发银行、北京银行,以及国家电网、南方电网等。2022年,百度智能云AI平台公有云付费用户数增长49%,私有化客户数增长32%,开发者增加122.8万,增长率约40%,复购率连年上升,重点行业复购率已达到50%。
5. **架构能力**
百度AI平台的架构设计在Forrester评分中荣获满分。如果用一句话总结,百度AI平台之所以达到“领导者”水平,就是做到了:算法多、工具多、运行快、效果好,同时节省服务器和人力,并保障安全和易用。通过对百度AI平台整体能力的分析,不难发现其中许多工具和构思都符合当下大模型趋势的新需求。
大模型时代,云上AI新竞争格局初定
大模型浪潮冲击下,市场对AI/ML平台的需求发生了哪些新变化?过去,CV、NLP等模型虽有SOTA之名,但在产业界更多被用于非核心业务。而现在,大模型凭借其颠覆传统工作流的惊人能力,开始受到越来越多认可,被视为突破各行业智能化瓶颈的关键。但对于云厂商而言,大模型时代并非“从零再出发”。随着大模型应用的深入,Agent(智能体)等技术领域越来越受关注。核心在于,大模型基于自身能力,在实际应用中连接调度成熟的小模型去解决问题,这种模式在生产场景中落地更快、更具价值。因此,在大模型开启的“新时代”里,对于AI/ML平台的“领导者”而言,小模型时代的技术积淀和大模型时代的技术创新,两者缺一不可。百度AI平台的答卷——百度智能云千帆大模型平台就是典型案例。
百度智能云千帆大模型平台作为一站式企业级大模型平台,本质上是百度在芯片层、框架层、模型层和应用层均有深度积累后的产物。具体体现在以下五个方面:
1. **算力层面**
百度智能云千帆平台提供高效、高性价比的异构算力服务。在大模型训练环节,通过分布式并行训练策略和微秒级互联能力,百度千帆平台上万卡规模集群训练的加速比可达95%,万卡集群有效训练时间占比达96%,大幅降低算力和时间成本。
2. **模型层面**
百度千帆平台纳管了包括文心大模型、Llama系列、ChatGLM等在内的44个国内外主流大模型,支持用户快速调用API直接获取大模型能力。对于第三方大模型,平台还针对性地进行了优化,包括中文增强、性能增强、上下文增强等。百度透露,百度千帆平台的大模型API调用量正持续高速攀升,目前已服务超过2万家客户。
3. **二次开发能力**
对于希望基于现有大模型进行二次开发的客户,百度千帆平台提供全生命周期工具链,以及41个高质量数据集,能实现针对具体业务场景的模型快速调优。
4. **应用层面**
针对企业基于大模型开发AI原生应用的需求,百度千帆平台提供了一系列能力组件和框架。例如,内置226个Prompt模板,让开发者在不熟悉提示工程的情况下也能快速提升大模型的回答质量。在10月17日的百度世界大会上,百度智能云还发布了“百度千帆AI原生应用开发工作台”,由应用组件+应用框架组成:
– **应用组件**:包括AI组件(问答、思维链等大语言模型组件,以及文生图、语音识别等多模态组件)和基础云组件(向量数据库、对象存储等传统云服务能力)。
– **应用框架**:面向具体场景任务,以大模型能力为基础,上述应用组件的有效组合应用。目前,百度千帆平台提供了检索增强生成(RAG)和智能体(Agent)等常用AI原生应用框架。
– **RAG框架**:将企业专有领域内的知识与大模型问答能力结合,对专业知识做出更精准的回答。三一重工基于此框架,快速实现了官网智能客服应用的开发和上线。搭建“小助手”的成本只需几百元,后续用户每次咨询仅需几分钱。
– **Agent框架**:大模型可对人类给定的任务进行自动拆解、规划并调用各种组件协同完成任务,同时根据任务完成效果自我反馈、改进自身能力。中天钢铁基于此框架,打造了智能化的“企业调度中枢”,实现任务指令的自动感知、分解和执行。例如,在发现钢铁产量不达标时,只需提问一次,大模型即可自动调用平台纳管的资源和API,找出未达标原因,及时调整排产计划并发送邮件通知调度人员。
5. **AI原生应用商店**
百度千帆上线了“AI原生应用商店”,连接AI原生应用的供应方和需求方,为大模型商业机会的汇集地。
不难看出,百度智能云千帆大模型平台的快速推出得益于百度自身大模型技术的发展,同时百度AI平台多年积累的产品能力及丰富的工业界实践经验,使得百度千帆平台在应用侧率先发挥实效。
根据IDC数据,2022年中国AI公有云服务市场逆市增长80.6%,整体市场规模达79.7亿元人民币。IDC分析认为,生成式AI、大模型的落地正处于起步阶段,这些能力在公有云上能看到更快速的更新迭代,短期内将为AI公有云服务带来明显利好。Gartner也指出,生成式AI由大模型驱动,对计算基础设施提出了强大、高可扩展的要求。“云提供了完美的解决方案和平台,生成式AI竞赛的关键参与者必然是头部云厂商。”结合Forrester的最新报告,可以看出AI云服务已成为云厂商新的竞争焦点,而竞争力如何衡量,评价标准也逐渐清晰:
核心在于:
1. **从开发者、企业用户角度**:依托AI云服务平台的能力,能否真正高性价比地解决复杂业务中的实际问题,以及智能化升级过程中,尤其是大模型浪潮下专业人才短缺的问题。
2. **从技术趋势角度**:与大模型的结合是否更为紧密。
百度AI平台的布局,可视为头部AI云厂商在最新竞争格局变化中给出的一份参考答案。至于成效如何?更多的落地案例中,可见真章。