微新创想(Idea2003.com)7月4日 消息:随着人工智能工具应用的日益广泛,企业对能够高效处理多样化任务的智能系统的需求正持续攀升。拥有ChatGPT或Bard等先进聊天界面,能够对长篇文档进行精准摘要或深度挖掘客户数据以提炼商业洞察,已成为企业提升运营效率的关键。然而,要实现这些高级功能,AI模型必须经过海量数据的严格训练。尽管许多企业出于成本考量选择了参数量更小、经济性更高的模型,但这类模型在处理复杂任务时往往力不从心。以Meta的LLaMA、Falcon-7B和MPT-7B等开源模型为例,其最大序列长度仅约2000个token,难以胜任对冗长非结构化数据如文件内容的深度分析。为突破这一瓶颈,Salesforce推出了创新的大型语言模型XGen-7B,该模型经过长达8000个token序列的训练,显著提升了处理海量文档输入的能力,总处理量高达1.5万亿个token。Salesforce的研究团队采用自研的JaxFormer框架及公共领域的高质量教学数据,成功训练出这一参数量达70亿的模型。在性能表现上,XGen-7B与LLaMA、Falcon和Redpajama等主流开源模型相比,实现了并跑甚至超越的优异成果。据SalesforceAI研究人员透露,借助Google Cloud的TPU-v4云计算平台,在1万亿个token规模上完成模型训练的投入仅为15万美元,展现出极高的性价比。XGen-7B基准测试表现卓越在多项权威基准测试中,XGen-7B的表现令人瞩目,在多个关键指标上超越了备受青睐的开源大型语言模型。在”Measuring Massive Multitask Language Understanding(MMLU)”基准测试中,XGen在四个测试类别中的三个取得了最高分,其加权平均分同样位居首位。仅在人文领域测试中,Meta的LLaMA表现略胜一筹。在零样本测试环节,XGen同样表现出色,虽在人文领域仍稍逊于LLaMA,但在整体零样本测试中仅在”TruthfulQA”基准测试中落后于其他模型。在ARC_ch、Hella Swag和Winogrande等基准测试中,LLaMA表现更优,但在代码生成任务上,XGen以14.20的pass@1指标成绩,大幅领先LLaMA(10.38)及其他竞争模型。特别是在处理长序列任务时,Salesforce的AI模型展现出压倒性优势,在SCROLLS基准测试的QMSum和GovReport数据集上均获得高分。不过研究团队特别指出,由于XGen模型未使用相同的教学数据进行训练,因此与同类模型存在可比性差异。XGen-7B系列模型详解Salesforce研究团队开发了三个不同配置的XGen-7B模型:XGen-7B-4K-base、XGen-7B-8K-base和XGen-7B-inst。XGen-7B-4K-base可处理8000亿个上下文token,采用两阶段训练策略,先在2000个token规模数据上训练,再扩展至4000个token。该模型遵循Apache-2.0许可协议,允许衍生作品采用不同许可方式分发,但原始组件必须保留Apache2.0许可。XGen-7B-8K-base在4K-base基础上增加3000亿token处理能力,总上下文理解能力达到1.5万亿个token,同样采用Apache-2.0许可。XGen-7B-inst则基于公共领域教学数据(包括databricks-dolly-15k、oasst1、Baize及GPT相关数据集)进行微调,在4000和8000个token规模上训练,主要用于研究目的。模型训练采用创新的两阶段策略,每个阶段使用不同数据组合。团队表示:”在C4数据处理中,我们整合了6个Common Crawl转储,通过保留各URL文档的最新版本实现跨转储去重,并构建线性分类模型将数据分为维基百科类文档和随机文档,最终选取前20%的维基百科类文档。”随后将Salesforce与Hugging Face联合开发的代码生成模型Starcoder纳入训练,其核心数据与前一阶段成果混合。模型采用OpenAI的tiktoken进行token化,并额外添加连续空白和制表符token。XGen-7B的局限性尽管训练出了一系列高性能AI模型,XGen系列仍存在改进空间。Salesforce指出,该模型在生成内容时仍可能出现事实性偏差问题。关于XGen-7B的更多技术细节,Salesforce已在官方博客发布详尽文章。模型代码库托管于GitHub,预训练检查点可在Hugging Face平台获取。上下文长度的重要性能够理解更长输入的模型对企业应用具有革命性意义。Salesforce研究人员强调,海量上下文数据使预训练语言模型能够深入分析客户信息,对复杂查询提供精准回应。对于聊天机器人应用而言,更长的上下文支持意味着更流畅自然的对话体验。事实上,Salesforce并非唯一关注这一领域的科技企业。新兴AI初创公司Anthropic(由OpenAI前员工创立)近期显著扩展了旗舰应用Claude的上下文处理能力,使其能够从多份商业文件或书籍中提取关键信息,并解答相关数据问题。当前AI模型在扩展上下文长度方面仍面临挑战。当ChatGPT和Bing AI等应用用户在单次对话中持续使用模型时,回应质量会逐渐下降,这源于模型难以有效处理长序列上下文导致的混淆和幻觉现象。XGen-7B项目网址:https://blog.salesforceairesearch.com/xgen/
最新快讯
2025年10月02日
2025年10月2日,OpenAI迎来历史性时刻,成功完成约66亿美元的股份转让,这一壮举使其估值飙升至令人惊叹的5000亿美元,正式跻身全球最贵初创公司的行列。这一里程碑不仅彰显了OpenAI在人工智能领域的卓越成就,更预示着AI技术的无限潜能与广阔前景。
在战略布局方面,OpenAI宣布与日本数字厅达成深度战略合作,双方将携手推动AI技术在公共领域的创新...
在汽车行业经历深刻变革的浪潮中,极氪凭借自主研发的尖端技术成功突破了传统豪华车市场的壁垒。该品牌推出的极氪9X车型采用不计成本的研发模式,搭载了1400匹马力的三电机混动电驱系统,其动力表现堪比顶级超跑,为消费者带来了前所未有的驾驶体验。
极氪9X的突破性进展不仅体现在动力系统上,更在于其与宁德时代联合研发的900V混动专用电池。这一创新技术使得该车型实...
2025年10月2日,黄海南部及山东南部、江苏北部近岸海域将迎来一次由出海气旋引发的风浪天气。受其影响,该区域预计将出现中到大浪,浪高可达2至3.4米,风力强劲。国家海洋预报台已紧急发布海浪蓝色警报,提醒公众密切关注天气变化。此次大浪预计将持续至10月3日上午,相关部门已启动应急响应机制。海事部门特别提醒海上作业船只加强航行安全管控,及时调整作业计划,沿海单...
2025年10月2日,国泰海通总裁郁伟君在重要场合发表观点,强调“并购六条”政策及退市制度的完善对并购市场环境的显著优化作用。他指出,这些改革不仅大幅提升了交易效率,更增强了市场灵活性,为各类企业提供了更为广阔的发展空间。郁伟君特别提到,国家正积极鼓励龙头企业通过并购手段在半导体、生物医药、新能源等战略性新兴产业中实现做优做强,这一战略导向为投行提供了前所未...
Steam最新公布的2025年9月软硬件调查报告揭示了令人瞩目的市场动态。在显卡领域,RTX 4060笔记本显卡凭借0.22%的份额增长强势回归,再次登顶显卡占有率榜首。值得注意的是,桌面版RTX 4060却出现0.6%的份额下滑,跌至第三位。这一变化反映出消费者对移动端高性能显卡需求的持续升温。
在操作系统方面,Windows 11的份额实现了显著增长,增...
2025年10月2日,备受瞩目的岚图汽车科技股份有限公司正式向香港联合交易所提交上市申请,计划以介绍方式登陆港股市场。作为东风公司倾力打造的高端智慧新能源品牌,岚图不仅是中国首个实现20万辆整车下线的央国企高端新能源车企,更以其卓越的市场表现和前瞻性的战略布局,在行业格局中占据重要地位。
自2022年至2024年,岚图汽车销量复合增长率高达103.2%,...
交通运输部最新监测数据显示,10月5日全国公路路网将迎来国庆假期第二个出行小高峰。今年国庆长假期间,中长距离公路出行需求显著攀升,小客车自驾出行比例高达近八成,成为假期主要出行方式。其中,新能源车辆表现尤为抢眼,日均使用量达到1250万辆,占日均总流量五分之一,较去年同期激增约30%,展现出强劲的增长势头。
国家能源局最新统计报告显示,国庆当日高速公路充电量...
行业消息人士透露,大疆将于今年11月迎来产品线的大规模更新,旗下Neo 2轻型无人机、Mic 3 Pro麦克风以及Osmo Mobile 8手机稳定器将同步亮相,为用户带来全方位的影像创作升级体验。
Neo 2无人机在续航能力上实现了显著突破,配备166 mAh电池可支持超18分钟的飞行时间,同时创新性地采用双层桨叶保护罩设计,大幅提升抗风与抗冲击性能。...
10月1日,国庆假期迎来客流首日,重庆火车站迎来年度客流高峰,当日累计发送旅客高达36.8万人次,刷新了该站单日客发量的历史纪录。这一数据不仅超越了往年的国庆假期客流峰值,更比2025年“五一”假期单日最高客发量增加了整整3.9万人次,充分展现了市民出行热情的持续高涨。面对如此庞大的客流压力,铁路部门迅速启动应急预案,采取了一系列有力措施确保旅客出行顺畅。具...
星展集团研究部最新发布的研究报告,对紫金黄金国际的未来发展前景给予了高度评价。报告指出,凭借其庞大的黄金储备规模以及卓越的海外资产整合能力,紫金黄金国际有望在盈利能力和增长表现上持续领跑行业。作为紫金矿业海外黄金资产的核心上市平台,该公司展现出令人瞩目的增长潜力,未来发展空间巨大。
报告详细分析了紫金黄金国际的财务状况和业务布局,认为其在黄金资源掌控、海外市...
斯巴鲁力狮轿车在美国市场掀起了一股意外热潮。尽管这款经典车型已于9月12日在印第安纳州工厂正式停产,但其在当月的销量却逆势上扬,售出1884辆,同比增长8.3%,成为斯巴鲁品牌当月唯一实现销量增长的车型。最后一辆下线的磁铁灰限量版力狮,不仅是一辆汽车,更是这款经典家用轿车时代的象征性落幕之作。
自1989年首次问世以来,力狮凭借其独特的水平对置发动机与AWD...
大和证券资深分析师John Choi近期发布了一份深度行业报告,指出随着人工智能技术的全面渗透,中国云基础设施市场正迎来前所未有的发展机遇。报告特别强调,作为中国云计算领域的领军企业,阿里巴巴凭借其前瞻性的战略布局,有望在未来几年内实现跨越式增长。
John Choi在报告中详细阐述了人工智能技术对各行业带来的颠覆性变革,并指出云基础设施作为AI发展的基...