微新创想(Idea2003.com)7月4日 消息:随着人工智能工具应用的日益广泛,企业对能够高效处理多样化任务的智能系统的需求正持续攀升。拥有ChatGPT或Bard等先进聊天界面,能够对长篇文档进行精准摘要或深度挖掘客户数据以提炼商业洞察,已成为企业提升运营效率的关键。然而,要实现这些高级功能,AI模型必须经过海量数据的严格训练。尽管许多企业出于成本考量选择了参数量更小、经济性更高的模型,但这类模型在处理复杂任务时往往力不从心。以Meta的LLaMA、Falcon-7B和MPT-7B等开源模型为例,其最大序列长度仅约2000个token,难以胜任对冗长非结构化数据如文件内容的深度分析。为突破这一瓶颈,Salesforce推出了创新的大型语言模型XGen-7B,该模型经过长达8000个token序列的训练,显著提升了处理海量文档输入的能力,总处理量高达1.5万亿个token。Salesforce的研究团队采用自研的JaxFormer框架及公共领域的高质量教学数据,成功训练出这一参数量达70亿的模型。在性能表现上,XGen-7B与LLaMA、Falcon和Redpajama等主流开源模型相比,实现了并跑甚至超越的优异成果。据SalesforceAI研究人员透露,借助Google Cloud的TPU-v4云计算平台,在1万亿个token规模上完成模型训练的投入仅为15万美元,展现出极高的性价比。XGen-7B基准测试表现卓越在多项权威基准测试中,XGen-7B的表现令人瞩目,在多个关键指标上超越了备受青睐的开源大型语言模型。在”Measuring Massive Multitask Language Understanding(MMLU)”基准测试中,XGen在四个测试类别中的三个取得了最高分,其加权平均分同样位居首位。仅在人文领域测试中,Meta的LLaMA表现略胜一筹。在零样本测试环节,XGen同样表现出色,虽在人文领域仍稍逊于LLaMA,但在整体零样本测试中仅在”TruthfulQA”基准测试中落后于其他模型。在ARC_ch、Hella Swag和Winogrande等基准测试中,LLaMA表现更优,但在代码生成任务上,XGen以14.20的pass@1指标成绩,大幅领先LLaMA(10.38)及其他竞争模型。特别是在处理长序列任务时,Salesforce的AI模型展现出压倒性优势,在SCROLLS基准测试的QMSum和GovReport数据集上均获得高分。不过研究团队特别指出,由于XGen模型未使用相同的教学数据进行训练,因此与同类模型存在可比性差异。XGen-7B系列模型详解Salesforce研究团队开发了三个不同配置的XGen-7B模型:XGen-7B-4K-base、XGen-7B-8K-base和XGen-7B-inst。XGen-7B-4K-base可处理8000亿个上下文token,采用两阶段训练策略,先在2000个token规模数据上训练,再扩展至4000个token。该模型遵循Apache-2.0许可协议,允许衍生作品采用不同许可方式分发,但原始组件必须保留Apache2.0许可。XGen-7B-8K-base在4K-base基础上增加3000亿token处理能力,总上下文理解能力达到1.5万亿个token,同样采用Apache-2.0许可。XGen-7B-inst则基于公共领域教学数据(包括databricks-dolly-15k、oasst1、Baize及GPT相关数据集)进行微调,在4000和8000个token规模上训练,主要用于研究目的。模型训练采用创新的两阶段策略,每个阶段使用不同数据组合。团队表示:”在C4数据处理中,我们整合了6个Common Crawl转储,通过保留各URL文档的最新版本实现跨转储去重,并构建线性分类模型将数据分为维基百科类文档和随机文档,最终选取前20%的维基百科类文档。”随后将Salesforce与Hugging Face联合开发的代码生成模型Starcoder纳入训练,其核心数据与前一阶段成果混合。模型采用OpenAI的tiktoken进行token化,并额外添加连续空白和制表符token。XGen-7B的局限性尽管训练出了一系列高性能AI模型,XGen系列仍存在改进空间。Salesforce指出,该模型在生成内容时仍可能出现事实性偏差问题。关于XGen-7B的更多技术细节,Salesforce已在官方博客发布详尽文章。模型代码库托管于GitHub,预训练检查点可在Hugging Face平台获取。上下文长度的重要性能够理解更长输入的模型对企业应用具有革命性意义。Salesforce研究人员强调,海量上下文数据使预训练语言模型能够深入分析客户信息,对复杂查询提供精准回应。对于聊天机器人应用而言,更长的上下文支持意味着更流畅自然的对话体验。事实上,Salesforce并非唯一关注这一领域的科技企业。新兴AI初创公司Anthropic(由OpenAI前员工创立)近期显著扩展了旗舰应用Claude的上下文处理能力,使其能够从多份商业文件或书籍中提取关键信息,并解答相关数据问题。当前AI模型在扩展上下文长度方面仍面临挑战。当ChatGPT和Bing AI等应用用户在单次对话中持续使用模型时,回应质量会逐渐下降,这源于模型难以有效处理长序列上下文导致的混淆和幻觉现象。XGen-7B项目网址:https://blog.salesforceairesearch.com/xgen/

最新快讯

2025年11月23日

00:09
2025年11月22日,宾利汽车以创新科技重新定义奢华体验,正式推出支持定制动画的迎宾灯光系统。这项前沿技术允许客户自由创作最长11秒的独特动画效果,为每一次出行注入个性化魅力。据悉,该技术首次亮相于在罗马尼亚雅典娜神庙举办的特别活动中,通过车门下方精密投影装置,为宾客呈现令人惊叹的光影艺术。 该系统采用尖端光学设计,集成了三色光源、五个高精度镜头、两个特殊...

2025年11月22日

23:32
微新创想11月22日讯 谷歌近日震撼发布全新Gemini3系列大模型,凭借卓越性能强势超越OpenAI,成为当前AI领域的顶尖力量,其影响力更推动谷歌股价实现历史性飞跃。Gemini 3系列的崛起,离不开谷歌自研TPU生态的强大支撑,这一技术壁垒为谷歌在AI领域的持续领先奠定了坚实基础。展望未来,若想保持Gemini 4的领先地位,谷歌必须进一步强化算力基础...
23:32
近日,航天技术领域传来重大进展,Axiom Space与KBR公司成功联手完成了一项关键性的新型舱外机动单元航天服测试。此次测试的核心目标是为NASA备受瞩目的“阿尔忒弥斯”重返月球计划提供坚实的技术支撑。整个测试过程在模拟真空环境下严谨进行,重点聚焦于航天服在极端环境下的热性能表现以及先进材料的实际应用效果。 据研究员Russell Ralston透露,本...
23:32
2025年11月25日至12月2日,《战地6》将开启为期一周的盛大免费试玩活动,为广大玩家提供深度体验的机会。本次试玩内容丰富多样,涵盖征服、突破、破坏、团队死斗以及一种神秘未公布模式,让玩家可以在“东方木林”“布莱克韦尔农场”“开罗围城”三张精心设计的地图中尽情探索。这三张地图各具特色,从紧张刺激的战场到充满策略的据点争夺,将为玩家带来全方位的游戏体验。 ...
22:58
微新创想11月22日讯 小米集团于当晚隆重举办小米17与澎湃OS3庆功盛典,以"软硬融合 共赴巅峰"为主题,向全球用户展示其创新成果。卢伟冰在社交媒体上分享的菜单细节,堪称一场精心策划的感官盛宴,从"澎湃启航"到"卓越并肩",四个篇章精心呈现了18道精致菜品及各式主食水果,每道菜名均巧妙融入"初心"、"希望"、"开拓"等关键词,将产品理念巧妙地编织在宴席的每...
22:58
微新创想11月22日重磅消息,知名科技博主罗永浩在最新一期《罗永浩的十字路口》播客节目中,首次公开透露了锤子科技濒临倒闭时的关键决策。他坦言,若没有推出备受争议的TNT项目,锤子科技或许能多存活数年。罗永浩回忆道,当时他并不满足于传统的产品迭代,渴望进行颠覆性的创新,正是这种雄心壮志催生了TNT项目。 在节目中,罗永浩详细阐述了TNT项目的初衷和愿景。他认为...
22:58
微新创想11月22日重磅消息,知名分析师Jeff Pu在其最新发布的研究报告中透露,苹果将推出全新iPhone 17e机型,计划于2026年第一季度中期正式发售。相较于前代iPhone 16e,iPhone 17e最引人注目的核心升级在于搭载了前置1800万像素摄像头,该配置与万元旗舰iPhone 17 Pro Max看齐,预示着苹果在移动影像领域的再次突破...
22:58
微新创想11月22日讯 近期,百川智能创始人王小川在一场重要活动上发表了一场引人深思的主题演讲。在回顾自身职业发展历程的同时,他也清晰阐述了未来的宏伟愿景。他坦诚地表示,早在2021年将公司出售给腾讯时,告别信中便已明确写下自己的梦想——生命科学与大健康领域。面对外界的疑问,他强调自己并非在寻找方向,而是早已目标明确,只是在等待技术的成熟。"当时的技术尚未...
22:58
小米汽车安全技术再获突破 微新创想11月22日重磅消息 中国汽研权威发布的四大安全辅助功能测试中 小米YU7紧急转向辅助系统(AES)以全项通过的成绩惊艳亮相 董事长雷军亲自宣布这一里程碑式成果 就在前一天 小米创始人 首席执行官雷军公开表示 中国汽研组织的四大安全辅助功能测试中 小米AES紧急转向辅助功能已全部成功通过 这标志着小米汽车在智能驾驶安全领...
22:58
11月22日最新消息,河南一位女子近日在网上分享了一则令人惊叹的经历:她的丈夫仅用8万元人民币,成功拍下了一套位于威海乳山的70平米海景房,迅速引发全网热议。据女子详细描述,其丈夫偶然在某知名网络拍卖平台上发现了一套位于威海乳山的海景房,令人意外的是起拍价仅为1111元。在看到如此低廉的价格后,丈夫一时冲动缴纳了保证金,开启了一场惊心动魄的竞拍之旅。 起拍后...
22:58
2025年广州国际车展盛大启幕,212越野车携全新力作T01高地版震撼登场,官方指导价定格于20.58万元。这款硬核越野利器精准定位于"全地形战士",专为户外探险、长途穿越等极限场景量身打造,以强悍性能征服各种复杂路况。 外观设计上,T01高地版采用极具辨识度的"晨曦金"车身配色,搭配独特的高地纹理设计,彰显硬朗气质。细节处彰显专业越野基因:配备加厚防滑...
22:58
2025年11月22日,铭凡正式发布了备受瞩目的MS-02 Ultra迷你工作站,这款创新产品以惊人的4.8升紧凑体积,重新定义了高性能计算设备的界限。作为行业首款真正意义上的微型工作站,MS-02 Ultra不仅集成了尖端硬件配置,更在空间利用和性能释放上实现了完美平衡,为专业用户和小型办公环境提供了前所未有的解决方案。 这款迷你工作站的核心配置堪称顶级—...