微新创想(Idea2003.com)7月4日 消息:随着人工智能工具应用的日益广泛,企业对能够高效处理多样化任务的智能系统的需求正持续攀升。拥有ChatGPT或Bard等先进聊天界面,能够对长篇文档进行精准摘要或深度挖掘客户数据以提炼商业洞察,已成为企业提升运营效率的关键。然而,要实现这些高级功能,AI模型必须经过海量数据的严格训练。尽管许多企业出于成本考量选择了参数量更小、经济性更高的模型,但这类模型在处理复杂任务时往往力不从心。以Meta的LLaMA、Falcon-7B和MPT-7B等开源模型为例,其最大序列长度仅约2000个token,难以胜任对冗长非结构化数据如文件内容的深度分析。为突破这一瓶颈,Salesforce推出了创新的大型语言模型XGen-7B,该模型经过长达8000个token序列的训练,显著提升了处理海量文档输入的能力,总处理量高达1.5万亿个token。Salesforce的研究团队采用自研的JaxFormer框架及公共领域的高质量教学数据,成功训练出这一参数量达70亿的模型。在性能表现上,XGen-7B与LLaMA、Falcon和Redpajama等主流开源模型相比,实现了并跑甚至超越的优异成果。据SalesforceAI研究人员透露,借助Google Cloud的TPU-v4云计算平台,在1万亿个token规模上完成模型训练的投入仅为15万美元,展现出极高的性价比。XGen-7B基准测试表现卓越在多项权威基准测试中,XGen-7B的表现令人瞩目,在多个关键指标上超越了备受青睐的开源大型语言模型。在”Measuring Massive Multitask Language Understanding(MMLU)”基准测试中,XGen在四个测试类别中的三个取得了最高分,其加权平均分同样位居首位。仅在人文领域测试中,Meta的LLaMA表现略胜一筹。在零样本测试环节,XGen同样表现出色,虽在人文领域仍稍逊于LLaMA,但在整体零样本测试中仅在”TruthfulQA”基准测试中落后于其他模型。在ARC_ch、Hella Swag和Winogrande等基准测试中,LLaMA表现更优,但在代码生成任务上,XGen以14.20的pass@1指标成绩,大幅领先LLaMA(10.38)及其他竞争模型。特别是在处理长序列任务时,Salesforce的AI模型展现出压倒性优势,在SCROLLS基准测试的QMSum和GovReport数据集上均获得高分。不过研究团队特别指出,由于XGen模型未使用相同的教学数据进行训练,因此与同类模型存在可比性差异。XGen-7B系列模型详解Salesforce研究团队开发了三个不同配置的XGen-7B模型:XGen-7B-4K-base、XGen-7B-8K-base和XGen-7B-inst。XGen-7B-4K-base可处理8000亿个上下文token,采用两阶段训练策略,先在2000个token规模数据上训练,再扩展至4000个token。该模型遵循Apache-2.0许可协议,允许衍生作品采用不同许可方式分发,但原始组件必须保留Apache2.0许可。XGen-7B-8K-base在4K-base基础上增加3000亿token处理能力,总上下文理解能力达到1.5万亿个token,同样采用Apache-2.0许可。XGen-7B-inst则基于公共领域教学数据(包括databricks-dolly-15k、oasst1、Baize及GPT相关数据集)进行微调,在4000和8000个token规模上训练,主要用于研究目的。模型训练采用创新的两阶段策略,每个阶段使用不同数据组合。团队表示:”在C4数据处理中,我们整合了6个Common Crawl转储,通过保留各URL文档的最新版本实现跨转储去重,并构建线性分类模型将数据分为维基百科类文档和随机文档,最终选取前20%的维基百科类文档。”随后将Salesforce与Hugging Face联合开发的代码生成模型Starcoder纳入训练,其核心数据与前一阶段成果混合。模型采用OpenAI的tiktoken进行token化,并额外添加连续空白和制表符token。XGen-7B的局限性尽管训练出了一系列高性能AI模型,XGen系列仍存在改进空间。Salesforce指出,该模型在生成内容时仍可能出现事实性偏差问题。关于XGen-7B的更多技术细节,Salesforce已在官方博客发布详尽文章。模型代码库托管于GitHub,预训练检查点可在Hugging Face平台获取。上下文长度的重要性能够理解更长输入的模型对企业应用具有革命性意义。Salesforce研究人员强调,海量上下文数据使预训练语言模型能够深入分析客户信息,对复杂查询提供精准回应。对于聊天机器人应用而言,更长的上下文支持意味着更流畅自然的对话体验。事实上,Salesforce并非唯一关注这一领域的科技企业。新兴AI初创公司Anthropic(由OpenAI前员工创立)近期显著扩展了旗舰应用Claude的上下文处理能力,使其能够从多份商业文件或书籍中提取关键信息,并解答相关数据问题。当前AI模型在扩展上下文长度方面仍面临挑战。当ChatGPT和Bing AI等应用用户在单次对话中持续使用模型时,回应质量会逐渐下降,这源于模型难以有效处理长序列上下文导致的混淆和幻觉现象。XGen-7B项目网址:https://blog.salesforceairesearch.com/xgen/
最新快讯
2025年08月14日
还在为选择哪个AI模型而烦恼不已?面对琳琅满目的国内外大模型,选型耗时、信息分散、参数对比困难,是否让你感到效率低下?一个专注于“快选型”的AI模型库,或许正是你需要的导航利器。在AI应用开发或研究的前沿,选择一个合适的模型进行调用,往往是项目成功的第一步。然而现实情况是:模型爆炸式增长,国内外新模型、新版本发布速度惊人,GPT、Claude、通义千问、文心...
清晨当你打开科技媒体,满屏都是"革命性突破"的喧嚣;翻看行业社群,又会被十几条"必备神器"推荐淹没;订阅的 newsletters 更是塞满了厂商精心炮制的宣传稿。我们似乎已经完全沉浸在AI资讯的海洋中,却依然难以找到真正值得投入的工具。某咨询公司最新调研数据揭示了残酷的真相:高达87%的从业者表示,甄别AI工具信息的有效性比学习使用本身更难。更令人焦虑的是...
2025年8月14日,石基信息正式发布重大战略举措,宣布将通过发行股份的方式,对思迅软件进行战略投资。公司将斥资2.16亿元,定向收购上海云鑫、张育宏及张伟所持有的思迅软件13.50%股权。此次交易不仅标志着石基信息在软件领域投资版图的显著扩张,更体现了公司对数字化技术持续深耕的决心。
作为国内领先的软件服务商,石基信息此次精准布局思迅软件,旨在强化其在企业...
2025年8月14日 夜盘期货市场开盘即显露出明显的分化格局 多数品种遭遇下跌压力。其中 菜粕、菜油、沪镍以及橡胶等品种跌幅显著 超过1%的跌幅令人瞩目 焦煤、铁矿石和沪银等品种也未能幸免 纷纷出现下跌态势。然而 与此同时 市场也呈现出另一面 纯碱价格逆势上涨 超过1%的涨幅彰显其强劲动力 玻璃和液化石油气等品种也紧随其后 上涨趋势明显。整体来看 夜盘期货市...
8月10日,宁德时代位于江西宜春的枧下窝锂云母矿正式宣布停产,矿区内的传送带和选矿厂设备已全面停止运行。这一举措引发了业界的广泛关注,特别是考虑到当前全球对碳酸锂的需求持续攀升。据公司官方公告,此次停产主要源于正在办理的采矿证延续申请流程,预计对公司的整体经营业绩影响有限。尽管如此,市场分析师仍对碳酸锂的供需格局表示担忧,认为宁德的停产可能对锂价走势产生微妙...
2025年8月14日,亿帆医药(股票代码002019)震撼发布2025年半年财务报告,数据显示公司创新药销售收入同比增长高达169.57%,这一亮眼成绩显著提升了高毛利业务的占比,并直接推动扣非利润率实现大幅增长。作为国内创新药领域的领军企业,亿帆医药此次业绩突破充分彰显了其强大的研发实力和市场竞争力。
在产品商业化方面,公司自主研发的I类大分子创新生物药亿...
2025年8月14日,中国电信正式公布其人工智能战略最新成果,宣布已成功构建160余个AI应用解决方案,这些应用广泛覆盖客户服务、渠道运营、智慧城市等关键领域,为超过2万家行业客户提供全方位智能化赋能。作为行业数字化转型的重要推动者,中国电信持续深化AI技术应用,不仅优化内部运营效率,更致力于加速外部赋能进程。公司近期重磅推出80余个行业专属大模型和30多个...
8月14日,豫光金铅正式发布公告,宣布终止原计划面向控股股东河南豫光金铅集团有限责任公司发行股票的相关事项。这一决策标志着公司资本运作策略的重大调整,不仅对公司未来股权结构产生深远影响,也反映出其在资本市场上的战略布局正在经历深刻变革。作为近期公司披露的核心公告内容,该决定涉及多维度资本运作层面的重新规划,预示着企业可能在股权激励、资产重组或融资渠道等方面迎...
2025年上半年,海能达营业收入达到22.59亿元,较去年同期出现17.50%的显著下滑;归属于上市公司股东的净利润为9358.18万元,同比降幅高达42.37%。面对这一业绩变化,公司方面明确指出,市场环境的波动以及行业竞争的加剧是导致业绩下滑的主要因素。在当前复杂多变的经济背景下,企业如何应对市场挑战、调整经营策略,成为业界关注的焦点。海能达的业绩表现不...
2025年8月14日,现货白银市场遭遇显著回调,日内跌幅进一步扩大至1%,最终报收于38.09美元/盎司的低位。这一下跌趋势的背后,市场分析主要指向两大关键因素:美元指数的企稳表现以及工业需求数据的疲软。美元指数近期展现出较强的抗跌性,其走强对以美元计价的贵金属形成明显压力,而工业领域需求的放缓则进一步削弱了市场对白银等工业金属的购买动力。在当前复杂的经济环...
2025年8月14日,金固股份(股票代码002488.SZ)正式宣布与鹿明机器人科技(深圳)有限公司达成战略合作,双方将携手开启全新的合作篇章,共同探索阿凡达铌微合金在机器人领域的创新应用。此次合作聚焦于四足机器人、人形机器人等前沿产品,旨在通过新材料技术的突破,推动机器人行业的智能化与轻量化发展。
此次战略合作框架协议的签订,标志着金固股份在机器人材料领域...
2025年8月14日,全球知名生物制药企业礼来公司正式宣布对其糖尿病治疗药物Mounjaro的定价策略进行调整。根据新政策,该药物最高剂量版本的单月供应价格将从之前的122英镑大幅提升至330英镑,涨幅高达170%。这一突如其来的价格调整迅速引发市场震动,也引起了全球医疗健康领域的广泛关注。
Mounjaro作为礼来公司研发的创新性糖尿病治疗药物,主要通过调...