微新创想(Idea2003.com)7月4日 消息:随着人工智能工具应用的日益广泛,企业对能够高效处理多样化任务的智能系统的需求正持续攀升。拥有ChatGPT或Bard等先进聊天界面,能够对长篇文档进行精准摘要或深度挖掘客户数据以提炼商业洞察,已成为企业提升运营效率的关键。然而,要实现这些高级功能,AI模型必须经过海量数据的严格训练。尽管许多企业出于成本考量选择了参数量更小、经济性更高的模型,但这类模型在处理复杂任务时往往力不从心。以Meta的LLaMA、Falcon-7B和MPT-7B等开源模型为例,其最大序列长度仅约2000个token,难以胜任对冗长非结构化数据如文件内容的深度分析。为突破这一瓶颈,Salesforce推出了创新的大型语言模型XGen-7B,该模型经过长达8000个token序列的训练,显著提升了处理海量文档输入的能力,总处理量高达1.5万亿个token。Salesforce的研究团队采用自研的JaxFormer框架及公共领域的高质量教学数据,成功训练出这一参数量达70亿的模型。在性能表现上,XGen-7B与LLaMA、Falcon和Redpajama等主流开源模型相比,实现了并跑甚至超越的优异成果。据SalesforceAI研究人员透露,借助Google Cloud的TPU-v4云计算平台,在1万亿个token规模上完成模型训练的投入仅为15万美元,展现出极高的性价比。XGen-7B基准测试表现卓越在多项权威基准测试中,XGen-7B的表现令人瞩目,在多个关键指标上超越了备受青睐的开源大型语言模型。在”Measuring Massive Multitask Language Understanding(MMLU)”基准测试中,XGen在四个测试类别中的三个取得了最高分,其加权平均分同样位居首位。仅在人文领域测试中,Meta的LLaMA表现略胜一筹。在零样本测试环节,XGen同样表现出色,虽在人文领域仍稍逊于LLaMA,但在整体零样本测试中仅在”TruthfulQA”基准测试中落后于其他模型。在ARC_ch、Hella Swag和Winogrande等基准测试中,LLaMA表现更优,但在代码生成任务上,XGen以14.20的pass@1指标成绩,大幅领先LLaMA(10.38)及其他竞争模型。特别是在处理长序列任务时,Salesforce的AI模型展现出压倒性优势,在SCROLLS基准测试的QMSum和GovReport数据集上均获得高分。不过研究团队特别指出,由于XGen模型未使用相同的教学数据进行训练,因此与同类模型存在可比性差异。XGen-7B系列模型详解Salesforce研究团队开发了三个不同配置的XGen-7B模型:XGen-7B-4K-base、XGen-7B-8K-base和XGen-7B-inst。XGen-7B-4K-base可处理8000亿个上下文token,采用两阶段训练策略,先在2000个token规模数据上训练,再扩展至4000个token。该模型遵循Apache-2.0许可协议,允许衍生作品采用不同许可方式分发,但原始组件必须保留Apache2.0许可。XGen-7B-8K-base在4K-base基础上增加3000亿token处理能力,总上下文理解能力达到1.5万亿个token,同样采用Apache-2.0许可。XGen-7B-inst则基于公共领域教学数据(包括databricks-dolly-15k、oasst1、Baize及GPT相关数据集)进行微调,在4000和8000个token规模上训练,主要用于研究目的。模型训练采用创新的两阶段策略,每个阶段使用不同数据组合。团队表示:”在C4数据处理中,我们整合了6个Common Crawl转储,通过保留各URL文档的最新版本实现跨转储去重,并构建线性分类模型将数据分为维基百科类文档和随机文档,最终选取前20%的维基百科类文档。”随后将Salesforce与Hugging Face联合开发的代码生成模型Starcoder纳入训练,其核心数据与前一阶段成果混合。模型采用OpenAI的tiktoken进行token化,并额外添加连续空白和制表符token。XGen-7B的局限性尽管训练出了一系列高性能AI模型,XGen系列仍存在改进空间。Salesforce指出,该模型在生成内容时仍可能出现事实性偏差问题。关于XGen-7B的更多技术细节,Salesforce已在官方博客发布详尽文章。模型代码库托管于GitHub,预训练检查点可在Hugging Face平台获取。上下文长度的重要性能够理解更长输入的模型对企业应用具有革命性意义。Salesforce研究人员强调,海量上下文数据使预训练语言模型能够深入分析客户信息,对复杂查询提供精准回应。对于聊天机器人应用而言,更长的上下文支持意味着更流畅自然的对话体验。事实上,Salesforce并非唯一关注这一领域的科技企业。新兴AI初创公司Anthropic(由OpenAI前员工创立)近期显著扩展了旗舰应用Claude的上下文处理能力,使其能够从多份商业文件或书籍中提取关键信息,并解答相关数据问题。当前AI模型在扩展上下文长度方面仍面临挑战。当ChatGPT和Bing AI等应用用户在单次对话中持续使用模型时,回应质量会逐渐下降,这源于模型难以有效处理长序列上下文导致的混淆和幻觉现象。XGen-7B项目网址:https://blog.salesforceairesearch.com/xgen/
最新快讯
2025年12月15日
2025年12月15日,贝耐特光学科技正式宣布成功完成数千万元人民币规模的A++轮独家融资,由知名投资机构安芯投资独家领投。此次融资不仅彰显了资本市场对贝耐特光学科技创新实力的高度认可,更将为其未来的技术突破与产业升级注入强劲动力。据悉,所获资金将全面投向三大核心领域:一是持续深耕LCoS(硅基液晶)空间光调制器及光谱分析模块的核心技术研发,力求在显示技术领...
2025年12月13日,中国汽车品牌奇瑞与法国西部汽车俱乐部(ACO)在马来西亚正式签署战略合作协议,标志着奇瑞成为首个正式进军勒芒24小时耐力赛的中国车企。此次合作中,奇瑞旗下高端品牌星途将肩负重任,代表中国汽车品牌开启参与世界顶级耐力赛的新篇章。勒芒赛事由ACO主办,每年6月在法国举行,是全球最著名、最具挑战性的三大汽车赛事之一,以其严苛的赛道环境和卓越...
2025年12月15日,广西数据集团有限公司正式宣告成立,标志着广西在数字经济领域迈出关键性步伐。该公司法定代表人为周飞,注册资本高达10亿元人民币,彰显了其雄厚的资本实力和发展潜力。作为一家具有地方战略意义的企业实体,广西数据集团有限公司的注册地位于广西壮族自治区,这一地理位置优势为其未来的业务拓展奠定了坚实基础。
在股权结构方面,该公司由多家实力雄厚的机...
2025年12月15日,贵州茅台股价迎来第四个交易日连续上涨,盘中涨幅一度突破1%。这一积极表现背后,市场传闻公司即将推出"控量"政策成为焦点。针对外界关注,茅台集团相关工作人员明确表示,该政策举措目前仍处于研究阶段,具体的实施方案预计将在12月28日举办的渠道商联谊会上正式公布。
据悉,茅台产品投放始终坚持以终端动销情况为依据,实施精准投放策略。工作人...
2025年12月15日,中国新能源汽车领域迎来重大合作里程碑。首驱科技与广西柳州市政府正式签署战略协议,宣布将在柳东新区核心区域投资15.21亿元人民币,建设华南地区规模领先的总部基地及智能电动车生产制造中心。这一项目承载着打造区域新能源汽车产业新引擎的宏伟目标,规划年产能高达150万台,将全面聚焦车规级智能两轮电动车的研发与量产,涵盖从核心技术突破到智能化...
2025年12月,中共西藏自治区委员会正式发布了《“十五五”时期国民经济和社会发展规划建议》,为西藏未来的发展擘画了宏伟蓝图。这份重要文件明确提出,将着力优化开放格局,构建具有西藏特色的对外开放新体系。该体系以拉萨为核心中心,以东部和西部为两翼支撑,同时联动多个口岸,形成全方位、多层次、立体化的开放格局。
作为“一带一路”倡议的重要参与者,西藏将深度融入西部...
在人工智能浪潮席卷创意产业的当下,一款名为《Codex Mortis》的类《吸血鬼幸存者》游戏横空出世,以惊人的方式宣告自己的存在——从代码到美术,再到音乐,全部由人工智能驱动完成。开发者 Grolaf(又名 Crunchfest)自豪地宣称,这款仅用三个月时间就诞生的独立游戏,是"真正意义上100% AI 生成的游戏"之一。据开发者自述,整个开发过程几乎完...
谷歌研究院、谷歌 DeepMind 与麻省理工学院近日联合发布的一项突破性研究,颠覆了传统观点中“更多智能体意味着更好结果”的认知。研究团队通过精心设计的180项控制实验,深入探究了多智能体系统在不同任务场景下的实际表现,结果令人惊讶:系统性能波动极大,有的任务效率提升高达81%,而另一些任务却出现了高达70%的性能下降。
研究表明,任务的类型对多智能体系统...
12月13日,在第二届CCF中国数据大会上,蚂蚁数科重磅宣布将全面开源其核心数据智能体技术Agentar SQL的全套资源,包括学术论文、源代码、预训练模型以及详细的使用指南。这一创新举措旨在推动企业数字化转型,使非专业人员也能通过自然语言轻松进行商业数据查询与分析,构建更精准高效的智能数据分析基座。
作为开源计划的首步,蚂蚁数科率先发布了实时文本转化结构化...
近日,美国佐治亚州引发社会广泛关注的一则新闻,主角是体重高达276斤的死刑犯斯泰西•汉弗莱斯。这位52岁的囚犯因在2003年犯下持枪抢劫并残忍杀害两名女性的重罪,被依法判处死刑。在行刑前,汉弗莱斯提出了一份令人瞠目结舌的“最后餐食”请求,这份被批准的菜单堪称一场“奢华盛宴”,迅速在网络和社交媒体上掀起轩然大波。
据悉,按照美国仍保留死刑执行州中的惯例,囚犯在...
2025年12月15日,一项由中国科学院青藏高原研究所牵头、联合全球数十家顶尖科研机构共同完成的突破性研究,成功揭示了大麦种子休眠的核心遗传机制。这项发表在《科学》期刊上的重要成果,通过深入分析大麦基因组,精准定位了调控种子休眠的关键基因位点,为培育适应极端气候的耐逆作物品种提供了全新的科学依据。
该研究团队利用先进的基因组测序和生物信息学技术,系统解析了大...
2025年12月15日,派杰投资机构正式宣布将可口可乐公司股票的目标价从81美元上调至87美元,这一调整幅度显著,充分体现了市场分析师对可口可乐未来业绩的乐观预期。据派杰投资发布的最新研究报告显示,此次目标价上调主要基于对可口可乐公司稳健经营策略和持续增长潜力的深度评估。
可口可乐在全球饮料市场的长期竞争优势和稳定的市场份额是支撑此次目标价上调的核心逻辑...
