微新创想(Idea2003.com)7月4日 消息:随着人工智能工具应用的日益广泛,企业对能够高效处理多样化任务的智能系统的需求正持续攀升。拥有ChatGPT或Bard等先进聊天界面,能够对长篇文档进行精准摘要或深度挖掘客户数据以提炼商业洞察,已成为企业提升运营效率的关键。然而,要实现这些高级功能,AI模型必须经过海量数据的严格训练。尽管许多企业出于成本考量选择了参数量更小、经济性更高的模型,但这类模型在处理复杂任务时往往力不从心。以Meta的LLaMA、Falcon-7B和MPT-7B等开源模型为例,其最大序列长度仅约2000个token,难以胜任对冗长非结构化数据如文件内容的深度分析。为突破这一瓶颈,Salesforce推出了创新的大型语言模型XGen-7B,该模型经过长达8000个token序列的训练,显著提升了处理海量文档输入的能力,总处理量高达1.5万亿个token。Salesforce的研究团队采用自研的JaxFormer框架及公共领域的高质量教学数据,成功训练出这一参数量达70亿的模型。在性能表现上,XGen-7B与LLaMA、Falcon和Redpajama等主流开源模型相比,实现了并跑甚至超越的优异成果。据SalesforceAI研究人员透露,借助Google Cloud的TPU-v4云计算平台,在1万亿个token规模上完成模型训练的投入仅为15万美元,展现出极高的性价比。XGen-7B基准测试表现卓越在多项权威基准测试中,XGen-7B的表现令人瞩目,在多个关键指标上超越了备受青睐的开源大型语言模型。在”Measuring Massive Multitask Language Understanding(MMLU)”基准测试中,XGen在四个测试类别中的三个取得了最高分,其加权平均分同样位居首位。仅在人文领域测试中,Meta的LLaMA表现略胜一筹。在零样本测试环节,XGen同样表现出色,虽在人文领域仍稍逊于LLaMA,但在整体零样本测试中仅在”TruthfulQA”基准测试中落后于其他模型。在ARC_ch、Hella Swag和Winogrande等基准测试中,LLaMA表现更优,但在代码生成任务上,XGen以14.20的pass@1指标成绩,大幅领先LLaMA(10.38)及其他竞争模型。特别是在处理长序列任务时,Salesforce的AI模型展现出压倒性优势,在SCROLLS基准测试的QMSum和GovReport数据集上均获得高分。不过研究团队特别指出,由于XGen模型未使用相同的教学数据进行训练,因此与同类模型存在可比性差异。XGen-7B系列模型详解Salesforce研究团队开发了三个不同配置的XGen-7B模型:XGen-7B-4K-base、XGen-7B-8K-base和XGen-7B-inst。XGen-7B-4K-base可处理8000亿个上下文token,采用两阶段训练策略,先在2000个token规模数据上训练,再扩展至4000个token。该模型遵循Apache-2.0许可协议,允许衍生作品采用不同许可方式分发,但原始组件必须保留Apache2.0许可。XGen-7B-8K-base在4K-base基础上增加3000亿token处理能力,总上下文理解能力达到1.5万亿个token,同样采用Apache-2.0许可。XGen-7B-inst则基于公共领域教学数据(包括databricks-dolly-15k、oasst1、Baize及GPT相关数据集)进行微调,在4000和8000个token规模上训练,主要用于研究目的。模型训练采用创新的两阶段策略,每个阶段使用不同数据组合。团队表示:”在C4数据处理中,我们整合了6个Common Crawl转储,通过保留各URL文档的最新版本实现跨转储去重,并构建线性分类模型将数据分为维基百科类文档和随机文档,最终选取前20%的维基百科类文档。”随后将Salesforce与Hugging Face联合开发的代码生成模型Starcoder纳入训练,其核心数据与前一阶段成果混合。模型采用OpenAI的tiktoken进行token化,并额外添加连续空白和制表符token。XGen-7B的局限性尽管训练出了一系列高性能AI模型,XGen系列仍存在改进空间。Salesforce指出,该模型在生成内容时仍可能出现事实性偏差问题。关于XGen-7B的更多技术细节,Salesforce已在官方博客发布详尽文章。模型代码库托管于GitHub,预训练检查点可在Hugging Face平台获取。上下文长度的重要性能够理解更长输入的模型对企业应用具有革命性意义。Salesforce研究人员强调,海量上下文数据使预训练语言模型能够深入分析客户信息,对复杂查询提供精准回应。对于聊天机器人应用而言,更长的上下文支持意味着更流畅自然的对话体验。事实上,Salesforce并非唯一关注这一领域的科技企业。新兴AI初创公司Anthropic(由OpenAI前员工创立)近期显著扩展了旗舰应用Claude的上下文处理能力,使其能够从多份商业文件或书籍中提取关键信息,并解答相关数据问题。当前AI模型在扩展上下文长度方面仍面临挑战。当ChatGPT和Bing AI等应用用户在单次对话中持续使用模型时,回应质量会逐渐下降,这源于模型难以有效处理长序列上下文导致的混淆和幻觉现象。XGen-7B项目网址:https://blog.salesforceairesearch.com/xgen/
最新快讯
2025年08月14日
声明:本文源自微信公众号《娱乐硬糖》,作者顾韩,经站长之家授权转载发布。进入存量竞争时代以来,各大视频平台对男性观众的争夺愈发激烈。男频大IP本被视为撬动男性市场的有效策略,但实际效果却屡屡不尽如人意。以今年暑期档真人版《凡人修仙传》为例,当“扑没扑”成为全网热议话题时,其市场反响已不言自明。尽管该剧在打戏特效和内核表达上并未重蹈《斗破苍穹》《武动乾坤》等前...
8月12日,一起由寄生虫感染引发的严重贫血病例在广州引起社会广泛关注。2024年初,68岁的张阿姨开始频繁出现头晕症状,经当地医院检查确诊为缺铁性贫血。起初,张阿姨并未将此症状放在心上,依然坚持日常生活与农活。然而到了今年7月,她的健康状况急转直下,持续性极度疲劳和严重乏力让她难以正常活动,脸色蜡黄,甚至连短距离行走都感到呼吸困难。意识到病情恶化,张阿姨立即...
微新创想8月14日重磅报道,一则来自格陵兰岛的惊险瞬间,通过游客镜头震撼呈现。在塞尔米利克峡湾这片壮丽的冰海之境,一场突如其来的自然奇观让世界屏息。据目击者描述,一座长达数百米、高近30米的巨型冰山突然发生崩塌,犹如山崩地裂般在平静的海面掀起滔天巨浪。更令人震惊的是,这座冰山在短时间内体积竟缩水了80%,其崩解之势之迅猛可见一斑。面对这突如其来的险情,游客们...
8月14日,天普股份正式发布公告,宣布公司实际控制人尤建义正在积极筹划一项重大事项,该事项或将对公司控制权产生重大影响。为避免股价异常波动,保障投资者利益,公司股票将于8月15日起暂停交易,预计停牌时间不会超过两个交易日。目前,相关事项仍处于内部筹划阶段,所有细节尚未最终确定。天普股份表示,将密切关注事件进展,并及时向市场披露最新动态,确保信息透明,维护股东...
2025年8月14日,长亮科技正式发布其2025年半年财务报告,数据显示公司上半年营收总额为6.64亿元,相较去年同期出现了5.64%的下滑。更值得关注的是,归属于上市公司股东净利润录得亏损1910.85万元,而去年同期同期则实现了183.7万元的盈利。这一业绩变化反映出当前市场环境下的挑战与压力。
尽管面临整体营收和利润的波动,长亮科技在数字金融业务领域表...
顺灏股份(002565)于8月14日正式发布了其2025年半年财务报告,数据显示公司在上半年取得了6.2亿元的营业收入,相较去年同期出现了12.19%的下滑。然而,令人欣喜的是,归属于上市公司股东的净利润达到了3330.34万元,实现了23.11%的显著增长。这一业绩表现充分展现了公司在面对市场波动时的稳健经营能力和盈利能力,也预示着公司在调整期内取得了积极...
华映科技(股票代码:000536)于8月14日正式发布了其2025年半年财务报告,详细披露了公司上半年的经营状况。报告显示,公司整体营收达到了7.21亿元人民币,然而与去年同期相比,营收出现了16.59%的显著下滑。这一数据反映出市场环境的变化对公司业务增长带来的挑战。
在盈利能力方面,华映科技上半年归属于上市公司股东的净利润为亏损4.76亿元。尽管亏损额度...
8月14日,气派科技(股票代码688216)正式发布2025年度定向增发股票预案,引发资本市场广泛关注。根据公告内容,公司计划以每股20.11元的发行价格,定向增发不超过790万股新股,预计募集资金总额不超过1.59亿元人民币。此次募资将专项用于补充公司流动资金,以强化资金链安全,提升运营效率。
本次定向增发的核心发行对象包括公司实际控制人梁大钟、白瑛及其子...
2025年8月14日,备受市场关注的贝斯特(股票代码:300580)正式披露了其2025年半年财务报告,展现了公司稳健的发展态势。报告显示,公司在上半年的经营业绩中,实现营业收入7.16亿元人民币,相较于去年同期增长了2.73%,这一增长幅度虽不算惊人,但体现了公司在市场环境变化中的适应能力。更为亮眼的是,归属于上市公司股东的净利润达到了1.48亿元,同比增...
8月14日传来重要消息中国人保资产管理有限公司成功获得国家金融监督管理总局的批复同意其发起设立人保启元惠众(北京)私募基金管理公司的申请这一关键进展标志着险资长期投资改革试点正加速落地稳步推进
此次获批不仅彰显了监管机构对保险资管行业创新发展的支持更体现了保险资金运用改革向纵深发展的坚定步伐作为业内领先的资产管理机构中国人保资管此次布局私募基金管理领域将...
8月14日晚间,重庆啤酒正式发布公告,宣布其控股子公司嘉士伯重庆啤酒有限公司将向嘉士伯啤酒(佛山)有限公司实施6亿元人民币的增资计划。这一战略举措旨在精准满足佛山公司在当前市场环境下的经营发展需求,同时通过优化其资产负债结构,进一步提升公司的财务稳健性和资本运作效率。根据公告内容,此次增资完成后,嘉士伯啤酒(佛山)有限公司的注册资本将成功提升至6.1亿元人民...
8月14日,全球航运业领军企业马士基发布紧急通报,其旗下的一艘大型集装箱船在利比里亚海岸附近遭遇严重火灾事故。据最新消息,这场突如其来的火灾事故发生在周三,时至今日大火仍未完全扑灭,船员们正紧急采取各种措施控制火势蔓延。由于火势持续,目前尚无法准确评估船上所载货物的具体损失情况,但此次事件已对相关航运线路造成一定程度的影响。海事部门已启动应急响应机制,密切关...