微新创想(Idea2003.com)7月4日 消息:随着人工智能工具应用的日益广泛,企业对能够高效处理多样化任务的智能系统的需求正持续攀升。拥有ChatGPT或Bard等先进聊天界面,能够对长篇文档进行精准摘要或深度挖掘客户数据以提炼商业洞察,已成为企业提升运营效率的关键。然而,要实现这些高级功能,AI模型必须经过海量数据的严格训练。尽管许多企业出于成本考量选择了参数量更小、经济性更高的模型,但这类模型在处理复杂任务时往往力不从心。以Meta的LLaMA、Falcon-7B和MPT-7B等开源模型为例,其最大序列长度仅约2000个token,难以胜任对冗长非结构化数据如文件内容的深度分析。为突破这一瓶颈,Salesforce推出了创新的大型语言模型XGen-7B,该模型经过长达8000个token序列的训练,显著提升了处理海量文档输入的能力,总处理量高达1.5万亿个token。Salesforce的研究团队采用自研的JaxFormer框架及公共领域的高质量教学数据,成功训练出这一参数量达70亿的模型。在性能表现上,XGen-7B与LLaMA、Falcon和Redpajama等主流开源模型相比,实现了并跑甚至超越的优异成果。据SalesforceAI研究人员透露,借助Google Cloud的TPU-v4云计算平台,在1万亿个token规模上完成模型训练的投入仅为15万美元,展现出极高的性价比。XGen-7B基准测试表现卓越在多项权威基准测试中,XGen-7B的表现令人瞩目,在多个关键指标上超越了备受青睐的开源大型语言模型。在”Measuring Massive Multitask Language Understanding(MMLU)”基准测试中,XGen在四个测试类别中的三个取得了最高分,其加权平均分同样位居首位。仅在人文领域测试中,Meta的LLaMA表现略胜一筹。在零样本测试环节,XGen同样表现出色,虽在人文领域仍稍逊于LLaMA,但在整体零样本测试中仅在”TruthfulQA”基准测试中落后于其他模型。在ARC_ch、Hella Swag和Winogrande等基准测试中,LLaMA表现更优,但在代码生成任务上,XGen以14.20的pass@1指标成绩,大幅领先LLaMA(10.38)及其他竞争模型。特别是在处理长序列任务时,Salesforce的AI模型展现出压倒性优势,在SCROLLS基准测试的QMSum和GovReport数据集上均获得高分。不过研究团队特别指出,由于XGen模型未使用相同的教学数据进行训练,因此与同类模型存在可比性差异。XGen-7B系列模型详解Salesforce研究团队开发了三个不同配置的XGen-7B模型:XGen-7B-4K-base、XGen-7B-8K-base和XGen-7B-inst。XGen-7B-4K-base可处理8000亿个上下文token,采用两阶段训练策略,先在2000个token规模数据上训练,再扩展至4000个token。该模型遵循Apache-2.0许可协议,允许衍生作品采用不同许可方式分发,但原始组件必须保留Apache2.0许可。XGen-7B-8K-base在4K-base基础上增加3000亿token处理能力,总上下文理解能力达到1.5万亿个token,同样采用Apache-2.0许可。XGen-7B-inst则基于公共领域教学数据(包括databricks-dolly-15k、oasst1、Baize及GPT相关数据集)进行微调,在4000和8000个token规模上训练,主要用于研究目的。模型训练采用创新的两阶段策略,每个阶段使用不同数据组合。团队表示:”在C4数据处理中,我们整合了6个Common Crawl转储,通过保留各URL文档的最新版本实现跨转储去重,并构建线性分类模型将数据分为维基百科类文档和随机文档,最终选取前20%的维基百科类文档。”随后将Salesforce与Hugging Face联合开发的代码生成模型Starcoder纳入训练,其核心数据与前一阶段成果混合。模型采用OpenAI的tiktoken进行token化,并额外添加连续空白和制表符token。XGen-7B的局限性尽管训练出了一系列高性能AI模型,XGen系列仍存在改进空间。Salesforce指出,该模型在生成内容时仍可能出现事实性偏差问题。关于XGen-7B的更多技术细节,Salesforce已在官方博客发布详尽文章。模型代码库托管于GitHub,预训练检查点可在Hugging Face平台获取。上下文长度的重要性能够理解更长输入的模型对企业应用具有革命性意义。Salesforce研究人员强调,海量上下文数据使预训练语言模型能够深入分析客户信息,对复杂查询提供精准回应。对于聊天机器人应用而言,更长的上下文支持意味着更流畅自然的对话体验。事实上,Salesforce并非唯一关注这一领域的科技企业。新兴AI初创公司Anthropic(由OpenAI前员工创立)近期显著扩展了旗舰应用Claude的上下文处理能力,使其能够从多份商业文件或书籍中提取关键信息,并解答相关数据问题。当前AI模型在扩展上下文长度方面仍面临挑战。当ChatGPT和Bing AI等应用用户在单次对话中持续使用模型时,回应质量会逐渐下降,这源于模型难以有效处理长序列上下文导致的混淆和幻觉现象。XGen-7B项目网址:https://blog.salesforceairesearch.com/xgen/
最新快讯
2026年02月09日
2026 年春节,AI圈的“红包大战”由阿里巴巴率先引爆。为了在激烈的AI入口竞争中突围,阿里正式启动了“春节 30 亿免单”活动,将AI技术深度植入生活场景,目标直指腾讯与字节跳动的市场高地。这一波,阿里玩的是“生态协同”的降维打击。活动期间,阿里千问APP在短时间内送出超过 100 万单奶茶,这种通过AI直接连接消费场景的能力,展示了阿里多年积累的生态闭...
澳大利亚AI基础设施初创公司 Firmus Technologies 今日宣布,已获得由 黑石集团(Blackstone) 领投的 100亿美元 巨额债务融资。这不仅是澳大利亚史上规模最大的私有信贷融资之一,也标志着全球AI算力基建进入了“军备竞赛”的新阶段。这笔资金将主要用于 Firmus 的“南门项目”。该计划拟在全澳构建超大规模AI中心,目...
微新创想:春节临近,年货采购进入高峰期,千问APP推出「免单卡」功能,为用户带来全新的购物体验。用户只需一句指令,即可在千问的帮助下完成年货的一站式采购,涵盖盒马、天猫超市等多家知名平台。无论是酒水零食、米面粮油,还是生鲜水果,都能通过这一功能轻松获取。
这项服务不仅简化了用户的购物流程,还提升了效率。用户只需简单说出需求,如“帮我买一箱牛奶”、“帮我在天猫...
微新创想:大模型竞争格局再度洗牌
根据最新发布的Artificial Analysis智能指数,Anthropic的旗舰模型Claude Opus4.6凭借卓越的表现力压群雄,正式登顶该权威排行榜
这一指数综合了编程、代理任务和科学推理等十项深度测试,Opus4.6在代理类工作任务、终端编程以及物理研究课题上均斩获第一
值得关注的是,尽管Opus4.6的运行...
微新创想:在过去的一年里,美国多家知名企业在宣布大规模裁员时,不约而同地将原因归结为“人工智能提高了效率”。然而,多位经济学家和技术分析师近期提出质疑,认为这种现象更像是所谓的“AI洗白”,即公司高管利用AI作为挡箭牌,以此掩盖关税压力、疫情期间过度招聘以及追求利润最大化等真实的经营问题。
微新创想:据咨询机构Challenger, Gray & C...
微新创想:2026年2月,斯达领动宣布完成数千万元A1轮融资,由老股东乾德电子独家投资。此次融资标志着公司在新能源汽车感知技术领域获得了重要认可与支持。
公司总部位于中国,专注于新能源汽车领域4D及成像毫米波雷达的研发与规模化应用。斯达领动致力于通过技术创新推动智能驾驶的发展,其产品在提升车辆感知能力方面具有显著优势。
本轮融资将主要用于新一代4D毫米波雷达...
微新创想:2025年2月6日,金雷股份(300443.SZ)发布公告,宣布财务总监朱晓宇因个人原因辞职,该辞职自公告之日起生效,朱晓宇将不再担任公司任何职务。朱晓宇于2025年7月加入金雷股份,同年10月28日正式被聘任为公司财务总监,任职时间仅约四个月。
朱晓宇此前曾在碧桂园地产和海亮股份担任财务总监,具备丰富的财务管理经验。他拥有大连理工大学管理科学与工...
微新创想:2月6日,深交所公告显示,苏州珂玛材料科技股份有限公司向不特定对象发行可转债已通过审核,符合发行、上市及信息披露要求。本次可转债发行总额不超过7.5亿元,募集资金将投向结构功能模块化陶瓷部件扩建、半导体设备用碳化硅材料及部件项目,并补充流动资金。
深交所要求公司结合先进材料生产基地项目进展及2025年度业绩预告,说明项目预计效益情况。珂玛科技主营先...
微新创想:2026年2月,北京派特美生生物科技有限公司宣布完成A+轮融资,由勤智资本独家投资。此次融资标志着公司在宠物医药领域迈出了重要一步。
该公司专注于宠物创新药物研发,业务覆盖动物疾病预防、诊断、治疗及保健,同时具备兽药生产与经营资质。派特美生致力于为宠物健康提供更安全、有效的解决方案。
本轮融资将用于加速核心管线临床试验推进、GMP生产基地建设及团队...
微新创想:2026年2月,AI数字人技术服务商智慧倍增机器人宣布完成Pre-A轮融资,投资方为灵初智能与方正多策。此次融资标志着公司在AI数字人领域迈出了重要一步,为后续发展提供了坚实的资金支持。
该公司总部位于中国,专注于数字文化创意软件开发、市场营销策划、电影摄制服务及网络技术服务等领域。凭借在人工智能与数字内容融合方面的创新探索,智慧倍增机器人逐渐在行...
微新创想:2月10日(星期二)晚20时 小米集团董事长兼CEO雷军将于北京小米定制服务中心开展春节主题直播
此次直播定于农历小年当晚 旨在与用户共迎新春
雷军通过社交媒体发出邀约 欢迎公众线上参与
活动将聚焦年味互动与品牌服务体验 不设商业带货环节 突出节日陪伴属性
微新创想:2026年2月,江苏卓科制药有限公司成功完成天使轮融资,投资方为金桥基金。此次融资为公司未来发展注入了新的动力,也体现了资本市场对其业务模式和市场前景的认可。
江苏卓科制药有限公司主要专注于专用化学产品的销售业务。公司凭借专业的技术实力和完善的供应链体系,在行业内建立了良好的口碑和稳定的客户基础。
本次融资将主要用于扩充研发团队,提升企业的技术创新...
