GPT-5多轮对话性能显著下降研究揭示上下文碎片化问题

2026-03-01 08:39:15 快讯 1 次阅读

微新创想：2026年3月1日，一项研究揭示了GPT-5及后续大语言模型在处理多轮分片式对话任务时出现显著性能下降的问题

研究人员菲利普·拉班团队对代码、数据库等六个任务进行了测试发现当使用分片式输入方式时模型的平均性能相比拼接式输入下降了33%这一结果在更新模型后依然存在

Python任务的表现相对较为稳定这表明不同任务类型对分片式输入的敏感度存在差异

性能下降的主要原因被归结为上下文碎片化问题即使调整温度值也无法有效缓解这一现象

研究团队建议在遇到异常情况时重启对话并以模型的自我总结作为新的起点这样可以部分恢复模型的性能

此外研究还指出实际用户在对话过程中动态调整意图的行为可能会进一步加剧模型性能的衰减这一发现对优化对话系统具有重要参考价值

2026年03月01日

09:14

红魔MWC2026全系电竞装备亮相散热器8 Pro3月9日上市

微新创想：2026年3月2日至5日，红魔将在西班牙巴塞罗那Fira Gran Via 3号馆3F30展位亮相MWC 2026。此次参展，红魔游戏手机产品总经理姜超提前公布了参展阵容，涵盖了多款备受期待的产品。其中包括红魔11 Pro系列、鸣潮限定版、11 Air手机，以及电竞平板3 Pro、GOLDEN SAGA臻金典藏版和首款开放式头戴电竞耳机等。这些产品...

09:14

伦敦废品商购得世嘉原型机遭警方突袭清运失误引争议

微新创想：2025年，伦敦警方对废品商大流士·汗的住所进行了突袭，查获了他所持有的世嘉开发机、原型机以及游戏卡带。据大流士·汗表示，这些设备是从世嘉办公室的清运废品中合法购得，并计划出售给电子游戏保存博物馆。警方在审讯了8小时后并未对其提起正式起诉，但仍然以涉嫌盗窃和洗钱等罪名对其施加压力。调查过程中，警方发现这些设备的流失并非出于大流士·汗的主观故意，而...

09:14

北京五和博澳药业港交所上市申请获批创新药物研发引领行业变革

微新创想：2026年2月27日，北京五和博澳药业股份有限公司正式向港交所递交上市申请，华泰国际担任其独家保荐人。公司自2010年成立以来，始终专注于天然药物创新及药物递送系统（DDS）的研发领域。凭借在该领域的深厚积累，五和博澳已成功推出一款商业化产品桑博恩®，该产品主要用于治疗2型糖尿病。同时，公司还拥有八款在研药物，涵盖多个治疗方向，展现出较强的创新能力...

09:14

小米汽车2月交付突破2万台 SU7持续热销渠道建设加速

微新创想：小米汽车在3月1日宣布，其2026年2月整车交付量已突破20000台。这一成绩标志着小米在智能电动汽车领域迈出了坚实的一步。此次交付主要以小米SU7单一车型为主，该车型自2025年4月正式上市以来，市场反响热烈，销量持续攀升。小米汽车的交付范围已覆盖全国30个省市，重点区域集中在一线及新一线城市。这表明小米汽车在市场拓展方面取得了显著进展，逐步建...

09:14

章源钨业宣布2026年3月1日起全面上调硬质合金产品价格

微新创想：2026年3月1日，江西崇义章源钨业股份有限公司宣布调整硬质合金产品价格。公司表示由于钨原材料价格持续上涨，导致生产成本大幅增加，为维持正常的生产经营秩序，决定自当日零时起全面执行新价格。此次调价涉及公司所有硬质合金产品，旧价格将同步停止使用。微新创想：此次价格调整是公司在面对原材料市场波动时采取的重要措施。钨作为重要的战略资源，其价格的变动直接...

09:14

3月1-2日北方强降雪江南华南暴雨预警雨雪天气防范指南

微新创想：3月1日至2日我国中东部地区将出现大范围雨雪天气此次天气过程影响范围广泛，涉及我国多个省份。北方多地预计将有较强降雪，给出行带来较大不便。同时，江南及华南地区降雨频繁，部分地区甚至可能出现暴雨，需特别关注天气变化带来的影响冷空气与暖湿气流的交汇是此次雨雪天气的主要成因。冷空气自北向南移动，与南方的暖湿气流相遇，形成明显的降水系统。这种天气变化不...

08:01

宝可梦30周年限量玩偶发售引抢购混乱多地宝可梦中心失控

微新创想：2月27日，《宝可梦》迎来30周年纪念日。为了庆祝这一重要时刻，宝可梦公司特别推出了黑白配色初代Game Boy风格的皮卡丘毛绒玩偶。这款限时周边产品在东京湾、横滨及大阪等地的宝可梦中心一经发售，便引发了巨大的抢购热潮。现场出现了无序涌入、推搡争抢、儿童哭喊等混乱场面。有报道称，一些顾客甚至为了抢购而发生肢体冲突，整个场景被形容为“战争”。工作人...

08:01

微软Win11彩色电池图标与新版开始菜单更新全面推送

微新创想：2026年2月，微软通过可选更新KB5077241，向更多Windows 11设备推送任务栏彩色电池图标及新版开始菜单。此次更新带来了更加直观的电池状态显示，使用户能够更清楚地了解设备的电量情况。该图标在设备充电时会显示为绿色并伴有闪电图案，当电量低于30%时会切换为橙色，电量低于6%时则变为红色。这种颜色变化设计有助于用户快速判断设备的电力状况...

08:01

薇拉·C·鲁宾天文台自动预警系统正式上线提升天体事件响应效率

微新创想：2026年2月24日，美国薇拉·C·鲁宾天文台的自动预警系统正式上线。该系统基于时空遗产巡天（LSST）相机，具备强大的观测能力。每晚可以拍摄大约1000张高分辨率图像，通过与基准图像进行比对，快速识别出天体变化。一旦发现新的暂现源，系统将在数分钟内将预警信息发送给全球的天文学家。微新创想：预警信息涵盖多种天体事件，包括小行星、超新星以及活动黑洞...

07:29

加拿大电动半挂卡车6年省15.7万加元真实测试数据

微新创想：2026年2月，加拿大林产品创新研究院（FPInnovations）联合交通部发布了一项为期12个月的真实道路测试报告。该测试覆盖超过20万公里的行驶里程，旨在评估福莱纳卡斯卡迪亚柴油版与电动版8级卡车在实际运营中的表现。测试地点位于蒙特利尔地区，研究团队采用了两支独立车队进行对比运营，确保测试结果的客观性和公正性。整个测试过程中未对使用方式进行...

03:50

卡塔尔航空3月1日19:00全面恢复全球160个目的地航班运营

微新创想：卡塔尔航空宣布将于多哈时间3月1日19:00正式恢复航班运营此次复航涵盖所有国内外航线，覆盖全球超过160个目的地公司表示复航决策基于航空安全评估的完成以及空管系统的全面恢复运行运营过程中将严格按照既定的防疫与安全标准执行旅客需遵守最新的出入境规定以确保顺利出行此举旨在逐步恢复正常客运服务并促进区域间的联通与经济复苏

02:43

内蒙古阿拉善沿黄光伏治沙锁边带工程启动铺就绿色屏障新篇章

微新创想：3月28日，内蒙古阿拉善盟沿黄光伏治沙锁边带工程正式开工建设。该工程位于黄河内蒙古段西岸生态脆弱区，由阿拉善盟组织实施，是国家“三北”防护林工程第六期重点项目。工程以“光伏+治沙+生态修复”模式推进，旨在遏制腾格里沙漠东扩，筑牢北方生态安全屏障。项目覆盖面积约200平方公里，规划建设装机容量超200万千瓦光伏设施，并同步实施草方格固沙、耐旱植被种...

GPT-5多轮对话性能显著下降 研究揭示上下文碎片化问题

最新快讯

2026年03月01日

GPT-5多轮对话性能显著下降研究揭示上下文碎片化问题