微新创想:2026年5月9日 稀宇科技(MiniMax)发布技术报告 宣布已修复M2系列大模型无法准确输出“马嘉祺”等人名的问题
问题源于分词器将“嘉祺”切为独立词元 但后训练数据中该词元样本极少 致其向量参数被高频词元挤压偏移
团队通过全词表合成数据开展“复读”训练 使词元生成稳定性显著提升 日语混入俄文字符率由47%降至1%
修复覆盖约20万个词元 其中4.9%存在类似退化现象
微新创想:2026年5月9日 稀宇科技(MiniMax)发布技术报告 宣布已修复M2系列大模型无法准确输出“马嘉祺”等人名的问题
问题源于分词器将“嘉祺”切为独立词元 但后训练数据中该词元样本极少 致其向量参数被高频词元挤压偏移
团队通过全词表合成数据开展“复读”训练 使词元生成稳定性显著提升 日语混入俄文字符率由47%降至1%
修复覆盖约20万个词元 其中4.9%存在类似退化现象