2025年12月18日,国际科技媒体纷纷聚焦OpenAI最新发布的ChatGPT-5.2模型,其基础测试结果却令人大跌眼镜。据多家权威媒体联合报道,该模型在核心功能测试中暴露出一系列严重缺陷,尤其是在处理特定视觉任务时表现令人担忧。测试显示,ChatGPT-5.2在生成按英文字母顺序排列的动物挂图时,系统性地遗漏了”U”和”Z”两个关键字母,这种明显的逻辑错误引发广泛关注。更令人惊讶的是,模型在描绘”X-ray fish”(X光鱼)这一特定概念时,错误地渲染了斑马图像,完全偏离了预期输出。此外,测试插图中的动物形象普遍存在结构异常问题,部分图像甚至出现明显的几何扭曲,显示出模型在视觉理解能力上的短板。
值得注意的是,这些问题并非ChatGPT-5.2的独创性缺陷,其前身ChatGPT-4在类似测试中也曾暴露出类似问题。尽管OpenAI团队在此次更新中承诺优化了多项技术指标,但上述基础性错误并未得到有效修复,反而暴露出模型在细节处理上的系统性缺陷。更令人担忧的是,测试过程中还发现生成内容开始混入用户提示语,这种”串行”现象表明模型在指令解析和内容过滤方面存在严重漏洞。这些技术短板不仅影响用户体验,更可能对ChatGPT-5.2的后续商业化应用构成重大障碍。
分析指出,ChatGPT-5.2的这些问题反映出大型语言模型在跨模态任务处理上的固有挑战。尽管该模型在自然语言处理方面持续进步,但在视觉信息整合和细节精准度上仍存在明显短板。对于依赖该模型进行内容创作的专业人士而言,这些缺陷可能意味着更高的错误率和更长的修正时间。随着人工智能技术竞争日益激烈,OpenAI需要在基础算法稳定性上投入更多研发资源,确保模型在关键任务中的可靠性和准确性。此次测试结果也提醒业界,人工智能发展仍需脚踏实地,在追求性能提升的同时不可忽视基础能力的打磨。
