
微新创想:2026年3月12日xAI正式发布新一代大语言模型Grok4.20Beta
该模型在保持价格竞争力的同时凭借极高的事实可靠性刷新了行业纪录
根据Artificial Analysis的最新评估Grok4.20在启用推理功能的智能指数中获得48分较前代版本提升6分

尽管在综合基准测试中仍与Gemini3.1Pro Preview和GPT-5.4存在差距但其在AA全知测试中的表现极为出色非幻觉率高达78%
有效解决了AI模型普遍存在的虚假信息编造问题
在产品矩阵与工程参数方面xAI同步推出了带推理功能不带推理功能以及多智能体模式的三种API版本
该模型支持高达200万个令牌的上下文窗口其定价策略极具市场渗透力每百万令牌成本仅为2美元至6美元较Grok4显著降低

技术层面Grok4.20在面对未知领域时表现出极强的克制力承认“不知道”的频率大幅提升错误率仅约为五分之一
当前全球大模型竞争已从单纯的参数规模转向推理深度与事实准确性的双重博弈
Grok4.20的推出标志着xAI在追求通用人工智能的过程中正试图通过强化“诚实性”与“低幻觉率”来构建差异化优势
这种对事实可靠性的极致追求不仅提升了AI在严谨行业应用中的落地潜力也为未来多智能体协同协作提供了更为稳固的信息信任基础
