
微新创想:大模型竞争格局再度洗牌
根据最新发布的Artificial Analysis智能指数,Anthropic的旗舰模型Claude Opus4.6凭借卓越的表现力压群雄,正式登顶该权威排行榜
这一指数综合了编程、代理任务和科学推理等十项深度测试,Opus4.6在代理类工作任务、终端编程以及物理研究课题上均斩获第一
值得关注的是,尽管Opus4.6的运行成本高达2,486美元,略高于OpenAIGPT-5.2的2,304美元,但在效率表现上却呈现出显著差异
数据显示,Opus4.6在测试过程中消耗了约5,800万个输出Token,虽然这一数字是前代机型4.5的两倍,但相较于GPT-5.2惊人的1.3亿个Token,Opus4.6显然在信息密度和处理逻辑上更为精简

目前,该模型已全面上线Claude.ai平台,并支持通过Google Vertex、AWS Bedrock等主流云服务进行调用
然而,Anthropic的领先地位正面临严峻挑战
行业巨头OpenAI的新一代编程利器Codex5.3已在备测名单中
分析人士指出,一旦Codex5.3完成所有基准测试,其在代码编写及相关逻辑领域的优势极有可能助其重夺王座
这场“全球最聪明模型”的拉锯战,远未到盖棺论定的时候
