在今晨备受瞩目的直播活动中,OpenAI正式发布了其最新力作——GPT-5模型,并自豪地宣称这是公司迄今为止最强大的AI系统。该模型在编程、数学、写作、健康咨询、视觉感知等多个领域均展现出惊人的能力,堪称全能型AI专家。OpenAI首席执行官萨姆·奥尔特曼在发布会上激动表示,与GPT-5对话就像同时与各领域顶尖专家交流,其智能水平实现了质的飞跃。据悉,GPT-5将于本周四开始逐步向所有用户开放,包括免费用户和付费订阅者。付费用户将获得更高的使用限额,其中Pro订阅者可以无限访问GPT-5的全部功能,而Plus用户则可以将GPT-5设为默认模型,大幅提升日常使用效率。
GPT-5是一个高度协同的智能系统,由三个核心组件构成:智能高效模型、深度推理模型(GPT-5thinking)和实时路由器。智能高效模型负责处理大部分常规问题,而深度推理模型则专注于解决复杂挑战。实时路由器会根据对话类型和难度智能匹配最合适的模型,并持续通过真实数据优化性能。当用户达到使用限制时,系统会自动切换到精简版模型处理剩余请求,未来OpenAI计划将这些功能整合为单一模型,进一步提升用户体验。
在多项基准测试中,GPT-5的表现全面超越了所有前代模型。不仅响应速度大幅提升,解答的实用性和准确性也显著增强,有效减少了AI常见的”幻觉”现象,指令遵循能力得到质的改进,同时大幅降低谄媚性回答。特别是在写作、编程和健康咨询等ChatGPT的核心应用场景,GPT-5的表现令人惊叹。
在编程领域,GPT-5被誉为史上最强的编程助手。它能在复杂前端生成和大型代码库调试方面取得突破性进展,根据简单提示就能创建出美观且响应迅速的网站、应用程序和游戏。在创意写作方面,GPT-5能将模糊的想法转化为富有文学魅力的作品,完美处理结构复杂的写作任务,为日常写作提供全方位支持。在健康咨询领域,GPT-5表现尤为突出,HealthBench测试得分远超以往模型,能主动识别潜在健康问题并提出追问,根据用户背景、知识水平和地理位置提供精准可靠的建议,但OpenAI特别强调,该模型不能替代专业医疗建议。
此外,GPT-5在数学(AIME2025无工具测试得分94.6%)、真实世界编程(SWE-bench Verified得分74.9%、Aider Polyglot得分88%)、多模态理解(MMMU得分84.2%)和健康(HealthBench Hard得分46.2%)等多个领域均创下新纪录。值得一提的是,GPT-5Pro凭借其扩展推理能力,在GPQA测试中无工具状态下取得88.4%的惊人成绩。作为OpenAI专为最难任务设计的旗舰模型,GPT-5Pro取代了之前的OpenAI o3-Pro,其更长的思考时间和规模化并行计算能力,使其能提供最高质量的全面答案。在多个高难度智力测试中,GPT-5Pro表现卓越,在1000个真实世界推理提示评估中,外部专家有67.8%更青睐GPT-5Pro,错误率降低了22%,在健康、科学、数学和编程领域均展现出无与伦比的实力。