北京时间今日凌晨1点,OpenAI 公司正式揭开 GPT-5 模型的神秘面纱,这一里程碑式的发布标志着人工智能技术迈向通用人工智能(AGI)的关键一步。OpenAI 首席执行官山姆・奥尔特曼在发布会上激动表示,与 GPT-5 的交流体验如同与人类专家对话般自然流畅,展现了AI技术的惊人进步。此次发布会不仅详细介绍了 GPT-5 的各项突破,更展示了其在多个权威基准测试中的卓越表现,特别是在提高可靠性、准确阐述事实方面的显著改进。
OpenAI 宣布 GPT-5 即日起面向所有订阅用户开放,包括免费、Plus 以及 Pro 用户。免费用户可享受基础功能但存在配额限制,而 Plus 和 Pro 用户则能获得更丰富的使用权益。在令人印象深刻的直播演示中,GPT-5展现了惊人的能力。无论是解释复杂的 Bernoulli 效果,还是创建精美的视觉效果,它都能迅速响应并出色完成任务。用户甚至可以要求 GPT-5“深入思考”或“更精确”,并观察其思维过程,这种透明度是前所未有的。
在编程演示环节,GPT-5的表现更是惊艳。短短几分钟内,它就能输出超过200行代码,并创建出一个包含丰富视觉与音频元素的网站,旨在帮助用户学习法语。除了编程能力,GPT-5还即将上线语音模式。在直播中,ChatGPT 仅用一个单词就能回应,并总结出“自豪感和偏见为‘人际关系’”的深刻见解,展现了其在自然语言处理方面的强大能力。
ChatGPT 的记忆功能也迎来重大升级。Pro、Plus 以及 Teams 订阅用户可将 ChatGPT 连接至谷歌帐号,访问日历内容,实现与 Gmail 和 Google Calendar 的无缝联动。这意味着 GPT-5 能根据用户的日常行程获取更多情境信息,甚至能主动提醒用户回复重要邮件。这一功能将于下周首先向 Pro 用户推出,随后扩展至 Plus 和 Teams 订阅用户。
在安全性和防止欺骗方面,OpenAI 也下足了功夫。GPT-5 的设计目标是在安全限制内最大程度地帮助用户。与以往模型直接拒绝回答不同,GPT-5 会解释为何不能提供帮助,并引导用户到第三方或手册获取信息,这种人性化的设计大大提升了用户体验。
此次发布的 GPT-5 系列包含 GPT-5、GPT-5mini 以及 GPT-5nano 三款模型,上下文长度均为400K,最大输出128K tokens。在 API 价格方面,GPT-5 每百万 tokens 输入费用1.25美元,输出费用10美元;GPT-5mini 每百万 tokens 输入费用0.25美元,输出费用2美元;GPT-5nano 每百万 tokens 输入费用0.05美元,输出费用0.40美元。值得一提的是,GPT-5 首次采用“内嵌式三位一体集成架构”,由 GPT-5-main、GPT-5-thinking 和实时路由机制共同组成,还附带额度耗尽后自动切换的 mini 版本。实时路由机制如同“交通指挥员”,能根据对话场景、复杂度、工具需求及用户意图,在毫秒级调度最适合的模型,并持续通过真实用户反馈自我进化。
在多项权威基准测试中,GPT-5的表现斐然。在2025年美国 AIME 数学竞赛中,无工具版本得分94.6%,启用 Python 后冲到99.6%,Pro 版叠加 Python 工具直接满分;软件工程权威 SWE-bench 测试中,GPT-5-thinking 以74.9%刷新纪录,远超 o3的69.1%;健康领域 HealthBench Hard 子集里,GPT-5-thinking 从 o3的31.6%跃升至46.2%,拿下全球第一;安全维度上,其高风险场景错误率比 GPT-4o 降低50倍,潜在幻觉率较 o3下降8倍,全球健康场景零失误。
不过,直播现场也发生了一段小插曲。官方演示 PPT 中误把 o3在 SWE-bench 的柱状图画成与4o 等高,引发弹幕调侃。OpenAI 强调,GPT-5 的训练数据依旧来自公开网络、合作授权及用户生成内容,但通过升级版过滤策略与 Moderation API 显著降低隐私与有害信息风险;强化学习则首次用于“先思考后回答”的推理链路,提升模型逻辑与准确率。
从今天起,ChatGPT Plus、Pro、团队用户已可切换至 GPT-5 作为默认模型,免费用户逐步放量,企业和教育版一周后全面开放;Pro 用户可无限使用并独占更强 Pro 模式,Plus 用户享有显著高于免费档的额度,团队及企业客户则可在组织层面无缝部署。OpenAICEO 山姆·阿尔特曼在直播尾声表示“希望 GPT-5成为人类大脑的延伸”,这一愿景不仅令人振奋,更留下业界对“通用人工智能临界点”的无限遐想。