GPT-5正式发布！ChatGPT迎来史上最大升级

经过漫长的等待，OpenAI终于在本周四发布了GPT-5。作为新一代旗舰模型，GPT-5将彻底改变我们使用ChatGPT的方式。

这次发布的GPT-5最大的特点就是"统一"，把以前需要在不同模型之间切换的功能全部整合到一个模型里。想要快速回答用GPT模式，需要深度思考就用o模式，现在GPT-5会自动判断用哪种方式最合适。

说白了，以前GPT-4主要是个聊天工具，现在GPT-5更像是个真正的工作助手。写代码、管理日程、做研究报告这些事情，GPT-5都能直接上手帮你搞定。而且操作变得特别简单，不用再去琢磨各种设置选项了。

Altman：这是史上最强模型

发布会上，OpenAI的CEO Sam Altman直接说GPT-5是"世界上最好的模型"。按他的说法，这是公司向AGI迈进路上的一大步——就是那种在大部分工作上都能超过人类的AI。

"这种技术在历史上任何时期都是无法想象的。"Altman这话说得确实有底气。

最让人意外的是，这次GPT-5直接对所有免费用户开放。从周四开始，你打开ChatGPT就默认用的是GPT-5了。

要知道，之前OpenAI的高级模型都是付费用户专享的。这次把最新模型免费开放，ChatGPT副总裁Nick Turley说这是为了"让这些技术真正惠及每个人"。

现在ChatGPT每周有超过7亿活跃用户，基本相当于全球十分之一的人口都在用。这个数字确实夸张。

不过如果想要体验ChatGPT Plus的完整功能，推荐通过 https://gptchongzhi.com 充值，每月仅需130元，比官方价格便宜不少！

OpenAI声称GPT-5在多个领域都达到了业界顶尖水平，在关键基准测试中略微领先Anthropic、谷歌DeepMind和马斯克的xAI等竞争对手的模型。当然，在某些领域GPT-5的表现也并非独占鳌头。

GPT-5在编程领域表现尤为抢眼。Altman特别提到，这个模型在按需生成完整软件应用方面表现卓越——业内称之为"氛围编程"（vibe coding），就是那种"你懂的，给我整一个那种感觉的应用"的需求，GPT-5都能心领神会。

在SWE-bench Verified测试（从GitHub抽取的真实编程任务）中，GPT-5首次尝试就获得了74.9%的分数，险胜Anthropic最新的Claude Opus 4.1（74.5%），大幅领先谷歌DeepMind的Gemini 2.5 Pro（59.6%）。

GPT-5正式发布！ChatGPT迎来史上最大升级

科学问答：在GPQA Diamond（博士级科学问题测试）中，GPT-5 Pro首次尝试得分89.4%，超越Claude Opus 4.1的80.9%和Grok 4 Heavy的88.9%。
健康咨询：在医疗健康问题的准确性测试中，GPT-5的幻觉率仅为1.6%，远低于GPT-4o的12.9%和o3的15.8%。虽然AI不是医生，但既然数百万人都在用它咨询健康问题，这个改进还是相当重要的。
创意任务：在创意设计和写作等主观性较强的领域，GPT-5的表现也更加自然。用Turley的话说："这个模型的感觉真的很棒。"（原话是"The vibes of this model are really good"，这个表达实在是太接地气了）
幻觉问题大幅改善

最让人欣喜的是，GPT-5大幅减少了"胡说八道"的情况。在回答提示词时，GPT-5（含思考模式）的错误信息率仅为4.8%，相比o3的22%和GPT-4o的20.6%，这是一个巨大的进步。要知道，之前OpenAI自己都搞不清楚为什么新模型的幻觉问题越来越严重。