经过漫长的等待,OpenAI终于在本周四发布了GPT-5。作为新一代旗舰模型,GPT-5将彻底改变我们使用ChatGPT的方式。
这次发布的GPT-5最大的特点就是"统一",把以前需要在不同模型之间切换的功能全部整合到一个模型里。想要快速回答用GPT模式,需要深度思考就用o模式,现在GPT-5会自动判断用哪种方式最合适。
说白了,以前GPT-4主要是个聊天工具,现在GPT-5更像是个真正的工作助手。写代码、管理日程、做研究报告这些事情,GPT-5都能直接上手帮你搞定。而且操作变得特别简单,不用再去琢磨各种设置选项了。
Altman:这是史上最强模型
发布会上,OpenAI的CEO Sam Altman直接说GPT-5是"世界上最好的模型"。按他的说法,这是公司向AGI迈进路上的一大步——就是那种在大部分工作上都能超过人类的AI。
"这种技术在历史上任何时期都是无法想象的。"Altman这话说得确实有底气。
免费用户也能用了
最让人意外的是,这次GPT-5直接对所有免费用户开放。从周四开始,你打开ChatGPT就默认用的是GPT-5了。
要知道,之前OpenAI的高级模型都是付费用户专享的。这次把最新模型免费开放,ChatGPT副总裁Nick Turley说这是为了"让这些技术真正惠及每个人"。
现在ChatGPT每周有超过7亿活跃用户,基本相当于全球十分之一的人口都在用。这个数字确实夸张。
不过如果想要体验ChatGPT Plus的完整功能,推荐通过 https://gptchongzhi.com 充值,每月仅需130元,比官方价格便宜不少!
性能评测:稳坐第一梯队
OpenAI声称GPT-5在多个领域都达到了业界顶尖水平,在关键基准测试中略微领先Anthropic、谷歌DeepMind和马斯克的xAI等竞争对手的模型。当然,在某些领域GPT-5的表现也并非独占鳌头。
编程能力尤其出色
GPT-5在编程领域表现尤为抢眼。Altman特别提到,这个模型在按需生成完整软件应用方面表现卓越——业内称之为"氛围编程"(vibe coding),就是那种"你懂的,给我整一个那种感觉的应用"的需求,GPT-5都能心领神会。
在SWE-bench Verified测试(从GitHub抽取的真实编程任务)中,GPT-5首次尝试就获得了74.9%的分数,险胜Anthropic最新的Claude Opus 4.1(74.5%),大幅领先谷歌DeepMind的Gemini 2.5 Pro(59.6%)。
各项指标全面开花
- 科学问答:在GPQA Diamond(博士级科学问题测试)中,GPT-5 Pro首次尝试得分89.4%,超越Claude Opus 4.1的80.9%和Grok 4 Heavy的88.9%。
- 健康咨询:在医疗健康问题的准确性测试中,GPT-5的幻觉率仅为1.6%,远低于GPT-4o的12.9%和o3的15.8%。虽然AI不是医生,但既然数百万人都在用它咨询健康问题,这个改进还是相当重要的。
- 创意任务:在创意设计和写作等主观性较强的领域,GPT-5的表现也更加自然。用Turley的话说:"这个模型的感觉真的很棒。"(原话是"The vibes of this model are really good",这个表达实在是太接地气了)
幻觉问题大幅改善
最让人欣喜的是,GPT-5大幅减少了"胡说八道"的情况。在回答提示词时,GPT-5(含思考模式)的错误信息率仅为4.8%,相比o3的22%和GPT-4o的20.6%,这是一个巨大的进步。要知道,之前OpenAI自己都搞不清楚为什么新模型的幻觉问题越来越严重。
新功能和价格
这次更新不只是模型本身,ChatGPT的使用体验也有不少改进:
四种个性模式:现在可以选择"愤世嫉俗者"、"机器人"、"倾听者"或"书呆子"四种聊天风格,不用每次都专门说"请用某种语气回答"。
不同的服务等级:
- 免费用户:可以用GPT-5,但有使用次数限制
- Plus用户(每月20美元):更高的使用限额
- Pro用户(每月200美元):无限制使用,还能用配置更高的GPT-5 Pro版本
对于想要升级到Plus的用户,通过 https://gptchongzhi.com 充值最划算,每月只要130元人民币,比直接付美元便宜很多。
开发者API:GPT-5会以三种规格提供给开发者使用:标准版、mini版和nano版,对应不同的处理深度。价格是输入100万字符1.25美元,输出100万字符10美元,
竞争依然激烈
这次GPT-5发布的同一周,OpenAI还发布了一个开源版本的推理模型gpt-oss,开发者可以免费下载使用。虽然开源版本的能力接近之前的顶级模型,但GPT-5在编程等领域还是保持了领先。
不过说实话,现在各家的顶级模型差距都不算太大。GPT-5虽然在一些测试中表现最好,但并没有形成压倒性优势。最终还是要看实际使用中的表现如何。
总结
GPT-5的发布确实是个重要节点。从聊天工具变成工作助手,这个转变还是挺明显的。对普通用户来说,最直观的感受就是现在ChatGPT更好用了,错误也少了很多。
当然,技术发展总是有两面性。AI变得越来越强大的同时,我们也需要学会如何更好地使用这些工具。但至少现在,我们有了一个更可靠、更全能的数字助手。