GPT-5正式发布!ChatGPT迎来史上最大升级

效率星球
• 阅读 12

经过漫长的等待,OpenAI终于在本周四发布了GPT-5。作为新一代旗舰模型,GPT-5将彻底改变我们使用ChatGPT的方式。

这次发布的GPT-5最大的特点就是"统一",把以前需要在不同模型之间切换的功能全部整合到一个模型里。想要快速回答用GPT模式,需要深度思考就用o模式,现在GPT-5会自动判断用哪种方式最合适。

说白了,以前GPT-4主要是个聊天工具,现在GPT-5更像是个真正的工作助手。写代码、管理日程、做研究报告这些事情,GPT-5都能直接上手帮你搞定。而且操作变得特别简单,不用再去琢磨各种设置选项了。

GPT-5正式发布!ChatGPT迎来史上最大升级

Altman:这是史上最强模型

发布会上,OpenAI的CEO Sam Altman直接说GPT-5是"世界上最好的模型"。按他的说法,这是公司向AGI迈进路上的一大步——就是那种在大部分工作上都能超过人类的AI。

"这种技术在历史上任何时期都是无法想象的。"Altman这话说得确实有底气。

免费用户也能用了

最让人意外的是,这次GPT-5直接对所有免费用户开放。从周四开始,你打开ChatGPT就默认用的是GPT-5了。

要知道,之前OpenAI的高级模型都是付费用户专享的。这次把最新模型免费开放,ChatGPT副总裁Nick Turley说这是为了"让这些技术真正惠及每个人"。

现在ChatGPT每周有超过7亿活跃用户,基本相当于全球十分之一的人口都在用。这个数字确实夸张。

不过如果想要体验ChatGPT Plus的完整功能,推荐通过 https://gptchongzhi.com 充值,每月仅需130元,比官方价格便宜不少!

性能评测:稳坐第一梯队

OpenAI声称GPT-5在多个领域都达到了业界顶尖水平,在关键基准测试中略微领先Anthropic、谷歌DeepMind和马斯克的xAI等竞争对手的模型。当然,在某些领域GPT-5的表现也并非独占鳌头。

编程能力尤其出色

GPT-5在编程领域表现尤为抢眼。Altman特别提到,这个模型在按需生成完整软件应用方面表现卓越——业内称之为"氛围编程"(vibe coding),就是那种"你懂的,给我整一个那种感觉的应用"的需求,GPT-5都能心领神会。

在SWE-bench Verified测试(从GitHub抽取的真实编程任务)中,GPT-5首次尝试就获得了74.9%的分数,险胜Anthropic最新的Claude Opus 4.1(74.5%),大幅领先谷歌DeepMind的Gemini 2.5 Pro(59.6%)。

GPT-5正式发布!ChatGPT迎来史上最大升级

各项指标全面开花

  • 科学问答:在GPQA Diamond(博士级科学问题测试)中,GPT-5 Pro首次尝试得分89.4%,超越Claude Opus 4.1的80.9%和Grok 4 Heavy的88.9%。
  • 健康咨询:在医疗健康问题的准确性测试中,GPT-5的幻觉率仅为1.6%,远低于GPT-4o的12.9%和o3的15.8%。虽然AI不是医生,但既然数百万人都在用它咨询健康问题,这个改进还是相当重要的。
  • 创意任务:在创意设计和写作等主观性较强的领域,GPT-5的表现也更加自然。用Turley的话说:"这个模型的感觉真的很棒。"(原话是"The vibes of this model are really good",这个表达实在是太接地气了)

    幻觉问题大幅改善

最让人欣喜的是,GPT-5大幅减少了"胡说八道"的情况。在回答提示词时,GPT-5(含思考模式)的错误信息率仅为4.8%,相比o3的22%和GPT-4o的20.6%,这是一个巨大的进步。要知道,之前OpenAI自己都搞不清楚为什么新模型的幻觉问题越来越严重。

新功能和价格

这次更新不只是模型本身,ChatGPT的使用体验也有不少改进:

四种个性模式:现在可以选择"愤世嫉俗者"、"机器人"、"倾听者"或"书呆子"四种聊天风格,不用每次都专门说"请用某种语气回答"。

不同的服务等级

  • 免费用户:可以用GPT-5,但有使用次数限制
  • Plus用户(每月20美元):更高的使用限额
  • Pro用户(每月200美元):无限制使用,还能用配置更高的GPT-5 Pro版本

对于想要升级到Plus的用户,通过 https://gptchongzhi.com 充值最划算,每月只要130元人民币,比直接付美元便宜很多。

开发者API:GPT-5会以三种规格提供给开发者使用:标准版、mini版和nano版,对应不同的处理深度。价格是输入100万字符1.25美元,输出100万字符10美元,

竞争依然激烈

这次GPT-5发布的同一周,OpenAI还发布了一个开源版本的推理模型gpt-oss,开发者可以免费下载使用。虽然开源版本的能力接近之前的顶级模型,但GPT-5在编程等领域还是保持了领先。

不过说实话,现在各家的顶级模型差距都不算太大。GPT-5虽然在一些测试中表现最好,但并没有形成压倒性优势。最终还是要看实际使用中的表现如何。

总结

GPT-5的发布确实是个重要节点。从聊天工具变成工作助手,这个转变还是挺明显的。对普通用户来说,最直观的感受就是现在ChatGPT更好用了,错误也少了很多。

当然,技术发展总是有两面性。AI变得越来越强大的同时,我们也需要学会如何更好地使用这些工具。但至少现在,我们有了一个更可靠、更全能的数字助手。

点赞
收藏
评论区
推荐文章
不是海碗 不是海碗
2年前
超火的 ChatGPT,APISpace 让你一分钟免费接入
ChatGPT是一个基于GPT3.5(GenerativePretrainedTransformer3.5)的语言模型,用于处理自然语言问答。GPT3.5是由人工智能公司OpenAI开发的一种大型神经网络模型,能够处理自然语言文本。ChatGPT是基于GPT3.5模型构建的,能够根据用户输入的问题,生成自然语言的回答。
Wesley13 Wesley13
3年前
NLP怪兽GPT
2020年5月底OpenAI发布了有史以来最强的NLP预训练模型GPT3,最大的GPT3模型参数达到了1750亿个参数。论文《LanguageModelsareFewShotLearners》长达74页已发布在arXiv。视频讲解:有网友估算最大的GPT3模型大小大约有700G,这个大小即使OpenAI公开模型,我们一
高耸入云 高耸入云
1年前
[OJAC近屿智能]GPT store和Assistants API横空出世,AI Agent创业公司将何去何从?
📖更多AI资讯请👉🏾根据OpenAI发布的产品时间线,我们可以看到OpenAI在短短一年内迅速推出了多个重要的产品和功能,下面是OpenAI发布的主要产品和功能的时间线:2022年11月30日:OpenAI发布了ChatGPT,使用GPT3.5语言技
近屿智能 近屿智能
3个月前
OpenAI 最强推理模型o3 和 o4-mini 正式发布,近屿智能带你入局AI
近日,OpenAI正式发布了o3和o4mini模型,代表着ChatGPT能力的重大飞跃。o3堪称最强大的推理模型,o4mini则针对快速且具成本效益的推理进行了优化。这两款模型均展现出卓越的推理能力,能智能调用ChatGPT中的各类工具,像搜索网络、运用P
近屿智能 近屿智能
2个月前
ChatGPT再升级!入门AI大模型就来近屿智能
近日,OpenAI正式发布GPT4.1和轻量级版本GPT4.1mini,并已全面上线ChatGPT平台,迅速引发全球AI圈热议,标志着ChatGPT在智能化和效率上再登新高峰。GPT4.1是为编程与任务处理优化的高性能模型。相较前作GPT4o,新版本在理解
脚本喵 脚本喵
7小时前
GPT-5发布:ModelGate迅速上线,探索新一代AI模型
今天凌晨,人工智能领域迎来了一个重要的里程碑——GPT5的发布。这一新一代模型在多个方面展现了其卓越的性能和潜力。作为领先的AI模型服务平台,ModelGate迅速响应,第一时间上线了GPT5模型,并为用户提供了千万Token的免费领取机会。本文将结合提供
波光粼粼 波光粼粼
7小时前
GPT-5 发布:长文本、多模态与代码生成的新纪元
今天凌晨,OpenAI正式发布了新一代通用模型GPT5。相比上一代,GPT5在推理能力、多模态处理以及上下文记忆长度上都有了跨越式提升,这意味着AI开发者未来可以围绕更庞大的数据集、更复杂的跨模态任务进行创新。从GPT1到GPT5,每一次迭代都带来新的可能
【GPT-4理论篇-1】GPT-4核心技术探秘 | 京东云技术团队
在本文中,我将结合GPT4的技术报告、GPT4相对于GPT3.5/ChatGPT的提升、GPT4和ChatGPT的对比、OpenAI的近期工作,大语言模型(LargeLanguageModel,LLM)模型的科研进展,多模态模型的科研进展等多方面的信息,深入分析GPT4的技术细节。