重磅!OpenAI发布GPT - 5,多领域展现卓越能力

发布于:2025-08-08 阅读:0
当地时间8月7日,OpenAI正式推出GPT - 5。它智能性能远超以往,在编码、写作、健康等领域表现卓越。Plus和Pro会员有更多权益,微软抢先接入。GPT - 5为用户和企业带来新便利,是人工智能发展重要里程碑。

当地时间周四(8月7日),OpenAI官方正式推出了备受外界期待的新一代人工智能模型GPT - 5。OpenAI在新闻稿中提及,GPT - 5的智能性能远超公司之前的所有模型。

GPT - 5

GPT - 5是一个统一的系统。它能够识别何时快速响应,何时需要更长时间的思考以提供专家级的应答。不必由用户手动选择使用常规语言模型还是推理系统。

OpenAI表示,GPT - 5将面向所有用户开放。Plus会员可获得更多使用量,Pro会员则可访问GPT - 5 Pro版本。该版本具有扩展推理能力,可提供更全面、更准确的答案。

先前,OpenAI首席执行官萨姆·奥尔特曼称GPT - 5是一次“重大升级”。“这还是第一次,真的像是在与某个领域的专家对话。”ChatGPT团队负责人Nick Turley表示,新模型在响应速度、回答准确性以及减少“幻觉”方面都优于前代产品。

在8月7日的简报会上,奥尔特曼对GPT - 5给予了极高评价,将GPT - 5定位为通往AGI的重要里程碑。

作为OpenAI的“最强大模型”,GPT - 5在三个关键领域实现了显著提升。

首先是编程能力。GPT - 5是OpenAI迄今为止最强大的编码模型。在复杂的前端生成和大型代码库调试方面表现突出。能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。

在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中,GPT - 5思考后首次尝试的准确率达74.9%。高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。

评论指出,这意味着,GPT - 5的表现略胜于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。

不过,在衡量数学、人文和自然科学领域模型表现的各学科专家级能力Humanity’s Last Exam测试中,带有扩展推理功能的GPT - 5增强版本GPT - 5 pro在使用工具的情况下得分42%。这略低于得分44.4%的xAI模型Grok 4 Heavy。

编程能力

奥尔特曼称,GPT - 5尤其擅长按需启动整个软件App,也就是所谓的“氛围编码”。即用AI根据自然语言提示生成功能代码,从而加快开发速度。

作为实例,OpenAI的研究者演示了,要求GPT - 5创建一款网页App,帮助说英语的用户学习法语。且该App必须有一个引人入胜的主题,包含抽认卡、测验、经典的贪吃蛇游戏,以及追踪每日学习进度的方法。研究者将相同的提示词提交到两个GPT - 5窗口中,几分钟后生成了两个不同的App。

在创意写作方面,GPT - 5能够处理结构复杂的写作任务。如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT - 5在创意任务上表现出“更好的品味”,响应更自然。

健康咨询是第三个重要提升领域。GPT - 5能更积极地标记潜在健康问题,帮助用户解析医疗结果。尽管OpenAI强调,ChatGPT不能替代医疗专业人员。

在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%。这远低于GPT - 4o和o3模型,后两者的错误信息率分别为15.8%和12.9%。

OpenAI称,GPT - 5相比此前的模型更可靠和实用。它能更准确地回答现实世界的疑问,出现幻觉的可能性显著降低。

OpenAI还表示,为GPT - 5引入了一种新的安全训练形式,名为安全补全(safe completions)。它教模型在安全范围内尽可能给出最有帮助的答案。

如果需要拒绝,经过训练的GPT - 5会以透明的方式告知用户拒绝的原因,并提供安全的替代方案。

OpenAI称,GPT - 5在指令执行方面表现提升,其执行自定义指令的能力也得到了相应的提升。OpenAI将为所有ChatGPT用户推出四种预设性格的全新研究预览版。

初始的四种性格选项——愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)和书呆子(Nerd)都是可选的。用户可在设置中随时调整,用以匹配ChatGPT和用户的沟通风格。

健康咨询

此外,微软在GPT - 5发布当日即宣布,将其整合到广泛的产品线中。在企业级应用方面,Microsoft 365 Copilot将利用GPT - 5更好地处理复杂问题、在长对话中保持专注并理解用户上下文。企业用户可通过推理功能处理电子邮件、文档和文件。

对于消费者,Microsoft Copilot的新智能模式将利用GPT - 5帮助用户发现最佳解决方案。用户可通过copilot.microsoft.com或Windows、Mac、Android和iOS设备上的Copilot应用免费体验GPT - 5。

开发者将通过GitHub Copilot和Visual Studio Code获得GPT - 5支持,用于编写、测试和部署代码。Azure AI Foundry平台将提供所有GPT - 5模型,配备AI驱动的模型路由器,根据每个任务的复杂性、性能需求和成本效率选择最优模型。

二维码

扫一扫关注我们

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至admin@pbootcms.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。

标签: GPT - 5 OpenAI 人工智能 编程 写作 健康咨询

相关文章