重磅！OpenAI发布GPT - 5，多领域展现卓越能力

发布于：2025-08-08 阅读：0

当地时间8月7日，OpenAI正式推出GPT - 5。它智能性能远超以往，在编码、写作、健康等领域表现卓越。Plus和Pro会员有更多权益，微软抢先接入。GPT - 5为用户和企业带来新便利，是人工智能发展重要里程碑。

当地时间周四（8月7日），OpenAI官方正式推出了备受外界期待的新一代人工智能模型GPT - 5。OpenAI在新闻稿中提及，GPT - 5的智能性能远超公司之前的所有模型。

GPT - 5

GPT - 5是一个统一的系统。它能够识别何时快速响应，何时需要更长时间的思考以提供专家级的应答。不必由用户手动选择使用常规语言模型还是推理系统。

OpenAI表示，GPT - 5将面向所有用户开放。Plus会员可获得更多使用量，Pro会员则可访问GPT - 5 Pro版本。该版本具有扩展推理能力，可提供更全面、更准确的答案。

先前，OpenAI首席执行官萨姆·奥尔特曼称GPT - 5是一次“重大升级”。“这还是第一次，真的像是在与某个领域的专家对话。”ChatGPT团队负责人Nick Turley表示，新模型在响应速度、回答准确性以及减少“幻觉”方面都优于前代产品。

在8月7日的简报会上，奥尔特曼对GPT - 5给予了极高评价，将GPT - 5定位为通往AGI的重要里程碑。

作为OpenAI的“最强大模型”，GPT - 5在三个关键领域实现了显著提升。

首先是编程能力。GPT - 5是OpenAI迄今为止最强大的编码模型。在复杂的前端生成和大型代码库调试方面表现突出。能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。

在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中，GPT - 5思考后首次尝试的准确率达74.9%。高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。

评论指出，这意味着，GPT - 5的表现略胜于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。

不过，在衡量数学、人文和自然科学领域模型表现的各学科专家级能力Humanity’s Last Exam测试中，带有扩展推理功能的GPT - 5增强版本GPT - 5 pro在使用工具的情况下得分42%。这略低于得分44.4%的xAI模型Grok 4 Heavy。

编程能力

奥尔特曼称，GPT - 5尤其擅长按需启动整个软件App，也就是所谓的“氛围编码”。即用AI根据自然语言提示生成功能代码，从而加快开发速度。

作为实例，OpenAI的研究者演示了，要求GPT - 5创建一款网页App，帮助说英语的用户学习法语。且该App必须有一个引人入胜的主题，包含抽认卡、测验、经典的贪吃蛇游戏，以及追踪每日学习进度的方法。研究者将相同的提示词提交到两个GPT - 5窗口中，几分钟后生成了两个不同的App。

在创意写作方面，GPT - 5能够处理结构复杂的写作任务。如无韵律的抑扬格五音步诗或自然流动的自由诗，犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示，GPT - 5在创意任务上表现出“更好的品味”，响应更自然。

健康咨询是第三个重要提升领域。GPT - 5能更积极地标记潜在健康问题，帮助用户解析医疗结果。尽管OpenAI强调，ChatGPT不能替代医疗专业人员。

在名为HealthBench Hard Hallucinations的测试中，具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%。这远低于GPT - 4o和o3模型，后两者的错误信息率分别为15.8%和12.9%。

OpenAI称，GPT - 5相比此前的模型更可靠和实用。它能更准确地回答现实世界的疑问，出现幻觉的可能性显著降低。

OpenAI还表示，为GPT - 5引入了一种新的安全训练形式，名为安全补全（safe completions）。它教模型在安全范围内尽可能给出最有帮助的答案。

如果需要拒绝，经过训练的GPT - 5会以透明的方式告知用户拒绝的原因，并提供安全的替代方案。

OpenAI称，GPT - 5在指令执行方面表现提升，其执行自定义指令的能力也得到了相应的提升。OpenAI将为所有ChatGPT用户推出四种预设性格的全新研究预览版。

初始的四种性格选项——愤世嫉俗者（Cynic）、机器人（Robot）、倾听者（Listener）和书呆子（Nerd）都是可选的。用户可在设置中随时调整，用以匹配ChatGPT和用户的沟通风格。

健康咨询

此外，微软在GPT - 5发布当日即宣布，将其整合到广泛的产品线中。在企业级应用方面，Microsoft 365 Copilot将利用GPT - 5更好地处理复杂问题、在长对话中保持专注并理解用户上下文。企业用户可通过推理功能处理电子邮件、文档和文件。

对于消费者，Microsoft Copilot的新智能模式将利用GPT - 5帮助用户发现最佳解决方案。用户可通过copilot.microsoft.com或Windows、Mac、Android和iOS设备上的Copilot应用免费体验GPT - 5。

开发者将通过GitHub Copilot和Visual Studio Code获得GPT - 5支持，用于编写、测试和部署代码。Azure AI Foundry平台将提供所有GPT - 5模型，配备AI驱动的模型路由器，根据每个任务的复杂性、性能需求和成本效率选择最优模型。

转载请注明出处：资讯热榜
本文地址：http://www.0451000.com/qykj/588.html

扫一扫关注我们

标签： GPT - 5 OpenAI 人工智能编程写作健康咨询

上一篇: 多名富豪深海瞬间死亡，“泰坦”号事故原因大揭秘

下一篇: 没有了！

重磅！OpenAI发布GPT - 5，多领域展现卓越能力

当地时间8月7日，OpenAI正式推出GPT - 5。它智能性能远超以往，在编码、写作、健康等领域表现卓越。Plus和Pro会员有更多权益，微软抢先接入。GPT - 5为用户和企业···

2025-08-08
多名富豪深海瞬间死亡，“泰坦”号事故原因大揭秘

2023年6月“泰坦”号深海潜水器爆炸，5名乘员遇难。美国海岸警卫队8月5日发布调查报告，指出事故主因是海洋之门公司在设计、认证等流程存在缺陷，未遵循安全规范···

2025-08-07
宇树科技王兴兴再添新身份，杭州具身智能产业加速崛起

近日，杭州高新区推进人工智能产业建设，宇树科技CEO王兴兴获聘杭州具身智能应用中试基地首席科学家。该中试基地将构建新质生产力，解决行业难题。宇树科技发展良···

2025-08-04
夏威夷惊人一幕：空投数万只蚊子为哪般？

这个夏天，美国夏威夷上空出现惊人一幕，大量无人机空投数万只蚊子。原来，当地蜜旋木雀等鸟类因蚊子传播的禽疟疾濒临灭绝。科学家投放携带沃尔巴克氏菌的雄蚊，···

2025-07-31
中国科学家多维度揭秘人体衰老密码，开启抗衰新征程

近期，中国科学家在衰老研究领域成果丰硕。绘制蛋白质组衰老图谱，揭示器官衰老时间表；发现线粒体双相时钟，解释器官衰老差异；还凸显中医药整体抗衰优势。这些···

2025-07-26