重磅!OpenAI发布GPT - 5,多领域展现卓越能力
当地时间8月7日,OpenAI正式推出GPT - 5。它智能性能远超以往,在编码、写作、健康等领域表现卓越。Plus和Pro会员有更多权益,微软抢先接入。GPT - 5为用户和企业···
2025-08-08
当地时间周四(8月7日),OpenAI官方正式推出了备受外界期待的新一代人工智能模型GPT - 5。OpenAI在新闻稿中提及,GPT - 5的智能性能远超公司之前的所有模型。
GPT - 5是一个统一的系统。它能够识别何时快速响应,何时需要更长时间的思考以提供专家级的应答。不必由用户手动选择使用常规语言模型还是推理系统。
OpenAI表示,GPT - 5将面向所有用户开放。Plus会员可获得更多使用量,Pro会员则可访问GPT - 5 Pro版本。该版本具有扩展推理能力,可提供更全面、更准确的答案。
先前,OpenAI首席执行官萨姆·奥尔特曼称GPT - 5是一次“重大升级”。“这还是第一次,真的像是在与某个领域的专家对话。”ChatGPT团队负责人Nick Turley表示,新模型在响应速度、回答准确性以及减少“幻觉”方面都优于前代产品。
在8月7日的简报会上,奥尔特曼对GPT - 5给予了极高评价,将GPT - 5定位为通往AGI的重要里程碑。
作为OpenAI的“最强大模型”,GPT - 5在三个关键领域实现了显著提升。
首先是编程能力。GPT - 5是OpenAI迄今为止最强大的编码模型。在复杂的前端生成和大型代码库调试方面表现突出。能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。
在从GitHub获取现实世界编码任务的基准测试SWE - bench Verified中,GPT - 5思考后首次尝试的准确率达74.9%。高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。
评论指出,这意味着,GPT - 5的表现略胜于Anthropic周二推出的Claude Opus 4.1和谷歌DeepMind的Gemini 2.5 Pro。
不过,在衡量数学、人文和自然科学领域模型表现的各学科专家级能力Humanity’s Last Exam测试中,带有扩展推理功能的GPT - 5增强版本GPT - 5 pro在使用工具的情况下得分42%。这略低于得分44.4%的xAI模型Grok 4 Heavy。
奥尔特曼称,GPT - 5尤其擅长按需启动整个软件App,也就是所谓的“氛围编码”。即用AI根据自然语言提示生成功能代码,从而加快开发速度。
作为实例,OpenAI的研究者演示了,要求GPT - 5创建一款网页App,帮助说英语的用户学习法语。且该App必须有一个引人入胜的主题,包含抽认卡、测验、经典的贪吃蛇游戏,以及追踪每日学习进度的方法。研究者将相同的提示词提交到两个GPT - 5窗口中,几分钟后生成了两个不同的App。
在创意写作方面,GPT - 5能够处理结构复杂的写作任务。如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT - 5在创意任务上表现出“更好的品味”,响应更自然。
健康咨询是第三个重要提升领域。GPT - 5能更积极地标记潜在健康问题,帮助用户解析医疗结果。尽管OpenAI强调,ChatGPT不能替代医疗专业人员。
在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT - 5出现幻觉的错误信息率仅为1.6%。这远低于GPT - 4o和o3模型,后两者的错误信息率分别为15.8%和12.9%。
OpenAI称,GPT - 5相比此前的模型更可靠和实用。它能更准确地回答现实世界的疑问,出现幻觉的可能性显著降低。
OpenAI还表示,为GPT - 5引入了一种新的安全训练形式,名为安全补全(safe completions)。它教模型在安全范围内尽可能给出最有帮助的答案。
如果需要拒绝,经过训练的GPT - 5会以透明的方式告知用户拒绝的原因,并提供安全的替代方案。
OpenAI称,GPT - 5在指令执行方面表现提升,其执行自定义指令的能力也得到了相应的提升。OpenAI将为所有ChatGPT用户推出四种预设性格的全新研究预览版。
初始的四种性格选项——愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)和书呆子(Nerd)都是可选的。用户可在设置中随时调整,用以匹配ChatGPT和用户的沟通风格。
此外,微软在GPT - 5发布当日即宣布,将其整合到广泛的产品线中。在企业级应用方面,Microsoft 365 Copilot将利用GPT - 5更好地处理复杂问题、在长对话中保持专注并理解用户上下文。企业用户可通过推理功能处理电子邮件、文档和文件。
对于消费者,Microsoft Copilot的新智能模式将利用GPT - 5帮助用户发现最佳解决方案。用户可通过copilot.microsoft.com或Windows、Mac、Android和iOS设备上的Copilot应用免费体验GPT - 5。
开发者将通过GitHub Copilot和Visual Studio Code获得GPT - 5支持,用于编写、测试和部署代码。Azure AI Foundry平台将提供所有GPT - 5模型,配备AI驱动的模型路由器,根据每个任务的复杂性、性能需求和成本效率选择最优模型。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件至admin@pbootcms.com举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
相关文章
当地时间8月7日,OpenAI正式推出GPT - 5。它智能性能远超以往,在编码、写作、健康等领域表现卓越。Plus和Pro会员有更多权益,微软抢先接入。GPT - 5为用户和企业···
2025-08-08
2023年6月“泰坦”号深海潜水器爆炸,5名乘员遇难。美国海岸警卫队8月5日发布调查报告,指出事故主因是海洋之门公司在设计、认证等流程存在缺陷,未遵循安全规范···
2025-08-07
近日,杭州高新区推进人工智能产业建设,宇树科技CEO王兴兴获聘杭州具身智能应用中试基地首席科学家。该中试基地将构建新质生产力,解决行业难题。宇树科技发展良···
2025-08-04
这个夏天,美国夏威夷上空出现惊人一幕,大量无人机空投数万只蚊子。原来,当地蜜旋木雀等鸟类因蚊子传播的禽疟疾濒临灭绝。科学家投放携带沃尔巴克氏菌的雄蚊,···
2025-07-31
近期,中国科学家在衰老研究领域成果丰硕。绘制蛋白质组衰老图谱,揭示器官衰老时间表;发现线粒体双相时钟,解释器官衰老差异;还凸显中医药整体抗衰优势。这些···
2025-07-26
最新资讯
重磅!OpenAI发布GPT - 5,多领域展现卓越能力
多名富豪深海瞬间死亡,“泰坦”号事故原因大揭秘
宇树科技王兴兴再添新身份,杭州具身智能产业加速崛起
夏威夷惊人一幕:空投数万只蚊子为哪般?
中国科学家多维度揭秘人体衰老密码,开启抗衰新征程
上海街头真无人出租车来袭,开启出行新体验
苹果iOS 26公测版发布:液态玻璃设计与AI功能带来全新体验
全国首次!翼龙无人机实现台风全链条应急侦察
软件服务故障致“星链”网络中断2.5小时
上海街头真无人出租车来袭,体验在即!