1. 首页 > AI杂谈 > 正文

OpenAI发布GPT-5.5:编程与计算机使用能力再升级,距上次更新不足两月

美东时间4月23日,距离GPT-5.4发布仅隔六周,OpenAI的又一枚“深水炸弹”投向全球AI产业。OpenAI正式推出全新旗舰模型GPT-5.5,将其定位为“面向真实工作的全新智能等级”,在代理式编码、计算机使用及科学研究领域表现卓越。

OpenAI发布GPT-5.5

在AI圈普遍接受“大力出奇迹”底层逻辑的当下,GPT-5.5的出现打破了一条长久以来的铁律——“更强”与“更慢”同时提速。过去,模型越聪明往往越慢、越贵,用户几乎必须在智能和效率之间做取舍。GPT-5.5达到了综合的成绩:在真实服务环境中,其每Token延迟与前代持平,完成相同任务所需的Token数量却显著减少,实现了“更聪明但没有更慢”。据测试,GPT-5.5在14个基准测试中达到最先进水平,而Anthropic Claude Opus 4.7仅达到4个,Google Gemini 3.1 Pro仅2个。就连英伟达工程师在早期测试后短暂的失去权限后亦感慨:“失去GPT-5.5的访问权限,感觉就像肢体被截肢了一样”。

编程和计算机使用能力是GPT-5.5此次升级的核心。在衡量复杂终端操作的Terminal-Bench 2.0中,GPT-5.5冲到82.7%,明显高于前代GPT-5.4的75.1%。OSWorld-Verified的成功率也首次超越人类基线。不过值得注意的是,在评估真实世界GitHub问题解决的SWE-Bench Pro中,GPT-5.5得分58.6%,而Anthropic承认部分问题存在记忆化的Claude Opus 4.7报出了64.3%。这说明在实际开发场景的补丁修复等任务上,编程能力的竞争依然胶着。

与以往发布相比,GPT-5.5还流露出一种微妙的审慎。OpenAI特别强调了网络安全与生物风险的红队测试,并承认模型在网络安全能力上实现了“实质性跨越”,部署了更严格的分类器来预防滥用。API版本交付也较以往明显更为保守,目前尚未完全开放。这种谨慎显然不同于GPT-5.4时期的激进,反映出OpenAI对强大代理模型的安全立场正在收紧。

从更宏观的角度审视,GPT-5.5的发布揭示出一个深刻指向行业竞争本质的信号:前沿AI实验室的竞逐,正从“谁的模型更强”向“谁的迭代更快”演变。六周一个大版本迭代推进,背后交织着多重驱动力。一方面,OpenAI面临着来自Anthropic等对手的压力,后者在企业市场的ARR从90亿美元飙升到300亿美元的节奏持续吸引华尔街目光;另一方面,模型的快速更新已是商业意志的现实折射。在资本与市场的双重驱动下,AI行业已然进入了以“周”为单位计时的竞速时代。

站在GPT-5.5的节点回望,从GPT-5.4到5.5的六周,恰好映照出AI赛道当前的核心命题——它不再仅仅关乎构建更强大的智能,更关乎谁能更快地将前沿模型送抵用户指尖,并在这个过程中保持对伦理与安全航向的持续校准。AI行业正以前所未有的加速度向前推进,这才是值得市场各方持续关注的动向。

AI部落温馨提示:以上是对OpenAI发布GPT-5.5:编程与计算机使用能力再升级,距上次更新不足两月的介绍,点击PetaCloud官网,了解PetaCloud虚拟机,释放云计算无线可能!

本文由网上采集发布,不代表我们立场,转载联系作者并注明出处:https://www.aijto.com/12548.html

联系我们

在线咨询:点击这里给我发消息

微信号:13180206953

工作日:9:30-18:30,节假日休息