GPT-5.6,将于下周发布?

就在昨天,网友们激动发现:Codex应用的底层代码中惊现GPT-5.6 Sol、Terra和Luna三大子模型标识。

更令人期待的是,一个全新的「速度拨盘」功能也出现在代码中。

这暗示着,用户可以根据需求在速度和质量之间自由调节,这无疑将给大家带来前所未有的控制体验。

根据爆料,OpenAI已经在内部定下了死命令:GPT-5.6发布的目标窗口直指下周二(7月7日)至7月9日。

为什么是7月7日?因为这一天,恰好是Claude Fable 5特定限额方案失效的真空期。

这是一场精准计算到小时的商业围猎。

最近,Anthropic因为一系列骚操作逼疯无数开发者,谷歌Gemini 3.5 Pro被迫紧急「回炉重造」,OpenAI就趁着这个时机,准备出手抄底了!

拆解Codex代码

Sol、Terra、Luna都要来了

「说实话,OpenAI就像没事人一样,悄悄地把模型名称塞进死代码里,好像我们不会注意到似的。」一位网友这样打趣道。

自从GPT-5.6限量发布后,极客们就紧盯着OpenAI的每一个前端更新。

终于,在最近一次Codex应用的合并中,有人发现了GPT-5.6的踪迹。

还有网友放出了短视频,虽然目前由于后端接口限制无法成功调用模型,但前端的弹出窗口里,三大模型的样式和全新的「速度选择器」已经清晰可见。

并且,代码中还隐约出现了 「Sol Ultra」 的字样。业内猜测,Sol Ultra将是直接对标竞品顶级旗舰的王牌,在性能上与Fable 5不相上下,但价格要亲民得多。

除了这三大模型,代码还透露了一个关键信息:备受期待的「实时语音支持」目前仍处于开发阶段,大概率无法下周直接上线。

偷跑实测流出:GPT-5.6 vs Fable 5

虽然大部分人还没用上,但个别拿到内测权限的玩家,已经分享出了GPT-5.6在实际工程环境中的对比评测。

结果就是四个字——降维打击。

回合一:效率与理解的极限拉扯

海外技术博主 Shivam 分享了他使用 GPT-5.6-terra 和 Fable 5 解决同一个复杂技术Prompt的体验。

Fable-5在100%的5小时会话限制下开始。这个模型疯狂地在后台「Think」,一直硬生生烧掉了21%的额度限制,最后给出的回应,居然是反问了一堆交叉问题,让他去重新确认要解决的技术细节。

同样的任务,GPT-5.6-terra仅仅消耗了13%的额度,响应速度快得惊人。

它没有说废话,而是直接高效率地列出了解决问题的几种不同方法和架构路径,并迅速开始执行。

Shivam直言:在用Fable的时候,我满脑子都在想它会不会突然降级到Opus 4.8;而GPT-5.6-terra的干脆,让我极度舒适。

回合二:WebGL前端硬核小游戏「盲测」

Oracle总监Gilson Melo,则给 GPT-5.6 High 和 Fable 5 High 出了一道硬核考题:

在单个HTML文件中,从头开始构建一个功能齐全的基于浏览器的游戏(使用WebGL或HTML5 Canvas)。游戏必须具备实时刚体物理、重力和用户控制的桨叶/飞船机制。写出完整的CSS、JS和HTML,不许省略任何逻辑,必须支持鼠标拖拽实时响应物理反馈。

这道题非常考验模型处理极致细节、长代码不缩水以及底层物理公式的计算能力。

两个模型在工作流中表现出不同的策略。

Fable 5 High的表现令人惊艳,它极其自信地一键到底,生成了整款游戏的全部代码。

而GPT-5.6 High在生成过程中非常人性化地暂停了两次 ,主动向开发者询问并澄清了两个最终关键决策。

更绝的是,在没有被要求的情况下,它自作主张地为游戏加上了音效。

最终结果显示,GPT-5.6 High在整体的游戏体验、物理碰撞的平滑度以及细节的稳健性上,拿下了更扎实的分数。

总之,两位测试者都认为,GPT-5.6在效率和响应风格上更胜一筹,特别是在处理复杂任务时的清晰度和速度上。

从这个结果看,非常有必要期待一波下一周GPT-5.6的上线了。

精准卡点

OpenAI趁火打劫抢用户

如果说模型泄露是意外,那发布时间绝对是深思熟虑的布局。

OpenAI计划于7月7日重磅发布GPT-5.6,正好卡在Claude用户失去Fable 5访问权限的这一天。

最近Claude流失了不少用户,OpenAI瞅准机会,准备全部接盘。

一位知情人士透露:「GPT-5.6的使用额度限制将大幅放宽,比Fable 5更慷慨。更严格的安全护栏也已在逐步推出,但不会像Fable那样激进到影响正常使用。」

用户不满情绪高涨,OpenAI抢人正当时

对比下来,Anthropic最近的民怨声很大。

Claude Fable 5虽然刚刚回归,已经引发了用户的强烈不满。

随便问几个问题,Fable 5就会降级到Opus 4.8.

生物医药工程师Derya Unutmaz试图让Fable 5解释「人类」这个词。

只打了「Explain human」,模型思考了几秒后就弹出「Switched to Opus 4.8」的卡片,因为Fable 5的安全机制判定这条消息里有需要拦截的内容。

更滑稽的是,半导体分析师Dylan Patel问了一个极其简单的问题:「raspberry这个单词里有几个字母r?」

这个问题同样被拦截了,界面弹出「Chat paused」,说明Fable 5的安全机制会拦截大多数网络安全或生物学话题。

另外,Opus 4.8最近的幻觉问题也非常严重,甚至自己的对话中会出现别人的信息。

这种用户体验的断崖式下跌,恰恰为OpenAI创造了最佳的抢人窗口。

而且,GPT-5.6也很可能更具成本优势。

爆料显示,GPT-5.6 Sol将比Fable 5便宜两倍以上,因为它的token效率更高。但关键是,它的性能是否足以与Fable 5相提并论?

有人预测,Sol Ultra应该可以与Fable 5相媲美,同时比Fable 5更便宜。如果这一预测成真,OpenAI将在性价比上完胜对手。

开发者提醒

4次Codex重置额度,别砸在手里

最后,给所有准备重回Codex的硬核开发者们同步一个「薅羊毛/避坑」指南。

根据Reflection CTO的深度挖掘,如果你之前在Codex里攒下了4次速率限制重置额度,请立刻检查你的账户后台。

OpenAI的官方底层规则显示,这些重置额度的有效期只有30天。如果你第一笔额度是在6月11日或12日前后到账的,那么在7月12日左右,它们就会开始成批过期!

如果你想知道自己的精确过期时间,可以让Codex调用你的ChatGPT token,去请求这个后端API: GET https://chatgpt.com/backend-api/wham/rate-limit-reset-credits。

你将会收到类似如下的JSON响应:

如果GPT-5.6真在下周二准时解禁,你将只有短短4到5天的时间去消耗手里的第一次重置额度。

下周二,OpenAI大概率会再送大家一次全新的Reset。所以,这几天赶紧把手里的老额度用在刀刃上吧。

GPT-5.6,下周见!

参考资料:

https://x.com/testingcatalog/status/2073049917266821338https://x.com/synthwavedd/status/2073084352251232435

https://x.com/ShivamS1123/status/2072664629445275897

https://x.com/gmelo33/status/2072822933194437035

编辑:Aeneas

本文来自微信公众号“新智元”,作者:ASI启示录,36氪经授权发布。