最强模型开始挑人:GPT-5.6 发布了,但你可能根本用不上它 | AI 精英周刊 044
本期要点
GPT-5.6 Sol 发布了,但普通用户现在大概率用不上。OpenAI 把它放进小范围预览,先给受信任合作伙伴;Anthropic 的 Fable 5 / Mythos 5 更直接,发布后三天就因为美国政府指令暂停访问,最新恢复也只先给一部分关键基础设施和网络防御组织。 很多人说,模型越来越强,提示词工程和系统设计就不重要了。这个判断漏掉了一个前提:你得先用得上那个模型。 最强模型正在变强,也正在变得更难拿到。AI 时代的新门槛,不只是钱,还有资格。
OpenAI 这次发布 GPT-5.6,表面看是一次常规的前沿模型更新。
但我觉得真正值得看的,不是它有多强。
而是它没有给谁用。
过去两年,我们已经习惯了一种节奏:新模型发布,大家一起冲进去试;有人夸,有人骂,有人做评测,有人写提示词,有人连夜把它接进自己的工作流。
这一次不太一样。

GPT-5.6 系列分成三档:Sol、Terra、Luna。Sol 是旗舰模型,也是 OpenAI 现在最强的一档。官方介绍里提到,它在编程、生物、网络安全和智能体任务上都有明显提升,还增加了更高的推理力度,以及会调用多个子代理处理复杂任务的超强模式。
如果只看能力,这当然是一条大新闻。

但更关键的信息藏在发布方式里:GPT-5.6 Sol 先提供给受信任合作伙伴。API 和 Codex 里也只是小范围用户先用。普通 ChatGPT 用户没有开放,帮助中心还明确写了,这次小范围预览没有公开申请入口,也没有候补名单。
说白了,你知道它来了。
但你现在大概率用不上。
这就是我这期真正想聊的事:
最强模型不只是变强了。
它开始挑人用了。
Anthropic 那边,故事更直接
如果 OpenAI 这次是“发布即限量”,Anthropic 的 Fable 5 和 Mythos 5 就更像一次提前上演的预告片:
发布,暂停,再局部恢复。
6 月 9 日,Anthropic 发布 Claude Fable 5 和 Claude Mythos 5。
Fable 5 被称为可以给普通用户使用的 Mythos 级模型。Anthropic 自己的说法是,Fable 5 的能力超过他们此前所有面向大众开放的模型,在软件工程、知识工作、视觉、科学研究等领域都很强。任务越长、越复杂,它和其他模型的差距越大。
Mythos 5 则是同一个底层模型,但在部分领域解除安全限制。它的起点不是普通用户,而是 Project Glasswing:Anthropic 和美国政府合作,把它部署给网络防御团队和基础设施服务方。Anthropic 说它有非常强的网络安全能力。
我自己对 Fable 5 的感觉也很复杂。
它不是那种“发布会很强,实际用起来一般”的模型。我是真的喜欢。尤其在长任务、代码、判断和复杂上下文处理上,你能感觉到它和上一代模型不太一样。
问题是,这种感觉只持续了一两天。
6 月 12 日,Anthropic 发公告,说美国政府基于国家安全权限发出出口管制指令,要求暂停 Fable 5 和 Mythos 5 对外国国民的访问。Anthropic 说,为了确保合规,他们实际需要对所有客户突然禁用这两个模型。其他 Anthropic 模型不受影响。
也就是说,你账户里好好的模型,说没就没了。
随后,AnthropicAI 在 X 上表示,Mythos 5 可以重新部署给一组在美国运营和防御关键基础设施的组织。他们会继续和政府合作,扩大 Mythos 5 的访问,并让 Fable 5 重新面向普通用户开放。

注意这里的顺序。
Fable 5 原本是大家能用的最强模型之一。几天后,它被收回。再往后,先恢复的不是普通用户,而是被认为有资格、有场景、有防御需求的一组组织。
这件事比“某个模型很强”重要得多。
因为它让我们看到一个新的趋势:
最强模型正在从“上线给大家用”,变成“先给一小撮人用,剩下的人等通知”。

“提示词不重要了”这个判断,漏掉了一个前提
这两年有一种说法很流行:
提示词工程很快就没用了。
理由也很简单:模型越来越强,很多过去需要技巧才能完成的事情,现在一句话就能做。以前你要把角色、步骤、格式、约束、例子写得很细,模型才勉强听懂。现在你随便说两句,它也能猜个八九不离十。
这个判断不是完全错。
很多早期的提示词技巧,确实正在失去价值。
但它漏掉了一个很重要的前提:
你得先用得上那个最强模型。
如果你能稳定用到最强模型,当然可以少写一点提示词,少做一点工程设计,少操一点心。模型会替你补很多空白,会猜你的意图,会修你的表达,会自动把模糊的需求往合理方向推。
但现在的问题是,最强模型不一定属于你。
GPT-5.6 Sol 先给受信任合作伙伴。Mythos 5 只恢复给部分关键基础设施和网络防御组织。Fable 5 还在等待重新面向普通用户开放。
最强模型没有像水电一样流到每个人手里,反而开始像高压电一样,需要资质、场景和审批。
所以真正的问题,不是“还要不要学提示词”。
真正的问题是:
当最强模型不属于你时,你还能不能用现有模型搭出可靠系统?
这是两个完全不同的问题。
前一个问题默认你永远能拿到最强模型。
后一个问题默认世界会出故障:模型会涨价,会限流,会降级,会改使用政策,也会从你的账号里消失。
如果你的能力建立在“我永远能用到最强模型”这个假设上,那它不是系统。
它只是租来的好运气。
越强的模型,越接近“两用品”
这里还有一个很微妙的地方。
为什么这些最强模型会被限量、暂停、审批?
一个很重要的原因是:它们太有用了。
听起来有点反直觉,但这正是问题所在。
一个模型如果只会帮你写邮件、改文案、做表格,大概率不会有太多人拦着你用。但一个模型如果强到能独立完成网络攻防、发现软件漏洞、设计复杂实验、协助生物研究,那它的每一次开放都会被审视。
因为这些能力天然有两面。
能修漏洞,就可能找漏洞。
能做网络防御,就可能做网络攻击。
能加速科研,也可能加速危险研究。
同一个能力,换一个使用场景,意义就完全不同。
这就是为什么越强的模型,越接近“两用品”:既能用来建设,也能用来破坏。
而越是这种东西,就越不可能像普通软件一样,随便上线、随便购买、随便调用。
所以“反正模型会越来越强,普通人迟早都能用上”这个预期,方向可能从一开始就错了。
能力往上走的时候,普及的阻力不一定越来越小。
反而可能越来越大。
一个只会写周报的模型,没人管你怎么用。
一个强到能处理关键基础设施网络防御的模型,就不是你多付二十美元会员费就能拿到的东西。
智能商品化,不等于智能平权
我以前也有过一个更乐观的想象:
当智能变成商品以后,人与人之间能调动的智能差距,最多也就等同于贫富差距。
说得直接一点,有钱的人可以买更贵的模型、更大的上下文窗口、更快的 API。没钱的人用免费版、开源模型、便宜模型。
差距当然存在,但至少规则很清楚:
谁付得起,谁用得多。
现在看,这个判断还不够悲观。
人工智能没有自动带来智能平权。它只是换了一套准入规则。
对普通人来说,没钱是一道坎,没资格是另一道坎。
钱这道坎再高,至少方向是清楚的。你知道往哪儿使劲,知道多花多少钱能换来多少能力。
资格这道坎不一样。
你不在名单上,就是不在。
你不是受信任合作伙伴,就不是。
你不属于关键基础设施组织,就不属于。
你可以知道那个模型存在,可以看评测,可以看别人截图,可以听别人说它多聪明,但你未必能调用。
这和我们过去对 AI 的想象不太一样。
很多人以为,模型变强以后,普通人和大公司之间的差距会缩小。现在更像是另一种结果:
普通人确实拿到了比过去强得多的工具。
但最强的那一层智能,正在进入一个由价格、资格和监管共同决定的分配系统。
模型越强,越不会平均分给所有人。
所以 MAPS 里的那个问题,要升级了
我在 MAPS 里一直强调一个问题:
如果你天天依赖的那个模型,突然涨价了,你有没有备用方案?
现在看,这个问题还要再往前推一步。
不是涨价。
是直接没了。
如果你最依赖的那个 AI,明天就像 Fable 5 这样从你的账号里消失,你手上的工作,停不停得下来?
以前我们讨论备用方案,更多是在讨论成本。
比如 GPT 太贵了,能不能切到 Claude?Claude 限流了,能不能切到 Gemini?某个 API 出问题,能不能先降级到另一个模型?
这些当然重要。
但这次 GPT-5.6 Sol 和 Fable / Mythos 的事情说明,模型供应链的不稳定,不只是价格问题。
它还包括访问权。
这也是为什么我一直强调系统优先,不是工具优先。
你追工具,永远会被工具带着跑。今天 GPT-5.6,明天 Fable 5,后天又是另一个名字。每一次发布都让你重新站队,每一次限制都让你重新焦虑。
但如果你从一开始就在设计系统,问题会变得很具体:
- 哪些任务必须用最强模型?
- 哪些任务普通模型就够?
- 哪些环节可以降级?
- 哪些环节必须人工确认?
- 你的上下文、提示词、评估标准、素材库、工作流放在哪里?
- 模型换掉以后,这套东西还能不能跑?
- 如果一个模型突然不可用,你有没有第二套路径?
这才是模型系统设计的核心。

模型是供应链,不是信仰
很多人把注意力都放在“用哪个模型”上。
好像谁接上了最强模型,谁就赢了。
但模型恰恰是最不属于你的那部分。
它可以被升级,也可以被降级;可以涨价,也可以限流;可以今天开放,也可以明天被收回。
你真正能带走的,是另一套东西:
你的任务拆分方式。
你的提示词库。
你的素材库。
你的判断标准。
你的验收流程。
你的备用规则。
你的自动化工作流。
你的系统架构。
这些东西不够酷,不会上热搜,也不会像新模型发布那样让人兴奋。
但它们才是你真正拥有的资产。
提示词工程也不是因为模型弱才重要。提示词是你把目标、约束和判断标准交给机器的接口。模型越强,这个接口可以更短、更自然,但它不会消失。除非模型真的能读心,否则你永远要告诉它什么叫好、什么叫错、什么不能碰、什么必须保留。
系统设计也不是为了把最强模型接进来。
系统设计是为了让模型可以被替换、降级、路由、审计。
今天用 Sol,明天用 Terra,后天用 Claude,再后天某个任务切到本地模型。只要你的上下文、流程和评估标准还在,模型就是一个可替换零件。
模型是供应链,不是信仰。
你可以喜欢一个模型。
但不要把自己的能力抵押给它。
真正要守住的,是你的系统
这场竞争已经不只是模型能力的竞争了。
模型能力是巨头的游戏。OpenAI、Anthropic、Google、美国政府、关键基础设施组织,都会参与那一层的分配规则。
普通人当然要关注这些变化,但不应该把自己的全部能力押在那一层。
你真正能守住的,是自己的系统。
因为最强模型不一定属于你。
但你的系统必须属于你。
这也是这两条新闻放在一起,对我最大的提醒。
我的结论不是“赶紧去申请 GPT-5.6”。
也不是“Anthropic 出大事了”。
而是:
别只追最强模型,先想想它断供时怎么办。
最强的那个模型,可能从来都不是为你我准备的。它会先去那些有资格、有审批、有名单的地方。
但好消息是,把今天你够得着的工具用到什么程度,这件事一直握在你自己手里。
与其盯着那个可能永远轮不到你的最强模型,不如把现在能用的模型,用得比大多数人都明白。
本期推荐
这篇文章里说的“别把自己绑死在一个模型上”,到底怎么落到具体做法,正是 MAPS 课程从头到尾在解决的问题。
MAPS 讲的不是“哪个模型最强”,而是怎么把模型、提示词、工作流、素材库和判断标准组织成一个能长期运行的系统。
换句话说:
模型可以变。
系统不能散。
Axton 的 AI 实践工具箱
MAPS 课程 · 从方法论到可交付系统
精英圈 PRO · 深度实践者社群
免费入门课 · 零门槛开始
MAPS 术语词典 & 原典索引:https://www.axtonliu.ai/maps
参考来源
- OpenAI: GPT-5.6 Sol、Terra、Luna 预览公告
- OpenAI 官方 X: GPT-5.6 系列预览发布
- OpenAI 帮助中心: GPT-5.6 Sol、Terra、Luna 预览说明
- OpenAI: GPT-5.6 预览系统卡
- Anthropic: Claude Fable 5 和 Claude Mythos 5 发布公告
- Anthropic: 美国政府指令暂停 Fable 5 和 Mythos 5 访问的说明
- Anthropic 官方 X: Mythos 5 关键基础设施访问更新
Responses