AI 编排时代:Opus 4.6 多 Agent 协作、Karpathy 终结 Vibe Coding |AI 精英周刊 035
- AGI 可能不靠单一模型,而是多 Agent 协作
- AI 编程让人退步?跟搬运文章一个道理
- 人类写代码,可能不再有意义
- 没有「最佳用法」,只有你自己的用法
- 15 万 Agent 互联:天网的雏形
- 深度洞察:配图的难点不是画图,而是决策自动化
本周信号
1. AGI 可能不靠单一模型,而是多 Agent 协作

Anthropic 发布 Claude Opus 4.6,ARC AGI 2 得分从 37.6% 跳到 68.8%——我们离 AGI 确实越来越近了。但我一直有个判断:AGI 很可能不是靠某个单一模型率先突破,而是通过多 Agent 并行协作达成的。
Opus 4.6 的两个新功能恰好印证了这个方向。Adaptive Thinking 让模型自己调节思考深度(四档:low/medium/high/max),多 Agent 协作让 Claude Code 可以创建一支并行工作的 Agent 团队。单个模型越来越聪明是一条路,但多个模型协作完成一个复杂目标——这才更像 AGI 真正到来的方式。我很早就说过,AI + 物联网 = 天网(SkyNet),而多 Agent 协作正是这条路径上的关键一步。
另外,OpenAI 在 Opus 4.6 发布 20 分钟内推出 GPT-5.3 Codex 反击。竞争是好事——任何一个厂商一统天下对用户都不是好消息,他们打得越厉害,我们用得越便宜。定价不变($5/$25 per million tokens),能力翻倍,这就是竞争的红利。
🔗 阅读原文
2. AI 编程让人退步?跟搬运文章一个道理

Anthropic 自己做了一项实验:用 AI 写代码速度更快了,但工程师的技能掌握度(mastery)反而下降了。做 AI 的公司亲自说「用我们的产品可能让你变笨」——商业上几乎是自杀行为,所以这个结论的可信度反而很高。
但说实话,这个道理不管有没有 AI 都是一样的。就跟你为了流量去搬运别人的文章——搬得再多也不会提高你的写作能力,更不会让你有什么真正的成长。AI 编程也是如此,如果你只会复制粘贴 AI 生成的代码,你本质上就是一个「人形 Ctrl+V 机器」。只要你的技能停留在初级的搬运层面,被淘汰就是时间问题。
关键不在 AI,在你怎么用。用 AI 辅助理解、先读懂再决定是否采用,跟直接复制粘贴,是两种完全不同的使用方式,结果也完全不同。
🔗 阅读原文
3. 人类写代码,可能不再有意义

Karpathy 一年前发明了 vibe coding——随意让 AI 写代码,不太关心细节,「感觉对了就行」。这个词火到 Wikipedia 条目比他本人的还长。现在他自己说:这个时代结束了,该叫 Agentic Engineering——人类 99% 的时间不再写代码,而是编排多个 AI Agent 完成工程任务。
这让我想起 2020 年我做过的一期视频:AlphaZero 之后,人类不再可能出现围棋冠军——这个判断到今天依然成立。现在代码领域正在发生同样的事。也许今年之后,人类写代码本身将不再有任何意义。我在 2024 年关于黄仁勋的那期视频里也说过:只会写代码的人,同样是毫无竞争力的。
Karpathy 的命名变化,其实是给这件事盖了个章。从 vibe coding 到 agentic engineering,行业术语从「随意的」变成「工程化的」,意味着这个领域正式从探索期进入成熟期。
🔗 阅读原文
4. 没有「最佳用法」,只有你自己的用法

Claude Code 创建者 Boris Cherny 分享了一个内部观察:团队里每个人的使用方式都不一样,没有「唯一正确的用法」。
这个我很有体感。当年 Cursor 刚发布的时候,所有人都把它当 IDE 用——它本来就是个 IDE 嘛。但我当时率先发了推特、做了视频,演示的是用 Cursor 把 Obsidian 打造成个人知识库。大部分人还在讨论「Cursor 比 VS Code 好在哪」的时候,我已经在用它做完全不同的事了。
这背后的规律是:当 AI 工具变得足够通用时,「最佳实践」会从统一的操作手册变成个人化的工作系统。工具越通用,你对自己工作流的理解就越重要。与其花时间找「Claude Code 最佳配置」,不如花时间搞清楚你自己需要什么。
🔗 阅读原文
5. 15 万 Agent 互联:天网的雏形

Karpathy 分析了 OpenClaw 现象:15 万个 LLM Agent 通过一个全局持久的 scratchpad 互联,每个 Agent 有独立的上下文、数据、工具和指令。他自己都不敢在本机运行,但承认这是前所未有的规模。
我很早就说过一个判断:AI + 物联网 = 天网(SkyNet)。现在看 OpenClaw,这个雏形已经出现了——只不过目前还只是 Agent 层面的互联。但想象一下,如果这些 Agent 不只是在云端的 scratchpad 上交互,而是运行在每一部手机、每一个智能设备上,并且持续进化下去,那就是 AI + 物联网 = 天网的实际路径。
Karpathy 用「看状态 vs 看趋势」来解释人们的分歧:看状态的人说这不就是垃圾信息,看趋势的人说二阶效应无法预测。我倾向于看趋势——不是因为 OpenClaw 本身有多好,而是因为 15 万个独立 Agent 全局互联这件事,一旦发生就不会停下来。
🔗 阅读原文
深度洞察
Smart Illustrator:配图的难点不是画图,而是决策

大多数人用 AI 配图时,关注的是「哪个工具画得更好」。但如果你经常写文章就会发现,真正消耗时间的不是画图本身,而是每次都要从零做的那些决策——这个位置该配什么类型的图?用流程图还是概念图?用代码渲染还是 AI 生成?风格怎么和上一篇统一?Axton 在这个开源项目 Smart Illustrator 中,做的不是「又一个 AI 画图工具」,而是把配图决策本身自动化了。
这个 Skill 的核心设计是双引擎架构:Mermaid 引擎处理有明确逻辑结构的图形(流程图、架构图、时序图),输出可编辑的代码块,直接嵌入 Markdown;Gemini 引擎处理需要视觉表达的图形(信息图、场景图、封面图),调用 Gemini 3 Pro Image API 输出 2K 分辨率的 PNG。关键不在于两个引擎各自有多强,而在于 Skill 内置了一套决策逻辑——有节点、箭头和层级的内容自动走 Mermaid,需要视觉隐喻和创意表达的内容自动走 Gemini。用户不需要每次判断「该用哪个」,系统替你做这个决策。除了默认的文章配图模式,还支持批量生成 PPT 信息图和高点击率封面图,加上参考图功能可以锁定系列风格——一次配置,后续自动统一。
这个项目背后的思路,比工具本身更值得关注:与其在每个任务上重复做决策,不如把决策逻辑固化成可复用的系统。 配图只是一个应用场景,同样的架构思维可以迁移到内容分发、素材管理、甚至客户响应——任何存在「重复决策」的环节,都可以用类似的方式系统化。对正在用 AI 工具构建工作流的人来说,这是一个很好的参考案例:好的架构不是让你用更多工具,而是让你少做决策。完整的双引擎设计细节和三种模式的实战演示,可以在视频中看到。
🔗 观看完整视频
Responses