我开源了一个让 Claude、GPT、Gemini 组队的 Skill| AI 精英周刊 042
Skill同一篇文章让三个顶尖 AI 分别审查,Claude 抓论证架构,GPT 拆逻辑链,Gemini 优化阅读体验。与其花时间评测哪一个 AI 更强,不如让它们各司其职。本文展示了如何用 ai-pair 协作系统让不同 AI 组成团队同时工作,并给出了多 AI 协作真正有价值的三类场景判断框架。
三个 AI 看同一篇文章,看到的东西完全不同
同一篇文章,我让 Claude、ChatGPT、Gemini 分别审查,它们看到的问题完全不同。
Claude 说我论证有硬伤。ChatGPT 把我的逻辑链逐段拆开,说我跳跃太大。Gemini 呢?它在夸我写得好,然后帮我优化阅读体验。
三个 AI,三种完全不同的关注维度。
这不是谁更好的问题,是它们天然适合干不同的活。
我一直说,用你负担得起的最好的模型。如果你能负担得起两三个顶尖模型的订阅,那就应该去订阅。但关键是,订了之后怎么让它们协作,而不是让它们做同一件事然后比谁更强。
它们的个性差异比你想的明显得多
我们平时说 Claude 强、GPT 强、Gemini 强,但到底强在哪,大部分人说不清楚。跑分评测看不出来的东西,让它们审查同一篇文章,一下就暴露了。
我用来测试的是自己的一篇 Newsletter,讲 AI 记忆系统的。文章不长,2000 多字,有观点,有案例,有引用。我让三个 AI 用同样的标准去审查,结果差距大到我自己都没预料到。
Claude 是均衡型。 它看的是整体论证架构,同时还会检查你的写作风格是不是跑偏了。它直接指出我的一处解读有过度推断的嫌疑,但措辞很克制,像一个文字功底不错的编辑在给你做点评。
GPT 是理工男。 它上来就拆你的论证链,逐段看你的论点和论据是不是对得上。它说我用了一个案例就跳到「结构性缺陷」这个结论,跨度太大。而且它的审查方式很有意思,会主动引用文章里提到的学术文献来支撑自己的审查意见,把你自己引用的论文反过来用在对你的批评上。
Gemini 是讨好型人格。 这么说可能有点不客气,但确实是我最直观的感受。它很少给出尖锐的批评,反倒花大量精力帮你优化阅读体验,比如这段话读起来有点长,建议拆成两段。它还有个很明显的特征,就是会夸人,包括夸其他 AI 的建议,经常说「这个建议非常好」之类的话。

我是怎么让它们同时工作的
刚才展示的审查结果,不是我一个一个去问的。我用了一个叫 ai-pair 的协作系统,让三个 AI 同时审查同一篇文章。
你可能会想,Claude Code 或者 Codex 自己不就有 Agent Teams 功能吗?能创建多个 agent 同时工作。没错,但它创建的所有 agent 用的都是同一个模型。Claude 的团队全是 Claude,Codex 的团队全是 GPT。这就像一个公司全招同一个专业的人,视角是同质化的。
ai-pair 做的是把不同模型组成一个团队。Claude 做 Team Lead 负责协调和审查,同时调度 Codex 和 Gemini 各自独立审查。三个不同的 AI,三个不同的视角,最后汇总到一起。

具体来说,我在 Claude Code 里输入一行命令,启动一个 content-team 模式。后台会同时启动 Codex 和 Gemini 做独立审查。整个过程几分钟。我不需要在三个窗口之间切换,不需要复制粘贴三次,系统会帮我把三份审查报告放在一起,我只需要看结果、做决定。
这套系统是从我之前开源的 ai-roundtable 演化来的。ai-roundtable 是一个 Chrome 浏览器扩展,让你在同一个界面里操控多个 AI 的网页版,互相讨论、互相评价。ai-pair 把这个思路搬到了命令行,加了明确的角色分工,让协作更有结构,也更适合日常的工作流。
从「比较」到「协作」
大部分人用多个 AI 的方式是这样的:同一个问题问一遍 Claude,再问一遍 ChatGPT,然后比较谁回答得好。
这是最大的浪费。
你在做的事情本质上是让三个不同特长的人做同一份考卷,然后只留一个人的答案。另外两个人的独特视角全浪费了。
在我的 MAPS 体系里,这属于 Systems 维度的设计。S 维度关注的不是单次对话的质量,而是多个 AI 怎么形成一个可持续运转的系统。
什么时候适合多 AI 协作
不是所有场景都需要同时用三个 AI。如果你在写一封邮件,或者问一个简单的事实性问题,用一个就够了。
多 AI 协作真正有价值的场景是:
第一,需要多角度审查的工作。 写完一篇文章,让 GPT 审逻辑,让 Gemini 审读者体验,让 Claude 做总协调。每个 AI 看到的盲区不一样,合在一起覆盖面就大了。
第二,需要不同类型输出的工作。 比如你在做一个项目,需要同时写代码和写文档。让擅长逻辑的去写代码,让擅长表达的去写文档,比让同一个 AI 两头跑效率高。
第三,需要制衡的工作。 如果你只用一个 AI,它说什么你很容易就信了。但如果两三个 AI 对同一件事给出不同判断,你反而更容易看清楚问题在哪里。

不适合的场景也要说清楚。纯聊天、头脑风暴、快速问答,这些用一个 AI 就够了。多 AI 协作有额外的协调成本,不值得用在简单任务上。
多 AI 协作的价值在于降低单一 AI 的偏见风险,提高最终输出的可靠性。但前提是你要知道每个 AI 擅长什么,然后把对的任务分给对的 AI。
这不是 bug,这是你可以利用的特性
回到开头那个发现:三个 AI 审查同一篇文章,看到的问题完全不同。
这不是 bug,这是你可以利用的特性。
我把 ai-pair 协作系统开源了,放在 GitHub 上。开源版保留了最容易上手的 Agent Teams 模式,你只需要装好 Claude Code,加上 Codex 或者 Gemini 的 CLI,就可以直接用。不需要写代码,不需要额外的配置。
如果你想更系统地学习怎么设计 AI 工作流,包括怎么设计约束条件让 AI 的输出更可控,怎么把多个 AI 编排成一个可持续运转的系统,这些都是 MAPS 课程 Systems 维度里的核心内容。
MAPS 术语词典 & 原典索引:https://www.axtonliu.ai/maps
Responses