← 阅读全部文章

Skill同一篇文章让三个顶尖 AI 分别审查，Claude 抓论证架构，GPT 拆逻辑链，Gemini 优化阅读体验。与其花时间评测哪一个 AI 更强，不如让它们各司其职。本文展示了如何用 ai-pair 协作系统让不同 AI 组成团队同时工作，并给出了多 AI 协作真正有价值的三类场景判断框架。

三个 AI 看同一篇文章，看到的东西完全不同

同一篇文章，我让 Claude、ChatGPT、Gemini 分别审查，它们看到的问题完全不同。

Claude 说我论证有硬伤。ChatGPT 把我的逻辑链逐段拆开，说我跳跃太大。Gemini 呢？它在夸我写得好，然后帮我优化阅读体验。

三个 AI，三种完全不同的关注维度。

这不是谁更好的问题，是它们天然适合干不同的活。

我一直说，用你负担得起的最好的模型。如果你能负担得起两三个顶尖模型的订阅，那就应该去订阅。但关键是，订了之后怎么让它们协作，而不是让它们做同一件事然后比谁更强。

它们的个性差异比你想的明显得多

我们平时说 Claude 强、GPT 强、Gemini 强，但到底强在哪，大部分人说不清楚。跑分评测看不出来的东西，让它们审查同一篇文章，一下就暴露了。

我用来测试的是自己的一篇 Newsletter，讲 AI 记忆系统的。文章不长，2000 多字，有观点，有案例，有引用。我让三个 AI 用同样的标准去审查，结果差距大到我自己都没预料到。

Claude 是均衡型。 它看的是整体论证架构，同时还会检查你的写作风格是不是跑偏了。它直接指出我的一处解读有过度推断的嫌疑，但措辞很克制，像一个文字功底不错的编辑在给你做点评。

GPT 是理工男。 它上来就拆你的论证链，逐段看你的论点和论据是不是对得上。它说我用了一个案例就跳到「结构性缺陷」这个结论，跨度太大。而且它的审查方式很有意思，会主动引用文章里提到的学术文献来支撑自己的审查意见，把你自己引用的论文反过来用在对你的批评上。

Gemini 是讨好型人格。 这么说可能有点不客气，但确实是我最直观的感受。它很少给出尖锐的批评，反倒花大量精力帮你优化阅读体验，比如这段话读起来有点长，建议拆成两段。它还有个很明显的特征，就是会夸人，包括夸其他 AI 的建议，经常说「这个建议非常好」之类的话。

三个 AI 各司其职：Claude 找论证硬伤，GPT 分析逻辑链，Gemini 评估可读性

我是怎么让它们同时工作的

刚才展示的审查结果，不是我一个一个去问的。我用了一个叫 ai-pair 的协作系统，让三个 AI 同时审查同一篇文章。

你可能会想，Claude Code 或者 Codex 自己不就有 Agent Teams 功能吗？能创建多个 agent 同时工作。没错，但它创建的所有 agent 用的都是同一个模型。Claude 的团队全是 Claude，Codex 的团队全是 GPT。这就像一个公司全招同一个专业的人，视角是同质化的。

ai-pair 做的是把不同模型组成一个团队。Claude 做 Team Lead 负责协调和审查，同时调度 Codex 和 Gemini 各自独立审查。三个不同的 AI，三个不同的视角，最后汇总到一起。

原生 Agent Teams（同质化）vs ai-pair 异构团队（多元互补）

具体来说，我在 Claude Code 里输入一行命令，启动一个 content-team 模式。后台会同时启动 Codex 和 Gemini 做独立审查。整个过程几分钟。我不需要在三个窗口之间切换，不需要复制粘贴三次，系统会帮我把三份审查报告放在一起，我只需要看结果、做决定。

这套系统是从我之前开源的 ai-roundtable 演化来的。ai-roundtable 是一个 Chrome 浏览器扩展，让你在同一个界面里操控多个 AI 的网页版，互相讨论、互相评价。ai-pair 把这个思路搬到了命令行，加了明确的角色分工，让协作更有结构，也更适合日常的工作流。

从「比较」到「协作」

大部分人用多个 AI 的方式是这样的：同一个问题问一遍 Claude，再问一遍 ChatGPT，然后比较谁回答得好。

这是最大的浪费。

你在做的事情本质上是让三个不同特长的人做同一份考卷，然后只留一个人的答案。另外两个人的独特视角全浪费了。

在我的 MAPS 体系里，这属于 Systems 维度的设计。S 维度关注的不是单次对话的质量，而是多个 AI 怎么形成一个可持续运转的系统。

什么时候适合多 AI 协作

不是所有场景都需要同时用三个 AI。如果你在写一封邮件，或者问一个简单的事实性问题，用一个就够了。

多 AI 协作真正有价值的场景是：

第一，需要多角度审查的工作。 写完一篇文章，让 GPT 审逻辑，让 Gemini 审读者体验，让 Claude 做总协调。每个 AI 看到的盲区不一样，合在一起覆盖面就大了。

第二，需要不同类型输出的工作。 比如你在做一个项目，需要同时写代码和写文档。让擅长逻辑的去写代码，让擅长表达的去写文档，比让同一个 AI 两头跑效率高。

第三，需要制衡的工作。 如果你只用一个 AI，它说什么你很容易就信了。但如果两三个 AI 对同一件事给出不同判断，你反而更容易看清楚问题在哪里。

多 AI 协作：适合 vs 不适合的场景

不适合的场景也要说清楚。纯聊天、头脑风暴、快速问答，这些用一个 AI 就够了。多 AI 协作有额外的协调成本，不值得用在简单任务上。

多 AI 协作的价值在于降低单一 AI 的偏见风险，提高最终输出的可靠性。但前提是你要知道每个 AI 擅长什么，然后把对的任务分给对的 AI。

这不是 bug，这是你可以利用的特性

回到开头那个发现：三个 AI 审查同一篇文章，看到的问题完全不同。

这不是 bug，这是你可以利用的特性。

我把 ai-pair 协作系统开源了，放在 GitHub 上。开源版保留了最容易上手的 Agent Teams 模式，你只需要装好 Claude Code，加上 Codex 或者 Gemini 的 CLI，就可以直接用。不需要写代码，不需要额外的配置。

GitHub - axtonliu/ai-pair: Coordinate multiple AI models (Clau...

Coordinate multiple AI models (Claude + GPT + Gemini) as a heterogeneous team. One creates, two review. A Claude Code Skill. - axtonliu/a...

github.com

如果你想更系统地学习怎么设计 AI 工作流，包括怎么设计约束条件让 AI 的输出更可控，怎么把多个 AI 编排成一个可持续运转的系统，这些都是 MAPS 课程 Systems 维度里的核心内容。

MAPS 术语词典 & 原典索引：https://www.axtonliu.ai/maps

这篇文章解决了你的一个“点”

但真正的竞争力，来自于将无数个“点”连接成“系统”的能力。旗舰课程 MAPS™ 训练营 专为此而设，带你从解决零散问题，到构建一个能为你持续创造价值的AI强大引擎。

点击了解系统化解决方案

我开源了一个让 Claude、GPT、Gemini 组队的 Skill｜ AI 精英周刊 042

三个 AI 看同一篇文章，看到的东西完全不同

它们的个性差异比你想的明显得多

我是怎么让它们同时工作的

从「比较」到「协作」

什么时候适合多 AI 协作

这不是 bug，这是你可以利用的特性

Responses

这篇文章解决了你的一个“点”

AI 精英周刊

精英圈 PRO 会员专享 Newsletter，深度阅读、高级分享、拒绝碎片！

Join Our Free Trial