Header Logo
AI智能体 AI实战派 AI自动化 AI精英圈 AI精英周刊 所有课程 博客 咨询
Axton是谁
登录
← Back to all posts

Claude 秒变 GPT o1?爆火的“神级”提示词,真的神吗| AI 精英周刊 011

Nov 18, 2024

 

Hey,你好!
「AI 快讯」全新升级为「AI 精英周刊」。在 AI 时代,信息获取越来越容易,但信息的筛选和甄别却变得成本高昂。「AI 精英周刊」拒绝快餐式内容,坚持深度阅读,不向互联网倒垃圾。我们的目标是为您的 AI 之旅提供真正有价值的内容。

文章由真人撰写,非 AI 生成。


这两天突然爆火一个“神级”PROMPT,据说用了这个提示词之后,就能让 Claude 3.5 Sonnet 达到 GPT-o1 水准,这事不但在Twitter上成了热门话题,也有观众朋友私信问我,神级 PROMPT 是不是这么神。 好,口说无凭,今天咱们就进行一次实测对比,用同一个任务,做三次,分别是:直接丢给 Claude 回答、让神级 PROMPT 加持的 Claude 回答、让 GPT-o1 回答。

YouTube 视频请点击链接观看。

Claude 秒变 GPT o1?爆火的

 

测试之前我先叠个甲,首先,我用于测试的例子只是我日常工作范围内的少数案例,测试结果仅供抛砖引玉,如果您有不同的结果,欢迎留言分享您的测试案例大家共同学习。其次,我测试的时间是11月16日,目前这个提示词在不断地更新当中,因此你的结果很可能与视频当中的不同。

首先,如何安装使用神级提示词

我们来到作者的 Github,这个项目的名称叫做 Thinking Claude,链接如下:

GitHub - richards199999/Thinking-Claude: Let your Claude able to think

作者叫做 Richard,据说是高中生,确实很厉害很佩服,这个项目已经破5千颗星了。

首先是作者的一个快速提醒,我猜这是在网上大热之后,Richard 特地添加的说明,提醒中说到:Thinking Claude 并不是为了基准测试或在数学等方面取得巨大飞跃,因为这些是由基础模型(新的克劳德-3.5 索尼特)预先确定的。我只想探索我们能通过克劳德的“深度思维”达到多远。从这里就能看得出来 Richard 的谦逊,非常好。

 

使用 Thinking Claude 有两种方式,一个是直接拷贝提示词到Claude的Project项目里用,一个是可以用 Richard 开发的浏览器插件,我们就先简单滴直接拷贝提示词来用。

按照说明,通过以下几个步骤就可以使用了:

  1. 复制model_instructions文件夹中的最新版本
  2. 在 Claude.ai 中启动一个新项目

     

  3. 将说明粘贴到自定义说明部分

     

  4. 克劳德现在将遵循思维协议进行所有后续互动

 

对比测试

测试的问题呢,是把 MKBHD 关于如何做好 YouTube 的一段54分钟视频的脚本,整理成一个脑图。

 

我们把字幕下载回来并转换成TXT文本文件,至于如何简单滴把 SRT 转换为 TXT,可以看我的这期视频:

桌面大战开启!ChatGPT 多应用协作功能实例演示 | 回到Axton

 

或者,直接使用 ChatGPT 写的 Shell 脚本:
grep -vE '^[0-9]+$|^[0-9]{2}:[0-9]{2}:[0-9]{2},[0-9]{3}' MKBHD.srt | sed '/^$/d' > MKBHD.txt

然后使用一个简单提示:

请根据以下文本内容,创建一个清晰、逻辑关系准确且易于理解的 Markdown 格式的脑图,输出中文

然后把生成的结果导入到脑图软件中显示。

 

首先,直接让 Claude 回答:

 

结果如下:

 

接下来,使用 Thinking Claude

 

结果如下:

 

 

GPT-o1 测试

 

结果如下:

 

那么,三个结果的对比效果如何呢?大家可以自己对比一下,得出你自己的结论。

那么,我的结论是什么呢?

三个结论

  • 用了神级提示词,Claude 是否能达到 GPT-o1 的水准了?
    • 这个问题其实很好回答,首先,Claude 3.5 Sonnet 是 Claude 的中级模型,与 GPT-o1 对标的应该是 Claude 的高级模型 Opus,如果一个提示词就能让 Sonnet 达到 o1 的水准,我们是不是可以向 OpenAI 的老板 Altman 喊话了: “别花钱训练模型了,干点正事研究下提示词吧”,这合理吗?
  • 提示词是否能够提升模型表现?
    • 是的,好的提示词确实能够提升模型表现,但是不存在一个万能模版。给我一本详细的菜谱,可以让我炒的菜好吃一点,但是不可能我就成大厨了,没有银弹!没有银弹,解决问题依然需要持续学习和迭代
  • 神级提示词是否值得学习?
    • 是的,这位高中同学写的提示词非常值得学习。有哪些值得学习的地方?我们同样可以分别让 Thinking Claude 和 o1 给出答案。

以下是一个详细的 PROMPT,用于提升大语言模型 Claude 的回答质量,请分析这个 PROMPT 的优点、有哪些值得AI爱好者们学习的地方以及AI爱好者该如何通过学习此PROMPT来提高自己写PROMPT的能力,使用中文输出为 Markdown 格式的脑图。

PROMPT 分析对比

首先,是 Thinking Claude 的输出转换为脑图的结果,由于输出的 Markdown 结构并不完美,所以二级节点的内容在导入脑图之后,都变成了注释。屏幕截图如下,我点开了“核心特点分析结构设计”部分:

 

接下来是 GPT-o1 的输出结果,无论是从 PROMPT 遵从性,还是总结后的条理性来说,这个结果远超 Claude 的输出效果:

 

以上,就是本次测试结果。当任何一个事情成为流行之后,比如 AI,就会不可避免地出现各种杂音、充斥着各种碎片信息。这也是为什么说「信息的获取变得越来越容易,而信息的甄别将会成为一件成本高昂的事情」。


感谢阅读!如果你喜欢这次分享的内容,请分享给你的一个朋友。也欢迎你加入『AI精英学院 』学习 AI 或者去我的YouTube频道 『 回到Axton 』做客,咱们一起好奇地看世界!

保持健康,保持快乐!

Axton

 

Responses

Join the conversation
t("newsletters.loading")
Loading...
Make 下架 Twitter 之后的备选方案 Buffer | AI 精英周刊 021
2025 年 4 月3 日起,Make.com 正式官宣下架 Twitter(现称 X)集成模块。这一决定的原因在于 Twitter 更新了 API 政策并大幅提高了接口收费,导致 Make 难以继续为用户提供可行的官方 Twitter 集成。换言之,除非第三方平台支付高昂费用,否则无法直接调用 Twitter API。对于内容创作者来说,这意味着原先通过 Make 自动发推的工作流需要寻找替代方案。 就在不久前,Make 还在功能更新中推出 Twitter 的回复(Reply)功能呢,原以为对 X 的支持会越来越多,结果好景不长,X 把基础版本的 API 费用从 100 美元每月翻倍到 200 美元不说,更是把企业版起价涨到 4 万 2 千美元一个月,可见 X 多么能折腾吧。 对此我真是无力吐槽, GPT 说得好,当平台规模 > 盈利能力 时,”免费开放”率先被祭天。 如果我们...
Trae + MCP 实战:一键生成 Obsidian 白板脑图 | AI 精英周刊 020
最近 AI 工具圈子里,字节跳动推出的免费 AI IDE —— Trae, 刚刚宣布支持 MCP,重点是 Trae 现在是免费的。 之前我在 「告别无聊 PPT,AI 一键生成 Obsidian 高颜值白板脑图!| AI 精英周刊 018」 这篇 Newsletter 中,和大家探讨了如何让 AI 帮助我们生成 Obsidian Canvas。今天,我们要玩点更酷的!借助 Trae 最近引入的 MCP 支持,特别是 filesystem 这个 MCP,我们可以实现更灵活的本地文件操作,直接在 Trae 中生成和控制我们 Obsidian Vault 中的 Canvas 文件。 当然,做为对比,我们还会演示直接使用 Claude 的桌面版 APP 借助 MCP,一键完成 Obsidian Canvas 的生成和编辑,而不需要手工地拷贝和粘贴 AI 生成的 Canvas 代码。 这不仅...
10篇报告深度实测!Gemini 2.5 Pro vs OpenAI Deep Research,谁才是AI研究之王? | AI 精英周刊 019
4 月 8 日 Google 发布了 Gemini 2.5 Pro 驱动的 Deep Research,毫不客气地贴出了与 OpenAI Deep Research 的对比图,所有项目都甩了 OpenAI 一条街。     我第一眼看到时,心里就两个字:“吹吧你就!” 但是,以前我就一直说,Google 在生态和技术积累上的优势绝不可小觑,这不是其他公司能够轻易超越的。 于是,我花了整整三天时间,仔细研读并逐一对比了 5 个主题、共 10 篇 Deep Research 报告。 Google 这次到底是不是真的行?能不能以 20 美元全家桶的价格吊打 200 美元的 OpenAI?这期就给你一场深度评测。 选题 首先,用来对比的研究主题分两类,每一类主题分别选择全面分析和专项分析。 第一类以《2025年斯坦福AI指数报告》为切入点,一个主题全面分析AI...

AI 精英周刊

深度阅读、高级分享、拒绝碎片!
© 2025 AI 精英学院 by Axton. All Rights Reserved.
Powered by Kajabi

Join Our Free Trial

Get started today before this once in a lifetime opportunity expires.