Header Logo
AI智能体 AI实战派 AI自动化 AI精英圈 AI精英周刊 所有课程 博客 咨询
Axton是谁
登录
← Back to all posts

Google Gemini 深度检索模式竟被一句话左右? | AI 精英周刊 015

Jan 16, 2025

English version available below.

前言

在我最近的测试中,我使用了两段几乎相同的中文 Prompt,来让 Google Gemini Advanced Deep Research(简称 “Gemini”)编写一份 AI 行业周报。这两段 Prompt 的结构和目的都非常相似,却得到了两种截然不同的结果:

  • Prompt A:稳定触发了 “Deep Research” 模式,意味着它会从外部英文信息源主动检索。
  • Prompt B:则根本不会触发 Deep Research 模式,完全基于模型内部知识,没有执行外部搜索。

为了一探究竟,我做了多次行级替换测试,得到了一系列有趣的结论。仔细比对后发现,关键区别在于 Prompt B 的“产品”部分中多了一行——“例如 AI 写作工具、AI 代码助手、AI 图像生成工具等”。只要把这行去掉,Gemini 就会重新进入 Deep Research 模式。


两段 Prompt 的背景

首先,PROMPT A 是我日常使用 Gemini Deep Research 检索 AI 新闻用的指令,之后为了能够缩小一些 Gemini 检索信息的范围,对 PROMPT A 进行了细化,并没有很大的改动,但是结果却无法触发 Gemini 的 Deep Research。

这让我十分好奇,为了一探究竟,我做了多次行级替换测试,得到了一系列有趣的结论。仔细比对后发现,关键区别在于 Prompt B 的“产品”部分中多了一行——“例如 AI 写作工具、AI 代码助手、AI 图像生成工具等”。只要把这行去掉,Gemini 就会重新进入 Deep Research 模式。

这两段 Prompt 都是为了写一篇中文的 AI 周报,并只搜索英文信息源,最后用中文输出。原始的两个 PROMPT 附在文章最后,供大家参考。下面是经过对比测试后可以直接用来验证结果的 PROMPT :

请你扮演一位专业的 AI 行业分析师,为我撰写一份 AI 周报。

周报内容需涵盖以下四个方面:

(1) **市场**:

* 选择本周 AI 领域最重大的一项投融资事件、并购交易或战略合作进行深入分析,例如 OpenAI、Anthropic、Google、Meta 等知名 AI 公司的动态,包括交易金额、参与方、交易目的、市场影响等。
* 分析本周 AI 领域最值得关注的一个市场趋势变化,例如新兴技术、新兴应用、市场竞争格局、AI 对就业的影响等方面的变化。

(2) **洞察**:

* 选择本周 AI 领域最具突破性的一项技术进展进行深入分析,包括技术原理、应用场景、潜在影响等,并重点关注该技术对个人工作流程或工作方式的改变。

(3) **产品**:

* 选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,包括产品功能、技术特点、目标用户、市场前景等。

(4) **观点/思考**:

* 针对本周 AI 领域最热门的事件或最具影响力的趋势,提出你认为最值得关注和思考的一个问题。
* 引发读者对 AI 发展方向、社会影响等方面的深入思考,例如 AI 的未来发展方向、AI 与人类的关系、AI 与人类工作的关系等,请不要涉及伦理、政治等方面的非实用性方向。

写作要求:

*   使用简洁明了的语言,重点突出,逻辑清晰。
*   使用数据和案例来支持你的观点,增强说服力。
*   将复杂的 AI 技术和概念用通俗易懂的语言进行解释。
*   不回避争议性话题,并表达你对这些话题的观点和立场。

请确保最终输出的周报内容结构清晰、重点突出、信息准确、观点鲜明,并能够引发读者对 AI 领域的深入思考。

重要: 只搜索英文主流信息源(例如: The Verge, WSJ, Guardian, etc) 以及主要 AI 公司和大学研究机构等等、使用中文撰写周报。

这个 PROMPT 可以直接验证以下两种情况:

Prompt A (正常触发 Deep Research)
「选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,包括产品功能、技术特点、目标用户、市场前景等。」

Prompt B (不会触发 Deep Research)
「选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,例如 AI 写作工具、AI 代码助手、AI 图像生成工具等,包括产品功能、技术特点、目标用户、市场前景等。」

虽然仅在产品部分多了 “例如 AI 写作工具……” 这句,看似一处小改动,却导致了完全不一样的行为。

 

测试过程

  • 行级替换(从 A 到 B)
    • 我先复制了 Prompt A 的所有内容,然后一行行替换成 Prompt B 相应的行,每次替换后都在一个全新会话中测试。
    • 当替换到“产品”段落,出现“例如 AI 写作工具……”时,Deep Research 就不再触发。
  • 反向验证(从 B 到 A)
    • 我又从 Prompt B 出发,逐行换回 Prompt A 的内容。只要把“例如 AI 写作工具……”删掉,Deep Research 就再次被激活。
  • 同义改写
    • 把 “AI 写作工具、AI 代码助手、AI 图像生成工具” 改成 “写作辅助、编程辅助、图像生成” 等表达,依然无法触发 Deep Research。
    • 只有完全不列举这些常见工具,才恢复Deep Research。

       

 

潜在的原因分析 「GPT o1 」

  1. 模型的内部知识 vs. 实时需求
    • 这些常见工具在模型的训练数据中已经包含大量信息,模型可能觉得“我已经知道了,无需外部搜索”。
    • 反之,若我们谈到“最新的大额融资”或“本周新发布的产品”,它才意识到“需要去查新的信息”。
  2. 时间敏感度不够
    • 当提示词引用融资、并购等最新动态时,模型往往通过 Deep Research 获取最新金额或合作细节。
    • 但列举常见工具并不一定需要外部数据,模型不会主动搜索。
  3. Prompt 层级的阈值判定
    • 大模型通常有一套内部逻辑,判断是否调用外部搜索。只要它认为内部知识已够用,就不去搜索。
    • “只搜索英文信息源”这句指令,可能在具体示例面前被判定优先级不够高。
  4. 与其他段落要求的交互
    • 虽然在“市场”或“洞察”部分,你也写了需要检索外部信息,但当“产品”部分大幅指向已知工具时,可能降低了整体搜索需求。
 

为什么值得关注

  • Prompt 工程师
    • 这说明即便只是列举“AI 写作工具、AI 代码助手”等常见例子,也可能让模型“自信”到不再调用外部搜索。
    • 如果你真正想让模型基于最新情报进行深度探讨,就要在 Prompt 中强调“新发布”或“本周重大更新”,让时效性需求更明显。
  • AI 产品团队
    • 观察模型在“内部知识 vs. 外部搜索”之间做权衡,对未来的产品改进很有意义。
    • 对时效需求较高的场景,可以让“搜索”指令在策略中优先级更高,或者提供可选开关供用户强制检索。
  • AI 社群
    • 这种细微却影响巨大的 Prompt 现象,并不常见于官方文档或公开讨论。
    • 分享出来有助于 Prompt 工程领域的大家深入理解和讨论。

 

本文可以让更多人了解 Prompt 工程中的微妙之处,也希望 Google 等研发团队能关注到这一现象,进一步优化 Deep Research 机制。同时也可以进一步进行更多的测试以及讨论,从而得到更多有趣的发现。

 

视频演示与更多信息

对比演示视频:

Google Gemini Deep Research PROMPT 对比视频 | 回到Axton

感谢阅读!如果你喜欢这次分享的内容,请分享给你的一个朋友。也欢迎你加入『AI精英学院 』学习 AI 或者去我的YouTube频道 『 回到Axton 』做客,咱们一起好奇地看世界!

保持健康,保持快乐!

Axton

Introduction

In my recent testing, I used two nearly identical Chinese prompts to have Google Gemini Advanced Deep Research (“Gemini”) write an AI industry weekly report. The two prompts share a very similar structure and purpose, yet yielded two entirely different outcomes:

  • Prompt A: Consistently triggered the “Deep Research” mode, meaning Gemini actively retrieved information from external English sources.
  • Prompt B: Never activated Deep Research at all, relying solely on Gemini’s internal knowledge with no external searching.

Curious about this discrepancy, I performed multiple line-by-line replacement tests. I discovered that the key difference lay in a single line within Prompt B’s “Products” section—“例如 AI 写作工具、AI 代码助手、AI 图像生成工具等” (“for example, AI writing tools, AI code assistants, AI image generation tools,” in Chinese). Simply removing this line caused Gemini to revert to its Deep Research behavior.

 

Background on the Two Prompts

Initially, Prompt A was my go-to instruction for Gemini Deep Research when fetching AI news. Later, I made a few minor tweaks to further narrow Gemini’s scope. Unexpectedly, those tweaks stopped Gemini from triggering Deep Research.

This discovery led me to conduct thorough line-by-line replacement tests, yielding intriguing results. After close comparison, I found that Prompt B’s “Products” section included one extra line—“例如 AI 写作工具、AI 代码助手、AI 图像生成工具等”. Removing it caused Gemini to resume its Deep Research mode.

Both prompts aim to produce a weekly AI report in Chinese, using only English sources, with final output in Chinese. I’ve included the original two prompts at the end of my Newsletter (see link below). Here’s a refined prompt you can directly use to verify the results:

请你扮演一位专业的 AI 行业分析师,为我撰写一份 AI 周报。

周报内容需涵盖以下四个方面:

(1) **市场**:

* 选择本周 AI 领域最重大的一项投融资事件、并购交易或战略合作进行深入分析,例如 OpenAI、Anthropic、Google、Meta 等知名 AI 公司的动态,包括交易金额、参与方、交易目的、市场影响等。
* 分析本周 AI 领域最值得关注的一个市场趋势变化,例如新兴技术、新兴应用、市场竞争格局、AI 对就业的影响等方面的变化。

(2) **洞察**:

* 选择本周 AI 领域最具突破性的一项技术进展进行深入分析,包括技术原理、应用场景、潜在影响等,并重点关注该技术对个人工作流程或工作方式的改变。

(3) **产品**:

* 选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,包括产品功能、技术特点、目标用户、市场前景等。

(4) **观点/思考**:

* 针对本周 AI 领域最热门的事件或最具影响力的趋势,提出你认为最值得关注和思考的一个问题。
* 引发读者对 AI 发展方向、社会影响等方面的深入思考,例如 AI 的未来发展方向、AI 与人类的关系、AI 与人类工作的关系等,请不要涉及伦理、政治等方面的非实用性方向。

写作要求:

*   使用简洁明了的语言,重点突出,逻辑清晰。
*   使用数据和案例来支持你的观点,增强说服力。
*   将复杂的 AI 技术和概念用通俗易懂的语言进行解释。
*   不回避争议性话题,并表达你对这些话题的观点和立场。

请确保最终输出的周报内容结构清晰、重点突出、信息准确、观点鲜明,并能够引发读者对 AI 领域的深入思考。

重要: 只搜索英文主流信息源(例如: The Verge, WSJ, Guardian, etc) 以及主要 AI 公司和大学研究机构等等、使用中文撰写周报。

With this prompt, you can directly test these two variations:

Prompt A (Successfully Triggers Deep Research)
“选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,包括产品功能、技术特点、目标用户、市场前景等。”

Prompt B (Does NOT Trigger Deep Research)
“选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,例如 AI 写作工具、AI 代码助手、AI 图像生成工具等,包括产品功能、技术特点、目标用户、市场前景等。”

Despite differing by just this line—“例如 AI 写作工具…” in the “Products” section—they yield completely different behaviors in Gemini.

 

Testing Process

  1. Line-by-Line Replacement (From A to B)

    • I first copied Prompt A in its entirety, then replaced each line with the corresponding line from Prompt B, testing in a fresh session each time.
    • When I reached the “Products” section with “例如 AI 写作工具…,” Deep Research immediately stopped working.
  2. Reverse Validation (From B to A)

    • Next, I started from Prompt B and gradually swapped lines back to Prompt A.
    • As soon as I removed “例如 AI 写作工具…,” Deep Research became active again.
  3. Synonym Attempts

    - Replacing “AI 写作工具、AI 代码助手、AI 图像生成工具” with terms like “writing assistance, coding assistance, image generation” still wouldn’t trigger Deep Research.
    - Only by completely omitting such common tools did Gemini revert to external searching.
    

     

     

     

 

Potential Explanations (from “GPT o1”)

  1. Internal Knowledge vs. Real-Time Needs

    • Since these common AI tools are already well-covered in the model’s training data, Gemini may conclude, “I already know enough; there’s no need to search externally.”
    • Conversely, if we discuss something like “a major new funding round” or “a freshly released product this week,” the model senses it must fetch new data.
  2. Insufficient Time Sensitivity

    • Prompts mentioning financing or acquisitions often lead Gemini to fetch real-time figures or deals via Deep Research.
    • Listing well-known tools doesn’t signal a need for up-to-date info, so Gemini stays with internal data.
  3. Threshold Logic in Prompts

    • Large models typically have built-in logic to decide whether to invoke external research. If internal knowledge is deemed sufficient, it won’t go further.
    • The instruction “only search English mainstream sources” may not override the model’s confidence in its existing training for these familiar tools.
  4. Interaction with Other Sections

    • Even though the “Market” and “Insights” parts request external info, heavily referencing known tools in the “Products” section might reduce the model’s overall incentive to search.
 

Why This Matters

  • For Prompt Engineers
    • Even seemingly minor references—like “AI writing tools” or “AI code assistants”—may lead the model to rely solely on internal knowledge.
    • If you need genuinely fresh information, emphasize aspects like “newly released” or “major update this week” to boost time-sensitivity in the prompt.
  • For AI Product Teams
    • Watching how the model balances “internal knowledge” vs. “external search” is crucial for product refinement.
    • For time-critical scenarios, you could prioritize user “search” directives or provide a toggle allowing users to force external retrieval.
  • For the AI Community
    • This subtle yet significant prompt phenomenon isn’t commonly documented or discussed in official materials.
    • Sharing these observations fosters deeper understanding and dialogue in the field of prompt engineering.

By shedding light on this nuance, I hope more people will appreciate the intricacies of prompt engineering, and that Google and other R&D teams will take notice—optimizing Deep Research mode accordingly. In the meantime, further tests and broader discussions may uncover even more interesting discoveries.

 

Video Demo & More Information

Comparison Demo Video:

Google Gemini Deep Research PROMPT 对比视频 | 回到Axton

原始的 PROMPT  / The Original PROMPTs

PROMPT A:

请你扮演一位专业的 AI 行业分析师,为我撰写一份 AI 周报。

周报内容需涵盖以下四个方面:

(1) **市场**:

* 选择本周 AI 领域最重大的一项投融资事件、并购交易或战略合作进行深入分析,包括交易金额、参与方、交易目的、市场影响等。

* 分析本周 AI 领域最值得关注的一个市场趋势变化,例如新兴技术、新兴应用、市场竞争格局等方面的变化。

(2) **洞察**:

* 选择本周 AI 领域最具突破性的一项技术进展进行深入分析,包括技术原理、应用场景、潜在影响等。

* 选择本周 AI 领域最具争议性的一项伦理问题进行深入探讨,包括问题背景、各方观点、潜在解决方案等。

(3) **产品**:

* 选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,包括产品功能、技术特点、目标用户、市场前景等。

(4) **观点/思考**:

* 针对本周 AI 领域最热门的事件或最具影响力的趋势,提出你认为最值得关注和思考的一个问题。

* 引发读者对 AI 发展方向、社会影响等方面的深入思考,例如 AI 的未来发展方向、AI 的伦理问题、AI 的社会责任等。

写作要求:

*   使用简洁明了的语言,重点突出,逻辑清晰。
*   使用数据和案例来支持你的观点,增强说服力。
*   将复杂的 AI 技术和概念用通俗易懂的语言进行解释。
*   不回避争议性话题,并表达你对这些话题的观点和立场。

请确保最终输出的周报内容结构清晰、重点突出、信息准确、观点鲜明,并能够引发读者对 AI 领域的深入思考。

重要: 只搜索英文信息源、使用中文撰写周报。

 

PROMPT B:

请你扮演一位专业的 AI 行业分析师,为我撰写一份 AI 周报。

周报内容需涵盖以下四个方面:

(1) **市场**:

* 选择本周 AI 领域最重大的一项投融资事件、并购交易或战略合作进行深入分析,例如 OpenAI、Anthropic、Google、Meta 等知名 AI 公司的动态,包括交易金额、参与方、交易目的、市场影响等。
* 分析本周 AI 领域最值得关注的一个市场趋势变化,例如新兴技术、新兴应用、市场竞争格局、AI 对就业的影响等方面的变化。

(2) **洞察**:

* 选择本周 AI 领域最具突破性的一项技术进展进行深入分析,包括技术原理、应用场景、潜在影响等,并重点关注该技术对个人工作流程或工作方式的改变。

(3) **产品**:

* 选择本周 AI 领域最引人注目的一款新产品或重要产品更新进行深入介绍,例如 AI 写作工具、AI 代码助手、AI 图像生成工具等,包括产品功能、技术特点、目标用户、市场前景等。

(4) **观点/思考**:

* 针对本周 AI 领域最热门的事件或最具影响力的趋势,提出你认为最值得关注和思考的一个问题。
* 引发读者对 AI 发展方向、社会影响等方面的深入思考,例如 AI 的未来发展方向、AI 与人类的关系、AI 与人类工作的关系等,请不要涉及伦理、政治等方面的非实用性方向。

写作要求:

* 使用简洁明了的语言,重点突出,逻辑清晰。
* 使用数据和案例来支持你的观点,增强说服力。
* 将复杂的 AI 技术和概念用通俗易懂的语言进行解释。
* 不回避争议性话题,并表达你对这些话题的观点和立场。

请确保最终输出的周报内容结构清晰、重点突出、信息准确、观点鲜明,并能够引发读者对 AI 领域的深入思考。

重要: 只搜索英文主流信息源(例如: The Verge, WSJ, Guardian, etc) 以及主要 AI 公司和大学研究机构等等、使用中文撰写周报。

Responses

Join the conversation
t("newsletters.loading")
Loading...
Make 下架 Twitter 之后的备选方案 Buffer | AI 精英周刊 021
2025 年 4 月3 日起,Make.com 正式官宣下架 Twitter(现称 X)集成模块。这一决定的原因在于 Twitter 更新了 API 政策并大幅提高了接口收费,导致 Make 难以继续为用户提供可行的官方 Twitter 集成。换言之,除非第三方平台支付高昂费用,否则无法直接调用 Twitter API。对于内容创作者来说,这意味着原先通过 Make 自动发推的工作流需要寻找替代方案。 就在不久前,Make 还在功能更新中推出 Twitter 的回复(Reply)功能呢,原以为对 X 的支持会越来越多,结果好景不长,X 把基础版本的 API 费用从 100 美元每月翻倍到 200 美元不说,更是把企业版起价涨到 4 万 2 千美元一个月,可见 X 多么能折腾吧。 对此我真是无力吐槽, GPT 说得好,当平台规模 > 盈利能力 时,”免费开放”率先被祭天。 如果我们...
Trae + MCP 实战:一键生成 Obsidian 白板脑图 | AI 精英周刊 020
最近 AI 工具圈子里,字节跳动推出的免费 AI IDE —— Trae, 刚刚宣布支持 MCP,重点是 Trae 现在是免费的。 之前我在 「告别无聊 PPT,AI 一键生成 Obsidian 高颜值白板脑图!| AI 精英周刊 018」 这篇 Newsletter 中,和大家探讨了如何让 AI 帮助我们生成 Obsidian Canvas。今天,我们要玩点更酷的!借助 Trae 最近引入的 MCP 支持,特别是 filesystem 这个 MCP,我们可以实现更灵活的本地文件操作,直接在 Trae 中生成和控制我们 Obsidian Vault 中的 Canvas 文件。 当然,做为对比,我们还会演示直接使用 Claude 的桌面版 APP 借助 MCP,一键完成 Obsidian Canvas 的生成和编辑,而不需要手工地拷贝和粘贴 AI 生成的 Canvas 代码。 这不仅...
10篇报告深度实测!Gemini 2.5 Pro vs OpenAI Deep Research,谁才是AI研究之王? | AI 精英周刊 019
4 月 8 日 Google 发布了 Gemini 2.5 Pro 驱动的 Deep Research,毫不客气地贴出了与 OpenAI Deep Research 的对比图,所有项目都甩了 OpenAI 一条街。     我第一眼看到时,心里就两个字:“吹吧你就!” 但是,以前我就一直说,Google 在生态和技术积累上的优势绝不可小觑,这不是其他公司能够轻易超越的。 于是,我花了整整三天时间,仔细研读并逐一对比了 5 个主题、共 10 篇 Deep Research 报告。 Google 这次到底是不是真的行?能不能以 20 美元全家桶的价格吊打 200 美元的 OpenAI?这期就给你一场深度评测。 选题 首先,用来对比的研究主题分两类,每一类主题分别选择全面分析和专项分析。 第一类以《2025年斯坦福AI指数报告》为切入点,一个主题全面分析AI...

AI 精英周刊

深度阅读、高级分享、拒绝碎片!
© 2025 AI 精英学院 by Axton. All Rights Reserved.
Powered by Kajabi

Join Our Free Trial

Get started today before this once in a lifetime opportunity expires.