Header Logo
AI训练营 AI实战派 AI自动化 AI精英圈 AI精英周刊 所有课程 博客 咨询
Axton是谁
登录
← Back to all posts

Gemini Pro API 用法大全 | AI 精英周刊 008

Mar 07, 2025

相关视频

「保姆级教程」从 Discord 机器人到 Zapier,谷歌 Gemini Pro API 用法大全!免费超强多模态震撼来袭 | 回到Axton

 

视频中的链接:

Google 开发者官网:Build with the Gemini API  |  Google AI for Developers

Gemini Discord Bot:clairelovesgravy/discord-bot-gemini: introducing gemini to discord

Replit 官网: https://replit.com/

如何访问官网

目前是免费,但是限制每分钟 60 个查询。这对于一般应用足够了。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at23-07-56-5.png
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-14-46-5.png

无论选择任何一项,都会进入到 Google AI Studio,只不过是打开了不同的菜单项。在下一幅图片中就可以看到。

虽然是使用的 API,但由于是免费使用,因此你的输入输出将会被用于训练,这就是免费的代价。

进入 Google AI Studio 后,主界面为:

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-31-16-5.png

所以,如果你在开始界面,选了「Get API Key」就等同于选择左侧菜单的「Get API Key」,如果选了「New Prompt」就等同于选择左侧菜单的「Create New」

我们接下来先看以下如何直接在 Google AI Studio 的环境中使用 Gemini Pro,然后再说使用 API Key 在你自己的环境中使用的方法。

如何在 Google AI Studio 中使用 Gemini Pro

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at13-44-54-5.png

AI Studio 提供了三种创建提示的方法来使用 Gemini Pro,分别是 Freeform Prompts,自由形式的提示、Structured Prompts 结构化提示和 Chat Prompts 聊天提示。根据 Google 的帮助文档,对三种形式的解释如下:

Freeform prompts 自由形式提示 - 这些提示提供了一个开放式的提示体验,用于生成内容和响应指令。您可以使用图像和文本数据作为提示。

Structured prompts 结构化提示 - 这种提示技术允许您通过提供一组示例请求和回复来引导模型输出。在您需要对模型输出的结构有更多控制时,请使用此方法。了解更多信息。

Chat prompts 聊天提示 - 使用聊天提示来构建对话式体验。这种提示技术允许多次输入和响应来生成输出。

看完后,我只能说我理解了什么是结构化提示,但是对于自由形式的提示和聊天提示,搞不懂 Google 在说什么。除了界面不同,难道区别在于聊天提示才支持多次输入和响应吗?

实际当然不是这样的,不看不知道,看了之后才发现,还是很有意思的。我们分别来看一下不同提示的方式吧。

Freeform Prompts 自由提示

基本功能

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-43-26-4.png
  • Freeform Prompts 的模型可以选择 Gemini Pro 以及 Gemini Pro Vision,顾名思义,Gemini Pro Vision 支持图片。但是让我好奇的是,Gemini 不是原生多模态吗?为什么还要分出一个 Vision 版本呢?
  • 如果没有图片,只能选择 Gemini Pro。换句话说,选择 Gemini Pro Vision 必须给图片 PROMPT。
  • Temperature 和 Top P 参数在我的『AI 实战派』课程当中都讲过,不再赘述。
  • 对于 PROMPT 的尺寸是有限制的:
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-52-41-4.png
  • 文字识别功能,对于格式不规则的文本,识别能力欠佳
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-55-23-4.png
  • 看看老对手的表现:
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at18-05-27-4.png
  • 只能说,对于格式不规范的中文识别,效果都差强人意。GPT-4 稍好些。
  • 对于格式规则的文本,识别能力一流
https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-19at17-56-59-4.png

设置变量

可以通过 Test Input 设置变量,并可以给变量多次赋值后批量执行。

https://www.axtonliu.com/content/images/2023/12/CleanShot-2023-12-20at00-39-09-4.png

参数:

以下是“Add stop sequence - Truncate response including and after string”参数的使用示例:

  • 在响应主体中,遇到特定标签或标记的第一次出现后停止读取响应流。
  • 通过将参数设置为预期在所需截断点发生的字符串,将响应流截断为特定大小。
  • 通过在接收到一定量数据后截断响应流来处理大型响应。

Structured prompts 结构化提示

Google AI Studio中的结构化提示可以帮助您做到这一点 - 将指令与示例结合起来,向模型展示您想要的输出类型,而不仅仅告诉它要做什么。

 

『以下为会员专属内容,欢迎点击此链接查看详细会员计划,加入AI精英圈获取更多专属内容。』

This post is for paying subscribers only

Upgrade

Already have an account? Log in

从宽泛到聚焦的PROMPT艺术与橘子树实践法 | AI 精英周刊 023
我们总是希望一次性给AI写出完美指令,但这样做真的对吗? 经过大量实践,我发现了一个有趣的现象:那些试图用复杂指令一步到位的人,往往错过了AI最有价值的创造性输出。相反,从宽泛主题开始,让AI自由发挥后再逐步聚焦的方法,反而能产出更令人惊喜的结果。 这套方法论我称之为”橘子树模型”——从播种到结果,从发散到收敛的完整流程。 你有没有发现,很多人在使用AI时都有一个共同的困惑:明明给了很详细的指令,为什么AI的回答总是差强人意?或者反过来,有时候随便问一句,AI却能给出让人眼前一亮的答案? 这背后其实隐藏着一个关键问题:我们究竟应该如何与AI沟通? 大多数人初接触AI时,总想着要给出”完美”且复杂的指令,期望一步到位。这就好比你面对一位才华横溢的画家,如果你一开始就给他一张精确到毫米的施工蓝图,要求他依葫芦画瓢,那么你得到的很可能只是一幅匠气十足的复制品。但如果你先给他一个...
揭秘不同AI的“文风”偏好:你的Prompt风格选对了吗? | AI 精英周刊 022
你是否注意到,和不同AI模型(比如Claude、GPT系列)打交道时,它们似乎对Prompt的”写法”有着不同的偏好?Claude偏爱有序列表和XML标签,GPT时常用分隔线和括号,而OpenAI Playground的生成器则钟情于Markdown标题。 这仅仅是不同厂商的”风格差异”吗?还是说,这些写法真的会影响AI的输出效果?今天,我们就来深入探讨这个话题。 AI Prompt的”三大流派”及其特点 让我们先直观感受一下这些不同风格的Prompt:   Claude风格:有序列表 + XML标签 Claude倾向于接收用XML标签包裹指令和上下文的Prompt。这种结构清晰,指令层级分明。比如以下的 PROMPT 片段:   GPT (o3)风格:连续分隔线 + 特殊括号 如果我们直接在 ChatGPT 中,选择用 o3 模型帮忙写 PROMPT,那么它一般会使用连续...
Make 下架 Twitter 之后的备选方案 Buffer | AI 精英周刊 021
2025 年 4 月3 日起,Make.com 正式官宣下架 Twitter(现称 X)集成模块。这一决定的原因在于 Twitter 更新了 API 政策并大幅提高了接口收费,导致 Make 难以继续为用户提供可行的官方 Twitter 集成。换言之,除非第三方平台支付高昂费用,否则无法直接调用 Twitter API。对于内容创作者来说,这意味着原先通过 Make 自动发推的工作流需要寻找替代方案。 就在不久前,Make 还在功能更新中推出 Twitter 的回复(Reply)功能呢,原以为对 X 的支持会越来越多,结果好景不长,X 把基础版本的 API 费用从 100 美元每月翻倍到 200 美元不说,更是把企业版起价涨到 4 万 2 千美元一个月,可见 X 多么能折腾吧。 对此我真是无力吐槽, GPT 说得好,当平台规模 > 盈利能力 时,”免费开放”率先被祭天。 如果我们...

AI 精英周刊

深度阅读、高级分享、拒绝碎片!
© 2025 AI 精英学院 by Axton. All Rights Reserved.
Powered by Kajabi

Join Our Free Trial

Get started today before this once in a lifetime opportunity expires.