Skip to content

Gemini API申请与使用教程2026:从零搭建自己的AI应用

更新时间:2026年4月 | 全文约4200字 | 阅读时间:12分钟

📌 本文面向想要调用Gemini API的开发者和技术爱好者,从申请API Key到实际调用代码,一步步带你搭建基于Gemini的AI应用。


Gemini API为什么值得关注?

在2026年的AI API市场中,Google的Gemini API正在成为越来越多开发者的首选。原因很简单:

  • 100万token超长上下文:目前所有大模型API中最长,可以一次性处理整本书或数小时视频
  • 原生多模态:一个API同时支持文本、图片、视频、音频输入
  • 性价比突出:相比GPT-5.4 API,Gemini在长文本场景下的成本优势明显

下面是Gemini 3.1 Pro API与主流竞品的核心参数对比:

参数Gemini 3.1 ProGPT-5.4Claude 4.6
上下文窗口100万tokens25.6万tokens20万tokens
多模态输入文本+图片+视频+音频文本+图片文本+图片
输入价格/百万token$2$5$3
输出价格/百万token$12$15$15
免费额度✅ 有
响应速度极快中等较慢

第一步:申请Gemini API Key

1.1 通过Google AI Studio申请

这是最简单的方式,适合个人开发者和原型开发:

  1. 访问 Google AI Studio
  2. 使用Google账号登录
  3. 点击左侧菜单的"Get API Key"
  4. 点击"Create API Key"生成密钥
  5. 复制并安全保存你的API Key

⚠️ 注意:API Key是敏感信息,不要将其提交到公开的代码仓库或分享给他人。

1.2 通过Google Cloud Platform申请

适合企业用户和需要更高限额的场景:

  1. 访问 Google Cloud Console
  2. 创建新项目或选择已有项目
  3. 启用"Generative Language API"
  4. 在"API和服务"→"凭据"中创建API密钥
  5. 建议设置API密钥限制(限定调用IP或应用)

Google Cloud新用户通常有$300的免费赠金,足够进行大量测试。


第二步:安装SDK并调用API

2.1 Python调用示例

安装SDK:

bash
pip install google-generativeai

基础对话调用:

python
import google.generativeai as genai

# 配置API Key
genai.configure(api_key="YOUR_API_KEY")

# 选择模型
model = genai.GenerativeModel("gemini-3.1-pro")

# 发送请求
response = model.generate_content("用通俗的语言解释什么是量子计算")
print(response.text)

多轮对话:

python
model = genai.GenerativeModel("gemini-3.1-pro")
chat = model.start_chat()

response1 = chat.send_message("你好,请介绍一下你自己")
print(response1.text)

response2 = chat.send_message("你能帮我分析数据吗?")
print(response2.text)

多模态调用(图片分析):

python
import PIL.Image

model = genai.GenerativeModel("gemini-3.1-pro")
image = PIL.Image.open("photo.jpg")

response = model.generate_content(
    ["请详细描述这张图片的内容", image]
)
print(response.text)

2.2 JavaScript/Node.js调用示例

安装SDK:

bash
npm install @google/generative-ai

基础调用:

javascript
const { GoogleGenerativeAI } = require("@google/generative-ai");

const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-3.1-pro" });

async function run() {
  const result = await model.generateContent("用JavaScript写一个快速排序算法");
  console.log(result.response.text());
}

run();

2.3 REST API直接调用

如果你不想安装SDK,也可以直接使用HTTP请求:

bash
curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro:generateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{"text": "你好,请用三句话介绍Gemini"}]
    }]
  }'

第三步:高级用法

3.1 系统提示词(System Instruction)

python
model = genai.GenerativeModel(
    "gemini-3.1-pro",
    system_instruction="你是一个专业的Python开发专家,回答简洁准确,代码注释用中文。"
)

3.2 流式输出(Streaming)

对于长文本生成,流式输出可以显著提升用户体验:

python
response = model.generate_content("写一篇2000字的科幻短篇小说", stream=True)
for chunk in response:
    print(chunk.text, end="", flush=True)

3.3 调整生成参数

python
generation_config = {
    "temperature": 0.7,      # 创造性(0-2,越高越随机)
    "top_p": 0.9,            # 核采样
    "top_k": 40,             # 候选token数量
    "max_output_tokens": 8192  # 最大输出长度
}

model = genai.GenerativeModel(
    "gemini-3.1-pro",
    generation_config=generation_config
)

3.4 处理超长文档

Gemini的100万token上下文窗口让它在处理长文档时具有独特优势:

python
# 上传大文件
file = genai.upload_file("long_document.pdf")

model = genai.GenerativeModel("gemini-3.1-pro")
response = model.generate_content([
    "请阅读这份文档,总结每个章节的核心观点,并指出文中的逻辑漏洞",
    file
])
print(response.text)

国内开发者的替代方案

由于网络环境限制,国内直接调用Google API可能不够稳定。如果你在开发面向国内用户的AI产品,以下方案值得考虑:

SnakeGPT:稳定运营4年的AI平台

SnakeGPT 集成了GPT-5.4、DeepSeek-V3、Gemini 3.1 Pro、Grok 4.2等主流模型,国内网络直连,国内邮箱即可注册使用。运营4年的稳定性,让它成为很多国内开发者的首选测试平台。

GPTCat:全模型覆盖的综合平台

GPTCat 支持GPT-5.4、Claude 4.6、Gemini 3.1 Pro、Grok 4.2、DeepSeek-V3以及MJ绘图,一比一还原官网体验。它还支持语音和视频交互功能,是目前市面上功能最完整的国内AI平台之一。

💡 开发建议:在原型阶段使用SnakeGPT或GPTCat快速验证想法,确定产品方向后再考虑直接对接官方API。


Gemini API常见问题

Q1:Gemini API有免费额度吗?

有。通过Google AI Studio申请的API Key有一定的免费调用额度,适合个人学习和原型开发。Google Cloud新用户还有$300赠金。

Q2:国内能直接调用Gemini API吗?

需要稳定的国际网络环境。如果网络不稳定,可以考虑使用中转服务或选择国内平台如SnakeGPT、GPTCat。

Q3:Gemini API和ChatGPT API哪个更好?

取决于场景。长文档处理选Gemini(100万token上下文),多模态分析选Gemini,日常对话两者差距不大,需要最强代码能力可以考虑GPT-5.4。

Q4:如何控制API调用成本?

  • 使用Flash模型处理简单任务(成本更低)
  • 合理设置max_output_tokens避免生成过长内容
  • 使用缓存避免重复请求
  • 监控Google Cloud Console中的用量仪表盘

总结

Gemini API凭借100万token上下文、原生多模态和有竞争力的定价,已经成为2026年最值得关注的AI API之一。无论你是想构建智能客服、文档分析工具还是代码助手,Gemini API都能提供强大的底层能力支持。

📚 相关教程

🔗 相关资源

专注于 Google Gemini AI 的中文教程与评测