Appearance
Gemini API申请与使用教程2026:从零搭建自己的AI应用
更新时间:2026年4月 | 全文约4200字 | 阅读时间:12分钟
📌 本文面向想要调用Gemini API的开发者和技术爱好者,从申请API Key到实际调用代码,一步步带你搭建基于Gemini的AI应用。
Gemini API为什么值得关注?
在2026年的AI API市场中,Google的Gemini API正在成为越来越多开发者的首选。原因很简单:
- 100万token超长上下文:目前所有大模型API中最长,可以一次性处理整本书或数小时视频
- 原生多模态:一个API同时支持文本、图片、视频、音频输入
- 性价比突出:相比GPT-5.4 API,Gemini在长文本场景下的成本优势明显
下面是Gemini 3.1 Pro API与主流竞品的核心参数对比:
| 参数 | Gemini 3.1 Pro | GPT-5.4 | Claude 4.6 |
|---|---|---|---|
| 上下文窗口 | 100万tokens | 25.6万tokens | 20万tokens |
| 多模态输入 | 文本+图片+视频+音频 | 文本+图片 | 文本+图片 |
| 输入价格/百万token | $2 | $5 | $3 |
| 输出价格/百万token | $12 | $15 | $15 |
| 免费额度 | ✅ 有 | ❌ | ❌ |
| 响应速度 | 极快 | 中等 | 较慢 |
第一步:申请Gemini API Key
1.1 通过Google AI Studio申请
这是最简单的方式,适合个人开发者和原型开发:
- 访问 Google AI Studio
- 使用Google账号登录
- 点击左侧菜单的"Get API Key"
- 点击"Create API Key"生成密钥
- 复制并安全保存你的API Key
⚠️ 注意:API Key是敏感信息,不要将其提交到公开的代码仓库或分享给他人。
1.2 通过Google Cloud Platform申请
适合企业用户和需要更高限额的场景:
- 访问 Google Cloud Console
- 创建新项目或选择已有项目
- 启用"Generative Language API"
- 在"API和服务"→"凭据"中创建API密钥
- 建议设置API密钥限制(限定调用IP或应用)
Google Cloud新用户通常有$300的免费赠金,足够进行大量测试。
第二步:安装SDK并调用API
2.1 Python调用示例
安装SDK:
bash
pip install google-generativeai基础对话调用:
python
import google.generativeai as genai
# 配置API Key
genai.configure(api_key="YOUR_API_KEY")
# 选择模型
model = genai.GenerativeModel("gemini-3.1-pro")
# 发送请求
response = model.generate_content("用通俗的语言解释什么是量子计算")
print(response.text)多轮对话:
python
model = genai.GenerativeModel("gemini-3.1-pro")
chat = model.start_chat()
response1 = chat.send_message("你好,请介绍一下你自己")
print(response1.text)
response2 = chat.send_message("你能帮我分析数据吗?")
print(response2.text)多模态调用(图片分析):
python
import PIL.Image
model = genai.GenerativeModel("gemini-3.1-pro")
image = PIL.Image.open("photo.jpg")
response = model.generate_content(
["请详细描述这张图片的内容", image]
)
print(response.text)2.2 JavaScript/Node.js调用示例
安装SDK:
bash
npm install @google/generative-ai基础调用:
javascript
const { GoogleGenerativeAI } = require("@google/generative-ai");
const genAI = new GoogleGenerativeAI("YOUR_API_KEY");
const model = genAI.getGenerativeModel({ model: "gemini-3.1-pro" });
async function run() {
const result = await model.generateContent("用JavaScript写一个快速排序算法");
console.log(result.response.text());
}
run();2.3 REST API直接调用
如果你不想安装SDK,也可以直接使用HTTP请求:
bash
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro:generateContent?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [{"text": "你好,请用三句话介绍Gemini"}]
}]
}'第三步:高级用法
3.1 系统提示词(System Instruction)
python
model = genai.GenerativeModel(
"gemini-3.1-pro",
system_instruction="你是一个专业的Python开发专家,回答简洁准确,代码注释用中文。"
)3.2 流式输出(Streaming)
对于长文本生成,流式输出可以显著提升用户体验:
python
response = model.generate_content("写一篇2000字的科幻短篇小说", stream=True)
for chunk in response:
print(chunk.text, end="", flush=True)3.3 调整生成参数
python
generation_config = {
"temperature": 0.7, # 创造性(0-2,越高越随机)
"top_p": 0.9, # 核采样
"top_k": 40, # 候选token数量
"max_output_tokens": 8192 # 最大输出长度
}
model = genai.GenerativeModel(
"gemini-3.1-pro",
generation_config=generation_config
)3.4 处理超长文档
Gemini的100万token上下文窗口让它在处理长文档时具有独特优势:
python
# 上传大文件
file = genai.upload_file("long_document.pdf")
model = genai.GenerativeModel("gemini-3.1-pro")
response = model.generate_content([
"请阅读这份文档,总结每个章节的核心观点,并指出文中的逻辑漏洞",
file
])
print(response.text)国内开发者的替代方案
由于网络环境限制,国内直接调用Google API可能不够稳定。如果你在开发面向国内用户的AI产品,以下方案值得考虑:
SnakeGPT:稳定运营4年的AI平台
SnakeGPT 集成了GPT-5.4、DeepSeek-V3、Gemini 3.1 Pro、Grok 4.2等主流模型,国内网络直连,国内邮箱即可注册使用。运营4年的稳定性,让它成为很多国内开发者的首选测试平台。
GPTCat:全模型覆盖的综合平台
GPTCat 支持GPT-5.4、Claude 4.6、Gemini 3.1 Pro、Grok 4.2、DeepSeek-V3以及MJ绘图,一比一还原官网体验。它还支持语音和视频交互功能,是目前市面上功能最完整的国内AI平台之一。
💡 开发建议:在原型阶段使用SnakeGPT或GPTCat快速验证想法,确定产品方向后再考虑直接对接官方API。
Gemini API常见问题
Q1:Gemini API有免费额度吗?
有。通过Google AI Studio申请的API Key有一定的免费调用额度,适合个人学习和原型开发。Google Cloud新用户还有$300赠金。
Q2:国内能直接调用Gemini API吗?
需要稳定的国际网络环境。如果网络不稳定,可以考虑使用中转服务或选择国内平台如SnakeGPT、GPTCat。
Q3:Gemini API和ChatGPT API哪个更好?
取决于场景。长文档处理选Gemini(100万token上下文),多模态分析选Gemini,日常对话两者差距不大,需要最强代码能力可以考虑GPT-5.4。
Q4:如何控制API调用成本?
- 使用Flash模型处理简单任务(成本更低)
- 合理设置
max_output_tokens避免生成过长内容 - 使用缓存避免重复请求
- 监控Google Cloud Console中的用量仪表盘
总结
Gemini API凭借100万token上下文、原生多模态和有竞争力的定价,已经成为2026年最值得关注的AI API之一。无论你是想构建智能客服、文档分析工具还是代码助手,Gemini API都能提供强大的底层能力支持。
📚 相关教程
🔗 相关资源
- ChatGPT中文指南 — ChatGPT国内使用完整教程
- ChatGPT中文版教程 — ChatGPT注册与使用详解
- ChatGPT中文导航 — ChatGPT资源导航站
- Grok中文指南 — xAI Grok使用教程
- GPT Home Chat — AI对话工具合集