作者注:詳解 Gemini 3.1 Flash Image Preview 圖像生成 429 限流問題的根因分析,對比 AI Studio、Vertex AI 和第三方平臺的限流策略,提供 4 種實測有效的解決方案
用 Gemini 3.1 Flash Image Preview 生成圖片時,最讓人頭疼的不是生成質量,而是剛跑起來就被 429 限流攔住。無論是用 AI Studio 還是 Vertex AI,RPD(每日請求數)和 RPM(每分鐘請求數) 的限制都非常嚴格,批量生圖基本跑不動。
本文將從實際使用經驗出發,詳細分析 429 限流的根因,對比不同平臺的限流策略差異,並給出 4 種經過驗證的解決方案——包括一個不限併發、價格低至 $0.045/張的方案。
核心價值:讀完本文,你將徹底理解 Gemini 圖像生成 429 報錯的底層邏輯,找到最適合你場景的解決方案。

Gemini 3.1 Flash Image Preview 429 報錯是什麼
先看一下這個報錯長什麼樣:
{
"error": {
"code": 429,
"message": "Resource has been exhausted (e.g. check quota).",
"status": "RESOURCE_EXHAUSTED",
"details": [
{
"reason": "RATE_LIMIT_EXCEEDED",
"metadata": {
"quota_limit": "GenerateContentRequestsPerDayPerProjectPerModel",
"quota_limit_value": "1500"
}
}
]
}
}
翻譯成大白話:你今天的請求次數用完了,或者每分鐘請求太頻繁了。
和 503 報錯不同,429 不是服務器扛不住,而是 Google 主動給你設的配額上限。不管服務器有沒有空閒算力,到了限額就直接拒絕。
Gemini 圖像生成 429 與 503 報錯的區別
| 對比項 | 429 RESOURCE_EXHAUSTED | 503 UNAVAILABLE |
|---|---|---|
| 本質原因 | 你的配額用完了 | 服務器算力不足 |
| 觸發條件 | 超過 RPD/RPM/TPM 限制 | 全局高負載 |
| 影響範圍 | 僅限你的項目 | 所有用戶 |
| 能否通過等待解決 | RPM 等 1 分鐘,RPD 等到第二天 | 通常幾分鐘到幾小時 |
| 能否通過付費解決 | Vertex AI 可提升配額 | 無法直接解決 |
| 根本解決方案 | 換平臺/提升配額 | 等待或換平臺 |
Gemini 3.1 Flash Image Preview 各平臺限流策略對比
這纔是問題的核心——不同平臺的限流差異巨大。
Gemini 圖像生成 AI Studio 限流參數
AI Studio 是大多數開發者的第一選擇,免費好用。但圖像生成的限流極其嚴格:
| 限流維度 | 限制值 | 換算 |
|---|---|---|
| RPM(每分鐘請求) | 10 次 | 每 6 秒才能請求 1 次 |
| RPD(每日請求) | 1,500 次 | 跑完約 2.5 小時就到上限 |
| TPM(每分鐘 Token) | 4,000,000 | 通常不是瓶頸 |
| 圖像輸出 TPM | 12,000 tokens/分 | 約 10 張圖/分鐘 |
實際體驗:如果你有 500 張圖需要批量生成,按 RPM=10 計算,理論最快需要 50 分鐘。但考慮到網絡延遲、重試等因素,實際要 1-2 小時。如果一天需要生成超過 1,500 張,直接被 RPD 卡死。
Gemini 圖像生成 Vertex AI 限流參數
Vertex AI 是 Google Cloud 的企業級方案,配額更高但也有上限:
| 限流維度 | 默認值 | 可申請提升 |
|---|---|---|
| RPM | 60 次 | 可以,需審批 |
| RPD | 無固定上限 | 但受 RPM 和 TPM 約束 |
| TPM | 4,000,000 | 可以申請 |
| 圖像輸出 TPM | 24,000 tokens/分 | 可以申請 |
實際體驗:RPM 從 10 提升到 60,看起來好很多,但申請提升需要走 Google Cloud 的工單流程,通常 1-3 個工作日。而且 Vertex AI 的配置比 AI Studio 複雜得多(需要創建 GCP 項目、設置服務賬號、配置 IAM 權限等),很多個人開發者和小團隊直接放棄。
Gemini 圖像生成第三方平臺限流對比
| 平臺 | 併發限制 | RPD 限制 | 單張價格(1K) | 備註 |
|---|---|---|---|---|
| AI Studio | RPM=10 | 1,500/天 | 免費(有限額) | 最嚴格 |
| Vertex AI | RPM=60 | 無固定上限 | ~$0.067 | 需 GCP 配置 |
| OpenRouter | 取決於套餐 | 取決於套餐 | ~$0.06-0.08 | 通用平臺 |
| 穩妥API | 不限併發 | 不限 | $0.045 | 按次計費,不限分辨率 |

解決 Gemini 3.1 Flash Image Preview 429 限流的 4 種方案
方案一:Gemini 圖像生成請求節流 + 自動重試
最基礎的方案,不需要換平臺,但效率低。
import time
import random
import requests
def generate_with_retry(prompt, max_retries=5):
"""帶退避重試的圖像生成請求"""
for attempt in range(max_retries):
try:
response = requests.post(endpoint, json=payload, headers=headers, timeout=120)
if response.status_code == 200:
return response.json()
elif response.status_code == 429:
# 指數退避 + 隨機抖動
wait_time = (2 ** attempt) + random.uniform(0, 1)
print(f"429 限流,等待 {wait_time:.1f}s 後重試 ({attempt+1}/{max_retries})")
time.sleep(wait_time)
else:
response.raise_for_status()
except Exception as e:
print(f"請求異常: {e}")
time.sleep(2)
raise Exception("超過最大重試次數")
查看完整的批量生成腳本(含速率控制)
import time
import random
import requests
import base64
from pathlib import Path
from concurrent.futures import ThreadPoolExecutor
class RateLimitedGenerator:
"""遵守 AI Studio RPM=10 限制的批量生成器"""
def __init__(self, api_key, rpm_limit=10):
self.api_key = api_key
self.interval = 60.0 / rpm_limit # 每次請求的最小間隔
self.last_request_time = 0
self.endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"
def _wait_for_rate_limit(self):
elapsed = time.time() - self.last_request_time
if elapsed < self.interval:
time.sleep(self.interval - elapsed)
self.last_request_time = time.time()
def generate(self, prompt, output_path, retries=3):
for attempt in range(retries):
self._wait_for_rate_limit()
try:
response = requests.post(
f"{self.endpoint}?key={self.api_key}",
json={
"contents": [{"parts": [{"text": prompt}]}],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {"aspectRatio": "1:1", "imageSize": "1K"}
}
},
timeout=120
)
if response.status_code == 200:
data = response.json()
img = data["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
Path(output_path).write_bytes(base64.b64decode(img))
return True
elif response.status_code == 429:
wait = (2 ** attempt) + random.uniform(0, 2)
print(f"[429] 等待 {wait:.1f}s ...")
time.sleep(wait)
except Exception as e:
print(f"異常: {e}")
time.sleep(2)
return False
# 使用示例
gen = RateLimitedGenerator("YOUR_AISTUDIO_KEY", rpm_limit=10)
prompts = ["a sunset over mountains", "a cat in space", "futuristic city"]
for i, p in enumerate(prompts):
success = gen.generate(p, f"output_{i}.png")
print(f"{'✅' if success else '❌'} {p}")
優點:零成本,適合小量請求
缺點:速度慢,RPD=1,500 的硬上限無法突破
方案二:Gemini 圖像生成遷移到 Vertex AI 提升配額
適合有 Google Cloud 賬號的企業用戶。
操作步驟:
- 創建 GCP 項目並啓用 Vertex AI API
- 設置服務賬號和 IAM 權限
- 在 Google Cloud Console → IAM → Quotas 中申請提升 RPM
- 將代碼中的端點從 AI Studio 切換到 Vertex AI
優點:RPM 從 10 提升到 60+,企業場景可用
缺點:配置複雜,審批週期 1-3 天,費用按 Google Cloud 標準計費
方案三:Gemini 圖像生成多項目輪詢
通過創建多個 GCP 項目或 AI Studio API Key,輪流請求來繞過單項目的 RPD/RPM 限制。
import itertools
api_keys = ["KEY_1", "KEY_2", "KEY_3", "KEY_4", "KEY_5"]
key_pool = itertools.cycle(api_keys)
def generate_with_rotation(prompt):
"""使用 Key 輪詢生成圖像"""
key = next(key_pool)
# ... 使用當前 key 發送請求
return send_request(prompt, api_key=key)
優點:理論上 N 個 Key 可以獲得 N 倍吞吐
缺點:違反 Google 服務條款(TOS),有封號風險;管理多個 Key 增加複雜度
方案四:Gemini 圖像生成使用不限併發的第三方平臺
這是我最終採用的方案。經過對比多個第三方平臺後,選擇了 穩妥API wentuo.ai,原因很直接:
| 對比維度 | AI Studio | Vertex AI | 穩妥API |
|---|---|---|---|
| 併發限制 | RPM=10 | RPM=60 | 不限 |
| 每日限制 | 1,500次/天 | 受 RPM 約束 | 不限 |
| 單張價格(含4K) | 免費但有限額 | $0.067-$0.151 | $0.045 |
| 按量計費(1K) | – | $0.067 | 約$0.025 |
| 配置複雜度 | 簡單 | 複雜 | 簡單 |
| 是否需要翻牆 | 是 | 是 | 否 |
實際使用下來,按次計費 $0.045 一張包含 4K 分辨率,按 Tokens 計費的話大概在 $0.02-$0.05 之間,取決於分辨率。最關鍵的是不限併發,批量任務可以全速跑,不用再被 429 卡住。
調用方式也很簡單,端點換一下就行:
import requests
import base64
API_KEY = "your-wentuo-api-key"
ENDPOINT = "https://api.wentuo.ai/v1beta/models/gemini-3.1-flash-image-preview:generateContent"
headers = {
"Content-Type": "application/json",
"x-goog-api-key": API_KEY
}
payload = {
"contents": [{"parts": [{"text": "A cute cat wearing a space helmet"}]}],
"generationConfig": {
"responseModalities": ["IMAGE"],
"imageConfig": {"aspectRatio": "1:1", "imageSize": "2K"}
}
}
response = requests.post(ENDPOINT, headers=headers, json=payload, timeout=120)
result = response.json()
image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open("output.png", "wb") as f:
f.write(base64.b64decode(image_data))
💡 使用建議:如果你的日均生成量超過 500 張,或者對併發速度有要求,建議直接使用穩妥API wentuo.ai 的不限併發方案。按次計費 $0.045/張(不限分辨率),按量計費低至 $0.018/張(512px),比 Google 官方節省 33%-70%。

Gemini 3.1 Flash Image Preview 429 限流的 4 種方案選擇建議
不同場景適合不同方案:
| 使用場景 | 推薦方案 | 原因 |
|---|---|---|
| 🎨 個人學習/體驗 | 方案一(節流重試) | 免費,量小不影響 |
| 🏢 企業已有 GCP | 方案二(Vertex AI) | 合規,可申請高配額 |
| 🔬 臨時大量測試 | 方案三(多 Key) | 短期可用,注意風險 |
| 🚀 生產環境/批量生成 | 方案四(穩妥API) | 不限併發,成本最低 |
Gemini 圖像生成不同方案的吞吐量對比
假設生成 1,000 張 1K 圖像:
| 方案 | 預計耗時 | 總成本 | 可行性 |
|---|---|---|---|
| AI Studio(RPM=10) | ~100 分鐘 + RPD 限制可能需要第二天 | 免費 | ⚠️ 受 RPD 限制 |
| Vertex AI(RPM=60) | ~17 分鐘 | ~$67 | ✅ 需 GCP |
| 多 Key 輪詢(5個 Key) | ~20 分鐘 | 免費 | ⚠️ 有封號風險 |
| 穩妥API(不限併發) | ~10-15 分鐘 | $45(按次)/ ~$25(按量) | ✅ 推薦 |
常見問題解答
Q1: Gemini 3.1 Flash Image Preview 429 報錯後多久能恢復?
取決於觸發的是哪種限流:
- RPM 限流:等待 1 分鐘後自動恢復
- RPD 限流:需要等到第二天(UTC 時間 0 點)重置
- TPM 限流:等待 1 分鐘後恢復
建議在代碼中根據 details 字段的 quota_limit 值判斷具體是哪種限流,採取對應策略。
Q2: 穩妥API 的圖像生成質量和 Google 官方一樣嗎?
是的,穩妥API wentuo.ai 直接調用的是 Google 官方的 Gemini 3.1 Flash Image Preview 模型,生成質量和官方完全一致。區別僅在於:
- 去掉了 RPD/RPM 限制
- 支持不限併發
- 價格更優惠($0.045/張 vs 官方 $0.067/張@1K)
Q3: 按次計費和按量計費怎麼選?
簡單的選擇邏輯:
- 固定用 2K/4K 分辨率 → 選按次計費($0.045/次,不限分辨率最划算)
- 主要用 512px/1K → 選按量計費(512px 僅 $0.018/次,比按次省 60%)
- 混合分辨率 → 算一下平均成本,通常按量計費更划算
穩妥API wentuo.ai 支持兩種計費方式靈活切換。
🎯 總結
Gemini 3.1 Flash Image Preview 的 429 限流問題,本質是 Google 對 AI Studio 和 Vertex AI 設置了嚴格的配額限制(RPD/RPM)。核心要點:
- 理解限流類型:429 是配額限制(你的問題),503 是服務器過載(Google 的問題),解決方案完全不同
- 評估你的用量:日均 100 張以內用 AI Studio 足夠,超過 500 張建議考慮第三方平臺
- 選擇合適方案:生產環境推薦使用不限併發的方案,避免被限流影響業務
- 成本對比很重要:穩妥API 按次 $0.045/張(含 4K),按量低至 $0.018/張,比官方節省 33%-70%
對於需要批量生成圖像的開發者,穩妥API wentuo.ai 是目前綜合體驗最好的選擇——不限併發、價格更低、無需翻牆、接口完全兼容。
📚 參考資料
-
Google Gemini API 官方文檔: 圖像生成配額和限流說明
- 鏈接:
ai.google.dev/gemini-api/docs/image-generation - 說明: 官方配額參數和最佳實踐
- 鏈接:
-
Google Cloud 配額管理: Vertex AI 配額申請流程
- 鏈接:
cloud.google.com/vertex-ai/docs/quotas - 說明: 企業用戶提升配額的官方途徑
- 鏈接:
-
穩妥API Nano Banana 2 文檔: 不限併發的圖像生成接入指南
- 鏈接:
docs.wentuo.ai - 說明: 按次/按量兩種計費方案的詳細說明和代碼示例
- 鏈接:
📝 作者簡介:技術內容創作團隊,專注 AI 圖像生成和 API 技術分享。更多技術內容和資源可訪問 穩妥API wentuo.ai 瞭解。
📋 內容說明:本文內容基於實際使用經驗整理,具體限流參數可能隨 Google 政策調整而變化。如需技術支持,可通過 穩妥API wentuo.ai 獲取幫助。