解決 Gemini 3.1 Flash Image Preview 429 限流報錯的 4 種方案（含不限併發方案）

作者注：詳解 Gemini 3.1 Flash Image Preview 圖像生成 429 限流問題的根因分析，對比 AI Studio、Vertex AI 和第三方平臺的限流策略，提供 4 種實測有效的解決方案

用 Gemini 3.1 Flash Image Preview 生成圖片時，最讓人頭疼的不是生成質量，而是剛跑起來就被 429 限流攔住。無論是用 AI Studio 還是 Vertex AI，RPD（每日請求數）和 RPM（每分鐘請求數）的限制都非常嚴格，批量生圖基本跑不動。

本文將從實際使用經驗出發，詳細分析 429 限流的根因，對比不同平臺的限流策略差異，並給出 4 種經過驗證的解決方案——包括一個不限併發、價格低至 $0.045/張的方案。

核心價值：讀完本文，你將徹底理解 Gemini 圖像生成 429 報錯的底層邏輯，找到最適合你場景的解決方案。

Gemini 3.1 Flash Image Preview 429 報錯是什麼

先看一下這個報錯長什麼樣：

{
  "error": {
    "code": 429，
    "message": "Resource has been exhausted （e.g. check quota）."，
    "status": "RESOURCE_EXHAUSTED"，
    "details": [
      {
        "reason": "RATE_LIMIT_EXCEEDED"，
        "metadata": {
          "quota_limit": "GenerateContentRequestsPerDayPerProjectPerModel"，
          "quota_limit_value": "1500"
        }
      }
    ]
  }
}

翻譯成大白話：你今天的請求次數用完了，或者每分鐘請求太頻繁了。

和 503 報錯不同，429 不是服務器扛不住，而是 Google 主動給你設的配額上限。不管服務器有沒有空閒算力，到了限額就直接拒絕。

Gemini 圖像生成 429 與 503 報錯的區別

對比項	429 RESOURCE_EXHAUSTED	503 UNAVAILABLE
本質原因	你的配額用完了	服務器算力不足
觸發條件	超過 RPD/RPM/TPM 限制	全局高負載
影響範圍	僅限你的項目	所有用戶
能否通過等待解決	RPM 等 1 分鐘，RPD 等到第二天	通常幾分鐘到幾小時
能否通過付費解決	Vertex AI 可提升配額	無法直接解決
根本解決方案	換平臺/提升配額	等待或換平臺

Gemini 3.1 Flash Image Preview 各平臺限流策略對比

這纔是問題的核心——不同平臺的限流差異巨大。

Gemini 圖像生成 AI Studio 限流參數

AI Studio 是大多數開發者的第一選擇，免費好用。但圖像生成的限流極其嚴格：

限流維度	限制值	換算
RPM（每分鐘請求）	10 次	每 6 秒才能請求 1 次
RPD（每日請求）	1，500 次	跑完約 2.5 小時就到上限
TPM（每分鐘 Token）	4，000，000	通常不是瓶頸
圖像輸出 TPM	12，000 tokens/分	約 10 張圖/分鐘

實際體驗：如果你有 500 張圖需要批量生成，按 RPM=10 計算，理論最快需要 50 分鐘。但考慮到網絡延遲、重試等因素，實際要 1-2 小時。如果一天需要生成超過 1，500 張，直接被 RPD 卡死。

Gemini 圖像生成 Vertex AI 限流參數

Vertex AI 是 Google Cloud 的企業級方案，配額更高但也有上限：

限流維度	默認值	可申請提升
RPM	60 次	可以，需審批
RPD	無固定上限	但受 RPM 和 TPM 約束
TPM	4，000，000	可以申請
圖像輸出 TPM	24，000 tokens/分	可以申請

實際體驗：RPM 從 10 提升到 60，看起來好很多，但申請提升需要走 Google Cloud 的工單流程，通常 1-3 個工作日。而且 Vertex AI 的配置比 AI Studio 複雜得多（需要創建 GCP 項目、設置服務賬號、配置 IAM 權限等），很多個人開發者和小團隊直接放棄。

Gemini 圖像生成第三方平臺限流對比

平臺	併發限制	RPD 限制	單張價格（1K）	備註
AI Studio	RPM=10	1，500/天	免費（有限額）	最嚴格
Vertex AI	RPM=60	無固定上限	~$0.067	需 GCP 配置
OpenRouter	取決於套餐	取決於套餐	~$0.06-0.08	通用平臺
穩妥API	不限併發	不限	$0.045	按次計費，不限分辨率

解決 Gemini 3.1 Flash Image Preview 429 限流的 4 種方案

方案一：Gemini 圖像生成請求節流 + 自動重試

最基礎的方案，不需要換平臺，但效率低。

import time
import random
import requests

def generate_with_retry（prompt， max_retries=5）:
    """帶退避重試的圖像生成請求"""
    for attempt in range（max_retries）:
        try:
            response = requests.post（endpoint， json=payload， headers=headers， timeout=120）
            if response.status_code == 200:
                return response.json（）
            elif response.status_code == 429:
                # 指數退避 + 隨機抖動
                wait_time = （2 ** attempt） + random.uniform（0， 1）
                print（f"429 限流，等待 {wait_time:.1f}s 後重試 （{attempt+1}/{max_retries}）"）
                time.sleep（wait_time）
            else:
                response.raise_for_status（）
        except Exception as e:
            print（f"請求異常: {e}"）
            time.sleep（2）
    raise Exception（"超過最大重試次數"）

查看完整的批量生成腳本（含速率控制）

import time
import random
import requests
import base64
from pathlib import Path
from concurrent.futures import ThreadPoolExecutor

class RateLimitedGenerator:
    """遵守 AI Studio RPM=10 限制的批量生成器"""

    def __init__（self， api_key， rpm_limit=10）:
        self.api_key = api_key
        self.interval = 60.0 / rpm_limit  # 每次請求的最小間隔
        self.last_request_time = 0
        self.endpoint = "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

    def _wait_for_rate_limit（self）:
        elapsed = time.time（） - self.last_request_time
        if elapsed < self.interval:
            time.sleep（self.interval - elapsed）
        self.last_request_time = time.time（）

    def generate（self， prompt， output_path， retries=3）:
        for attempt in range（retries）:
            self._wait_for_rate_limit（）
            try:
                response = requests.post（
                    f"{self.endpoint}？key={self.api_key}"，
                    json={
                        "contents": [{"parts": [{"text": prompt}]}]，
                        "generationConfig": {
                            "responseModalities": ["IMAGE"]，
                            "imageConfig": {"aspectRatio": "1:1"， "imageSize": "1K"}
                        }
                    }，
                    timeout=120
                ）
                if response.status_code == 200:
                    data = response.json（）
                    img = data["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
                    Path（output_path）.write_bytes（base64.b64decode（img））
                    return True
                elif response.status_code == 429:
                    wait = （2 ** attempt） + random.uniform（0， 2）
                    print（f"[429] 等待 {wait:.1f}s ..."）
                    time.sleep（wait）
            except Exception as e:
                print（f"異常: {e}"）
                time.sleep（2）
        return False

# 使用示例
gen = RateLimitedGenerator（"YOUR_AISTUDIO_KEY"， rpm_limit=10）
prompts = ["a sunset over mountains"， "a cat in space"， "futuristic city"]
for i， p in enumerate（prompts）:
    success = gen.generate（p， f"output_{i}.png"）
    print（f"{'✅' if success else '❌'} {p}"）

優點：零成本，適合小量請求
缺點：速度慢，RPD=1，500 的硬上限無法突破

方案二：Gemini 圖像生成遷移到 Vertex AI 提升配額

適合有 Google Cloud 賬號的企業用戶。

操作步驟：

創建 GCP 項目並啓用 Vertex AI API
設置服務賬號和 IAM 權限
在 Google Cloud Console → IAM → Quotas 中申請提升 RPM
將代碼中的端點從 AI Studio 切換到 Vertex AI

優點：RPM 從 10 提升到 60+，企業場景可用
缺點：配置複雜，審批週期 1-3 天，費用按 Google Cloud 標準計費

方案三：Gemini 圖像生成多項目輪詢

通過創建多個 GCP 項目或 AI Studio API Key，輪流請求來繞過單項目的 RPD/RPM 限制。

import itertools

api_keys = ["KEY_1"， "KEY_2"， "KEY_3"， "KEY_4"， "KEY_5"]
key_pool = itertools.cycle（api_keys）

def generate_with_rotation（prompt）:
    """使用 Key 輪詢生成圖像"""
    key = next（key_pool）
    # ... 使用當前 key 發送請求
    return send_request（prompt， api_key=key）

優點：理論上 N 個 Key 可以獲得 N 倍吞吐
缺點：違反 Google 服務條款（TOS），有封號風險；管理多個 Key 增加複雜度

方案四：Gemini 圖像生成使用不限併發的第三方平臺

這是我最終採用的方案。經過對比多個第三方平臺後，選擇了穩妥API wentuo.ai，原因很直接：

對比維度	AI Studio	Vertex AI	穩妥API
併發限制	RPM=10	RPM=60	不限
每日限制	1，500次/天	受 RPM 約束	不限
單張價格（含4K）	免費但有限額	$0.067-$0.151	$0.045
按量計費（1K）	–	$0.067	約$0.025
配置複雜度	簡單	複雜	簡單
是否需要翻牆	是	是	否

實際使用下來，按次計費 $0.045 一張包含 4K 分辨率，按 Tokens 計費的話大概在 $0.02-$0.05 之間，取決於分辨率。最關鍵的是不限併發，批量任務可以全速跑，不用再被 429 卡住。

調用方式也很簡單，端點換一下就行：

import requests
import base64

API_KEY = "your-wentuo-api-key"
ENDPOINT = "https://api.wentuo.ai/v1beta/models/gemini-3.1-flash-image-preview:generateContent"

headers = {
    "Content-Type": "application/json"，
    "x-goog-api-key": API_KEY
}

payload = {
    "contents": [{"parts": [{"text": "A cute cat wearing a space helmet"}]}]，
    "generationConfig": {
        "responseModalities": ["IMAGE"]，
        "imageConfig": {"aspectRatio": "1:1"， "imageSize": "2K"}
    }
}

response = requests.post（ENDPOINT， headers=headers， json=payload， timeout=120）
result = response.json（）

image_data = result["candidates"][0]["content"]["parts"][0]["inlineData"]["data"]
with open（"output.png"， "wb"） as f:
    f.write（base64.b64decode（image_data））

💡 使用建議：如果你的日均生成量超過 500 張，或者對併發速度有要求，建議直接使用穩妥API wentuo.ai 的不限併發方案。按次計費 $0.045/張（不限分辨率），按量計費低至 $0.018/張（512px），比 Google 官方節省 33%-70%。

Gemini 3.1 Flash Image Preview 429 限流的 4 種方案選擇建議

不同場景適合不同方案：

使用場景	推薦方案	原因
🎨 個人學習/體驗	方案一（節流重試）	免費，量小不影響
🏢 企業已有 GCP	方案二（Vertex AI）	合規，可申請高配額
🔬 臨時大量測試	方案三（多 Key）	短期可用，注意風險
🚀 生產環境/批量生成	方案四（穩妥API）	不限併發，成本最低

Gemini 圖像生成不同方案的吞吐量對比

假設生成 1，000 張 1K 圖像：

方案	預計耗時	總成本	可行性
AI Studio（RPM=10）	~100 分鐘 + RPD 限制可能需要第二天	免費	⚠️ 受 RPD 限制
Vertex AI（RPM=60）	~17 分鐘	~$67	✅ 需 GCP
多 Key 輪詢（5個 Key）	~20 分鐘	免費	⚠️ 有封號風險
穩妥API（不限併發）	~10-15 分鐘	$45（按次）/ ~$25（按量）	✅ 推薦

常見問題解答

Q1: Gemini 3.1 Flash Image Preview 429 報錯後多久能恢復？

取決於觸發的是哪種限流：

RPM 限流：等待 1 分鐘後自動恢復
RPD 限流：需要等到第二天（UTC 時間 0 點）重置
TPM 限流：等待 1 分鐘後恢復

建議在代碼中根據 details 字段的 quota_limit 值判斷具體是哪種限流，採取對應策略。

Q2: 穩妥API 的圖像生成質量和 Google 官方一樣嗎？

是的，穩妥API wentuo.ai 直接調用的是 Google 官方的 Gemini 3.1 Flash Image Preview 模型，生成質量和官方完全一致。區別僅在於：

去掉了 RPD/RPM 限制
支持不限併發
價格更優惠（$0.045/張 vs 官方 $0.067/張@1K）

Q3: 按次計費和按量計費怎麼選？

簡單的選擇邏輯：

固定用 2K/4K 分辨率 → 選按次計費（$0.045/次，不限分辨率最划算）
主要用 512px/1K → 選按量計費（512px 僅 $0.018/次，比按次省 60%）
混合分辨率 → 算一下平均成本，通常按量計費更划算

穩妥API wentuo.ai 支持兩種計費方式靈活切換。

🎯 總結

Gemini 3.1 Flash Image Preview 的 429 限流問題，本質是 Google 對 AI Studio 和 Vertex AI 設置了嚴格的配額限制（RPD/RPM）。核心要點：

理解限流類型：429 是配額限制（你的問題），503 是服務器過載（Google 的問題），解決方案完全不同
評估你的用量：日均 100 張以內用 AI Studio 足夠，超過 500 張建議考慮第三方平臺
選擇合適方案：生產環境推薦使用不限併發的方案，避免被限流影響業務
成本對比很重要：穩妥API 按次 $0.045/張（含 4K），按量低至 $0.018/張，比官方節省 33%-70%

對於需要批量生成圖像的開發者，穩妥API wentuo.ai 是目前綜合體驗最好的選擇——不限併發、價格更低、無需翻牆、接口完全兼容。

📚 參考資料

Google Gemini API 官方文檔: 圖像生成配額和限流說明
- 鏈接: ai.google.dev/gemini-api/docs/image-generation
- 說明: 官方配額參數和最佳實踐
Google Cloud 配額管理: Vertex AI 配額申請流程
- 鏈接: cloud.google.com/vertex-ai/docs/quotas
- 說明: 企業用戶提升配額的官方途徑
穩妥API Nano Banana 2 文檔: 不限併發的圖像生成接入指南
- 鏈接: docs.wentuo.ai
- 說明: 按次/按量兩種計費方案的詳細說明和代碼示例

📝 作者簡介：技術內容創作團隊，專注 AI 圖像生成和 API 技術分享。更多技術內容和資源可訪問穩妥API wentuo.ai 瞭解。

📋 內容說明：本文內容基於實際使用經驗整理，具體限流參數可能隨 Google 政策調整而變化。如需技術支持，可通過穩妥API wentuo.ai 獲取幫助。