6 méthodes pour résoudre les limites de taille d’entrée de Nano Banana 2 : formule de calcul des tokens et correction de l’erreur 65536

Lors de la génération d'images avec Nano Banana 2, vous avez peut-être rencontré cette erreur : The input token count exceeds the maximum number of tokens allowed (65536). C'est l'une des confusions les plus courantes pour les développeurs lors de l'invocation de l'API de génération d'images Gemini — la fiche officielle du modèle indique pourtant une limite de tokens d'entrée de 131 072, alors pourquoi la limite réelle est-elle de 65 536 ?

Valeur clé : Après avoir lu cet article, vous comprendrez parfaitement les limites de tokens d'entrée et de sortie de Nano Banana 2, la formule de calcul précise des tokens d'image, ainsi que 6 méthodes pratiques pour résoudre l'erreur 65536.

nano-banana-2-input-size-token-limit-specs-guide-fr 图示


Spécifications du modèle Nano Banana 2 : Tableau complet des paramètres

L'ID du modèle sous-jacent de Nano Banana 2 est gemini-3.1-flash-image-preview. Voici les spécifications complètes extraites de la fiche officielle du modèle :

Paramètre Valeur Description
Code du modèle gemini-3.1-flash-image-preview Paramètre de modèle utilisé lors de l'invocation de l'API
Type d'entrée Text / Image / PDF Prend en charge les fichiers texte, image et PDF
Type de sortie Image / Text Peut générer des images ou du texte
Limite de tokens en entrée 65,536 ~ 131,072 Varie selon la plateforme (voir ci-dessous)
Limite de tokens en sortie 32,768 Inclut les tokens d'image et de texte
Nombre max. d'images en entrée 14 (10 objets + 4 personnages) Par requête
Résolution max. en sortie 4096×4096 (4K) Prend en charge plusieurs rapports d'aspect
Limite de résolution des images en entrée 3072×3072 px Mise à l'échelle automatique si dépassé

Matrice de support des fonctionnalités de Nano Banana 2

Fonctionnalité Statut de support Description
Génération d'images ✅ Pris en charge Capacité principale
API par lots ✅ Pris en charge Traitement par lots, 50% de réduction
Ancrage de recherche ✅ Pris en charge Génération améliorée par la recherche
Réflexion ✅ Pris en charge Niveau de raisonnement ajustable
Génération audio ❌ Non pris en charge
Mise en cache ❌ Non pris en charge Impossible de mettre en cache le contexte
Exécution de code ❌ Non pris en charge
Recherche de fichiers ❌ Non pris en charge
Appel de fonction ❌ Non pris en charge
Google Maps ❌ Non pris en charge
API en direct ❌ Non pris en charge
Sorties structurées ❌ Non pris en charge
Contexte URL ❌ Non pris en charge

🎯 Rappel important : Nano Banana 2 ne prend pas en charge la mise en cache (cache de contexte), ce qui signifie que chaque requête nécessite de renvoyer l'intégralité du contenu d'entrée. Pour les scénarios incluant un grand nombre d'images de référence, cela augmentera considérablement la consommation de tokens. Lors de l'invocation via la plateforme APIYI apiyi.com, il est recommandé d'optimiser le contenu d'entrée pour contrôler l'utilisation des tokens par requête.


Limites de tokens de Nano Banana 2 : La question clé : 65536 ou 131072 ?

nano-banana-2-input-size-token-limit-specs-guide-fr 图示

C'est la question qui déroute le plus les développeurs : la documentation officielle indique 131 072, mais l'API renvoie une erreur signalant une limite de 65 536.

La vérité : Des différences de stratégie de plateforme, pas de capacité du modèle

Source de la documentation Limite de tokens en entrée Limite de tokens en sortie
Firebase AI Logic 65,536 32,768
Google AI Studio / Gemini API 131,072 32,768
Vertex AI 131,072 32,768
Gemini 3 Flash (version texte) 1,048,576 65,536

Pourquoi ces différences ?

En tant que modèle de génération d'images, Nano Banana 2 doit allouer d'importantes ressources de calcul au processus de synthèse d'images (tête de diffusion). Contrairement aux modèles purement textuels qui peuvent utiliser toute leur capacité de contexte pour comprendre l'entrée, un modèle de génération d'images doit maintenir simultanément le pipeline de génération.

  • Firebase AI Logic adopte une limite plus conservatrice de 65 536, probablement en tenant compte de la stabilité sur les appareils mobiles et edge.
  • Vertex AI / Google AI offre la limite complète de 131 072, destinée au développement côté serveur et cloud.

Impact réel : Si vous invoquez via l'API Gemini standard et recevez une erreur de 65 536, cela peut être dû à :

  1. La version du SDK que vous utilisez a par défaut emprunté le canal Firebase.
  2. Les limites de la plateforme ne sont pas encore uniformisées pendant la phase de prévisualisation.
  3. Des limites de quota spécifiques à une région ou à un niveau.

💡 Conseil pratique : Lors de l'invocation de Nano Banana 2 via la plateforme APIYI apiyi.com, il est recommandé de maintenir les tokens d'entrée en dessous de 65 536. De cette manière, aucune limite ne sera déclenchée, quelle que soit la plateforme sous-jacente utilisée pour le routage. La plateforme APIYI choisira automatiquement le chemin d'invocation optimal.


Formule de calcul des Tokens d'image d'entrée pour Nano Banana 2

Comprendre comment les images sont converties en Tokens est crucial pour résoudre les problèmes de taille d'entrée. Gemini utilise une stratégie de découpage (Tiling) pour calculer la consommation de Tokens des images.

Règles de calcul de base

Règle un : Petites images (deux côtés ≤ 384px)

Consommation de Tokens = 258 tokens (valeur fixe)

Toute image dont les deux côtés ne dépassent pas 384 pixels, quelle que soit sa taille réelle, consomme systématiquement 258 Tokens. C'est l'option la plus économique.

Règle deux : Grandes images (un côté > 384px)

Consommation de Tokens = ceil(largeur ÷ 768) × ceil(hauteur ÷ 768) × 258

Les grandes images sont découpées en blocs (Tiles) de 768×768, chaque bloc consommant 258 Tokens.

Tableau récapitulatif de la consommation de Tokens pour les tailles d'image courantes

Taille de l'image Calcul des blocs Consommation de Tokens Description
256×256 1×1 258 Valeur fixe pour petite image
384×384 1×1 258 Limite supérieure pour petite image
512×512 1×1 258 Toujours dans un seul bloc
768×768 1×1 258 Exactement un bloc
1024×1024 2×2 1 032 Taille d'entrée courante
1920×1080 3×2 1 548 Image Full HD
2048×2048 3×3 2 322 Image 2K
3072×3072 4×4 4 128 Résolution d'entrée maximale
4096×4096 Mise à l'échelle automatique à 3072 Traitement automatique si dépassement de la limite

Contrôle du paramètre media_resolution

Les modèles de la série Gemini 3 prennent en charge le paramètre media_resolution, permettant un contrôle précis de la consommation de Tokens pour chaque image d'entrée :

Valeur du paramètre Tokens/image (Gemini 3) Tokens/image (Gemini 2.5) Scénario d'application
LOW 280 64 Aperçu rapide, pas besoin de détails
MEDIUM 560 256 Référence générale
HIGH (par défaut) 1 120 256 + Pan&Scan (~2 048) Nécessite une analyse détaillée
ULTRA_HIGH 2 240 Précision maximale

Découverte clé : Le paramètre HIGH par défaut consomme 1 120 Tokens par image. Si vous transmettez 14 images de référence (la limite de Nano Banana 2) dans une seule requête, les images seules consommeront 15 680 Tokens — et avec l'invite textuelle, vous approcherez facilement la limite de 65 536.


Détail de la consommation de Tokens de sortie pour Nano Banana 2

La sortie a également une limite de Tokens : 32 768 Tokens. Chaque image générée consomme un nombre différent de Tokens de sortie en fonction de sa résolution :

Résolution de sortie Consommation de Tokens Prix par image (officiel) Prix par image (APIYI)
512px ~747 tokens 0,045 $ ~0,02 $
1K (1024×1024) ~1 120 tokens 0,067 $ 0,03 $
2K (2048×2048) ~1 680 tokens 0,101 $ ~0,04 $
4K (4096×4096) ~2 520 tokens 0,151 $ ~0,06 $

Quantité maximale de sortie par requête

Basé sur la limite de 32 768 Tokens de sortie :

Résolution de sortie Tokens par image Nombre max. d'images en sortie Description
512px 747 ~43 images Idéal pour les miniatures en lot
1K 1 120 ~29 images Génération en lot standard
2K 1 680 ~19 images Lot haute définition
4K 2 520 ~13 images Lot grand format

🚀 Conseil pour la génération en lot : Si vous avez besoin de générer un grand nombre d'images, il est recommandé d'utiliser l'API Batch (50 % de réduction sur le prix) plutôt que d'insérer un grand nombre d'images dans une seule requête. La plateforme APIYI apiyi.com prend en charge les appels d'API Batch, où chaque image 1K ne coûte qu'environ 0,015 $.


Détails sur les formats d'entrée et les limites de Nano Banana 2

Formats d'image d'entrée pris en charge

Format Prise en charge Description
PNG Recommandé, qualité sans perte
JPEG Recommandé, petite taille de fichier
WebP Format moderne, équilibre qualité et taille
HEIC Format natif iOS
HEIF Format d'image haute efficacité
GIF Animations non prises en charge
BMP Non pris en charge
TIFF Non pris en charge

Limites de taille de fichier

Méthode d'upload Taille maximale Scénario d'application
En ligne (base64) 7 Mo Transmis directement par le SDK
Files API 20 Mo → 100 Mo Upload de fichiers volumineux
Cloud Storage 30 Mo Stockage Google Cloud
Corps de requête total 500 Mo Inclut tout le contenu

Limites de résolution des images d'entrée

  • Résolution d'entrée maximale : 3072×3072 pixels
  • Les images dépassant cette résolution seront automatiquement redimensionnées proportionnellement pour rester dans les 3072×3072 pixels.
  • Le rapport d'aspect est conservé après le redimensionnement.

Prise en charge de l'entrée PDF

Nano Banana 2 prend en charge le format PDF en entrée, mais il faut faire attention à la consommation de Tokens :

  • Chaque page PDF est traitée comme une image, consommant le même nombre de Tokens qu'une image.
  • En résolution HIGH (par défaut), chaque page consomme environ 1 120 Tokens.
  • Avec une limite de 65 536 Tokens, un maximum d'environ 58 pages PDF est pris en charge.
  • Conseil : Ne transmettez que les pages nécessaires, pas le document entier.

Rapports d'aspect pris en charge par Nano Banana 2

Nano Banana 2 ajoute plusieurs rapports d'aspect extrêmes par rapport à Nano Banana Pro :

Rapport d'aspect Exemple de dimensions (1K) Scénario d'application Nano Banana 2 Nano Banana Pro
1:1 1024×1024 Avatars sociaux, images de produits
16:9 1024×576 Miniatures vidéo, bannières
9:16 576×1024 Fonds d'écran mobiles, Stories
4:3 1024×768 Rapport d'écran traditionnel
3:4 768×1024 Affiches verticales
3:2 1024×683 Rapport photo courant
2:3 683×1024 Photos verticales
4:5 1024×1280 Recommandé par Instagram
5:4 1024×819 Presque carré
21:9 1024×439 Écran ultra-large
4:1 1024×256 Bannière ultra-large
1:4 256×1024 Bannière verticale ultra-étroite
8:1 1024×128 Bannière extrêmement large
1:8 128×1024 Bannière verticale extrêmement étroite

💡 Explication des nouveaux rapports : Les rapports extrêmes 4:1, 1:4, 8:1, 1:8 ajoutés dans Nano Banana 2 sont idéaux pour générer des bannières de site web, des infographies allongées, des images de barre latérale et d'autres scénarios spécifiques. Tous ces rapports sont directement utilisables via la plateforme APIYI apiyi.com.


6 méthodes pour résoudre l'erreur de limite de jetons 65536 de Nano Banana 2

nano-banana-2-input-size-token-limit-specs-guide-fr 图示

Lorsque vous rencontrez l'erreur The input token count exceeds the maximum number of tokens allowed (65536), voici 6 méthodes pour vous aider à la résoudre :

Méthode un : Réduire le paramètre media_resolution (recommandé)

Effet : Réduction de la consommation de jetons de 50 % à 75 %

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Interface unifiée APIYI
)

# Réduit la consommation de jetons en diminuant la résolution des images d'entrée
# HIGH (par défaut) = 1 120 jetons/image
# MEDIUM = 560 jetons/image (réduction de 50 %)
# LOW = 280 jetons/image (réduction de 75 %)
Voir un exemple de configuration de media_resolution avec l’API native Gemini
import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Spécifier la résolution lors du téléchargement de l'image
image = genai.upload_file("input.jpg")

response = model.generate_content(
    contents=[
        "Edit this image to add a sunset background",
        image
    ],
    generation_config={
        "response_modalities": ["IMAGE", "TEXT"],
        "media_resolution": "MEDIUM"  # De HIGH à MEDIUM
    }
)

# MEDIUM : 560 jetons/image (contre HIGH : 1 120 jetons/image)
# 14 images : 7 840 jetons (contre 15 680 jetons)

Méthode deux : Réduire la taille des images d'entrée

Effet : Compression maximale à 258 jetons/image

Avant d'envoyer à l'API, réduisez les images de référence à moins de 384×384 :

from PIL import Image

def optimize_for_token(img_path, max_size=384):
    """Réduit l'image à moins de 384px, la consommation de jetons est fixée à 258"""
    img = Image.open(img_path)
    img.thumbnail((max_size, max_size), Image.LANCZOS)
    optimized_path = img_path.replace(".", "_optimized.")
    img.save(optimized_path, quality=85)
    return optimized_path

# Avant optimisation : 1024x1024 = 1 032 jetons
# Après optimisation : 384x384 = 258 jetons (économie de 75 %)

Méthode trois : Réduire le nombre d'images de référence

Effet : Réduction linéaire de la consommation de jetons

Nano Banana 2 prend en charge jusqu'à 14 images d'entrée, mais la plupart des scénarios n'en nécessitent pas autant :

Nombre d'images de référence Consommation de jetons (HIGH) Consommation de jetons (MEDIUM) Consommation de jetons (optimisé 384px)
1 image 1 120 560 258
3 images 3 360 1 680 774
7 images 7 840 3 920 1 806
14 images 15 680 7 840 3 612

Conseil : Ne fournissez que les images de référence réellement nécessaires. Pour les scénarios de cohérence faciale, 2 à 3 images suffisent généralement, il n'est pas nécessaire d'en fournir 14.

Méthode quatre : Fractionner les requêtes

Effet : Contourne la limite de requêtes uniques

Si vous devez traiter un grand nombre d'images ou de longs PDF, divisez la requête en plusieurs petites requêtes :

def split_process(images, prompt, batch_size=3):
    """Divise les requêtes multi-images en petits lots"""
    results = []
    for i in range(0, len(images), batch_size):
        batch = images[i:i+batch_size]
        response = client.images.generate(
            model="nano-banana-2",
            prompt=prompt,
            # Ne passer que batch_size images à chaque fois
        )
        results.append(response)
    return results

Méthode cinq : Utiliser l'API Files au lieu de l'encodage base64 en ligne

Effet : Évite un corps de requête trop volumineux, permet de télécharger des fichiers plus grands

L'encodage base64 en ligne peut augmenter la taille du corps de la requête d'environ 33 %. L'utilisation de l'API Files permet de télécharger d'abord le fichier pour obtenir une référence, puis de l'utiliser dans la requête :

# Utiliser l'API Files pour télécharger de grandes images (supporte 20-100 Mo)
file = genai.upload_file("large_image.png")

# Référencer dans la requête, plutôt qu'en ligne
response = model.generate_content([
    "Based on this reference, generate a similar style image",
    file  # Référence au lieu de base64
])

Méthode six : Simplifier l'invite textuelle

Effet : Libère plus de jetons pour les images

N'oubliez pas que l'invite textuelle consomme également des jetons. Une invite trop longue peut accaparer une part précieuse de votre budget de jetons :

  • ❌ Description détaillée de 500 mots → ~750 jetons
  • ✅ Invite raffinée de 100 mots → ~150 jetons
  • Économie : ~600 jetons, ce qui équivaut à une image supplémentaire en résolution MEDIUM

🎯 Conseil général : En développement réel, nous recommandons de combiner les méthodes un + deux + trois. Lorsque vous invoquez Nano Banana 2 via la plateforme APIYI apiyi.com, définissez media_resolution sur MEDIUM, prétraitez les images d'entrée à 384px et ne fournissez que les images de référence nécessaires. Cela vous permettra de maintenir la consommation de jetons en dessous de 5 000, loin de la limite de 65 536.


Comparaison des limites de tokens de Nano Banana 2 et d'autres modèles

nano-banana-2-input-size-token-limit-specs-guide-fr 图示

Modèle Limite de tokens en entrée Limite de tokens en sortie Tokens d'image en sortie Prix/image (1K)
Gemini 3 Flash (Texte) 1 048 576 65 536
Nano Banana Pro ~200 000 32 768 ~1 120 $0.134
Nano Banana 2 65 536-131 072 32 768 ~1 120 $0.067 (officiel)
Nano Banana 2 (APIYI) 65 536-131 072 32 768 ~1 120 $0.03
Gemini 2.5 Flash Image 1 290/image 1 290 fixe $0.039
Imagen 4 Fast $0.020

Différences clés :

  1. La limite de tokens en entrée de Nano Banana 2 est bien inférieure à celle de Gemini 3 Flash (texte pur) (65K vs 1M), ce qui est une limitation de l'architecture de génération d'images.
  2. La limite d'entrée de Nano Banana Pro (~200K) est plus élevée que celle de Nano Banana 2, ce qui est adapté aux éditions complexes nécessitant une grande fenêtre de contexte.
  3. Gemini 2.5 Flash Image utilise un modèle simplifié avec un nombre fixe de tokens par image, sans calcul complexe de tokens.

Questions fréquentes

Q1 : Pourquoi la documentation officielle indique-t-elle 131 072, mais l’API renvoie une erreur à 65 536 ?

Il s'agit d'une différence de politique de plateforme. La documentation Firebase AI Logic indique 65 536, tandis que la documentation Vertex AI / Google AI indique 131 072. Les deux chiffres sont « corrects », selon la plateforme par laquelle vous effectuez l'invocation du modèle. Pendant la phase de prévisualisation, il est recommandé de planifier vos tokens d'entrée en fonction de 65 536 pour garantir un fonctionnement correct sur toutes les plateformes. L'invocation via la plateforme APIYI (apiyi.com) optimise automatiquement le routage.

Q2 : Comment calculer rapidement le nombre de tokens que ma requête consommera ?

Formule simple : Tokens d'entrée totaux ≈ Tokens de texte + Nombre d'images × Tokens par image. Le texte représente environ 1 token pour 4 caractères anglais, et environ 1 à 2 caractères chinois pour 1 token. Les tokens d'image dépendent de la media_resolution : LOW=280, MEDIUM=560, HIGH=1120. Par exemple : une invite de 200 caractères chinois (~300 tokens) + 5 images MEDIUM (2 800 tokens) ≈ 3 100 tokens, ce qui est bien en deçà de la limite de 65 536.

Q3 : Combien de pages un PDF peut-il prendre en charge au maximum en entrée ?

En calculant avec une résolution HIGH (par défaut), chaque page consomme environ 1 120 tokens. Avec une limite de 65 536, cela représente un maximum d'environ 58 pages. Si vous réduisez à MEDIUM, chaque page consomme 560 tokens, ce qui permet de prendre en charge environ 117 pages. Il est recommandé de ne transmettre que les pages qui sont réellement nécessaires comme images de référence. Lors de l'invocation via APIYI (apiyi.com), l'utilisation des tokens est détaillée dans les journaux d'invocation.

Q4 : Les grandes images sont-elles automatiquement redimensionnées lors de l’entrée ?

Oui. Les images dépassant 3072×3072 pixels sont automatiquement redimensionnées proportionnellement pour rester dans les limites de 3072×3072. Cependant, même après redimensionnement, les tokens sont toujours calculés en fonction de la taille réelle. Il est recommandé de réduire manuellement les images à 384×384 (seulement 258 tokens) ou 768×768 (seulement 258 tokens) avant l'envoi, afin d'obtenir une efficacité optimale en termes de tokens.

Q5 : Lequel de Nano Banana 2 ou Pro a la plus grande limite d’entrée ?

La limite de tokens en entrée de Nano Banana Pro (~200 000) est environ 1,5 à 3 fois supérieure à celle de Nano Banana 2 (65 536-131 072). Si votre cas d'utilisation nécessite de transmettre un grand nombre d'images de référence ou de longs PDF, Nano Banana Pro est plus approprié. Cependant, pour la plupart des scénarios standards de texte vers image et d'image vers image simples, la limite d'entrée de Nano Banana 2 est amplement suffisante, et il est deux fois moins cher et 2 à 3 fois plus rapide. La plateforme APIYI (apiyi.com) prend en charge les deux, vous pouvez donc basculer à tout moment.


Résumé

La limite de Tokens de Nano Banana 2 n'est pas un problème, mais plutôt un mécanisme à comprendre. Maîtrisez les points clés suivants pour la gérer facilement :

  1. Limite d'entrée 65 536-131 072 — Planifier avec 65 536 est le plus sûr
  2. Calcul des Tokens d'image — 258 fixes pour les petites images, les grandes images sont divisées en blocs de 768×768
  3. media_resolution est le moyen d'ajustement le plus efficace — HIGH→MEDIUM réduit directement de 50 %
  4. Limite de sortie 32 768 — Maximum 43 images de 512 px ou 13 images 4K par appel
  5. 6 solutions — L'utilisation combinée est la plus efficace

Nous recommandons d'utiliser la plateforme APIYI apiyi.com pour invoquer Nano Banana 2 et profiter de toutes les capacités du modèle au prix de 0,03 $ par image. La plateforme fournit des statistiques détaillées sur l'utilisation des Tokens, vous aidant à optimiser précisément chaque invocation.


📝 Auteur : Équipe APIYI | Équipe technique APIYI
🔗 Échanges techniques : Visitez apiyi.com pour obtenir le guide d'intégration complet de Nano Banana 2
📅 Date de mise à jour : 27 février 2026

Laisser un commentaire