Resolvendo o limite de tamanho de entrada do Nano Banana 2: 6 métodos para a fórmula de cálculo de tokens e correção do erro 65536

Ao usar o Nano Banana 2 para gerar imagens, você pode ter encontrado este erro: The input token count exceeds the maximum number of tokens allowed (65536). Esta é uma das dúvidas mais comuns entre os desenvolvedores ao invocar a API de geração de imagens do Gemini — a ficha oficial do modelo indica um limite de tokens de entrada de 131.072, então por que o limite real é de 65.536?

Valor Essencial: Ao terminar de ler este artigo, você entenderá completamente os limites de tokens de entrada e saída do Nano Banana 2, a fórmula exata para calcular os tokens de imagem e 6 métodos práticos para resolver o erro 65536.

Especificações do Modelo Nano Banana 2: Tabela Completa de Parâmetros

O ID do modelo base do Nano Banana 2 é gemini-3.1-flash-image-preview. Abaixo estão as especificações completas extraídas do cartão oficial do modelo:

Parâmetro	Valor	Descrição
Código do Modelo	`gemini-3.1-flash-image-preview`	Parâmetro `model` usado na invocação da API
Tipo de Entrada	Texto / Imagem / PDF	Suporta arquivos de texto, imagem e PDF
Tipo de Saída	Imagem / Texto	Pode gerar imagens ou texto
Limite de Token de Entrada	65.536 ~ 131.072	Varia por plataforma (veja abaixo)
Limite de Token de Saída	32.768	Inclui tokens de imagem e texto
Máximo de Imagens de Entrada	14 imagens (10 objetos + 4 personagens)	Por solicitação única
Resolução Máxima de Saída	4096×4096 (4K)	Suporta várias proporções
Limite de Imagem de Entrada	3072×3072 px	Redimensionamento automático se excedido

Matriz de Suporte a Funcionalidades do Nano Banana 2

Funcionalidade	Status de Suporte	Descrição
Image generation	✅ Suportado	Capacidade central
Batch API	✅ Suportado	Processamento em lote, 50% de desconto
Search grounding	✅ Suportado	Geração aprimorada por pesquisa
Thinking	✅ Suportado	Nível de raciocínio ajustável
Audio generation	❌ Não suportado	—
Caching	❌ Não suportado	Não é possível armazenar contexto em cache
Code execution	❌ Não suportado	—
File search	❌ Não suportado	—
Function calling	❌ Não suportado	—
Google Maps	❌ Não suportado	—
Live API	❌ Não suportado	—
Structured outputs	❌ Não suportado	—
URL context	❌ Não suportado	—

🎯 Lembrete Importante: O Nano Banana 2 não suporta Caching (cache de contexto), o que significa que cada solicitação precisa reenviar o conteúdo de entrada completo. Para cenários com muitas imagens de referência, isso aumentará significativamente o consumo de Token. Ao invocar o modelo através da plataforma APIYI (apiyi.com), é recomendável otimizar o conteúdo de entrada para controlar o uso de Token em cada solicitação.

Limites de Token do Nano Banana 2: A Questão Central: 65536 ou 131072?

Esta é a questão que mais confunde os desenvolvedores: a documentação oficial indica 131.072, mas a API retorna um erro dizendo que o limite é 65.536.

A Verdade: Diferenças na Estratégia da Plataforma, Não na Capacidade do Modelo

Fonte da Documentação	Limite de Token de Entrada	Limite de Token de Saída
Firebase AI Logic	65.536	32.768
Google AI Studio / Gemini API	131.072	32.768
Vertex AI	131.072	32.768
Gemini 3 Flash (versão texto)	1.048.576	65.536

Por que existem diferenças?

O Nano Banana 2, como um modelo de geração de imagens, precisa alocar muitos recursos de computação para o processo de síntese de imagens (cabeça de difusão). Diferente dos modelos puramente textuais que podem usar toda a capacidade de contexto para entender a entrada, os modelos de geração de imagens precisam manter o pipeline de geração simultaneamente.

Firebase AI Logic adota um limite mais conservador de 65.536, possivelmente considerando a estabilidade em dispositivos móveis e de borda.
Vertex AI / Google AI oferecem o limite completo de 131.072, visando o desenvolvimento em servidores e na nuvem.

Impacto real: Se você invocar o modelo através da API Gemini padrão e receber um erro de 65.536, pode ser devido a:

A versão do SDK que você está usando por padrão utiliza o canal do Firebase.
As restrições da plataforma na fase de pré-visualização ainda não foram unificadas.
Restrições de cota para uma região ou nível específico.

💡 Sugestão de Teste: Ao invocar o Nano Banana 2 através da plataforma APIYI (apiyi.com), é recomendável manter os tokens de entrada abaixo de 65.536. Assim, não haverá problemas de limite, independentemente da plataforma subjacente para a qual a solicitação for roteada. A plataforma APIYI selecionará automaticamente o caminho de invocação mais otimizado.

Fórmula de Cálculo de Tokens de Imagem de Entrada do Nano Banana 2

Entender como as imagens são convertidas em Tokens é crucial para resolver problemas de tamanho de entrada. O Gemini utiliza uma estratégia de fatiamento (Tiling) para calcular o consumo de Tokens das imagens.

Regras Básicas de Cálculo

Regra Um: Imagens Pequenas (ambos os lados ≤ 384px)

Token 消耗 = 258 tokens (valor fixo)

Qualquer imagem com ambos os lados não excedendo 384 pixels, independentemente do tamanho real, consumirá 258 Tokens. Esta é a opção mais econômica.

Regra Dois: Imagens Grandes (qualquer lado > 384px)

Token 消耗 = ceil(width ÷ 768) × ceil(height ÷ 768) × 258

Imagens grandes são divididas em blocos (Tiles) de 768×768, e cada bloco consome 258 Tokens.

Tabela de Consulta Rápida de Consumo de Tokens para Tamanhos Comuns de Imagem

Tamanho da Imagem	Cálculo de Blocos	Consumo de Tokens	Descrição
256×256	1×1	258	Valor fixo para imagem pequena
384×384	1×1	258	Limite superior para imagem pequena
512×512	1×1	258	Ainda dentro de um bloco
768×768	1×1	258	Exatamente um bloco
1024×1024	2×2	1.032	Tamanho de entrada comum
1920×1080	3×2	1.548	Imagem Full HD
2048×2048	3×3	2.322	Imagem 2K
3072×3072	4×4	4.128	Resolução máxima de entrada
4096×4096	—	Redimensionado automaticamente para 3072	Excede o limite, processado automaticamente

Controle do Parâmetro `media_resolution`

Os modelos da série Gemini 3 suportam o parâmetro media_resolution, que permite controlar precisamente o consumo de Tokens de cada imagem de entrada:

Valor do Parâmetro	Tokens/Imagem (Gemini 3)	Tokens/Imagem (Gemini 2.5)	Cenário de Uso
`LOW`	280	64	Visualização rápida, sem necessidade de detalhes
`MEDIUM`	560	256	Referência geral
`HIGH` (padrão)	1.120	256 + Pan&Scan (~2.048)	Necessita de análise detalhada
`ULTRA_HIGH`	2.240	—	Maior precisão

Descoberta Chave: A configuração HIGH padrão consome 1.120 Tokens por imagem. Se você enviar 14 imagens de referência (o limite do Nano Banana 2) em uma única requisição, apenas as imagens consumiriam 15.680 Tokens — e, adicionando o comando de texto, você facilmente se aproximaria do limite de 65.536.

Detalhes do Consumo de Tokens de Saída do Nano Banana 2

O lado da saída também tem um limite de Tokens: 32.768 Tokens. Cada imagem gerada consome uma quantidade diferente de Tokens de saída, dependendo da resolução:

Resolução de Saída	Consumo de Tokens	Preço por Imagem (Oficial)	Preço por Imagem (APIYI)
512px	~747 tokens	$0.045	~$0.02
1K (1024×1024)	~1.120 tokens	$0.067	$0.03
2K (2048×2048)	~1.680 tokens	$0.101	~$0.04
4K (4096×4096)	~2.520 tokens	$0.151	~$0.06

Quantidade Máxima de Saída por Requisição Única

Com base no limite de 32.768 Tokens de saída:

Resolução de Saída	Tokens por Imagem	Número Máximo de Imagens de Saída	Descrição
512px	747	~43 imagens	Ideal para miniaturas em lote
1K	1.120	~29 imagens	Geração em lote regular
2K	1.680	~19 imagens	Lote em alta definição
4K	2.520	~13 imagens	Lote de grande formato

🚀 Sugestão para Geração em Lote: Se você precisa gerar um grande volume de imagens, é recomendável usar a Batch API (com 50% de desconto no preço) em vez de enviar muitas imagens em uma única requisição. A plataforma APIYI apiyi.com suporta chamadas da Batch API, onde cada imagem de 1K custa apenas cerca de $0.015.

Detalhes sobre Formatos de Entrada e Limites do Nano Banana 2

Formatos de Imagem de Entrada Suportados

Formato	Suporte	Descrição
PNG	✅	Recomendado, qualidade sem perdas
JPEG	✅	Recomendado, arquivo pequeno
WebP	✅	Formato moderno, equilibra qualidade e tamanho
HEIC	✅	Formato nativo do iOS
HEIF	✅	Formato de imagem eficiente
GIF	❌	Não suporta imagens animadas
BMP	❌	Não suportado
TIFF	❌	Não suportado

Limites de Tamanho de Arquivo

Método de Upload	Limite de Tamanho	Cenário de Uso
Inline (base64)	7 MB	Passado diretamente pelo SDK
API de Arquivos	20 MB → 100 MB	Upload de arquivos grandes
Armazenamento em Nuvem	30 MB	Google Cloud Storage
Corpo total da requisição	500 MB	Inclui todo o conteúdo

Limites de Resolução da Imagem de Entrada

Resolução máxima de entrada: 3072×3072 pixels
Imagens que excedem esta resolução serão automaticamente redimensionadas proporcionalmente para dentro de 3072×3072.
A proporção será mantida após o redimensionamento.

Suporte para Entrada de PDF

O Nano Banana 2 suporta PDF como entrada, mas é importante ficar atento ao consumo de Tokens:

Cada página do PDF é processada como uma imagem, consumindo a mesma quantidade de Tokens que uma imagem.
Na resolução HIGH (padrão), cada página consome aproximadamente 1.120 Tokens.
Com o limite de 65.536 Tokens, é possível suportar no máximo cerca de 58 páginas de PDF.
Recomendação: Envie apenas as páginas necessárias, não o documento inteiro.

Proporções de Tela Suportadas pelo Nano Banana 2

O Nano Banana 2 adicionou algumas proporções de tela extremas em comparação com o Nano Banana Pro:

Proporção	Tamanho de Exemplo (1K)	Cenário de Uso	Nano Banana 2	Nano Banana Pro
1:1	1024×1024	Avatares de redes sociais, imagens de produtos	✅	✅
16:9	1024×576	Capas de vídeo, banners	✅	✅
9:16	576×1024	Papéis de parede de celular, Stories	✅	✅
4:3	1024×768	Proporção de tela tradicional	✅	✅
3:4	768×1024	Pôsteres verticais	✅	✅
3:2	1024×683	Proporção comum para fotos	✅	✅
2:3	683×1024	Fotos verticais	✅	✅
4:5	1024×1280	Recomendado pelo Instagram	✅	✅
5:4	1024×819	Quase quadrado	✅	✅
21:9	1024×439	Tela ultra-wide	✅	✅
4:1	1024×256	Banner ultra-largo	✅	❌
1:4	256×1024	Banner vertical ultra-estreito	✅	❌
8:1	1024×128	Banner extremamente largo	✅	❌
1:8	128×1024	Banner vertical extremamente estreito	✅	❌

💡 Explicação das Novas Proporções: As proporções extremas 4:1, 1:4, 8:1 e 1:8, adicionadas no Nano Banana 2, são ideais para gerar banners de sites, infográficos longos, imagens para barras laterais e outros cenários especiais. Todas as proporções podem ser usadas diretamente através da plataforma APIYI apiyi.com.

6 Métodos para Resolver o Erro de Limite de Token 65536 do Nano Banana 2

Quando você se depara com o erro The input token count exceeds the maximum number of tokens allowed (65536), os 6 métodos a seguir podem te ajudar a resolvê-lo:

Método Um: Reduzir o parâmetro `media_resolution` (Recomendado)

Efeito: Consumo de tokens reduzido em 50%-75%

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Interface unificada APIYI
)

# Reduz o consumo de tokens diminuindo a resolução da imagem de entrada
# HIGH (padrão) = 1.120 tokens/imagem
# MEDIUM = 560 tokens/imagem (redução de 50%)
# LOW = 280 tokens/imagem (redução de 75%)

Ver exemplo de configuração de `media_resolution` na API nativa do Gemini

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Especifica a resolução ao fazer upload da imagem
image = genai.upload_file("input.jpg")

response = model.generate_content(
    contents=[
        "Edit this image to add a sunset background",
        image
    ],
    generation_config={
        "response_modalities": ["IMAGE", "TEXT"],
        "media_resolution": "MEDIUM"  # De HIGH para MEDIUM
    }
)

# MEDIUM: 560 tokens/imagem (comparado a HIGH: 1.120 tokens/imagem)
# 14 imagens: 7.840 tokens (comparado a 15.680 tokens)

Método Dois: Reduzir o tamanho da imagem de entrada

Efeito: Compressão máxima para 258 tokens/imagem

Antes de enviar para a API, reduza a imagem de referência para um tamanho de 384×384 ou menos:

from PIL import Image

def optimize_for_token(img_path, max_size=384):
    """Reduz a imagem para 384px ou menos, fixando o consumo de tokens em 258"""
    img = Image.open(img_path)
    img.thumbnail((max_size, max_size), Image.LANCZOS)
    optimized_path = img_path.replace(".", "_optimized.")
    img.save(optimized_path, quality=85)
    return optimized_path

# Antes da otimização: 1024x1024 = 1.032 tokens
# Após otimização: 384x384 = 258 tokens (economia de 75%)

Método Três: Reduzir o número de imagens de referência

Efeito: Redução linear do consumo de tokens

O Nano Banana 2 suporta até 14 imagens de entrada, mas a maioria dos cenários não exige tantas:

Nº de Imagens de Referência	Consumo de Token (HIGH)	Consumo de Token (MEDIUM)	Consumo de Token (Otimizado 384px)
1 Imagem	1.120	560	258
3 Imagens	3.360	1.680	774
7 Imagens	7.840	3.920	1.806
14 Imagens	15.680	7.840	3.612

Sugestão: Envie apenas as imagens de referência realmente necessárias. Para cenários de consistência facial, geralmente 2-3 imagens são suficientes, não é preciso enviar as 14.

Método Quatro: Dividir requisições

Efeito: Contorna o limite de requisição única

Se você precisa processar muitas imagens ou PDFs longos, divida a requisição em várias requisições menores:

def split_process(images, prompt, batch_size=3):
    """Divide requisições com múltiplas imagens em lotes menores"""
    results = []
    for i in range(0, len(images), batch_size):
        batch = images[i:i+batch_size]
        response = client.images.generate(
            model="nano-banana-2",
            prompt=prompt,
            # Envia apenas 'batch_size' imagens por vez
        )
        results.append(response)
    return results

Método Cinco: Usar a Files API em vez de base64 inline

Efeito: Evita que o corpo da requisição seja muito grande, permite upload de arquivos maiores

A codificação base64 inline pode inflar o corpo da requisição em cerca de 33%. Usar a Files API permite que você faça o upload do arquivo primeiro para obter uma referência e, em seguida, usá-la na requisição:

# Usa a Files API para fazer upload de imagens grandes (suporta 20-100MB)
file = genai.upload_file("large_image.png")

# Referencia na requisição, em vez de inline
response = model.generate_content([
    "Based on this reference, generate a similar style image",
    file  # Referência em vez de base64
])

Método Seis: Simplificar o comando de texto

Efeito: Libera mais tokens para imagens

Não ignore que o comando de texto também consome tokens. Comandos longos podem ocupar um orçamento valioso de tokens:

❌ Descrição detalhada de 500 palavras → ~750 tokens
✅ Comando refinado de 100 palavras → ~150 tokens
Economia: ~600 tokens, o equivalente a uma imagem extra com resolução MEDIUM

🎯 Sugestão Abrangente: No desenvolvimento prático, recomendamos combinar os métodos um + dois + três. Ao invocar o Nano Banana 2 através da plataforma APIYI apiyi.com, defina media_resolution como MEDIUM, pré-processe as imagens de entrada para 384px e envie apenas as imagens de referência necessárias. Dessa forma, o consumo de tokens pode ser mantido abaixo de 5.000, bem longe do limite de 65.536.

Comparação dos Limites de Token do Nano Banana 2 com Outros Modelos

Modelo	Limite Máximo de Tokens de Entrada	Limite Máximo de Tokens de Saída	Tokens de Imagem de Saída	Preço/Imagem (1K)
Gemini 3 Flash (Texto)	1.048.576	65.536	—	—
Nano Banana Pro	~200.000	32.768	~1.120	$0.134
Nano Banana 2	65.536-131.072	32.768	~1.120	$0.067 (oficial)
Nano Banana 2 (APIYI)	65.536-131.072	32.768	~1.120	$0.03
Gemini 2.5 Flash Image	—	1.290/imagem	1.290 fixo	$0.039
Imagen 4 Fast	—	—	—	$0.020

Diferenças Chave:

O limite de tokens de entrada do Nano Banana 2 é significativamente menor que o do Gemini 3 Flash (somente texto) (65K vs 1M), o que é uma limitação da arquitetura de geração de imagens.
O limite de entrada do Nano Banana Pro (~200K) é maior que o do Nano Banana 2, sendo mais adequado para edições complexas que exigem um grande volume de contexto.
O Gemini 2.5 Flash Image utiliza um modelo simplificado com um número fixo de tokens por imagem, eliminando cálculos complexos de tokens.

Perguntas Frequentes

P1: Por que a documentação oficial menciona 131.072, mas a API retorna um erro para 65.536?

Isso se deve a diferenças nas políticas das plataformas. A documentação do Firebase AI Logic indica 65.536, enquanto a documentação do Vertex AI / Google AI aponta 131.072. Ambos os números estão "corretos", dependendo da plataforma pela qual você faz a invocação. Na fase de pré-visualização, é recomendável planejar seus tokens de entrada com base em 65.536 para garantir que funcione em todas as plataformas. Ao invocar via APIYI (apiyi.com), a plataforma otimiza o roteamento automaticamente.

P2: Como posso calcular rapidamente quantos tokens minha solicitação consumirá?

A fórmula simples é: Total de Tokens de Entrada ≈ Tokens de Texto + Número de Imagens × Tokens por Imagem. Para texto, aproximadamente 1 token a cada 4 caracteres em inglês, e cerca de 1-2 caracteres chineses por token. Os tokens de imagem dependem da media_resolution: LOW=280, MEDIUM=560, HIGH=1120. Por exemplo: um comando em chinês de 200 caracteres (~300 tokens) + 5 imagens MEDIUM (2.800 tokens) ≈ 3.100 tokens, o que está bem abaixo do limite de 65.536.

P3: Quantas páginas um PDF pode ter como entrada no máximo?

Considerando a resolução HIGH (padrão), cada página consome aproximadamente 1.120 tokens. Com o limite de 65.536, isso permite cerca de 58 páginas. Se você reduzir para MEDIUM, cada página consome 560 tokens, suportando cerca de 117 páginas. É recomendável enviar apenas as páginas que realmente precisam ser referenciadas. Ao invocar via APIYI (apiyi.com), o uso de tokens será exibido detalhadamente nos logs de invocação.

P4: Imagens grandes são redimensionadas automaticamente ao serem enviadas?

Sim. Imagens com mais de 3072×3072 pixels são automaticamente redimensionadas proporcionalmente para dentro de 3072×3072. No entanto, mesmo após o redimensionamento, os tokens ainda serão calculados com base nas dimensões reais. Recomenda-se redimensionar manualmente as imagens para 384×384 (apenas 258 tokens) ou 768×768 (apenas 258 tokens) antes de enviá-las, para obter a melhor eficiência de tokens.

P5: Qual tem um limite de entrada maior, Nano Banana 2 ou Pro?

O limite de tokens de entrada do Nano Banana Pro (~200.000) é aproximadamente 1,5 a 3 vezes maior que o do Nano Banana 2 (65.536-131.072). Se o seu caso de uso exige a entrada de muitas imagens de referência ou PDFs longos, o Nano Banana Pro é mais adequado. No entanto, para a maioria dos cenários padrão de texto para imagem e imagem para imagem simples, o limite de entrada do Nano Banana 2 é totalmente suficiente, além de ser metade do preço e 2-3 vezes mais rápido. A plataforma APIYI (apiyi.com) suporta ambos, e você pode alternar a qualquer momento.

Resumo

A limitação de Tokens do Nano Banana 2 não é um problema, mas sim um mecanismo que precisa ser compreendido. Dominando os seguintes pontos, você conseguirá usá-lo com facilidade:

Limite de entrada 65.536-131.072 — Planejar com 65.536 é o mais seguro
Cálculo de Tokens de imagem — Imagens pequenas 258 fixos, imagens grandes são divididas em blocos de 768×768
media_resolution é o meio de ajuste mais eficaz — HIGH→MEDIUM reduz diretamente 50%
Limite de saída 32.768 — No máximo 43 imagens de 512px ou 13 imagens 4K por vez
6 soluções — O uso combinado é o mais eficaz

Recomendamos invocar o Nano Banana 2 através da plataforma APIYI apiyi.com, para aproveitar todas as capacidades do modelo por $0.03/imagem. A plataforma oferece estatísticas detalhadas de uso de Tokens, ajudando você a otimizar precisamente cada invocação.

📝 Autor: Equipe APIYI | Equipe Técnica APIYI
🔗 Comunicação Técnica: Visite apiyi.com para obter o guia completo de integração do Nano Banana 2
📅 Data de Atualização: 27 de fevereiro de 2026