Resolvendo o limite de tamanho de entrada do Nano Banana 2: 6 métodos para a fórmula de cálculo de tokens e correção do erro 65536

Ao usar o Nano Banana 2 para gerar imagens, você pode ter encontrado este erro: The input token count exceeds the maximum number of tokens allowed (65536). Esta é uma das dúvidas mais comuns entre os desenvolvedores ao invocar a API de geração de imagens do Gemini — a ficha oficial do modelo indica um limite de tokens de entrada de 131.072, então por que o limite real é de 65.536?

Valor Essencial: Ao terminar de ler este artigo, você entenderá completamente os limites de tokens de entrada e saída do Nano Banana 2, a fórmula exata para calcular os tokens de imagem e 6 métodos práticos para resolver o erro 65536.

nano-banana-2-input-size-token-limit-specs-guide-pt-pt 图示


Especificações do Modelo Nano Banana 2: Tabela Completa de Parâmetros

O ID do modelo base do Nano Banana 2 é gemini-3.1-flash-image-preview. Abaixo estão as especificações completas extraídas do cartão oficial do modelo:

Parâmetro Valor Descrição
Código do Modelo gemini-3.1-flash-image-preview Parâmetro model usado na invocação da API
Tipo de Entrada Texto / Imagem / PDF Suporta arquivos de texto, imagem e PDF
Tipo de Saída Imagem / Texto Pode gerar imagens ou texto
Limite de Token de Entrada 65.536 ~ 131.072 Varia por plataforma (veja abaixo)
Limite de Token de Saída 32.768 Inclui tokens de imagem e texto
Máximo de Imagens de Entrada 14 imagens (10 objetos + 4 personagens) Por solicitação única
Resolução Máxima de Saída 4096×4096 (4K) Suporta várias proporções
Limite de Imagem de Entrada 3072×3072 px Redimensionamento automático se excedido

Matriz de Suporte a Funcionalidades do Nano Banana 2

Funcionalidade Status de Suporte Descrição
Image generation ✅ Suportado Capacidade central
Batch API ✅ Suportado Processamento em lote, 50% de desconto
Search grounding ✅ Suportado Geração aprimorada por pesquisa
Thinking ✅ Suportado Nível de raciocínio ajustável
Audio generation ❌ Não suportado
Caching ❌ Não suportado Não é possível armazenar contexto em cache
Code execution ❌ Não suportado
File search ❌ Não suportado
Function calling ❌ Não suportado
Google Maps ❌ Não suportado
Live API ❌ Não suportado
Structured outputs ❌ Não suportado
URL context ❌ Não suportado

🎯 Lembrete Importante: O Nano Banana 2 não suporta Caching (cache de contexto), o que significa que cada solicitação precisa reenviar o conteúdo de entrada completo. Para cenários com muitas imagens de referência, isso aumentará significativamente o consumo de Token. Ao invocar o modelo através da plataforma APIYI (apiyi.com), é recomendável otimizar o conteúdo de entrada para controlar o uso de Token em cada solicitação.


Limites de Token do Nano Banana 2: A Questão Central: 65536 ou 131072?

nano-banana-2-input-size-token-limit-specs-guide-pt-pt 图示

Esta é a questão que mais confunde os desenvolvedores: a documentação oficial indica 131.072, mas a API retorna um erro dizendo que o limite é 65.536.

A Verdade: Diferenças na Estratégia da Plataforma, Não na Capacidade do Modelo

Fonte da Documentação Limite de Token de Entrada Limite de Token de Saída
Firebase AI Logic 65.536 32.768
Google AI Studio / Gemini API 131.072 32.768
Vertex AI 131.072 32.768
Gemini 3 Flash (versão texto) 1.048.576 65.536

Por que existem diferenças?

O Nano Banana 2, como um modelo de geração de imagens, precisa alocar muitos recursos de computação para o processo de síntese de imagens (cabeça de difusão). Diferente dos modelos puramente textuais que podem usar toda a capacidade de contexto para entender a entrada, os modelos de geração de imagens precisam manter o pipeline de geração simultaneamente.

  • Firebase AI Logic adota um limite mais conservador de 65.536, possivelmente considerando a estabilidade em dispositivos móveis e de borda.
  • Vertex AI / Google AI oferecem o limite completo de 131.072, visando o desenvolvimento em servidores e na nuvem.

Impacto real: Se você invocar o modelo através da API Gemini padrão e receber um erro de 65.536, pode ser devido a:

  1. A versão do SDK que você está usando por padrão utiliza o canal do Firebase.
  2. As restrições da plataforma na fase de pré-visualização ainda não foram unificadas.
  3. Restrições de cota para uma região ou nível específico.

💡 Sugestão de Teste: Ao invocar o Nano Banana 2 através da plataforma APIYI (apiyi.com), é recomendável manter os tokens de entrada abaixo de 65.536. Assim, não haverá problemas de limite, independentemente da plataforma subjacente para a qual a solicitação for roteada. A plataforma APIYI selecionará automaticamente o caminho de invocação mais otimizado.

Fórmula de Cálculo de Tokens de Imagem de Entrada do Nano Banana 2

Entender como as imagens são convertidas em Tokens é crucial para resolver problemas de tamanho de entrada. O Gemini utiliza uma estratégia de fatiamento (Tiling) para calcular o consumo de Tokens das imagens.

Regras Básicas de Cálculo

Regra Um: Imagens Pequenas (ambos os lados ≤ 384px)

Token 消耗 = 258 tokens (valor fixo)

Qualquer imagem com ambos os lados não excedendo 384 pixels, independentemente do tamanho real, consumirá 258 Tokens. Esta é a opção mais econômica.

Regra Dois: Imagens Grandes (qualquer lado > 384px)

Token 消耗 = ceil(width ÷ 768) × ceil(height ÷ 768) × 258

Imagens grandes são divididas em blocos (Tiles) de 768×768, e cada bloco consome 258 Tokens.

Tabela de Consulta Rápida de Consumo de Tokens para Tamanhos Comuns de Imagem

Tamanho da Imagem Cálculo de Blocos Consumo de Tokens Descrição
256×256 1×1 258 Valor fixo para imagem pequena
384×384 1×1 258 Limite superior para imagem pequena
512×512 1×1 258 Ainda dentro de um bloco
768×768 1×1 258 Exatamente um bloco
1024×1024 2×2 1.032 Tamanho de entrada comum
1920×1080 3×2 1.548 Imagem Full HD
2048×2048 3×3 2.322 Imagem 2K
3072×3072 4×4 4.128 Resolução máxima de entrada
4096×4096 Redimensionado automaticamente para 3072 Excede o limite, processado automaticamente

Controle do Parâmetro media_resolution

Os modelos da série Gemini 3 suportam o parâmetro media_resolution, que permite controlar precisamente o consumo de Tokens de cada imagem de entrada:

Valor do Parâmetro Tokens/Imagem (Gemini 3) Tokens/Imagem (Gemini 2.5) Cenário de Uso
LOW 280 64 Visualização rápida, sem necessidade de detalhes
MEDIUM 560 256 Referência geral
HIGH (padrão) 1.120 256 + Pan&Scan (~2.048) Necessita de análise detalhada
ULTRA_HIGH 2.240 Maior precisão

Descoberta Chave: A configuração HIGH padrão consome 1.120 Tokens por imagem. Se você enviar 14 imagens de referência (o limite do Nano Banana 2) em uma única requisição, apenas as imagens consumiriam 15.680 Tokens — e, adicionando o comando de texto, você facilmente se aproximaria do limite de 65.536.


Detalhes do Consumo de Tokens de Saída do Nano Banana 2

O lado da saída também tem um limite de Tokens: 32.768 Tokens. Cada imagem gerada consome uma quantidade diferente de Tokens de saída, dependendo da resolução:

Resolução de Saída Consumo de Tokens Preço por Imagem (Oficial) Preço por Imagem (APIYI)
512px ~747 tokens $0.045 ~$0.02
1K (1024×1024) ~1.120 tokens $0.067 $0.03
2K (2048×2048) ~1.680 tokens $0.101 ~$0.04
4K (4096×4096) ~2.520 tokens $0.151 ~$0.06

Quantidade Máxima de Saída por Requisição Única

Com base no limite de 32.768 Tokens de saída:

Resolução de Saída Tokens por Imagem Número Máximo de Imagens de Saída Descrição
512px 747 ~43 imagens Ideal para miniaturas em lote
1K 1.120 ~29 imagens Geração em lote regular
2K 1.680 ~19 imagens Lote em alta definição
4K 2.520 ~13 imagens Lote de grande formato

🚀 Sugestão para Geração em Lote: Se você precisa gerar um grande volume de imagens, é recomendável usar a Batch API (com 50% de desconto no preço) em vez de enviar muitas imagens em uma única requisição. A plataforma APIYI apiyi.com suporta chamadas da Batch API, onde cada imagem de 1K custa apenas cerca de $0.015.

Detalhes sobre Formatos de Entrada e Limites do Nano Banana 2

Formatos de Imagem de Entrada Suportados

Formato Suporte Descrição
PNG Recomendado, qualidade sem perdas
JPEG Recomendado, arquivo pequeno
WebP Formato moderno, equilibra qualidade e tamanho
HEIC Formato nativo do iOS
HEIF Formato de imagem eficiente
GIF Não suporta imagens animadas
BMP Não suportado
TIFF Não suportado

Limites de Tamanho de Arquivo

Método de Upload Limite de Tamanho Cenário de Uso
Inline (base64) 7 MB Passado diretamente pelo SDK
API de Arquivos 20 MB → 100 MB Upload de arquivos grandes
Armazenamento em Nuvem 30 MB Google Cloud Storage
Corpo total da requisição 500 MB Inclui todo o conteúdo

Limites de Resolução da Imagem de Entrada

  • Resolução máxima de entrada: 3072×3072 pixels
  • Imagens que excedem esta resolução serão automaticamente redimensionadas proporcionalmente para dentro de 3072×3072.
  • A proporção será mantida após o redimensionamento.

Suporte para Entrada de PDF

O Nano Banana 2 suporta PDF como entrada, mas é importante ficar atento ao consumo de Tokens:

  • Cada página do PDF é processada como uma imagem, consumindo a mesma quantidade de Tokens que uma imagem.
  • Na resolução HIGH (padrão), cada página consome aproximadamente 1.120 Tokens.
  • Com o limite de 65.536 Tokens, é possível suportar no máximo cerca de 58 páginas de PDF.
  • Recomendação: Envie apenas as páginas necessárias, não o documento inteiro.

Proporções de Tela Suportadas pelo Nano Banana 2

O Nano Banana 2 adicionou algumas proporções de tela extremas em comparação com o Nano Banana Pro:

Proporção Tamanho de Exemplo (1K) Cenário de Uso Nano Banana 2 Nano Banana Pro
1:1 1024×1024 Avatares de redes sociais, imagens de produtos
16:9 1024×576 Capas de vídeo, banners
9:16 576×1024 Papéis de parede de celular, Stories
4:3 1024×768 Proporção de tela tradicional
3:4 768×1024 Pôsteres verticais
3:2 1024×683 Proporção comum para fotos
2:3 683×1024 Fotos verticais
4:5 1024×1280 Recomendado pelo Instagram
5:4 1024×819 Quase quadrado
21:9 1024×439 Tela ultra-wide
4:1 1024×256 Banner ultra-largo
1:4 256×1024 Banner vertical ultra-estreito
8:1 1024×128 Banner extremamente largo
1:8 128×1024 Banner vertical extremamente estreito

💡 Explicação das Novas Proporções: As proporções extremas 4:1, 1:4, 8:1 e 1:8, adicionadas no Nano Banana 2, são ideais para gerar banners de sites, infográficos longos, imagens para barras laterais e outros cenários especiais. Todas as proporções podem ser usadas diretamente através da plataforma APIYI apiyi.com.


6 Métodos para Resolver o Erro de Limite de Token 65536 do Nano Banana 2

nano-banana-2-input-size-token-limit-specs-guide-pt-pt 图示

Quando você se depara com o erro The input token count exceeds the maximum number of tokens allowed (65536), os 6 métodos a seguir podem te ajudar a resolvê-lo:

Método Um: Reduzir o parâmetro media_resolution (Recomendado)

Efeito: Consumo de tokens reduzido em 50%-75%

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Interface unificada APIYI
)

# Reduz o consumo de tokens diminuindo a resolução da imagem de entrada
# HIGH (padrão) = 1.120 tokens/imagem
# MEDIUM = 560 tokens/imagem (redução de 50%)
# LOW = 280 tokens/imagem (redução de 75%)
Ver exemplo de configuração de `media_resolution` na API nativa do Gemini
import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Especifica a resolução ao fazer upload da imagem
image = genai.upload_file("input.jpg")

response = model.generate_content(
    contents=[
        "Edit this image to add a sunset background",
        image
    ],
    generation_config={
        "response_modalities": ["IMAGE", "TEXT"],
        "media_resolution": "MEDIUM"  # De HIGH para MEDIUM
    }
)

# MEDIUM: 560 tokens/imagem (comparado a HIGH: 1.120 tokens/imagem)
# 14 imagens: 7.840 tokens (comparado a 15.680 tokens)

Método Dois: Reduzir o tamanho da imagem de entrada

Efeito: Compressão máxima para 258 tokens/imagem

Antes de enviar para a API, reduza a imagem de referência para um tamanho de 384×384 ou menos:

from PIL import Image

def optimize_for_token(img_path, max_size=384):
    """Reduz a imagem para 384px ou menos, fixando o consumo de tokens em 258"""
    img = Image.open(img_path)
    img.thumbnail((max_size, max_size), Image.LANCZOS)
    optimized_path = img_path.replace(".", "_optimized.")
    img.save(optimized_path, quality=85)
    return optimized_path

# Antes da otimização: 1024x1024 = 1.032 tokens
# Após otimização: 384x384 = 258 tokens (economia de 75%)

Método Três: Reduzir o número de imagens de referência

Efeito: Redução linear do consumo de tokens

O Nano Banana 2 suporta até 14 imagens de entrada, mas a maioria dos cenários não exige tantas:

Nº de Imagens de Referência Consumo de Token (HIGH) Consumo de Token (MEDIUM) Consumo de Token (Otimizado 384px)
1 Imagem 1.120 560 258
3 Imagens 3.360 1.680 774
7 Imagens 7.840 3.920 1.806
14 Imagens 15.680 7.840 3.612

Sugestão: Envie apenas as imagens de referência realmente necessárias. Para cenários de consistência facial, geralmente 2-3 imagens são suficientes, não é preciso enviar as 14.

Método Quatro: Dividir requisições

Efeito: Contorna o limite de requisição única

Se você precisa processar muitas imagens ou PDFs longos, divida a requisição em várias requisições menores:

def split_process(images, prompt, batch_size=3):
    """Divide requisições com múltiplas imagens em lotes menores"""
    results = []
    for i in range(0, len(images), batch_size):
        batch = images[i:i+batch_size]
        response = client.images.generate(
            model="nano-banana-2",
            prompt=prompt,
            # Envia apenas 'batch_size' imagens por vez
        )
        results.append(response)
    return results

Método Cinco: Usar a Files API em vez de base64 inline

Efeito: Evita que o corpo da requisição seja muito grande, permite upload de arquivos maiores

A codificação base64 inline pode inflar o corpo da requisição em cerca de 33%. Usar a Files API permite que você faça o upload do arquivo primeiro para obter uma referência e, em seguida, usá-la na requisição:

# Usa a Files API para fazer upload de imagens grandes (suporta 20-100MB)
file = genai.upload_file("large_image.png")

# Referencia na requisição, em vez de inline
response = model.generate_content([
    "Based on this reference, generate a similar style image",
    file  # Referência em vez de base64
])

Método Seis: Simplificar o comando de texto

Efeito: Libera mais tokens para imagens

Não ignore que o comando de texto também consome tokens. Comandos longos podem ocupar um orçamento valioso de tokens:

  • ❌ Descrição detalhada de 500 palavras → ~750 tokens
  • ✅ Comando refinado de 100 palavras → ~150 tokens
  • Economia: ~600 tokens, o equivalente a uma imagem extra com resolução MEDIUM

🎯 Sugestão Abrangente: No desenvolvimento prático, recomendamos combinar os métodos um + dois + três. Ao invocar o Nano Banana 2 através da plataforma APIYI apiyi.com, defina media_resolution como MEDIUM, pré-processe as imagens de entrada para 384px e envie apenas as imagens de referência necessárias. Dessa forma, o consumo de tokens pode ser mantido abaixo de 5.000, bem longe do limite de 65.536.


Comparação dos Limites de Token do Nano Banana 2 com Outros Modelos

nano-banana-2-input-size-token-limit-specs-guide-pt-pt 图示

Modelo Limite Máximo de Tokens de Entrada Limite Máximo de Tokens de Saída Tokens de Imagem de Saída Preço/Imagem (1K)
Gemini 3 Flash (Texto) 1.048.576 65.536
Nano Banana Pro ~200.000 32.768 ~1.120 $0.134
Nano Banana 2 65.536-131.072 32.768 ~1.120 $0.067 (oficial)
Nano Banana 2 (APIYI) 65.536-131.072 32.768 ~1.120 $0.03
Gemini 2.5 Flash Image 1.290/imagem 1.290 fixo $0.039
Imagen 4 Fast $0.020

Diferenças Chave:

  1. O limite de tokens de entrada do Nano Banana 2 é significativamente menor que o do Gemini 3 Flash (somente texto) (65K vs 1M), o que é uma limitação da arquitetura de geração de imagens.
  2. O limite de entrada do Nano Banana Pro (~200K) é maior que o do Nano Banana 2, sendo mais adequado para edições complexas que exigem um grande volume de contexto.
  3. O Gemini 2.5 Flash Image utiliza um modelo simplificado com um número fixo de tokens por imagem, eliminando cálculos complexos de tokens.

Perguntas Frequentes

P1: Por que a documentação oficial menciona 131.072, mas a API retorna um erro para 65.536?

Isso se deve a diferenças nas políticas das plataformas. A documentação do Firebase AI Logic indica 65.536, enquanto a documentação do Vertex AI / Google AI aponta 131.072. Ambos os números estão "corretos", dependendo da plataforma pela qual você faz a invocação. Na fase de pré-visualização, é recomendável planejar seus tokens de entrada com base em 65.536 para garantir que funcione em todas as plataformas. Ao invocar via APIYI (apiyi.com), a plataforma otimiza o roteamento automaticamente.

P2: Como posso calcular rapidamente quantos tokens minha solicitação consumirá?

A fórmula simples é: Total de Tokens de Entrada ≈ Tokens de Texto + Número de Imagens × Tokens por Imagem. Para texto, aproximadamente 1 token a cada 4 caracteres em inglês, e cerca de 1-2 caracteres chineses por token. Os tokens de imagem dependem da media_resolution: LOW=280, MEDIUM=560, HIGH=1120. Por exemplo: um comando em chinês de 200 caracteres (~300 tokens) + 5 imagens MEDIUM (2.800 tokens) ≈ 3.100 tokens, o que está bem abaixo do limite de 65.536.

P3: Quantas páginas um PDF pode ter como entrada no máximo?

Considerando a resolução HIGH (padrão), cada página consome aproximadamente 1.120 tokens. Com o limite de 65.536, isso permite cerca de 58 páginas. Se você reduzir para MEDIUM, cada página consome 560 tokens, suportando cerca de 117 páginas. É recomendável enviar apenas as páginas que realmente precisam ser referenciadas. Ao invocar via APIYI (apiyi.com), o uso de tokens será exibido detalhadamente nos logs de invocação.

P4: Imagens grandes são redimensionadas automaticamente ao serem enviadas?

Sim. Imagens com mais de 3072×3072 pixels são automaticamente redimensionadas proporcionalmente para dentro de 3072×3072. No entanto, mesmo após o redimensionamento, os tokens ainda serão calculados com base nas dimensões reais. Recomenda-se redimensionar manualmente as imagens para 384×384 (apenas 258 tokens) ou 768×768 (apenas 258 tokens) antes de enviá-las, para obter a melhor eficiência de tokens.

P5: Qual tem um limite de entrada maior, Nano Banana 2 ou Pro?

O limite de tokens de entrada do Nano Banana Pro (~200.000) é aproximadamente 1,5 a 3 vezes maior que o do Nano Banana 2 (65.536-131.072). Se o seu caso de uso exige a entrada de muitas imagens de referência ou PDFs longos, o Nano Banana Pro é mais adequado. No entanto, para a maioria dos cenários padrão de texto para imagem e imagem para imagem simples, o limite de entrada do Nano Banana 2 é totalmente suficiente, além de ser metade do preço e 2-3 vezes mais rápido. A plataforma APIYI (apiyi.com) suporta ambos, e você pode alternar a qualquer momento.


Resumo

A limitação de Tokens do Nano Banana 2 não é um problema, mas sim um mecanismo que precisa ser compreendido. Dominando os seguintes pontos, você conseguirá usá-lo com facilidade:

  1. Limite de entrada 65.536-131.072 — Planejar com 65.536 é o mais seguro
  2. Cálculo de Tokens de imagem — Imagens pequenas 258 fixos, imagens grandes são divididas em blocos de 768×768
  3. media_resolution é o meio de ajuste mais eficaz — HIGH→MEDIUM reduz diretamente 50%
  4. Limite de saída 32.768 — No máximo 43 imagens de 512px ou 13 imagens 4K por vez
  5. 6 soluções — O uso combinado é o mais eficaz

Recomendamos invocar o Nano Banana 2 através da plataforma APIYI apiyi.com, para aproveitar todas as capacidades do modelo por $0.03/imagem. A plataforma oferece estatísticas detalhadas de uso de Tokens, ajudando você a otimizar precisamente cada invocação.


📝 Autor: Equipe APIYI | Equipe Técnica APIYI
🔗 Comunicação Técnica: Visite apiyi.com para obter o guia completo de integração do Nano Banana 2
📅 Data de Atualização: 27 de fevereiro de 2026

Deixe um comentário