Решение ограничений размера ввода Nano Banana 2: формула расчета токенов и 6 способов исправления ошибки 65536

При генерации изображений с помощью Nano Banana 2 вы могли столкнуться с такой ошибкой: The input token count exceeds the maximum number of tokens allowed (65536). Это одно из самых распространённых затруднений, с которым сталкиваются разработчики при вызове API генерации изображений Gemini — в официальной карточке модели чётко указан лимит входных токенов 131 072, так почему же фактический лимит составляет 65 536?

Ключевая ценность: Прочитав эту статью, вы полностью поймёте ограничения токенов ввода и вывода Nano Banana 2, точную формулу расчёта токенов изображений, а также 6 практических способов решения ошибки 65536.

Технические характеристики модели Nano Banana 2: Полная таблица параметров

Базовый ID модели Nano Banana 2 — gemini-3.1-flash-image-preview. Ниже приведена полная спецификация, извлеченная из официальной карточки модели:

Параметр	Значение	Описание
Код модели	`gemini-3.1-flash-image-preview`	Параметр модели, используемый при вызове API
Тип ввода	Текст / Изображение / PDF	Поддерживает текст, изображения и PDF-файлы
Тип вывода	Изображение / Текст	Может генерировать изображения или текст
Макс. входных токенов	65,536 ~ 131,072	Зависит от платформы (подробнее ниже)
Макс. выходных токенов	32,768	Включает токены изображений и текста
Макс. входных изображений	14 (10 объектов + 4 персонажа)	За один запрос
Макс. выходное разрешение	4096×4096 (4K)	Поддерживает различные соотношения сторон
Макс. размер входного изображения	3072×3072 px	При превышении автоматически масштабируется

Матрица поддержки функций Nano Banana 2

Функция	Статус поддержки	Описание
Генерация изображений	✅ Поддерживается	Основная возможность
Batch API	✅ Поддерживается	Пакетная обработка, скидка 50%
Search grounding	✅ Поддерживается	Генерация с улучшенным поиском
Thinking	✅ Поддерживается	Регулируемый уровень рассуждений
Генерация аудио	❌ Не поддерживается	—
Кэширование	❌ Не поддерживается	Невозможно кэшировать контекст
Выполнение кода	❌ Не поддерживается	—
Поиск файлов	❌ Не поддерживается	—
Вызов функций	❌ Не поддерживается	—
Google Maps	❌ Не поддерживается	—
Live API	❌ Не поддерживается	—
Структурированные выводы	❌ Не поддерживается	—
Контекст URL	❌ Не поддерживается	—

🎯 Важное напоминание: Nano Banana 2 не поддерживает кэширование контекста, что означает, что каждый запрос требует повторной отправки полного входного содержимого. В сценариях с большим количеством эталонных изображений это значительно увеличит потребление токенов. При вызове через платформу APIYI (apiyi.com) рекомендуется оптимизировать входные данные, чтобы контролировать использование токенов для каждого запроса.

Ограничения токенов Nano Banana 2: Ключевой вопрос — 65536 или 131072?

Это самый запутанный вопрос для разработчиков: в официальной документации указано 131 072, но API возвращает ошибку, что лимит составляет 65 536.

Правда: Различия в политике платформ, а не в возможностях модели

Источник документации	Макс. входных токенов	Макс. выходных токенов
Firebase AI Logic	65,536	32,768
Google AI Studio / Gemini API	131,072	32,768
Vertex AI	131,072	32,768
Gemini 3 Flash (текстовая версия)	1,048,576	65,536

Почему существуют различия?

Nano Banana 2, как модель генерации изображений, требует выделения значительных вычислительных ресурсов для процесса синтеза изображений (диффузионная головка). В отличие от чисто текстовых моделей, которые могут использовать весь объем контекста для понимания входных данных, модель генерации изображений должна одновременно поддерживать конвейер генерации.

Firebase AI Logic использует более консервативное ограничение в 65 536 токенов, возможно, с учетом стабильности на мобильных и периферийных устройствах.
Vertex AI / Google AI предоставляют полное ограничение в 131 072 токена, ориентированное на серверную и облачную разработку.

Фактическое влияние: Если вы вызываете стандартный Gemini API и получаете ошибку с лимитом 65 536, это может быть связано с тем, что:

Используемая вами версия SDK по умолчанию использует канал Firebase.
Ограничения платформы на этапе предварительного просмотра еще не унифицированы.
Существуют ограничения квоты для определенного региона или уровня.

💡 Рекомендации по результатам тестирования: При вызове Nano Banana 2 через платформу APIYI (apiyi.com) рекомендуется контролировать количество входных токенов в пределах 65 536. Таким образом, независимо от того, на какую базовую платформу будет маршрутизирован запрос, ограничение не будет вызвано. Платформа APIYI автоматически выберет оптимальный путь вызова.

Формула расчёта токенов для входных изображений Nano Banana 2

Понимание того, как изображения преобразуются в токены, — ключ к решению проблем с размером входных данных. Gemini использует стратегию разбиения на блоки (Tiling) для расчёта потребления токенов изображением.

Базовые правила расчёта

Правило 1: Маленькие изображения (обе стороны ≤ 384px)

Token 消耗 = 258 tokens (固定值)

Любое изображение, у которого обе стороны не превышают 384 пикселя, независимо от фактического размера, всегда потребляет 258 токенов. Это самый экономичный вариант.

Правило 2: Большие изображения (любая сторона > 384px)

Token 消耗 = ceil(width ÷ 768) × ceil(height ÷ 768) × 258

Большие изображения разбиваются на блоки (тайлы) размером 768×768, каждый блок потребляет 258 токенов.

Таблица быстрого просмотра потребления токенов для распространённых размеров изображений

Размер изображения	Расчёт блоков	Потребление токенов	Описание
256×256	1×1	258	Фиксированное значение для маленьких изображений
384×384	1×1	258	Верхний предел для маленьких изображений
512×512	1×1	258	Всё ещё в одном блоке
768×768	1×1	258	Ровно один блок
1024×1024	2×2	1,032	Распространённый входной размер
1920×1080	3×2	1,548	Изображение Full HD
2048×2048	3×3	2,322	Изображение 2K
3072×3072	4×4	4,128	Максимальное входное разрешение
4096×4096	—	Автоматически масштабируется до 3072	Автоматическая обработка при превышении лимита

Управление параметром `media_resolution`

Модели серии Gemini 3 поддерживают параметр media_resolution, который позволяет точно контролировать потребление токенов для каждого входного изображения:

Значение параметра	Токенов/изображение (Gemini 3)	Токенов/изображение (Gemini 2.5)	Сценарий использования
`LOW`	280	64	Быстрый предпросмотр, детали не требуются
`MEDIUM`	560	256	Общая справка
`HIGH` (по умолчанию)	1,120	256 + Pan&Scan (~2,048)	Требуется детальный анализ
`ULTRA_HIGH`	2,240	—	Максимальная точность

Ключевое открытие: Настройка HIGH по умолчанию потребляет 1120 токенов на каждое изображение. Если вы передадите 14 эталонных изображений (максимум для Nano Banana 2) в одном запросе, только изображения съедят 15 680 токенов — а если добавить текстовый промпт, то легко можно приблизиться к лимиту в 65 536.

Подробный анализ потребления токенов при выводе в Nano Banana 2

На стороне вывода также есть ограничение по токенам: 32 768 токенов. Каждое сгенерированное изображение потребляет разное количество выходных токенов в зависимости от разрешения:

Выходное разрешение	Потребление токенов	Цена за изображение (официальная)	Цена за изображение (APIYI)
512px	~747 токенов	$0.045	~$0.02
1K (1024×1024)	~1,120 токенов	$0.067	$0.03
2K (2048×2048)	~1,680 токенов	$0.101	~$0.04
4K (4096×4096)	~2,520 токенов	$0.151	~$0.06

Максимальный объём вывода за один запрос

Исходя из верхнего предела в 32 768 выходных токенов:

Выходное разрешение	Токенов за изображение	Максимальное количество изображений	Описание
512px	747	~43 изображения	Подходит для пакетной генерации миниатюр
1K	1,120	~29 изображений	Обычная пакетная генерация
2K	1,680	~19 изображений	Пакетная генерация HD
4K	2,520	~13 изображений	Пакетная генерация больших форматов

🚀 Рекомендации по пакетной генерации: Если вам нужно сгенерировать много изображений, рекомендуем использовать Batch API (скидка 50% от цены) вместо того, чтобы отправлять большое количество изображений в одном запросе. Платформа APIYI (apiyi.com) поддерживает вызовы Batch API, и каждое изображение 1K обойдётся всего примерно в $0.015.

Подробности о форматах ввода и ограничениях Nano Banana 2

Поддерживаемые форматы входных изображений

Формат	Поддержка	Описание
PNG	✅	Рекомендуется, без потерь качества
JPEG	✅	Рекомендуется, небольшой размер файла
WebP	✅	Современный формат, баланс качества и размера
HEIC	✅	Нативный формат iOS
HEIF	✅	Эффективный формат изображений
GIF	❌	Анимированные изображения не поддерживаются
BMP	❌	Не поддерживается
TIFF	❌	Не поддерживается

Ограничения на размер файла

Способ загрузки	Максимальный размер	Сценарий использования
Встроенный (base64)	7 МБ	Прямая передача через SDK
Files API	20 МБ → 100 МБ	Загрузка больших файлов
Cloud Storage	30 МБ	Google Cloud Storage
Общий размер запроса	500 МБ	Включая весь контент

Ограничения на разрешение входных изображений

Максимальное входное разрешение: 3072×3072 пикселей
Изображения, превышающие это разрешение, будут автоматически масштабированы с сохранением пропорций до 3072×3072 пикселей.
Соотношение сторон после масштабирования сохраняется.

Поддержка ввода PDF

Nano Banana 2 поддерживает PDF в качестве входных данных, но стоит учитывать потребление токенов:

Каждая страница PDF обрабатывается как изображение и потребляет столько же токенов.
При разрешении HIGH (по умолчанию) каждая страница потребляет около 1120 токенов.
При лимите в 65 536 токенов поддерживается до 58 страниц PDF.
Рекомендация: передавайте только необходимые страницы, не загружайте весь документ.

Поддерживаемые соотношения сторон в Nano Banana 2

Nano Banana 2, по сравнению с Nano Banana Pro, добавил несколько экстремальных соотношений сторон:

Соотношение сторон	Примерный размер (1K)	Сценарий использования	Nano Banana 2	Nano Banana Pro
1:1	1024×1024	Аватары для соцсетей, изображения продуктов	✅	✅
16:9	1024×576	Обложки видео, баннеры	✅	✅
9:16	576×1024	Обои для телефона, Stories	✅	✅
4:3	1024×768	Традиционное соотношение сторон экрана	✅	✅
3:4	768×1024	Вертикальные постеры	✅	✅
3:2	1024×683	Часто используемое соотношение для фотографий	✅	✅
2:3	683×1024	Вертикальные фотографии	✅	✅
4:5	1024×1280	Рекомендовано для Instagram	✅	✅
5:4	1024×819	Близко к квадрату	✅	✅
21:9	1024×439	Сверхширокий экран	✅	✅
4:1	1024×256	Сверхширокий баннер	✅	❌
1:4	256×1024	Сверхтонкий вертикальный баннер	✅	❌
8:1	1024×128	Экстремально широкий баннер	✅	❌
1:8	128×1024	Экстремально тонкий вертикальный баннер	✅	❌

💡 Пояснение к новым соотношениям: Новые экстремальные соотношения 4:1, 1:4, 8:1, 1:8 в Nano Banana 2 идеально подходят для создания баннеров для сайтов, длинных инфографик, изображений для боковых панелей и других специфических сценариев. Все эти соотношения доступны для использования напрямую через платформу APIYI apiyi.com.

6 способов решить ошибку ограничения токенов Nano Banana 2 (65536)

Когда вы сталкиваетесь с ошибкой The input token count exceeds the maximum number of tokens allowed (65536), следующие 6 методов помогут вам её решить:

Метод один: Снижение параметра `media_resolution` (рекомендуется)

Эффект: Потребление токенов снижается на 50-75%

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # Единый интерфейс APIYI
)

# Уменьшаем потребление токенов за счет снижения разрешения входного изображения
# HIGH (по умолчанию) = 1120 токенов/изображение
# MEDIUM = 560 токенов/изображение (снижение на 50%)
# LOW = 280 токенов/изображение (снижение на 75%)

Пример настройки `media_resolution` для нативного API Gemini

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Указываем разрешение при загрузке изображения
image = genai.upload_file("input.jpg")

response = model.generate_content(
    contents=[
        "Edit this image to add a sunset background",
        image
    ],
    generation_config={
        "response_modalities": ["IMAGE", "TEXT"],
        "media_resolution": "MEDIUM"  # Снижено с HIGH до MEDIUM
    }
)

# MEDIUM: 560 токенов/изображение (по сравнению с HIGH: 1120 токенов/изображение)
# 14 изображений: 7840 токенов (по сравнению с 15680 токенами)

Метод два: Уменьшение размера входного изображения

Эффект: Максимальное сжатие до 258 токенов/изображение

Перед отправкой в API уменьшите эталонное изображение до размера не более 384×384 пикселей:

from PIL import Image

def optimize_for_token(img_path, max_size=384):
    """Уменьшает изображение до 384px, потребление токенов фиксируется на 258"""
    img = Image.open(img_path)
    img.thumbnail((max_size, max_size), Image.LANCZOS)
    optimized_path = img_path.replace(".", "_optimized.")
    img.save(optimized_path, quality=85)
    return optimized_path

# До оптимизации: 1024x1024 = 1032 токена
# После оптимизации: 384x384 = 258 токенов (экономия 75%)

Метод три: Уменьшение количества эталонных изображений

Эффект: Линейное сокращение потребления токенов

Nano Banana 2 поддерживает до 14 входных изображений, но в большинстве сценариев столько не требуется:

Количество эталонных изображений	Потребление токенов (HIGH)	Потребление токенов (MEDIUM)	Потребление токенов (оптимизировано до 384px)
1 изображение	1,120	560	258
3 изображения	3,360	1,680	774
7 изображений	7,840	3,920	1,806
14 изображений	15,680	7,840	3,612

Совет: Передавайте только действительно необходимые эталонные изображения. Для сценариев согласованности лиц обычно достаточно 2-3 изображений, нет необходимости передавать все 14.

Метод четыре: Разделение запросов

Эффект: Обход ограничения на количество токенов в одном запросе

Если вам нужно обработать большое количество изображений или длинные PDF-файлы, разделите запрос на несколько небольших:

def split_process(images, prompt, batch_size=3):
    """Разделяет запрос с несколькими изображениями на небольшие пакеты"""
    results = []
    for i in range(0, len(images), batch_size):
        batch = images[i:i+batch_size]
        response = client.images.generate(
            model="nano-banana-2",
            prompt=prompt,
            # Передаем только batch_size изображений за раз
        )
        results.append(response)
    return results

Метод пять: Использование Files API вместо встроенного base64

Эффект: Избегает слишком большого тела запроса, позволяет загружать более крупные файлы

Встроенное кодирование base64 увеличивает тело запроса примерно на 33%. Использование Files API позволяет сначала загрузить файл, получить ссылку на него, а затем использовать эту ссылку в запросе:

# Загрузка большого изображения с помощью Files API (поддерживает 20-100 МБ)
file = genai.upload_file("large_image.png")

# Ссылка в запросе, а не встроенный файл
response = model.generate_content([
    "Based on this reference, generate a similar style image",
    file  # ссылка, а не base64
])

Метод шесть: Упрощение текстового промпта

Эффект: Высвобождает больше токенов для изображений

Не забывайте, что текстовые промпты также потребляют токены. Длинные промпты занимают ценный бюджет токенов:

❌ Подробное описание из 500 слов → ~750 токенов
✅ Уточненный промпт из 100 слов → ~150 токенов
Экономия: ~600 токенов, что эквивалентно дополнительному изображению со средним разрешением

🎯 Общие рекомендации: В реальной разработке мы рекомендуем комбинировать методы один + два + три. При вызове Nano Banana 2 через платформу APIYI apiyi.com установите media_resolution на MEDIUM, предварительно обработайте входные изображения до 384px и передавайте только необходимые эталонные изображения. Таким образом, потребление токенов можно будет контролировать в пределах 5000, избегая ограничения в 65536.

Сравнение лимитов токенов Nano Banana 2 с другими моделями

Модель	Макс. входных токенов	Макс. выходных токенов	Токены на изображение	Цена/изображение (1K)
Gemini 3 Flash (текст)	1 048 576	65 536	—	—
Nano Banana Pro	~200 000	32 768	~1 120	$0.134
Nano Banana 2	65 536-131 072	32 768	~1 120	$0.067 (официально)
Nano Banana 2 (APIYI)	65 536-131 072	32 768	~1 120	$0.03
Gemini 2.5 Flash Image	—	1 290/изображение	1 290 фиксировано	$0.039
Imagen 4 Fast	—	—	—	$0.020

Ключевые отличия:

Лимит входных токенов Nano Banana 2 значительно меньше, чем у чисто текстовой Gemini 3 Flash (65K против 1M), что обусловлено ограничениями архитектуры генерации изображений.
Лимит входных токенов Nano Banana Pro (~200K) выше, чем у Nano Banana 2, что делает его подходящим для сложного редактирования, требующего большого контекста.
Gemini 2.5 Flash Image использует упрощенную модель с фиксированным количеством токенов на изображение, без сложного расчета токенов.

Часто задаваемые вопросы

В1: Почему в официальных источниках указано 131 072, а API выдает ошибку на 65 536?

Это связано с различиями в политике платформ. Документация Firebase AI Logic указывает 65 536, в то время как документация Vertex AI / Google AI — 131 072. Оба числа «верны» и зависят от того, через какую платформу вы делаете вызов. На этапе предварительного просмотра рекомендуется планировать входные токены исходя из 65 536, чтобы обеспечить корректную работу на всех платформах. Вызовы через платформу APIYI (apiyi.com) автоматически оптимизируют маршрутизацию.

В2: Как быстро рассчитать, сколько токенов будет израсходовано моим запросом?

Простая формула: Общее количество входных токенов ≈ токены текста + количество изображений × токены на изображение. Для текста: примерно 1 токен на каждые 4 английских символа, и примерно 1-2 токена на каждый китайский иероглиф. Токены изображения зависят от media_resolution: LOW=280, MEDIUM=560, HIGH=1120. Например: промпт из 200 китайских иероглифов (~300 токенов) + 5 изображений MEDIUM (2 800 токенов) ≈ 3 100 токенов, что значительно меньше 65 536.

В3: Сколько страниц PDF максимально поддерживается для ввода?

При расчете по разрешению HIGH (по умолчанию) каждая страница потребляет около 1 120 токенов. При лимите в 65 536 токенов это составляет максимум около 58 страниц. Если снизить разрешение до MEDIUM, каждая страница будет стоить 560 токенов, что позволит поддерживать около 117 страниц. Рекомендуется передавать только те страницы, которые действительно необходимы для справки. При вызове через платформу APIYI (apiyi.com) использование токенов будет подробно отображаться в логах вызовов.

В4: Будут ли большие изображения автоматически масштабироваться при загрузке?

Да. Изображения размером более 3072×3072 пикселей будут автоматически пропорционально уменьшены до 3072×3072. Однако после масштабирования токены все равно будут рассчитываться исходя из фактического размера. Рекомендуется вручную уменьшать изображения до 384×384 (всего 258 токенов) или 768×768 (всего 258 токенов) перед отправкой, чтобы добиться оптимальной эффективности использования токенов.

В5: У какой модели, Nano Banana 2 или Pro, больше лимит входных токенов?

Лимит входных токенов Nano Banana Pro (~200 000) примерно в 1,5-3 раза больше, чем у Nano Banana 2 (65 536-131 072). Если ваш сценарий использования требует передачи большого количества эталонных изображений или длинных PDF-файлов, Nano Banana Pro подойдет лучше. Однако для большинства стандартных сценариев текст-в-изображение и простое изображение-в-изображение лимита Nano Banana 2 вполне достаточно, при этом он вдвое дешевле и в 2-3 раза быстрее. Платформа APIYI (apiyi.com) поддерживает обе модели, и вы можете переключаться между ними в любое время.

Итоги

Ограничение токенов в Nano Banana 2 — это не проблема, а механизм, который нужно понять. Освоив следующие ключевые моменты, вы сможете легко управлять им:

Максимальный лимит ввода 65,536-131,072 — безопаснее всего планировать исходя из 65,536
Расчет токенов для изображений — 258 для маленьких изображений (фиксировано), для больших изображений расчет ведется блоками 768×768
media_resolution — самый эффективный способ регулировки: переход с HIGH на MEDIUM снижает потребление на 50%
Максимальный лимит вывода 32,768 — до 43 изображений 512px или 13 изображений 4K за один вызов
6 способов решения — комбинированное использование дает наилучший результат

Рекомендуем вызывать Nano Banana 2 через платформу APIYI apiyi.com, чтобы наслаждаться полными возможностями модели по цене $0.03 за изображение. Платформа предоставляет подробную статистику использования токенов, что поможет вам точно оптимизировать каждый вызов.

📝 Автор: Команда APIYI | Техническая команда APIYI
🔗 Техническая поддержка: Посетите apiyi.com для получения полного руководства по интеграции Nano Banana 2
📅 Дата обновления: 27 февраля 2026 г.