Mengatasi batas ukuran input Nano Banana 2: Rumus perhitungan Token dan 6 metode perbaikan kesalahan 65536

Saat menggunakan Nano Banana 2 untuk pembuatan gambar, Anda mungkin pernah menemui error ini: The input token count exceeds the maximum number of tokens allowed (65536). Ini adalah salah satu kebingungan paling umum yang dialami developer saat memanggil API pembuatan gambar Gemini — kartu model resmi jelas-jelas menuliskan batas token input 131.072, lalu mengapa batas sebenarnya adalah 65.536?

Nilai Inti: Setelah membaca artikel ini, Anda akan sepenuhnya memahami batasan Token input dan output Nano Banana 2, rumus perhitungan Token gambar yang akurat, serta 6 metode praktis untuk mengatasi error 65536.

Spesifikasi Model Nano Banana 2: Tabel Parameter Lengkap

ID model dasar Nano Banana 2 adalah gemini-3.1-flash-image-preview. Berikut adalah spesifikasi lengkap yang diambil dari kartu model resmi:

Parameter	Nilai	Keterangan
Kode Model	`gemini-3.1-flash-image-preview`	Parameter model yang digunakan saat pemanggilan API
Tipe Input	Teks / Gambar / PDF	Mendukung file teks, gambar, dan PDF
Tipe Output	Gambar / Teks	Dapat menghasilkan gambar atau teks
Batas Token Input	65.536 ~ 131.072	Bervariasi tergantung platform (lihat di bawah)
Batas Token Output	32.768	Termasuk Token gambar dan teks
Gambar Input Maksimal	14 Gambar (10 objek + 4 karakter)	Dalam satu permintaan
Resolusi Output Maksimal	4096×4096 (4K)	Mendukung berbagai rasio aspek
Batas Gambar Input	3072×3072 px	Otomatis diskalakan jika melebihi

Matriks Dukungan Fitur Nano Banana 2

Fitur	Status Dukungan	Keterangan
Pembuatan gambar	✅ Didukung	Kemampuan inti
API Batch	✅ Didukung	Pemrosesan batch, diskon 50%
Pencarian yang ditingkatkan	✅ Didukung	Pembuatan yang ditingkatkan pencarian
Berpikir	✅ Didukung	Tingkat inferensi yang dapat disesuaikan
Pembuatan Audio	❌ Tidak didukung	—
Cache	❌ Tidak didukung	Tidak dapat melakukan cache konteks
Eksekusi Kode	❌ Tidak didukung	—
Pencarian File	❌ Tidak didukung	—
Pemanggilan Fungsi	❌ Tidak didukung	—
Google Maps	❌ Tidak didukung	—
API Langsung	❌ Tidak didukung	—
Output Terstruktur	❌ Tidak didukung	—
Konteks URL	❌ Tidak didukung	—

🎯 Peringatan Penting: Nano Banana 2 tidak mendukung Caching (cache konteks), yang berarti setiap permintaan perlu mengirim ulang seluruh konten input. Untuk skenario yang melibatkan banyak gambar referensi, ini akan secara signifikan meningkatkan konsumsi Token. Saat melakukan pemanggilan model melalui platform APIYI apiyi.com, disarankan untuk mengoptimalkan konten input guna mengontrol penggunaan Token di setiap permintaan.

Masalah Utama Batasan Token Nano Banana 2: 65536 atau 131072?

Ini adalah pertanyaan yang paling membingungkan bagi developer: Dokumentasi resmi menyebutkan 131.072, tetapi API mengembalikan error yang menyatakan batas atasnya adalah 65.536.

Faktanya: Perbedaan Kebijakan Platform, Bukan Perbedaan Kemampuan Model

Sumber Dokumentasi	Batas Token Input	Batas Token Output
Firebase AI Logic	65,536	32,768
Google AI Studio / Gemini API	131,072	32,768
Vertex AI	131,072	32,768
Gemini 3 Flash (versi teks)	1,048,576	65,536

Mengapa ada perbedaan?

Sebagai model pembuatan gambar, Nano Banana 2 perlu mengalokasikan banyak sumber daya komputasi untuk proses sintesis gambar (diffusion head). Berbeda dengan model teks murni yang dapat menggunakan seluruh kapasitas jendela konteks untuk memahami input, model pembuatan gambar perlu mempertahankan pipeline generatif secara bersamaan.

Firebase AI Logic menggunakan batasan 65.536 yang lebih konservatif, kemungkinan mempertimbangkan stabilitas untuk perangkat seluler dan edge.
Vertex AI / Google AI menyediakan batasan 131.072 penuh, ditujukan untuk pengembangan sisi server dan cloud.

Dampak Sebenarnya: Jika kamu memanggil melalui Gemini API standar dan menerima error 65.536, kemungkinan penyebabnya adalah:

Versi SDK yang kamu gunakan secara default melewati jalur Firebase.
Batasan platform pada tahap pratinjau belum diseragamkan.
Batasan kuota untuk wilayah atau tingkatan tertentu.

💡 Saran Berdasarkan Pengujian: Saat memanggil Nano Banana 2 melalui platform APIYI apiyi.com, disarankan untuk menjaga input token di bawah 65.536. Dengan begitu, batasan tidak akan terpicu, tidak peduli platform mana yang digunakan di bawahnya. Platform APIYI akan secara otomatis memilih jalur pemanggilan yang optimal.

Formula Perhitungan Token Gambar Input Nano Banana 2

Memahami bagaimana gambar diubah menjadi token adalah kunci untuk mengatasi masalah ukuran input. Gemini menggunakan strategi pembagian blok (Tiling) untuk menghitung konsumsi token gambar.

Aturan Perhitungan Dasar

Aturan Satu: Gambar Kecil (Kedua sisi ≤ 384px)

Token 消耗 = 258 tokens (nilai tetap)

Gambar apa pun yang kedua sisinya tidak melebihi 384 piksel, terlepas dari ukuran sebenarnya, akan selalu mengonsumsi 258 token. Ini adalah pilihan yang paling ekonomis.

Aturan Dua: Gambar Besar (Salah satu sisi > 384px)

Token 消耗 = ceil(width ÷ 768) × ceil(height ÷ 768) × 258

Gambar besar akan dibagi menjadi blok (Tile) berukuran 768×768, dan setiap blok mengonsumsi 258 token.

Tabel Cepat Konsumsi Token untuk Ukuran Gambar Umum

Ukuran Gambar	Perhitungan Blok	Konsumsi Token	Keterangan
256×256	1×1	258	Nilai tetap untuk gambar kecil
384×384	1×1	258	Batas atas gambar kecil
512×512	1×1	258	Masih dalam satu blok
768×768	1×1	258	Tepat satu blok
1024×1024	2×2	1,032	Ukuran input umum
1920×1080	3×2	1,548	Gambar Full HD
2048×2048	3×3	2,322	Gambar 2K
3072×3072	4×4	4,128	Resolusi input maksimum
4096×4096	—	Otomatis diskalakan ke 3072	Penanganan otomatis jika melebihi batas

Kontrol Parameter `media_resolution`

Model seri Gemini 3 mendukung parameter media_resolution yang dapat mengontrol konsumsi token setiap gambar input secara presisi:

Nilai Parameter	Token/Gambar (Gemini 3)	Token/Gambar (Gemini 2.5)	Skenario Penggunaan
`LOW`	280	64	Pratinjau cepat, tidak butuh detail
`MEDIUM`	560	256	Referensi umum
`HIGH` (Default)	1,120	256 + Pan&Scan (~2,048)	Membutuhkan analisis detail
`ULTRA_HIGH`	2,240	—	Akurasi tertinggi

Penemuan Penting: Pengaturan HIGH default mengonsumsi 1.120 token per gambar. Jika kamu mengirimkan 14 gambar referensi (batas Nano Banana 2) dalam satu permintaan, gambar saja sudah mengonsumsi 15.680 token — ditambah petunjuk teks, sangat mudah mendekati batasan 65.536.

Detail Konsumsi Token Output Nano Banana 2

Output juga memiliki batasan Token: 32.768 Token. Setiap gambar yang dihasilkan akan mengonsumsi jumlah Token output yang berbeda tergantung pada resolusinya:

Resolusi Output	Konsumsi Token	Harga per Gambar (Resmi)	Harga per Gambar (APIYI)
512px	~747 tokens	$0.045	~$0.02
1K (1024×1024)	~1.120 tokens	$0.067	$0.03
2K (2048×2048)	~1.680 tokens	$0.101	~$0.04
4K (4096×4096)	~2.520 tokens	$0.151	~$0.06

Jumlah Output Maksimum per Permintaan

Berdasarkan batas atas Token output 32.768:

Resolusi Output	Token per Gambar	Jumlah Gambar Output Maksimum	Keterangan
512px	747	~43 Gambar	Cocok untuk thumbnail massal
1K	1.120	~29 Gambar	Pembuatan massal standar
2K	1.680	~19 Gambar	Massal resolusi tinggi
4K	2.520	~13 Gambar	Massal format besar

🚀 Saran Pembuatan Massal: Jika kamu perlu membuat banyak gambar, disarankan untuk menggunakan Batch API (diskon harga 50%) daripada memasukkan banyak gambar dalam satu permintaan. Melalui platform APIYI apiyi.com, pemanggilan Batch API didukung, dan setiap gambar 1K hanya membutuhkan sekitar $0.015.

Detail Format dan Batasan Input Nano Banana 2

Format Gambar Input yang Didukung

Format	Dukungan	Keterangan
PNG	✅	Direkomendasikan, kualitas lossless
JPEG	✅	Direkomendasikan, ukuran file kecil
WebP	✅	Format modern, menyeimbangkan kualitas dan ukuran
HEIC	✅	Format asli iOS
HEIF	✅	Format gambar efisien
GIF	❌	Tidak mendukung gambar bergerak (GIF)
BMP	❌	Tidak didukung
TIFF	❌	Tidak didukung

Batasan Ukuran File

Metode Unggah	Batas Ukuran	Skenario Penggunaan
Inline (base64)	7 MB	Langsung dimasukkan oleh SDK
Files API	20 MB → 100 MB	Unggah file besar
Cloud Storage	30 MB	Penyimpanan Google Cloud
Total Permintaan	500 MB	Termasuk semua konten

Batasan Resolusi Gambar Input

Resolusi input maksimum: 3072×3072 piksel
Gambar yang melebihi resolusi ini akan secara otomatis diskalakan secara proporsional hingga 3072×3072
Rasio aspek akan tetap terjaga setelah penskalaan

Dukungan Input PDF

Nano Banana 2 mendukung PDF sebagai input, tetapi perlu diperhatikan konsumsi Token:

Setiap halaman PDF diperlakukan sebagai gambar, dan mengonsumsi Token yang sama dengan gambar
Pada resolusi HIGH (default), setiap halaman mengonsumsi sekitar 1.120 Token
Dengan batas atas 65.536 Token, maksimal sekitar 58 halaman PDF dapat didukung
Saran: Hanya masukkan halaman yang diperlukan, jangan masukkan seluruh dokumen

Rasio Aspek yang Didukung Nano Banana 2

Nano Banana 2 menambahkan beberapa rasio aspek ekstrem baru dibandingkan dengan Nano Banana Pro:

Rasio Aspek	Contoh Ukuran (1K)	Skenario Penggunaan	Nano Banana 2	Nano Banana Pro
1:1	1024×1024	Avatar media sosial, gambar produk	✅	✅
16:9	1024×576	Sampul video, spanduk	✅	✅
9:16	576×1024	Wallpaper ponsel, Stories	✅	✅
4:3	1024×768	Rasio layar tradisional	✅	✅
3:4	768×1024	Poster vertikal	✅	✅
3:2	1024×683	Rasio foto umum	✅	✅
2:3	683×1024	Foto vertikal	✅	✅
4:5	1024×1280	Rekomendasi Instagram	✅	✅
5:4	1024×819	Mendekati persegi	✅	✅
21:9	1024×439	Layar ultra-lebar	✅	✅
4:1	1024×256	Spanduk ultra-lebar	✅	❌
1:4	256×1024	Spanduk vertikal ultra-sempit	✅	❌
8:1	1024×128	Spanduk sangat lebar	✅	❌
1:8	128×1024	Spanduk sangat sempit	✅	❌

💡 Penjelasan Rasio Baru: Rasio ekstrem 4:1, 1:4, 8:1, 1:8 yang baru ditambahkan di Nano Banana 2 cocok untuk skenario khusus seperti membuat banner situs web, infografis memanjang, dan gambar samping. Semua rasio dapat langsung digunakan melalui platform APIYI apiyi.com.

6 Cara Mengatasi Error Batas Token 65536 pada Nano Banana 2

6 Cara Mengatasi Kesalahan 65536 Token Diurutkan berdasarkan efek dan rekomendasi · Kombinasi penggunaan memberikan hasil terbaik

Metode Penghematan token Kesulitan Rekomendasi Satu kalimat penjelasan

① Turunkan media_resolution TINGGI→SEDANG atau RENDAH 50%-75% ↓ Sederhana ★★★★★ Perubahan satu baris parameter

② Pangkas ukuran gambar masukan Praproses hingga ≤384px 75%+ ↓ Sederhana ★★★★★ Tetapkan 258 token

③ Kurangi jumlah gambar referensi 14 lembar→3-5 lembar Linearitas ↓ Sederhana ★★★★ Hanya unggah gambar yang diperlukan

④ Pisahkan permintaan Pemrosesan batch multi-gambar/PDF panjang Melewati batasan Sedang ★★★★ Perlu modifikasi kode

⑤ Menggunakan Files API Ganti base64 sebaris ~33% turun Sedang ★★★ Mengurangi pembengkakan badan permintaan

⑥ Sederhanakan petunjuk teks 500 kata→100 kata ~600 Sederhana ★★★ Ekspresi yang disempurnakan lebih efektif

Rekomendasi kombinasi: ① + ② + ③ digunakan secara bersamaan · Sumber data: Tim teknis APIYI apiyi.com

Ketika Anda menemui error The input token count exceeds the maximum number of tokens allowed (65536), berikut adalah 6 cara yang dapat membantu Anda mengatasinya:

Metode Satu: Turunkan Parameter `media_resolution` (Direkomendasikan)

Efek: Konsumsi Token berkurang 50%-75%

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # APIYI unified interface
)

# Kurangi konsumsi Token dengan menurunkan resolusi gambar input
# HIGH (default) = 1.120 token/gambar
# MEDIUM = 560 token/gambar (berkurang 50%)
# LOW = 280 token/gambar (berkurang 75%)

Lihat Contoh Pengaturan `media_resolution` pada Gemini Native API

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Tentukan resolusi saat mengunggah gambar
image = genai.upload_file("input.jpg")

response = model.generate_content(
    contents=[
        "Edit this image to add a sunset background",
        image
    ],
    generation_config={
        "response_modalities": ["IMAGE", "TEXT"],
        "media_resolution": "MEDIUM"  # Turunkan dari HIGH ke MEDIUM
    }
)

# MEDIUM: 560 token/gambar (dibandingkan HIGH: 1.120 token/gambar)
# 14 gambar: 7.840 token (dibandingkan 15.680 token)

Metode Dua: Perkecil Ukuran Gambar Input

Efek: Kompresi maksimal hingga 258 token/gambar

Sebelum mengirim ke API, perkecil gambar referensi hingga di bawah 384×384:

from PIL import Image

def optimize_for_token(img_path, max_size=384):
    """Mengecilkan gambar hingga di bawah 384px, konsumsi Token tetap 258"""
    img = Image.open(img_path)
    img.thumbnail((max_size, max_size), Image.LANCZOS)
    optimized_path = img_path.replace(".", "_optimized.")
    img.save(optimized_path, quality=85)
    return optimized_path

# Sebelum optimasi: 1024x1024 = 1.032 token
# Setelah optimasi: 384x384 = 258 token (hemat 75%)

Metode Tiga: Kurangi Jumlah Gambar Referensi

Efek: Pengurangan konsumsi Token secara linear

Nano Banana 2 mendukung hingga 14 gambar input, tetapi sebagian besar skenario tidak memerlukan sebanyak itu:

Jumlah Gambar Referensi	Konsumsi Token (HIGH)	Konsumsi Token (MEDIUM)	Konsumsi Token (Setelah Optimasi 384px)
1 Gambar	1.120	560	258
3 Gambar	3.360	1.680	774
7 Gambar	7.840	3.920	1.806
14 Gambar	15.680	7.840	3.612

Saran: Hanya masukkan gambar referensi yang benar-benar diperlukan. Untuk skenario konsistensi wajah, biasanya 2-3 gambar sudah cukup, tidak perlu 14 gambar.

Metode Empat: Pisahkan Permintaan

Efek: Melewati batasan permintaan tunggal

Jika Anda perlu memproses banyak gambar atau PDF panjang, pisahkan permintaan menjadi beberapa permintaan kecil:

def split_process(images, prompt, batch_size=3):
    """Memisahkan permintaan multi-gambar menjadi batch kecil"""
    results = []
    for i in range(0, len(images), batch_size):
        batch = images[i:i+batch_size]
        response = client.images.generate(
            model="nano-banana-2",
            prompt=prompt,
            # Hanya masukkan gambar sejumlah batch_size setiap kali
        )
        results.append(response)
    return results

Metode Lima: Gunakan Files API sebagai Pengganti Base64 Inline

Efek: Menghindari ukuran payload permintaan yang terlalu besar, dapat mengunggah file lebih besar

Encoding base64 inline dapat membuat ukuran payload permintaan membengkak sekitar 33%. Menggunakan Files API memungkinkan Anda mengunggah file terlebih dahulu untuk mendapatkan referensi, lalu menggunakannya dalam permintaan:

# Unggah gambar besar menggunakan Files API (mendukung 20-100MB)
file = genai.upload_file("large_image.png")

# Referensikan dalam permintaan, bukan inline
response = model.generate_content([
    "Based on this reference, generate a similar style image",
    file  # Referensi bukan base64
])

Metode Enam: Sederhanakan Petunjuk Teks

Efek: Membebaskan lebih banyak Token untuk gambar

Jangan abaikan bahwa petunjuk teks juga mengonsumsi Token. Petunjuk yang terlalu panjang akan menghabiskan anggaran Token yang berharga:

❌ Deskripsi detail 500 kata → ~750 token
✅ Petunjuk ringkas 100 kata → ~150 token
Hemat: ~600 token, setara dengan menambahkan satu gambar resolusi MEDIUM

🎯 Saran Komprehensif: Dalam pengembangan nyata, kami merekomendasikan kombinasi penggunaan Metode Satu + Metode Dua + Metode Tiga. Saat memanggil Nano Banana 2 melalui platform APIYI apiyi.com, atur media_resolution ke MEDIUM, pra-proses gambar input hingga 384px, dan hanya masukkan gambar referensi yang diperlukan. Dengan begitu, konsumsi Token dapat dikendalikan di bawah 5.000, jauh dari batasan 65.536.

Perbandingan Batasan Token Nano Banana 2 dengan Model Lain

Model	Batasan Token Input	Batasan Token Output	Token Gambar Output	Harga/Gambar (1K)
Gemini 3 Flash (Teks)	1,048,576	65,536	—	—
Nano Banana Pro	~200,000	32,768	~1,120	$0.134
Nano Banana 2	65,536-131,072	32,768	~1,120	$0.067 (Resmi)
Nano Banana 2 (APIYI)	65,536-131,072	32,768	~1,120	$0.03
Gemini 2.5 Flash Image	—	1,290/Gambar	1,290 Tetap	$0.039
Imagen 4 Fast	—	—	—	$0.020

Perbedaan Utama:

Batasan Token input Nano Banana 2 jauh lebih kecil daripada Gemini 3 Flash (teks saja) (65K vs 1M). Ini adalah batasan arsitektur pembuatan gambar.
Batasan input Nano Banana Pro (~200K) lebih tinggi daripada Nano Banana 2, cocok untuk pengeditan kompleks yang membutuhkan banyak jendela konteks.
Gemini 2.5 Flash Image menggunakan model sederhana dengan Token tetap per gambar, tanpa perhitungan Token yang rumit.

Pertanyaan Umum

Q1: Mengapa dokumentasi resmi menyebut 131,072, tetapi API melaporkan kesalahan 65,536?

Ini adalah perbedaan kebijakan platform. Dokumentasi Firebase AI Logic menunjukkan 65,536, sementara dokumentasi Vertex AI / Google AI menunjukkan 131,072. Kedua angka ini "benar", tergantung pada platform mana yang Anda gunakan untuk pemanggilan model. Selama fase pratinjau, disarankan untuk merencanakan Token input berdasarkan 65,536 untuk memastikan fungsionalitas di semua platform. Pemanggilan model melalui platform APIYI (apii.com) akan secara otomatis mengoptimalkan rute.

Q2: Bagaimana cara cepat menghitung berapa banyak Token yang akan dikonsumsi oleh permintaan saya?

Rumus sederhana: Total Token Input ≈ Token Teks + Jumlah Gambar × Token per Gambar. Untuk teks, sekitar 1 Token per 4 karakter bahasa Inggris, dan sekitar 1-2 karakter bahasa Mandarin per 1 Token. Token gambar tergantung pada media_resolution: LOW=280, MEDIUM=560, HIGH=1120. Contoh: petunjuk 200 karakter Mandarin (~300 Token) + 5 gambar MEDIUM (2,800 Token) ≈ 3,100 Token, yang masih jauh di bawah batas 65,536.

Q3: Berapa halaman PDF yang didukung sebagai input maksimal?

Dihitung dengan resolusi HIGH (default), setiap halaman mengonsumsi sekitar 1,120 Token. Dengan batas 65,536, maksimal sekitar 58 halaman. Jika diturunkan ke MEDIUM, setiap halaman 560 Token, dapat mendukung sekitar 117 halaman. Disarankan untuk hanya memasukkan halaman yang benar-benar perlu dijadikan gambar referensi. Saat pemanggilan model melalui APIYI (apii.com), penggunaan Token akan ditampilkan secara rinci dalam log pemanggilan.

Q4: Apakah gambar besar akan otomatis diskalakan saat diinput?

Ya. Gambar yang melebihi 3072×3072 piksel akan secara otomatis diskalakan secara proporsional hingga di bawah 3072×3072. Namun, setelah diskalakan, Token akan tetap dihitung berdasarkan ukuran aslinya. Disarankan untuk secara manual mengecilkan gambar menjadi 384×384 (hanya membutuhkan 258 Token) atau 768×768 (hanya membutuhkan 258 Token) sebelum mengirim, untuk mendapatkan efisiensi Token yang optimal.

Q5: Nano Banana 2 atau Pro, mana yang memiliki batasan input lebih besar?

Batasan Token input Nano Banana Pro (~200,000) sekitar 1.5-3 kali lebih besar dari Nano Banana 2 (65,536-131,072). Jika skenario penggunaan Anda membutuhkan banyak gambar referensi atau PDF panjang, Nano Banana Pro lebih cocok. Namun, untuk sebagian besar skenario teks ke gambar standar dan gambar ke gambar sederhana, batasan input Nano Banana 2 sudah lebih dari cukup, dengan harga setengahnya dan kecepatan 2-3 kali lebih cepat. Platform APIYI (apii.com) mendukung keduanya, dan Anda bisa beralih kapan saja.

Ringkasan

Batasan Token Nano Banana 2 bukanlah masalah, melainkan mekanisme yang perlu dipahami. Dengan menguasai poin-poin berikut, Anda bisa mengelolanya dengan mudah:

Batas input 65.536-131.072 — Merencanakan dengan 65.536 adalah yang paling aman
Perhitungan Token gambar — Gambar kecil 258 tetap, gambar besar dibagi per blok 768×768
media_resolution adalah cara penyesuaian yang paling efektif — HIGH→MEDIUM langsung mengurangi 50%
Batas output 32.768 — Maksimal 43 gambar 512px atau 13 gambar 4K per panggilan
6 metode solusi — Penggunaan kombinasi memberikan hasil terbaik

Disarankan untuk memanggil Nano Banana 2 melalui platform APIYI apiyi.com, untuk menikmati kemampuan model secara penuh dengan harga $0.03/gambar. Platform ini menyediakan statistik penggunaan Token yang detail, membantu Anda mengoptimalkan setiap pemanggilan dengan tepat.

📝 Penulis: Tim APIYI | Tim Teknis APIYI
🔗 Diskusi Teknis: Kunjungi apiyi.com untuk panduan integrasi lengkap Nano Banana 2
📅 Tanggal Pembaruan: 27 Februari 2026