Mengatasi batas ukuran input Nano Banana 2: Rumus perhitungan Token dan 6 metode perbaikan kesalahan 65536

Saat menggunakan Nano Banana 2 untuk pembuatan gambar, Anda mungkin pernah menemui error ini: The input token count exceeds the maximum number of tokens allowed (65536). Ini adalah salah satu kebingungan paling umum yang dialami developer saat memanggil API pembuatan gambar Gemini — kartu model resmi jelas-jelas menuliskan batas token input 131.072, lalu mengapa batas sebenarnya adalah 65.536?

Nilai Inti: Setelah membaca artikel ini, Anda akan sepenuhnya memahami batasan Token input dan output Nano Banana 2, rumus perhitungan Token gambar yang akurat, serta 6 metode praktis untuk mengatasi error 65536.

nano-banana-2-input-size-token-limit-specs-guide-id 图示


Spesifikasi Model Nano Banana 2: Tabel Parameter Lengkap

ID model dasar Nano Banana 2 adalah gemini-3.1-flash-image-preview. Berikut adalah spesifikasi lengkap yang diambil dari kartu model resmi:

Parameter Nilai Keterangan
Kode Model gemini-3.1-flash-image-preview Parameter model yang digunakan saat pemanggilan API
Tipe Input Teks / Gambar / PDF Mendukung file teks, gambar, dan PDF
Tipe Output Gambar / Teks Dapat menghasilkan gambar atau teks
Batas Token Input 65.536 ~ 131.072 Bervariasi tergantung platform (lihat di bawah)
Batas Token Output 32.768 Termasuk Token gambar dan teks
Gambar Input Maksimal 14 Gambar (10 objek + 4 karakter) Dalam satu permintaan
Resolusi Output Maksimal 4096×4096 (4K) Mendukung berbagai rasio aspek
Batas Gambar Input 3072×3072 px Otomatis diskalakan jika melebihi

Matriks Dukungan Fitur Nano Banana 2

Fitur Status Dukungan Keterangan
Pembuatan gambar ✅ Didukung Kemampuan inti
API Batch ✅ Didukung Pemrosesan batch, diskon 50%
Pencarian yang ditingkatkan ✅ Didukung Pembuatan yang ditingkatkan pencarian
Berpikir ✅ Didukung Tingkat inferensi yang dapat disesuaikan
Pembuatan Audio ❌ Tidak didukung
Cache ❌ Tidak didukung Tidak dapat melakukan cache konteks
Eksekusi Kode ❌ Tidak didukung
Pencarian File ❌ Tidak didukung
Pemanggilan Fungsi ❌ Tidak didukung
Google Maps ❌ Tidak didukung
API Langsung ❌ Tidak didukung
Output Terstruktur ❌ Tidak didukung
Konteks URL ❌ Tidak didukung

🎯 Peringatan Penting: Nano Banana 2 tidak mendukung Caching (cache konteks), yang berarti setiap permintaan perlu mengirim ulang seluruh konten input. Untuk skenario yang melibatkan banyak gambar referensi, ini akan secara signifikan meningkatkan konsumsi Token. Saat melakukan pemanggilan model melalui platform APIYI apiyi.com, disarankan untuk mengoptimalkan konten input guna mengontrol penggunaan Token di setiap permintaan.


Masalah Utama Batasan Token Nano Banana 2: 65536 atau 131072?

nano-banana-2-input-size-token-limit-specs-guide-id 图示

Ini adalah pertanyaan yang paling membingungkan bagi developer: Dokumentasi resmi menyebutkan 131.072, tetapi API mengembalikan error yang menyatakan batas atasnya adalah 65.536.

Faktanya: Perbedaan Kebijakan Platform, Bukan Perbedaan Kemampuan Model

Sumber Dokumentasi Batas Token Input Batas Token Output
Firebase AI Logic 65,536 32,768
Google AI Studio / Gemini API 131,072 32,768
Vertex AI 131,072 32,768
Gemini 3 Flash (versi teks) 1,048,576 65,536

Mengapa ada perbedaan?

Sebagai model pembuatan gambar, Nano Banana 2 perlu mengalokasikan banyak sumber daya komputasi untuk proses sintesis gambar (diffusion head). Berbeda dengan model teks murni yang dapat menggunakan seluruh kapasitas jendela konteks untuk memahami input, model pembuatan gambar perlu mempertahankan pipeline generatif secara bersamaan.

  • Firebase AI Logic menggunakan batasan 65.536 yang lebih konservatif, kemungkinan mempertimbangkan stabilitas untuk perangkat seluler dan edge.
  • Vertex AI / Google AI menyediakan batasan 131.072 penuh, ditujukan untuk pengembangan sisi server dan cloud.

Dampak Sebenarnya: Jika kamu memanggil melalui Gemini API standar dan menerima error 65.536, kemungkinan penyebabnya adalah:

  1. Versi SDK yang kamu gunakan secara default melewati jalur Firebase.
  2. Batasan platform pada tahap pratinjau belum diseragamkan.
  3. Batasan kuota untuk wilayah atau tingkatan tertentu.

💡 Saran Berdasarkan Pengujian: Saat memanggil Nano Banana 2 melalui platform APIYI apiyi.com, disarankan untuk menjaga input token di bawah 65.536. Dengan begitu, batasan tidak akan terpicu, tidak peduli platform mana yang digunakan di bawahnya. Platform APIYI akan secara otomatis memilih jalur pemanggilan yang optimal.


Formula Perhitungan Token Gambar Input Nano Banana 2

Memahami bagaimana gambar diubah menjadi token adalah kunci untuk mengatasi masalah ukuran input. Gemini menggunakan strategi pembagian blok (Tiling) untuk menghitung konsumsi token gambar.

Aturan Perhitungan Dasar

Aturan Satu: Gambar Kecil (Kedua sisi ≤ 384px)

Token 消耗 = 258 tokens (nilai tetap)

Gambar apa pun yang kedua sisinya tidak melebihi 384 piksel, terlepas dari ukuran sebenarnya, akan selalu mengonsumsi 258 token. Ini adalah pilihan yang paling ekonomis.

Aturan Dua: Gambar Besar (Salah satu sisi > 384px)

Token 消耗 = ceil(width ÷ 768) × ceil(height ÷ 768) × 258

Gambar besar akan dibagi menjadi blok (Tile) berukuran 768×768, dan setiap blok mengonsumsi 258 token.

Tabel Cepat Konsumsi Token untuk Ukuran Gambar Umum

Ukuran Gambar Perhitungan Blok Konsumsi Token Keterangan
256×256 1×1 258 Nilai tetap untuk gambar kecil
384×384 1×1 258 Batas atas gambar kecil
512×512 1×1 258 Masih dalam satu blok
768×768 1×1 258 Tepat satu blok
1024×1024 2×2 1,032 Ukuran input umum
1920×1080 3×2 1,548 Gambar Full HD
2048×2048 3×3 2,322 Gambar 2K
3072×3072 4×4 4,128 Resolusi input maksimum
4096×4096 Otomatis diskalakan ke 3072 Penanganan otomatis jika melebihi batas

Kontrol Parameter media_resolution

Model seri Gemini 3 mendukung parameter media_resolution yang dapat mengontrol konsumsi token setiap gambar input secara presisi:

Nilai Parameter Token/Gambar (Gemini 3) Token/Gambar (Gemini 2.5) Skenario Penggunaan
LOW 280 64 Pratinjau cepat, tidak butuh detail
MEDIUM 560 256 Referensi umum
HIGH (Default) 1,120 256 + Pan&Scan (~2,048) Membutuhkan analisis detail
ULTRA_HIGH 2,240 Akurasi tertinggi

Penemuan Penting: Pengaturan HIGH default mengonsumsi 1.120 token per gambar. Jika kamu mengirimkan 14 gambar referensi (batas Nano Banana 2) dalam satu permintaan, gambar saja sudah mengonsumsi 15.680 token — ditambah petunjuk teks, sangat mudah mendekati batasan 65.536.


Detail Konsumsi Token Output Nano Banana 2

Output juga memiliki batasan Token: 32.768 Token. Setiap gambar yang dihasilkan akan mengonsumsi jumlah Token output yang berbeda tergantung pada resolusinya:

Resolusi Output Konsumsi Token Harga per Gambar (Resmi) Harga per Gambar (APIYI)
512px ~747 tokens $0.045 ~$0.02
1K (1024×1024) ~1.120 tokens $0.067 $0.03
2K (2048×2048) ~1.680 tokens $0.101 ~$0.04
4K (4096×4096) ~2.520 tokens $0.151 ~$0.06

Jumlah Output Maksimum per Permintaan

Berdasarkan batas atas Token output 32.768:

Resolusi Output Token per Gambar Jumlah Gambar Output Maksimum Keterangan
512px 747 ~43 Gambar Cocok untuk thumbnail massal
1K 1.120 ~29 Gambar Pembuatan massal standar
2K 1.680 ~19 Gambar Massal resolusi tinggi
4K 2.520 ~13 Gambar Massal format besar

🚀 Saran Pembuatan Massal: Jika kamu perlu membuat banyak gambar, disarankan untuk menggunakan Batch API (diskon harga 50%) daripada memasukkan banyak gambar dalam satu permintaan. Melalui platform APIYI apiyi.com, pemanggilan Batch API didukung, dan setiap gambar 1K hanya membutuhkan sekitar $0.015.


Detail Format dan Batasan Input Nano Banana 2

Format Gambar Input yang Didukung

Format Dukungan Keterangan
PNG Direkomendasikan, kualitas lossless
JPEG Direkomendasikan, ukuran file kecil
WebP Format modern, menyeimbangkan kualitas dan ukuran
HEIC Format asli iOS
HEIF Format gambar efisien
GIF Tidak mendukung gambar bergerak (GIF)
BMP Tidak didukung
TIFF Tidak didukung

Batasan Ukuran File

Metode Unggah Batas Ukuran Skenario Penggunaan
Inline (base64) 7 MB Langsung dimasukkan oleh SDK
Files API 20 MB → 100 MB Unggah file besar
Cloud Storage 30 MB Penyimpanan Google Cloud
Total Permintaan 500 MB Termasuk semua konten

Batasan Resolusi Gambar Input

  • Resolusi input maksimum: 3072×3072 piksel
  • Gambar yang melebihi resolusi ini akan secara otomatis diskalakan secara proporsional hingga 3072×3072
  • Rasio aspek akan tetap terjaga setelah penskalaan

Dukungan Input PDF

Nano Banana 2 mendukung PDF sebagai input, tetapi perlu diperhatikan konsumsi Token:

  • Setiap halaman PDF diperlakukan sebagai gambar, dan mengonsumsi Token yang sama dengan gambar
  • Pada resolusi HIGH (default), setiap halaman mengonsumsi sekitar 1.120 Token
  • Dengan batas atas 65.536 Token, maksimal sekitar 58 halaman PDF dapat didukung
  • Saran: Hanya masukkan halaman yang diperlukan, jangan masukkan seluruh dokumen

Rasio Aspek yang Didukung Nano Banana 2

Nano Banana 2 menambahkan beberapa rasio aspek ekstrem baru dibandingkan dengan Nano Banana Pro:

Rasio Aspek Contoh Ukuran (1K) Skenario Penggunaan Nano Banana 2 Nano Banana Pro
1:1 1024×1024 Avatar media sosial, gambar produk
16:9 1024×576 Sampul video, spanduk
9:16 576×1024 Wallpaper ponsel, Stories
4:3 1024×768 Rasio layar tradisional
3:4 768×1024 Poster vertikal
3:2 1024×683 Rasio foto umum
2:3 683×1024 Foto vertikal
4:5 1024×1280 Rekomendasi Instagram
5:4 1024×819 Mendekati persegi
21:9 1024×439 Layar ultra-lebar
4:1 1024×256 Spanduk ultra-lebar
1:4 256×1024 Spanduk vertikal ultra-sempit
8:1 1024×128 Spanduk sangat lebar
1:8 128×1024 Spanduk sangat sempit

💡 Penjelasan Rasio Baru: Rasio ekstrem 4:1, 1:4, 8:1, 1:8 yang baru ditambahkan di Nano Banana 2 cocok untuk skenario khusus seperti membuat banner situs web, infografis memanjang, dan gambar samping. Semua rasio dapat langsung digunakan melalui platform APIYI apiyi.com.


6 Cara Mengatasi Error Batas Token 65536 pada Nano Banana 2

6 Cara Mengatasi Kesalahan 65536 Token Diurutkan berdasarkan efek dan rekomendasi · Kombinasi penggunaan memberikan hasil terbaik

Metode Penghematan token Kesulitan Rekomendasi Satu kalimat penjelasan

Turunkan media_resolution TINGGI→SEDANG atau RENDAH 50%-75% ↓ Sederhana ★★★★★ Perubahan satu baris parameter

Pangkas ukuran gambar masukan Praproses hingga ≤384px 75%+ ↓ Sederhana ★★★★★ Tetapkan 258 token

Kurangi jumlah gambar referensi 14 lembar→3-5 lembar Linearitas ↓ Sederhana ★★★★ Hanya unggah gambar yang diperlukan

Pisahkan permintaan Pemrosesan batch multi-gambar/PDF panjang Melewati batasan Sedang ★★★★ Perlu modifikasi kode

Menggunakan Files API Ganti base64 sebaris ~33% turun Sedang ★★★ Mengurangi pembengkakan badan permintaan

Sederhanakan petunjuk teks 500 kata→100 kata ~600 Sederhana ★★★ Ekspresi yang disempurnakan lebih efektif

Rekomendasi kombinasi: ① + ② + ③ digunakan secara bersamaan · Sumber data: Tim teknis APIYI apiyi.com

Ketika Anda menemui error The input token count exceeds the maximum number of tokens allowed (65536), berikut adalah 6 cara yang dapat membantu Anda mengatasinya:

Metode Satu: Turunkan Parameter media_resolution (Direkomendasikan)

Efek: Konsumsi Token berkurang 50%-75%

import openai

client = openai.OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.apiyi.com/v1"  # APIYI unified interface
)

# Kurangi konsumsi Token dengan menurunkan resolusi gambar input
# HIGH (default) = 1.120 token/gambar
# MEDIUM = 560 token/gambar (berkurang 50%)
# LOW = 280 token/gambar (berkurang 75%)
Lihat Contoh Pengaturan `media_resolution` pada Gemini Native API
import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

model = genai.GenerativeModel("gemini-3.1-flash-image-preview")

# Tentukan resolusi saat mengunggah gambar
image = genai.upload_file("input.jpg")

response = model.generate_content(
    contents=[
        "Edit this image to add a sunset background",
        image
    ],
    generation_config={
        "response_modalities": ["IMAGE", "TEXT"],
        "media_resolution": "MEDIUM"  # Turunkan dari HIGH ke MEDIUM
    }
)

# MEDIUM: 560 token/gambar (dibandingkan HIGH: 1.120 token/gambar)
# 14 gambar: 7.840 token (dibandingkan 15.680 token)

Metode Dua: Perkecil Ukuran Gambar Input

Efek: Kompresi maksimal hingga 258 token/gambar

Sebelum mengirim ke API, perkecil gambar referensi hingga di bawah 384×384:

from PIL import Image

def optimize_for_token(img_path, max_size=384):
    """Mengecilkan gambar hingga di bawah 384px, konsumsi Token tetap 258"""
    img = Image.open(img_path)
    img.thumbnail((max_size, max_size), Image.LANCZOS)
    optimized_path = img_path.replace(".", "_optimized.")
    img.save(optimized_path, quality=85)
    return optimized_path

# Sebelum optimasi: 1024x1024 = 1.032 token
# Setelah optimasi: 384x384 = 258 token (hemat 75%)

Metode Tiga: Kurangi Jumlah Gambar Referensi

Efek: Pengurangan konsumsi Token secara linear

Nano Banana 2 mendukung hingga 14 gambar input, tetapi sebagian besar skenario tidak memerlukan sebanyak itu:

Jumlah Gambar Referensi Konsumsi Token (HIGH) Konsumsi Token (MEDIUM) Konsumsi Token (Setelah Optimasi 384px)
1 Gambar 1.120 560 258
3 Gambar 3.360 1.680 774
7 Gambar 7.840 3.920 1.806
14 Gambar 15.680 7.840 3.612

Saran: Hanya masukkan gambar referensi yang benar-benar diperlukan. Untuk skenario konsistensi wajah, biasanya 2-3 gambar sudah cukup, tidak perlu 14 gambar.

Metode Empat: Pisahkan Permintaan

Efek: Melewati batasan permintaan tunggal

Jika Anda perlu memproses banyak gambar atau PDF panjang, pisahkan permintaan menjadi beberapa permintaan kecil:

def split_process(images, prompt, batch_size=3):
    """Memisahkan permintaan multi-gambar menjadi batch kecil"""
    results = []
    for i in range(0, len(images), batch_size):
        batch = images[i:i+batch_size]
        response = client.images.generate(
            model="nano-banana-2",
            prompt=prompt,
            # Hanya masukkan gambar sejumlah batch_size setiap kali
        )
        results.append(response)
    return results

Metode Lima: Gunakan Files API sebagai Pengganti Base64 Inline

Efek: Menghindari ukuran payload permintaan yang terlalu besar, dapat mengunggah file lebih besar

Encoding base64 inline dapat membuat ukuran payload permintaan membengkak sekitar 33%. Menggunakan Files API memungkinkan Anda mengunggah file terlebih dahulu untuk mendapatkan referensi, lalu menggunakannya dalam permintaan:

# Unggah gambar besar menggunakan Files API (mendukung 20-100MB)
file = genai.upload_file("large_image.png")

# Referensikan dalam permintaan, bukan inline
response = model.generate_content([
    "Based on this reference, generate a similar style image",
    file  # Referensi bukan base64
])

Metode Enam: Sederhanakan Petunjuk Teks

Efek: Membebaskan lebih banyak Token untuk gambar

Jangan abaikan bahwa petunjuk teks juga mengonsumsi Token. Petunjuk yang terlalu panjang akan menghabiskan anggaran Token yang berharga:

  • ❌ Deskripsi detail 500 kata → ~750 token
  • ✅ Petunjuk ringkas 100 kata → ~150 token
  • Hemat: ~600 token, setara dengan menambahkan satu gambar resolusi MEDIUM

🎯 Saran Komprehensif: Dalam pengembangan nyata, kami merekomendasikan kombinasi penggunaan Metode Satu + Metode Dua + Metode Tiga. Saat memanggil Nano Banana 2 melalui platform APIYI apiyi.com, atur media_resolution ke MEDIUM, pra-proses gambar input hingga 384px, dan hanya masukkan gambar referensi yang diperlukan. Dengan begitu, konsumsi Token dapat dikendalikan di bawah 5.000, jauh dari batasan 65.536.


Perbandingan Batasan Token Nano Banana 2 dengan Model Lain

nano-banana-2-input-size-token-limit-specs-guide-id 图示

Model Batasan Token Input Batasan Token Output Token Gambar Output Harga/Gambar (1K)
Gemini 3 Flash (Teks) 1,048,576 65,536
Nano Banana Pro ~200,000 32,768 ~1,120 $0.134
Nano Banana 2 65,536-131,072 32,768 ~1,120 $0.067 (Resmi)
Nano Banana 2 (APIYI) 65,536-131,072 32,768 ~1,120 $0.03
Gemini 2.5 Flash Image 1,290/Gambar 1,290 Tetap $0.039
Imagen 4 Fast $0.020

Perbedaan Utama:

  1. Batasan Token input Nano Banana 2 jauh lebih kecil daripada Gemini 3 Flash (teks saja) (65K vs 1M). Ini adalah batasan arsitektur pembuatan gambar.
  2. Batasan input Nano Banana Pro (~200K) lebih tinggi daripada Nano Banana 2, cocok untuk pengeditan kompleks yang membutuhkan banyak jendela konteks.
  3. Gemini 2.5 Flash Image menggunakan model sederhana dengan Token tetap per gambar, tanpa perhitungan Token yang rumit.

Pertanyaan Umum

Q1: Mengapa dokumentasi resmi menyebut 131,072, tetapi API melaporkan kesalahan 65,536?

Ini adalah perbedaan kebijakan platform. Dokumentasi Firebase AI Logic menunjukkan 65,536, sementara dokumentasi Vertex AI / Google AI menunjukkan 131,072. Kedua angka ini "benar", tergantung pada platform mana yang Anda gunakan untuk pemanggilan model. Selama fase pratinjau, disarankan untuk merencanakan Token input berdasarkan 65,536 untuk memastikan fungsionalitas di semua platform. Pemanggilan model melalui platform APIYI (apii.com) akan secara otomatis mengoptimalkan rute.

Q2: Bagaimana cara cepat menghitung berapa banyak Token yang akan dikonsumsi oleh permintaan saya?

Rumus sederhana: Total Token Input ≈ Token Teks + Jumlah Gambar × Token per Gambar. Untuk teks, sekitar 1 Token per 4 karakter bahasa Inggris, dan sekitar 1-2 karakter bahasa Mandarin per 1 Token. Token gambar tergantung pada media_resolution: LOW=280, MEDIUM=560, HIGH=1120. Contoh: petunjuk 200 karakter Mandarin (~300 Token) + 5 gambar MEDIUM (2,800 Token) ≈ 3,100 Token, yang masih jauh di bawah batas 65,536.

Q3: Berapa halaman PDF yang didukung sebagai input maksimal?

Dihitung dengan resolusi HIGH (default), setiap halaman mengonsumsi sekitar 1,120 Token. Dengan batas 65,536, maksimal sekitar 58 halaman. Jika diturunkan ke MEDIUM, setiap halaman 560 Token, dapat mendukung sekitar 117 halaman. Disarankan untuk hanya memasukkan halaman yang benar-benar perlu dijadikan gambar referensi. Saat pemanggilan model melalui APIYI (apii.com), penggunaan Token akan ditampilkan secara rinci dalam log pemanggilan.

Q4: Apakah gambar besar akan otomatis diskalakan saat diinput?

Ya. Gambar yang melebihi 3072×3072 piksel akan secara otomatis diskalakan secara proporsional hingga di bawah 3072×3072. Namun, setelah diskalakan, Token akan tetap dihitung berdasarkan ukuran aslinya. Disarankan untuk secara manual mengecilkan gambar menjadi 384×384 (hanya membutuhkan 258 Token) atau 768×768 (hanya membutuhkan 258 Token) sebelum mengirim, untuk mendapatkan efisiensi Token yang optimal.

Q5: Nano Banana 2 atau Pro, mana yang memiliki batasan input lebih besar?

Batasan Token input Nano Banana Pro (~200,000) sekitar 1.5-3 kali lebih besar dari Nano Banana 2 (65,536-131,072). Jika skenario penggunaan Anda membutuhkan banyak gambar referensi atau PDF panjang, Nano Banana Pro lebih cocok. Namun, untuk sebagian besar skenario teks ke gambar standar dan gambar ke gambar sederhana, batasan input Nano Banana 2 sudah lebih dari cukup, dengan harga setengahnya dan kecepatan 2-3 kali lebih cepat. Platform APIYI (apii.com) mendukung keduanya, dan Anda bisa beralih kapan saja.


Ringkasan

Batasan Token Nano Banana 2 bukanlah masalah, melainkan mekanisme yang perlu dipahami. Dengan menguasai poin-poin berikut, Anda bisa mengelolanya dengan mudah:

  1. Batas input 65.536-131.072 — Merencanakan dengan 65.536 adalah yang paling aman
  2. Perhitungan Token gambar — Gambar kecil 258 tetap, gambar besar dibagi per blok 768×768
  3. media_resolution adalah cara penyesuaian yang paling efektif — HIGH→MEDIUM langsung mengurangi 50%
  4. Batas output 32.768 — Maksimal 43 gambar 512px atau 13 gambar 4K per panggilan
  5. 6 metode solusi — Penggunaan kombinasi memberikan hasil terbaik

Disarankan untuk memanggil Nano Banana 2 melalui platform APIYI apiyi.com, untuk menikmati kemampuan model secara penuh dengan harga $0.03/gambar. Platform ini menyediakan statistik penggunaan Token yang detail, membantu Anda mengoptimalkan setiap pemanggilan dengan tepat.


📝 Penulis: Tim APIYI | Tim Teknis APIYI
🔗 Diskusi Teknis: Kunjungi apiyi.com untuk panduan integrasi lengkap Nano Banana 2
📅 Tanggal Pembaruan: 27 Februari 2026

Tinggalkan komentar