gemini-3.1-pro-preview und gemini-3.1-pro-preview-customtools sind zwei Modell-Endpunkte, die Google am selben Tag veröffentlicht hat. Sie haben den gleichen Preis und die gleiche Inferenzleistung, verhalten sich jedoch grundlegend unterschiedlich. In diesem Artikel vergleichen wir die Unterschiede anhand von 6 entscheidenden Dimensionen, um Ihnen bei der richtigen Wahl für Ihre Agent-Entwicklung zu helfen.
Kernbotschaft: Nach der Lektüre dieses Artikels wissen Sie genau, in welchem Szenario Sie die Standard-Version und wann die Customtools-Version einsetzen sollten, um Stolperfallen bei der Entwicklung von KI-Agents zu vermeiden.

Fazit vorab: Wann welche Version nutzen?
Wenn Sie es eilig haben, finden Sie hier die direkte Übersicht:
| Ihr Szenario | Empfehlung | Grund |
|---|---|---|
| Reiner Chat / Q&A | Standard-Version | Stabilste Qualität |
| Textübersetzung / Analyse | Standard-Version | Keine Tool-Aufrufe erforderlich |
| Codegenerierung (ohne Tools) | Standard-Version | Direkte Codeausgabe |
Coding-Assistent (mit Tools wie view_file) |
Customtools-Version | Stellt korrekte Tool-Aufrufe sicher |
| DevOps Agent (Bash + eigene Tools) | Customtools-Version | Verhindert, dass das Modell eigene Tools durch Bash umgeht |
| MCP-Workflows | Customtools-Version | Garantierte Tool-Priorisierung |
| Unsicher? | Erst Standard, bei ignorierten Tools zu Customtools wechseln | Offizielle Empfehlung von Google |
🎯 Originalzitat von Google: "If you are using gemini-3.1-pro-preview and the model ignores your custom tools in favor of bash commands, try the gemini-3.1-pro-preview-customtools model instead."
Unterschied 1: Priorität beim Tool-Aufruf – Der entscheidende Unterschied
Dies ist der einzige wesentliche Unterschied zwischen den beiden Versionen. Wie entscheidet das Modell, wenn es gleichzeitig über die Fähigkeiten „Bash-Ausführung“ und „benutzerdefinierte Tools“ verfügt?
Das Problem der Standardversion: Heimliche Nutzung von Bash
Wenn Sie in der Standardversion ein Tool namens view_file registriert haben, das Modell aber anweisen, eine Datei anzuzeigen:
Benutzer: "Zeige den Inhalt von src/main.py an"
Verhalten der Standardversion: Führt den Bash-Befehl `cat src/main.py` aus ← Ihr Tool wurde übersprungen!
In den Entwicklerdiskussionen auf Hacker News berichteten mehrere Entwickler von ähnlichen Problemen:
- „Das Modell versucht, Dateien auf seltsame Weise zu bearbeiten, anstatt die bereitgestellten Textbearbeitungs-Tools zu verwenden.“
- „Die Fähigkeit zum Tool-Aufruf ist schwächer, es werden oft Umwege genommen.“
- „Es neigt dazu, in Schleifen stecken zu bleiben und kommt nicht voran.“
Die Korrektur in der customtools-Version: Respektiert Ihre Tools
Benutzer: "Zeige den Inhalt von src/main.py an"
Verhalten der customtools-Version: Ruft view_file("src/main.py") auf ← Verwendet Ihr registriertes Tool ✓
| Szenario | Verhalten Standardversion | Verhalten customtools-Version |
|---|---|---|
| Datei anzeigen | cat src/main.py (bash) |
view_file("src/main.py") |
| Code durchsuchen | grep -r "TODO" *.py (bash) |
search_code("TODO", "*.py") |
| Datei bearbeiten | sed -i 's/old/new/' file (bash) |
edit_file(path, old, new) |
| Dateien auflisten | ls -la src/ (bash) |
list_files("src/") |
| Tests ausführen | pytest tests/ (bash) |
run_tests("tests/") |
Unterschied 2: Allgemeine Qualitätsleistung – Standardversion ist stabiler
Google weist in der offiziellen Dokumentation ausdrücklich auf eine wichtige Warnung hin:
"Obwohl gemini-3.1-pro-preview-customtools für agentische Workflows optimiert ist, die benutzerdefinierte Tools und Bash verwenden, kann es bei einigen Anwendungsfällen, die nicht von solchen Tools profitieren, zu Qualitätsschwankungen kommen."
Das bedeutet, dass die customtools-Version in den folgenden Szenarien möglicherweise weniger stabil ist als die Standardversion:
| Szenariotyp | Qualität Standardversion | Qualität customtools-Version | Erläuterung |
|---|---|---|---|
| Reiner Text-Dialog | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | Mögliche geringfügige Schwankungen |
| Schreiben langer Texte | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | Ohne Tools ist die Standardversion besser |
| Mathematisches logisches Denken | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Kernfähigkeit für logisches Denken identisch |
| Codegenerierung (ohne Tools) | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | Standardversion leicht überlegen |
| Agent + benutzerdefinierte Tools | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | customtools deutlich besser |
| Mischung aus Bash + benutzerdefinierten Tools | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Kernvorteil von customtools |
Wichtige Erkenntnis: Die customtools-Version ist kein „stärkeres“ Modell, sondern eine fein abgestimmte Version, die sich „stärker auf Tool-Aufrufe konzentriert“. In Szenarien, die keine Tools beinhalten, ist die Standardversion tatsächlich besser.
💡 Empfehlung zur Auswahl: Wenn mehr als 50 % der Anfragen Ihrer Anwendung keine Tool-Aufrufe beinhalten, empfiehlt es sich, die Standardversion als Standard beizubehalten und nur bei Agent-Workflows auf die customtools-Version umzuschalten. APIYI apiyi.com unterstützt den dynamischen Wechsel des
model-Parameters im Code je nach Szenario.
区别 3: 模型参数和规格 — 完全相同
两个版本在「硬件规格」层面完全一致:
| 规格 | 标准版 | customtools 版 |
|---|---|---|
| 输入上下文 | 1,048,576 tokens | 1,048,576 tokens |
| 最大输出 | 65,536 tokens | 65,536 tokens |
| 输入价格 (≤200K) | $2.00 / 1M tokens | $2.00 / 1M tokens |
| 输入价格 (>200K) | $4.00 / 1M tokens | $4.00 / 1M tokens |
| 输出价格 (≤200K) | $12.00 / 1M tokens | $12.00 / 1M tokens |
| 输出价格 (>200K) | $18.00 / 1M tokens | $18.00 / 1M tokens |
| 上下文缓存 | $0.20-$0.40 / 1M | $0.20-$0.40 / 1M |
| ARC-AGI-2 | 77.1% | 相同 (未单独发布) |
| SWE-Bench | 80.6% | 相同 (未单独发布) |
| GPQA Diamond | 94.3% | 相同 (未单独发布) |
| 思考系统 | Low / Medium / High | Low / Medium / High |
| 多模态输入 | 文本/图片/音频/视频 | 文本/图片/音频/视频 |
重点: 谷歌没有为 customtools 版单独发布基准测试数据,因为底层模型是同一个。差异仅在于工具调用行为的调优。
区别 4: API 调用方式 — 仅 model 参数不同

代码示例: 一键切换标准版和 customtools 版
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # APIYI 统一接口
)
# 定义自定义工具
tools = [{
"type": "function",
"function": {
"name": "view_file",
"description": "查看指定文件的内容",
"parameters": {
"type": "object",
"properties": {
"file_path": {"type": "string", "description": "文件路径"}
},
"required": ["file_path"]
}
}
}]
# 标准版: 可能跳过工具
resp_standard = client.chat.completions.create(
model="gemini-3.1-pro-preview",
messages=[{"role": "user", "content": "查看 src/main.py"}],
tools=tools
)
# customtools 版: 优先使用工具
resp_custom = client.chat.completions.create(
model="gemini-3.1-pro-preview-customtools",
messages=[{"role": "user", "content": "查看 src/main.py"}],
tools=tools
)
# 对比行为差异
print("标准版:", resp_standard.choices[0].message)
print("customtools:", resp_custom.choices[0].message)
Unterschied 5: Praktische Entwicklererfahrung — Community-Feedback
Entwickler-Feedback auf Hacker News und GitHub zeigt die Schwachstellen der Standardversion in Agent-Szenarien auf:
Probleme der Standardversion in Agent-Szenarien
Entwickler-Feedback aus Hacker News-Diskussionen:
| Problembeschreibung | Ursachenanalyse | Kann customtools das lösen? |
|---|---|---|
| „Das Modell versucht, Dateien auf seltsame Weise zu bearbeiten, anstatt die bereitgestellten Textbearbeitungswerkzeuge zu nutzen“ | Standardversion bevorzugt bash | Lösbar — Priorisiert benutzerdefinierte Tools |
| „Schwache Tool-Aufruffähigkeiten, macht oft Umwege“ | Niedrige Tool-Priorität | Lösbar — Erhöht die Tool-Priorität |
| „Gerät leicht in Schleifen und kommt nicht voran“ | Verwirrung beim Wechsel zwischen Tools und bash | Teilweise lösbar — Klarere Tool-Pfade |
| „Verbraucht massenhaft Thinking-Token für unsinnige Aktionen“ | Konflikt zwischen Modell-Reasoning und Tool-Auswahl | Teilweise lösbar — Tool-Auswahl ist deterministischer |
| „Man muss ihm ständig sagen, es solle weitermachen oder fertigstellen“ | Problem im Haupt-Loop des Agents | Nicht lösbar — Dies ist ein allgemeines Modellproblem |
Die Praxis bei GitHub Copilot
Das GitHub Copilot-Team stellte bei der Integration von Gemini 3.1 Pro fest:
„Das Modell glänzt im Edit-then-Test-Zyklus mit hoher Tool-Präzision und erreicht Ziele mit weniger Tool-Aufrufen.“
Dies zeigt, dass die Agent-Fähigkeiten von Gemini 3.1 Pro in einem korrekten Tool-Calling-Framework sehr stark sind. Die customtools-Version wurde genau dafür entwickelt, diese „hohe Tool-Präzision“ zuverlässiger auszulösen.
🚀 Praxistipp: Wenn Sie Coding-Assistenten entwickeln, empfehlen wir, direkt mit der customtools-Version zu starten, um das Problem des Überspringens von Tools in der Standardversion zu vermeiden. Über APIYI (apiyi.com) lässt sich dies schnell bereitstellen und testen.
Unterschied 6: Geeignete Agent-Frameworks und Coding-Tools
| Tool/Framework | Empfohlene Version | Grund |
|---|---|---|
| Eigenentwickelte Agents (mit benutzerdefinierten Tools) | customtools | Stellt sicher, dass Tools korrekt aufgerufen werden |
| Claude Code-ähnliche Produkte | customtools | Benötigt Tools wie view_file, edit_file usw. |
| Cursor | customtools | IDE-Toolsets benötigen Prioritätsgarantien |
| GitHub Copilot | Bereits integriert | Copilot hat den Tool-Aufruf selbst optimiert |
| LangChain Agent | customtools | Vom Framework registrierte Tools müssen priorisiert aufgerufen werden |
| MCP-Protokoll Agent | customtools | MCP-Tools benötigen Priorität |
| Reine RAG-Anwendungen | Standardversion | Normalerweise keine Konflikte zwischen bash und Tools |
| Chat-Anwendungen | Standardversion | Keine Tool-Aufrufe involviert |
| Content-Generierungs-API | Standardversion | Reine Textausgabe |
Wie Sie entscheiden, ob Sie von der Standardversion zur customtools-Version wechseln sollten

Schnelle Diagnose-Checkliste
Wenn Sie bei der Verwendung der Standardversion auf folgende Situationen stoßen, sollten Sie zur customtools-Version wechseln:
- Das Modell führt
cataus, anstatt Ihrview_fileaufzurufen. - Das Modell führt
grepaus, anstatt Ihrsearch_codeaufzurufen. - Das Modell führt
sedaus, anstatt Ihredit_fileaufzurufen. - In den Tool-Aufruf-Logs erscheinen häufig Bash-Befehle.
- Die Tool-Aufrufrate des Modells liegt unter den Erwartungen (weniger als 50 %).
- Das Modell scheint „nicht zu wissen“, dass benutzerdefinierte Tools verfügbar sind.
Wenn mehr als 2 Punkte zutreffen, empfehlen wir den sofortigen Wechsel zu gemini-3.1-pro-preview-customtools.
Fortgeschritten: Dynamisches Umschalten zwischen beiden Versionen im Code
Die beste Praxis ist kein „Entweder-oder“, sondern ein dynamisches Routing basierend auf dem Anfragetyp:
import openai
client = openai.OpenAI(
api_key="YOUR_API_KEY",
base_url="https://api.apiyi.com/v1" # APIYI einheitliche Schnittstelle
)
def smart_route(messages, tools=None):
"""Wählt die Modellversion dynamisch aus, je nachdem, ob Tools benötigt werden"""
if tools and len(tools) > 0:
# Benutzerdefinierte Tools vorhanden -> customtools-Version nutzen, um Tool-Aufrufe sicherzustellen
model = "gemini-3.1-pro-preview-customtools"
else:
# Reiner Chat/Reasoning -> Standardversion für stabile Qualität nutzen
model = "gemini-3.1-pro-preview"
return client.chat.completions.create(
model=model,
messages=messages,
tools=tools
)
# Szenario 1: Reines Reasoning -> Wählt automatisch die Standardversion
resp1 = smart_route(
messages=[{"role": "user", "content": "Erkläre das Prinzip der Quantenverschränkung"}]
)
# Szenario 2: Agent-Workflow -> Wählt automatisch die customtools-Version
tools = [{"type": "function", "function": {
"name": "view_file",
"description": "Datei anzeigen",
"parameters": {"type": "object", "properties": {
"path": {"type": "string"}
}, "required": ["path"]}
}}]
resp2 = smart_route(
messages=[{"role": "user", "content": "Zeige config.py an"}],
tools=tools
)
💰 Kostentipp: Beide Versionen kosten exakt gleich viel. Dynamisches Routing verursacht keine zusätzlichen Kosten. Über die einheitliche Schnittstelle von APIYI (apiyi.com) ist der Modellwechsel so einfach wie das Ändern eines Strings.
Häufig gestellte Fragen
Q1: Wird die customtools-Version teurer sein?
Nein. Die Preise für beide Versionen sind absolut identisch: Input $2,00 / 1M Tokens, Output $12,00 / 1M Tokens. Über die Plattform APIYI (apiyi.com) können beide Versionen mit demselben API-Key genutzt werden.
Q2: Ich nutze nur Function Calling, habe aber keine Bash-Ausführungsberechtigungen vergeben. Benötige ich die customtools-Version?
Normalerweise nicht. Die customtools-Version löst primär das Problem, dass das Modell Bash bevorzugt, wenn sowohl Bash als auch benutzerdefinierte Tools gleichzeitig vorhanden sind. Wenn Ihr Agent keine Bash-Ausführungsfähigkeiten besitzt, ist der Tool-Aufruf der Standardversion bereits zuverlässig genug.
Q3: Was genau bedeutet die „Qualitätsschwankung“ der customtools-Version?
Google hat keine spezifischen Daten veröffentlicht. Basierend auf Entwickler-Feedback zeigt sich dies vor allem in Szenarien ohne Tools, wie reinen Dialogen oder der Generierung langer Texte, wo die Konsistenz der Ausgabe und der Schreibstil leicht schwanken können. Für Tool-intensive Agent-Szenarien ist die Gesamtqualität der customtools-Version hingegen tendenziell besser.
Q4: Kann ich beide Versionen gleichzeitig nutzen?
Natürlich. Es wird empfohlen, im Code ein dynamisches Routing basierend auf dem Anfragetyp zu implementieren: Anfragen mit Tool-Aufrufen gehen an die customtools-Version, reine Textanfragen an die Standardversion. Über die einheitliche Schnittstelle von APIYI (apiyi.com) müssen Sie lediglich den model-Parameter ändern.
Fazit: Standard- vs. Customtools-Version – 6-Punkte-Vergleich im Überblick
| # | Vergleichsdimension | Standardversion | customtools-Version | Empfehlung |
|---|---|---|---|---|
| 1 | Tool-Priorität | Bevorzugt evtl. Bash | Bevorzugt benutzerdefinierte Tools | Agenten nutzen customtools |
| 2 | Allgemeine Qualität | Ausgewogen in allen Szenarien | Leichte Schwankungen in Szenarien ohne Tools | Standardversion für allgemeine Aufgaben |
| 3 | Spezifikationen/Preis | Absolut identisch | Absolut identisch | Kein Kostenunterschied |
| 4 | API-Aufruf | Nur model-Parameter unterscheidet sich |
Nur model-Parameter unterscheidet sich |
Wechsel mit einem Klick |
| 5 | Community-Feedback | Tool-Aufrufe teils unzuverlässig | Tool-Aufrufe zuverlässiger | customtools für Agent-Szenarien wählen |
| 6 | Geeignete Frameworks | Chat/RAG/Reine Inferenz | Cursor/Claude Code/MCP | Abhängig vom Anwendungstyp |
Fazit in einem Satz: customtools ist kein Upgrade, sondern eine Spezialversion — dasselbe Gehirn, aber eine andere Strategie bei der Tool-Auswahl. Nutzen Sie customtools für die Entwicklung von Agenten und die Standardversion für andere Szenarien. Beide Versionen lassen sich über APIYI (apiyi.com) mit demselben API-Key flexibel wechseln.
Entscheidungshilfe auf einen Blick
| Ihre Situation | Antwort |
|---|---|
| Ich erstelle nur Dialog-Anwendungen | Standardversion nutzen |
| Ich entwickle einen Agenten | customtools-Version nutzen |
| Welche Version ist stärker? | Die Inferenzleistung ist identisch, customtools ist bei Tool-Aufrufen zuverlässiger |
| Muss ich für den Wechsel den Code ändern? | Nur den model-Parameter anpassen, der restliche Code bleibt gleich |
| Gibt es Kostenunterschiede? | Absolut identisch |
Referenzen
-
Google AI Dokumentation: Modellseite für Gemini 3.1 Pro Preview
- Link:
ai.google.dev/gemini-api/docs/models/gemini-3.1-pro-preview - Beschreibung: Einführung in den customtools-Endpunkt und Nutzungshinweise
- Link:
-
Gemini 3 Entwicklerhandbuch: FAQ — Wann man das Modell wechseln sollte
- Link:
ai.google.dev/gemini-api/docs/gemini-3 - Beschreibung: Offizielle Empfehlungen zum Zeitpunkt des Wechsels von der Standardversion zur customtools-Version
- Link:
-
Gemini API Changelog: Release-Notes vom 19. Februar 2026
- Link:
ai.google.dev/gemini-api/docs/changelog - Beschreibung: Ankündigung der Erstveröffentlichung der customtools-Variante
- Link:
-
Hacker News Diskussion: Feedback von Entwicklern zu Tool-Aufrufen in Gemini 3.1 Pro
- Link:
news.ycombinator.com/item?id=47074735 - Beschreibung: Reale Entwicklererfahrungen und Problemberichte
- Link:
-
GitHub Copilot Changelog: Integration von Gemini 3.1 Pro
- Link:
github.blog/changelog/2026-02-19-gemini-3-1-pro-is-now-in-public-preview-in-github-copilot - Beschreibung: Bewertung der Tool-Präzision in Szenarien für Coding-Assistenten
- Link:
📝 Autor: APIYI Team | Für technischen Austausch besuchen Sie bitte APIYI apiyi.com
📅 Aktualisierungsdatum: 20. Februar 2026
🏷️ Schlagworte: gemini-3.1-pro-preview-customtools, Vergleich mit der Standardversion, Agent-Entwicklung, Tool-Aufrufe, Function Calling, Modellauswahl