Gemini Thinking Modus in 3 Schritten konfigurieren: Vollständiges Setup-Tutorial für Cherry Studio und Chatbox

Möchten Sie, dass die KI wie ein Mensch „zuerst nachdenkt und dann antwortet“? Der Gemini-Thinking-Modus ist die neueste Deep-Reasoning-Funktion von Google, die es dem Modell ermöglicht, vor der Antwort den vollständigen Denkprozess anzuzeigen. In diesem Artikel erfahren Sie im Detail, wie Sie den Gemini-Thinking-Modus in den beiden gängigen KI-Clients Cherry Studio und Chatbox korrekt konfigurieren.

Kernwert: Nach der Lektüre dieses Artikels wissen Sie, wie Sie den Gemini-Thinking-Modus in Cherry Studio und Chatbox aktivieren, den Denkprozess des Modells einsehen und die Ergebnisse bei komplexen Aufgaben verbessern.

Kernpunkte des Gemini-Thinking-Modus

Der Gemini-Thinking-Modus ist eine Deep-Reasoning-Funktion, die von Google in den Gemini 2.5- und 3-Modellserien eingeführt wurde. Im Gegensatz zu gewöhnlichen Dialogen erlaubt der Thinking-Modus dem Modell, interne logische Überlegungen anzustellen, bevor es die endgültige Antwort gibt, was die Genauigkeit bei komplexen Aufgaben erheblich steigert.

Punkt	Erläuterung	Wert
Denkprozess-Visualisierung	Zeigt die logischen Schritte des Modells	Verstehen, wie die KI zu einem Schluss kommt
Gesteigertes Reasoning	Mehrstufige logische Schlussfolgerungen	Lösung komplexer mathematischer und Programmierprobleme
Steuerbare Denktiefe	Anpassung des Token-Budgets für das Denken	Balance zwischen Geschwindigkeit und Präzision
Modellkompatibilität	Komplette Gemini 2.5/3 Serie	Flexible Auswahl je nach Szenario

Vom Gemini-Thinking-Modus unterstützte Modelle

Derzeit unterstützen folgende Gemini-Modelle den Thinking-Modus:

Modellname	Modell-ID	Thinking-Parameter	Standardverhalten
Gemini 3 Pro	`gemini-3-pro-preview`	thinking_level	Dynamisches Denken (HIGH)
Gemini 3 Flash	`gemini-3-flash-preview`	thinking_level	Dynamisches Denken (HIGH)
Gemini 2.5 Pro	`gemini-2.5-pro`	thinking_budget	Dynamisch (8192 Tokens)
Gemini 2.5 Flash	`gemini-2.5-flash`	thinking_budget	Dynamisch (-1)
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`	thinking_budget	Standardmäßig AUS (0)

🎯 Technischer Rat: In der Praxis empfehlen wir, Gemini-Thinking-Modelle zentral über die Plattform APIYI (apiyi.com) aufzurufen. Diese Plattform bietet Schnittstellen, die mit dem OpenAI-Format kompatibel sind, sodass Sie sich nicht mit komplexen Google-API-Authentifizierungsprozessen befassen müssen.

Detaillierte API-Parameter für den Gemini-Thinking-Modus

Verschiedene Versionen der Gemini-Modelle verwenden unterschiedliche Parameter zur Steuerung des Denkprozesses:

Gemini 3 Serie – Parameter thinking_level

Level	Erläuterung	Anwendungsszenarien
`minimal`	Minimales Denken	Einfache Fragen & Antworten
`low`	Geringes Denken	Alltägliche Konversation
`medium`	Mittleres Denken	Allgemeines Schlussfolgern
`high`	Tiefgreifendes Denken (Standard)	Komplexe Aufgaben

Gemini 2.5 Serie – Parameter thinking_budget

Wert	Erläuterung	Anwendungsszenarien
`0`	Denken deaktiviert	Schnelle Antwort
`-1`	Dynamisches Denken (Empfohlen)	Automatische Anpassung
`128-32768`	Spezifizierte Token-Anzahl	Feinsteuerung

Gemini Thinking Modus in Cherry Studio konfigurieren

Cherry Studio ist ein leistungsstarker AI-Client, der über 300 Modelle und verschiedene AI-Provider unterstützt. Hier sind die detaillierten Schritte zur Konfiguration des Gemini Thinking Modus in Cherry Studio.

Schritt 1: Gemini API-Provider hinzufügen

Öffnen Sie Cherry Studio und gehen Sie zu Einstellungen → Provider
Suchen Sie nach Gemini oder Benutzerdefinierter Provider
Geben Sie die API-Konfigurationsdaten ein:

API-Adresse: https://api.apiyi.com/v1
API-Key: Ihr APIYI-Key

💡 Konfigurations-Tipp: Verwenden Sie APIYI (apiyi.com) als API-Adresse, um einen stabileren Zugriff und ein einheitliches Schnittstellenformat zu erhalten.

Schritt 2: Gemini Thinking Modelle hinzufügen

Klicken Sie unten auf die Schaltfläche „Verwalten“ oder „Hinzufügen“, um die folgenden Modelle manuell hinzuzufügen:

Hinzugefügter Modellname	Beschreibung
`gemini-3-pro-preview`	Gemini 3 Pro Thinking Version
`gemini-3-flash-preview`	Gemini 3 Flash Thinking Version
`gemini-2.5-pro`	Gemini 2.5 Pro Thinking Version
`gemini-2.5-flash`	Gemini 2.5 Flash Thinking Version

Schritt 3: Thinking Mode Schalter aktivieren

Im Chat-Interface:

Klicken Sie oben rechts auf das Einstellungen-Symbol
Suchen Sie die Option Thinking Mode
Schalten Sie den Schalter auf ON

Benutzerdefinierte Parameterkonfiguration in Cherry Studio

Falls der UI-Schalter keine Wirkung zeigt, müssen Sie die benutzerdefinierten Parameter manuell konfigurieren:

Für Gemini 3 Modelle:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

Für Gemini 2.5 Modelle:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingBudget": -1,
      "includeThoughts": true
    }
  }
}

Kopieren Sie die obige JSON-Konfiguration in den Bereich Benutzerdefinierte Parameter (Custom Parameters) in Cherry Studio.

Vollständige Anleitung zur Cherry Studio Konfiguration ansehen

Detaillierte Konfigurationsschritte:

Modelleinstellungen öffnen: Klicken Sie oben auf den Modellnamen im Chat-Fenster
Erweiterte Einstellungen: Scrollen Sie zum Bereich „Benutzerdefinierte Parameter“
JSON einfügen: Kopieren Sie die entsprechende JSON-Konfiguration für das jeweilige Modell
Speichern und Testen: Senden Sie eine Nachricht, um zu prüfen, ob der Denkprozess angezeigt wird

Fehlerbehebung:

Stellen Sie sicher, dass das JSON-Format korrekt ist (keine überflüssigen Kommas)
Überprüfen Sie, ob der Modellname mit der Konfiguration übereinstimmt
Prüfen Sie, ob der API-Key gültig ist

🚀 Schnellstart: Wir empfehlen die Plattform APIYI (apiyi.com) zum Erhalt Ihres API-Keys. Sie unterstützt die gesamte Gemini-Modellreihe und bietet eine einfachere Konfiguration.

Chatbox-Konfiguration für den Gemini-Thinking-Modus

Chatbox ist ein weiterer sehr beliebter KI-Desktop-Client mit einer übersichtlichen Benutzeroberfläche und Multi-Plattform-Unterstützung. Hier erfahren Sie, wie Sie den Gemini-Thinking-Modus in Chatbox konfigurieren.

Schritt 1: API-Provider konfigurieren

Öffnen Sie Chatbox und klicken Sie unten links auf Einstellungen.
Wählen Sie Modell-Anbieter → Benutzerdefiniert.
Konfigurieren Sie die API-Informationen:

Name: Gemini Thinking
API-Typ: OpenAI Compatible
API Host: https://api.apiyi.com
API Key: sk-your-apiyi-key

Schritt 2: Thinking-Modell auswählen

Geben Sie im Modell-Selector Folgendes ein oder wählen Sie aus:

gemini-3-pro-preview – Maximale Reasoning-Fähigkeit
gemini-2.5-pro – Balance zwischen Leistung und Kosten
gemini-2.5-flash – Schnelle Antworten

Schritt 3: Thinking-Parameter konfigurieren

Chatbox unterstützt die Konfiguration des Thinking-Modus über Extra Parameters:

{
  "thinking_config": {
    "thinking_level": "high"
  }
}

Oder verwenden Sie thinking_budget:

{
  "thinking_config": {
    "thinking_budget": 8192
  }
}

Einstellungen zur Anzeige des Denkprozesses in Chatbox

Chatbox klappt den Denkprozess standardmäßig ein. Sie können die Anzeige wie folgt anpassen:

Einstellung	Wirkung	Empfohlener Wert
Denkprozess anzeigen	Denkprozess ein-/ausklappen	Ein
Stil des Denkprozesses	Separater Block/Inline	Separater Block
Automatisches Einklappen	Lange Denkprozesse automatisch minimieren	Ein

Chatbox-Konfigurationscode-Beispiel anzeigen

# 使用 OpenAI SDK 配置 Gemini Thinking
import openai

client = openai.OpenAI(
    api_key="sk-your-apiyi-key",
    base_url="https://api.apiyi.com/v1"  # APIYI 统一接口
)

response = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[
        {"role": "user", "content": "请解释为什么 1+1=2"}
    ],
    extra_body={
        "thinking_config": {
            "thinking_budget": 8192,
            "include_thoughts": True
        }
    }
)

# 输出思考过程和答案
print(response.choices[0].message.content)

Best Practices für den Gemini-Thinking-Modus

Konfiguration der Thinking-Tiefe für verschiedene Szenarien

Anwendungsfall	Empfohlenes Modell	Thinking-Konfiguration	Erklärung
Mathematische Beweise	gemini-3-pro-preview	thinking_level: high	Erfordert präzise Logik
Code-Debugging	gemini-2.5-pro	thinking_budget: 16384	Komplexe Logikanalyse
Alltägliche Fragen	gemini-2.5-flash	thinking_budget: -1	Dynamische Anpassung
Schnelle Antworten	gemini-2.5-flash-lite	thinking_budget: 0	Thinking deaktiviert
Texte verfassen	gemini-3-flash-preview	thinking_level: medium	Balance aus Kreativität und Effizienz

Empfehlungen für das Thinking-Token-Budget

Einfache Fragen: 0-1.024 Tokens
Allgemeine Logik: 1.024-4.096 Tokens
Komplexe Aufgaben: 4.096-16.384 Tokens
Extreme Logik: 16.384-32.768 Tokens

💡 Empfehlung: Die Wahl der Thinking-Tiefe hängt primär von der Komplexität der Aufgabe ab. Wir empfehlen, praktische Tests über die APIYI-Plattform (apiyi.com) durchzuführen, um die optimale Konfiguration für Ihr Szenario zu finden. Die Plattform unterstützt alle Gemini-Thinking-Modelle und ermöglicht einen schnellen Vergleich der Ergebnisse.

Vergleich: Thinking-Modus vs. Standard-Modus

Vergleichsdimension	Standard-Modus	Thinking-Modus
Antwortgeschwindigkeit	Schnell (1-3 Sek.)	Etwas langsamer (3-10 Sek.)
Logiktiefe	Oberflächlich	Tiefgreifend & mehrstufig
Token-Verbrauch	Niedrig	Mittel bis hoch
Genauigkeit (Komplexe Aufgaben)	60-70%	85-95%
Erklärbarkeit	Niedrig	Hoch (Denkprozess einsehbar)
Anwendungsbereiche	Einfache Fragen	Komplexe Logikaufgaben

Häufig gestellte Fragen

Q1: Cherry Studio zeigt den Denkprozess (Thinking Mode) trotz aktiviertem Schalter nicht an?

Dies ist ein bekanntes Problem. Bei einigen Providern greift der Schalter in der Benutzeroberfläche eventuell nicht. In diesem Fall muss die JSON-Konfiguration manuell in den „benutzerdefinierten Parametern“ hinzugefügt werden:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

Stellen Sie sicher, dass includeThoughts auf true gesetzt ist – dies ist der entscheidende Parameter für die Anzeige des Denkprozesses. Bei Aufrufen über die Plattform APIYI (apiyi.com) ist die Rückgabe der Denk-Zusammenfassung standardmäßig aktiviert.

Q2: Was sind die Unterschiede zwischen den Parametern von Gemini 2.5 und Gemini 3?

Beide Serien verwenden unterschiedliche Parameter zur Steuerung des Denkmodus:

Gemini 3-Serie: Verwendet den Parameter thinkingLevel mit den Werten minimal/low/medium/high.
Gemini 2.5-Serie: Verwendet den Parameter thinkingBudget mit einem numerischen Wert zwischen 0 und 32768.

Die Parameter dürfen nicht vermischt werden, da die API sonst einen Fehler zurückgibt. Wir empfehlen den Aufruf über die einheitliche Schnittstelle von APIYI (apiyi.com), da die Plattform die Parameterkompatibilität automatisch verarbeitet.

Q3: Wie stark erhöht der Denkmodus den Token-Verbrauch?

Denk-Token (Thinking Tokens) werden zusätzlich abgerechnet. Beispiel Gemini 2.5 Pro:

Standard-Budget für das Denken: 8192 Tokens
Maximales Budget für das Denken: 32768 Tokens

Der tatsächliche Verbrauch hängt von der Komplexität der Aufgabe ab. Bei einfachen Fragen nutzt das Modell vielleicht nur ein paar hundert Denk-Token; bei komplexen Problemen kann das gesamte Budget ausgeschöpft werden. Die Einstellung thinkingBudget: -1 lässt das Modell die Regulierung automatisch vornehmen und bietet das beste Preis-Leistungs-Verhältnis.

Q4: Wie erhält man nur eine Zusammenfassung des Denkprozesses anstatt des vollständigen Verlaufs?

Wenn Sie im API-Aufruf includeThoughts: true setzen, wird eine Zusammenfassung (Summary) des Denkprozesses zurückgegeben und nicht die vollständigen internen Denk-Token. Zusammenfassungen sind prägnanter und ideal für die Anzeige in Benutzeroberflächen. Der vollständige interne Denkprozess ist derzeit nicht öffentlich zugänglich.

Q5: Welche Aufgaben eignen sich am besten für den Thinking-Modus?

Der Thinking-Modus ist besonders nützlich für Aufgaben, die mehrstufiges logisches Denken erfordern:

Mathematische Beweise und Berechnungen
Code-Debugging und Algorithmen-Design
Logische Schlussfolgerungen und Problemanalysen
Strategische Planung und Entscheidungsanalysen

Einfache Informationsabfragen, Übersetzungen oder Zusammenfassungen benötigen keinen Thinking-Modus; hier würde er nur die Latenz und die Kosten erhöhen.

Fazit

Der Gemini Thinking-Modus ist eine leistungsstarke Funktion zur Steigerung der KI-Argumentationsfähigkeit. Durch dieses Tutorial haben Sie gelernt:

Das Prinzip des Thinking-Modus verstehen: Die Unterschiede zwischen den Parametern thinking_level und thinking_budget kennen.
Konfiguration in Cherry Studio: Aktivierung des Denkmodus über den UI-Schalter oder benutzerdefinierte JSON-Parameter.
Konfiguration in Chatbox: Verwendung von „Extra Parameters“ zur Konfiguration der Denkparameter.
Best Practices: Auswahl der passenden Denktiefe basierend auf der Aufgabenkomplexität.

Wir empfehlen die Plattform APIYI (apiyi.com), um die Effekte des Gemini Thinking-Modus schnell zu testen. Die Plattform bietet eine einheitliche OpenAI-kompatible Schnittstelle, unterstützt alle Modelle der Serien Gemini 2.5 und 3, ist einfacher zu konfigurieren und bietet einen stabilen Zugriff.

Referenzen

Offizielle Dokumentation zu Google Gemini Thinking: Vollständige Beschreibung der API-Parameter
- Link: ai.google.dev/gemini-api/docs/thinking
Offizielle Dokumentation zu Cherry Studio: Leitfaden zur Client-Konfiguration
- Link: docs.cherry-ai.com
Gemini Modellliste: Liste der Modelle, die Thinking unterstützen
- Link: ai.google.dev/gemini-api/docs/models

Autor: APIYI Team
Technischer Support: Für den Zugriff auf die Gemini API oder technische Beratung besuchen Sie bitte APIYI apiyi.com