3 步配置 Gemini Thinking 模式：Cherry Studio 和 Chatbox 完整设置教程

想让 AI 像人一样「先思考、再回答」吗？Gemini Thinking 模式是 Google 最新推出的深度推理功能，能让模型在回答前展示完整的思考过程。本文将详细介绍如何在 Cherry Studio 和 Chatbox 两款主流 AI 客户端中正确配置 Gemini Thinking 模式。

核心价值: 读完本文，你将学会在 Cherry Studio 和 Chatbox 中启用 Gemini 思考模式，查看模型的推理过程，提升复杂任务的解决效果。

Gemini Thinking 模式核心要点

Gemini Thinking 模式是 Google 在 Gemini 2.5 和 3 系列模型中引入的深度推理功能。与普通对话不同，Thinking 模式让模型在给出最终答案前，先进行内部推理思考，显著提升了复杂任务的准确性。

要点	说明	价值
思考可视化	显示模型的推理过程	理解 AI 如何得出结论
推理能力增强	多步骤逻辑推理	解决复杂数学和编程问题
可控思考深度	调节思考 Token 预算	平衡速度与准确性
模型兼容	Gemini 2.5/3 全系列	灵活选择适合场景

Gemini Thinking 模式支持的模型

目前支持 Thinking 模式的 Gemini 模型如下：

模型名称	模型 ID	思考参数	默认行为
Gemini 3 Pro	`gemini-3-pro-preview`	thinking_level	动态思考 (HIGH)
Gemini 3 Flash	`gemini-3-flash-preview`	thinking_level	动态思考 (HIGH)
Gemini 2.5 Pro	`gemini-2.5-pro`	thinking_budget	动态 (8192 tokens)
Gemini 2.5 Flash	`gemini-2.5-flash`	thinking_budget	动态 (-1)
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`	thinking_budget	默认关闭 (0)

🎯 技术建议: 在实际开发中，我们建议通过 API易 apiyi.com 平台统一调用 Gemini Thinking 模型。该平台提供兼容 OpenAI 格式的接口，无需处理复杂的 Google API 认证流程。

Gemini Thinking 模式 API 参数详解

不同版本的 Gemini 模型使用不同的思考控制参数：

Gemini 3 系列 – thinking_level 参数

级别	说明	适用场景
`minimal`	最小思考	简单问答
`low`	低度思考	日常对话
`medium`	中度思考	一般推理
`high`	深度思考 (默认)	复杂任务

Gemini 2.5 系列 – thinking_budget 参数

数值	说明	适用场景
`0`	关闭思考	快速响应
`-1`	动态思考 (推荐)	自动调节
`128-32768`	指定 Token 数	精细控制

Cherry Studio 配置 Gemini Thinking 模式

Cherry Studio 是一款功能强大的 AI 客户端，支持 300+ 模型和多种 AI Provider。以下是在 Cherry Studio 中配置 Gemini Thinking 模式的详细步骤。

步骤 1：添加 Gemini API Provider

打开 Cherry Studio，进入 设置 → 服务商
找到 Gemini 或 自定义 Provider
输入 API 配置信息：

API 地址: https://api.apiyi.com/v1
API Key: 你的 API易 密钥

💡 配置提示: 使用 API易 apiyi.com 作为 API 地址，可以获得更稳定的国内访问和统一的接口格式。

步骤 2：添加 Gemini Thinking 模型

点击底部的「管理」或「添加」按钮，手动添加以下模型：

添加的模型名称	说明
`gemini-3-pro-preview`	Gemini 3 Pro 思考版
`gemini-3-flash-preview`	Gemini 3 Flash 思考版
`gemini-2.5-pro`	Gemini 2.5 Pro 思考版
`gemini-2.5-flash`	Gemini 2.5 Flash 思考版

步骤 3：开启 Thinking Mode 开关

在聊天界面中：

点击右上角的 设置图标
找到 Thinking Mode 选项
将开关切换为 ON

Cherry Studio 自定义参数配置

如果 UI 开关不生效，需要手动配置自定义参数：

对于 Gemini 3 模型：

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

对于 Gemini 2.5 模型：

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingBudget": -1,
      "includeThoughts": true
    }
  }
}

将上述 JSON 配置粘贴到 Cherry Studio 的 自定义参数 (Custom Parameters) 区域。

查看 Cherry Studio 完整配置截图说明

配置步骤详解：

打开模型设置: 点击对话框顶部的模型名称
进入高级设置: 滚动到「自定义参数」区域
粘贴 JSON: 复制上方对应模型的 JSON 配置
保存并测试: 发送一条消息验证思考过程是否显示

常见问题排查：

确保 JSON 格式正确，无多余逗号
确认模型名称与配置匹配
检查 API Key 是否有效

🚀 快速开始: 推荐使用 API易 apiyi.com 平台获取 API Key，支持 Gemini 全系列模型，配置更简单。

Chatbox 配置 Gemini Thinking 模式

Chatbox 是另一款广受欢迎的 AI 桌面客户端，界面简洁，支持多平台。以下是在 Chatbox 中配置 Gemini Thinking 模式的方法。

步骤 1：配置 API Provider

打开 Chatbox，点击左下角设置
选择 模型提供商 → 自定义
配置 API 信息：

名称: Gemini Thinking
API 类型: OpenAI Compatible
API Host: https://api.apiyi.com
API Key: sk-your-apiyi-key

步骤 2：选择 Thinking 模型

在模型选择器中输入或选择：

gemini-3-pro-preview – 最强推理能力
gemini-2.5-pro – 平衡性能与成本
gemini-2.5-flash – 快速响应

步骤 3：配置思考参数

Chatbox 支持通过 Extra Parameters 配置思考模式：

{
  "thinking_config": {
    "thinking_level": "high"
  }
}

或使用 thinking_budget：

{
  "thinking_config": {
    "thinking_budget": 8192
  }
}

Chatbox 思考过程显示设置

Chatbox 默认会折叠显示思考过程，你可以调整显示方式：

设置项	作用	推荐值
显示思考过程	展开/折叠思考内容	开启
思考过程样式	独立区块/内联显示	独立区块
自动折叠	长思考自动收起	开启

查看 Chatbox 配置代码示例

# 使用 OpenAI SDK 配置 Gemini Thinking
import openai

client = openai.OpenAI(
    api_key="sk-your-apiyi-key",
    base_url="https://api.apiyi.com/v1"  # API易 统一接口
)

response = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[
        {"role": "user", "content": "请解释为什么 1+1=2"}
    ],
    extra_body={
        "thinking_config": {
            "thinking_budget": 8192,
            "include_thoughts": True
        }
    }
)

# 输出思考过程和答案
print(response.choices[0].message.content)

Gemini Thinking 模式最佳实践

不同场景的思考深度配置

使用场景	推荐模型	思考配置	说明
数学证明	gemini-3-pro-preview	thinking_level: high	需要严谨推理
代码调试	gemini-2.5-pro	thinking_budget: 16384	复杂逻辑分析
日常问答	gemini-2.5-flash	thinking_budget: -1	动态自适应
快速响应	gemini-2.5-flash-lite	thinking_budget: 0	关闭思考
文章写作	gemini-3-flash-preview	thinking_level: medium	平衡创意与效率

思考 Token 预算建议

简单问题: 0-1024 tokens
一般推理: 1024-4096 tokens
复杂任务: 4096-16384 tokens
极限推理: 16384-32768 tokens

💡 选择建议: 选择哪个思考深度主要取决于任务复杂度。我们建议通过 API易 apiyi.com 平台进行实际测试，以便找到最适合您场景的配置。该平台支持所有 Gemini Thinking 模型，便于快速对比效果。

Thinking Token 预算与任务复杂度根据任务类型选择合适的思考深度

任务复杂度

Thinking Token 预算

0 1K 8K 16K 32K

简单问题 0 – 1,024 tokens

<!-- 示例任务 -->
<rect x="105" y="100" width="150" height="70" rx="6" fill="#1e293b" stroke="#22c55e" stroke-width="1" />
<text x="180" y="120" text-anchor="middle" fill="#22c55e" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="115" y="140" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 简单翻译</text>
<text x="115" y="155" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 信息查询</text>

<!-- 连接线 -->
<line x1="180" y1="170" x2="180" y2="280" stroke="#22c55e" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

一般推理 1K – 4K tokens

<!-- 示例任务 -->
<rect x="260" y="100" width="155" height="70" rx="6" fill="#1e293b" stroke="#3b82f6" stroke-width="1" />
<text x="337" y="120" text-anchor="middle" fill="#3b82f6" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="270" y="140" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 代码解释</text>
<text x="270" y="155" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 文章摘要</text>

<!-- 连接线 -->
<line x1="337" y1="170" x2="337" y2="230" stroke="#3b82f6" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

复杂任务 4K – 16K tokens

<!-- 示例任务 -->
<rect x="420" y="100" width="155" height="60" rx="6" fill="#1e293b" stroke="#f59e0b" stroke-width="1" />
<text x="497" y="118" text-anchor="middle" fill="#f59e0b" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="430" y="136" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 算法设计 • 调试分析</text>
<text x="430" y="151" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 方案对比 • 架构设计</text>

<!-- 连接线 -->
<line x1="497" y1="160" x2="497" y2="170" stroke="#f59e0b" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

极限推理 16K – 32K tokens

<!-- 示例任务 -->
<rect x="580" y="175" width="155" height="60" rx="6" fill="#1e293b" stroke="#ef4444" stroke-width="1" />
<text x="657" y="193" text-anchor="middle" fill="#ef4444" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="590" y="211" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 数学证明 • 复杂编程</text>
<text x="590" y="226" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 深度推理 • 策略规划</text>

💡 推荐: 使用 thinking_budget: -1 (动态模式) 让模型自动调节思考深度

思考模式 vs 普通模式对比

对比维度	普通模式	Thinking 模式
响应速度	快 (1-3秒)	较慢 (3-10秒)
推理深度	浅层	深层多步骤
Token 消耗	低	中-高
准确率 (复杂任务)	60-70%	85-95%
可解释性	低	高 (可查看思考)
适用场景	简单问答	复杂推理任务

常见问题

Q1: Cherry Studio 开启 Thinking Mode 开关后不显示思考过程？

这是一个已知问题。部分 Provider 的 UI 开关可能不生效，需要手动在「自定义参数」中添加 JSON 配置：

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

确保 includeThoughts 设置为 true，这是显示思考过程的关键参数。通过 API易 apiyi.com 平台调用时，默认已开启思考摘要返回。

Q2: Gemini 2.5 和 Gemini 3 的参数有什么区别？

两个系列使用不同的参数控制思考模式：

Gemini 3 系列: 使用 thinkingLevel 参数，值为 minimal/low/medium/high
Gemini 2.5 系列: 使用 thinkingBudget 参数，值为 0 到 32768 的数字

不能混用参数，否则 API 会返回错误。建议通过 API易 apiyi.com 统一接口调用，平台会自动处理参数兼容性。

Q3: 思考模式会增加多少 Token 消耗？

思考 Token 是额外计费的。以 Gemini 2.5 Pro 为例：

默认思考预算: 8192 tokens
最大思考预算: 32768 tokens

实际消耗取决于任务复杂度。对于简单问题，模型可能只使用几百个思考 Token；复杂问题可能用满预算。设置 thinkingBudget: -1 可让模型自动调节，是性价比最高的选择。

Q4: 如何只获取思考摘要而不是完整思考过程？

在 API 调用中设置 includeThoughts: true，返回的是思考摘要而非完整的内部思考 Token。摘要更简洁，适合在 UI 中展示。完整思考过程目前不对外开放。

Q5: 哪些任务最适合使用 Thinking 模式？

Thinking 模式特别适合需要多步推理的任务：

数学证明和计算
代码调试和算法设计
逻辑推理和问题分析
策略规划和决策分析

简单的信息查询、翻译、摘要等任务不需要开启 Thinking 模式，反而会增加延迟和成本。

总结

Gemini Thinking 模式是提升 AI 推理能力的强大功能。通过本文的配置教程，你已经学会了：

理解 Thinking 模式原理: 掌握 thinking_level 和 thinking_budget 参数的区别
Cherry Studio 配置方法: 通过 UI 开关或自定义 JSON 参数启用思考模式
Chatbox 配置方法: 使用 Extra Parameters 配置思考参数
最佳实践: 根据任务复杂度选择合适的思考深度

推荐通过 API易 apiyi.com 快速验证 Gemini Thinking 模式效果，平台提供统一的 OpenAI 兼容接口，支持所有 Gemini 2.5 和 3 系列模型，配置更简单，访问更稳定。

参考资料

Google Gemini Thinking 官方文档: 完整的 API 参数说明
- 链接: ai.google.dev/gemini-api/docs/thinking
Cherry Studio 官方文档: 客户端配置指南
- 链接: docs.cherry-ai.com
Gemini 模型列表: 支持 Thinking 的模型清单
- 链接: ai.google.dev/gemini-api/docs/models

作者: APIYI Team
技术支持: 如需获取 Gemini API 或技术咨询，请访问 API易 apiyi.com