3 步配置 Gemini Thinking 模式:Cherry Studio 和 Chatbox 完整设置教程

想让 AI 像人一样「先思考、再回答」吗?Gemini Thinking 模式是 Google 最新推出的 深度推理功能,能让模型在回答前展示完整的思考过程。本文将详细介绍如何在 Cherry Studio 和 Chatbox 两款主流 AI 客户端中正确配置 Gemini Thinking 模式。

核心价值: 读完本文,你将学会在 Cherry Studio 和 Chatbox 中启用 Gemini 思考模式,查看模型的推理过程,提升复杂任务的解决效果。

gemini-thinking-mode-cherry-studio-chatbox-config-guide 图示


Gemini Thinking 模式核心要点

Gemini Thinking 模式是 Google 在 Gemini 2.5 和 3 系列模型中引入的深度推理功能。与普通对话不同,Thinking 模式让模型在给出最终答案前,先进行内部推理思考,显著提升了复杂任务的准确性。

要点 说明 价值
思考可视化 显示模型的推理过程 理解 AI 如何得出结论
推理能力增强 多步骤逻辑推理 解决复杂数学和编程问题
可控思考深度 调节思考 Token 预算 平衡速度与准确性
模型兼容 Gemini 2.5/3 全系列 灵活选择适合场景

Gemini Thinking 模式支持的模型

目前支持 Thinking 模式的 Gemini 模型如下:

模型名称 模型 ID 思考参数 默认行为
Gemini 3 Pro gemini-3-pro-preview thinking_level 动态思考 (HIGH)
Gemini 3 Flash gemini-3-flash-preview thinking_level 动态思考 (HIGH)
Gemini 2.5 Pro gemini-2.5-pro thinking_budget 动态 (8192 tokens)
Gemini 2.5 Flash gemini-2.5-flash thinking_budget 动态 (-1)
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite thinking_budget 默认关闭 (0)

🎯 技术建议: 在实际开发中,我们建议通过 API易 apiyi.com 平台统一调用 Gemini Thinking 模型。该平台提供兼容 OpenAI 格式的接口,无需处理复杂的 Google API 认证流程。

gemini-thinking-mode-cherry-studio-chatbox-config-guide 图示

Gemini Thinking 模式 API 参数详解

不同版本的 Gemini 模型使用不同的思考控制参数:

Gemini 3 系列 – thinking_level 参数

级别 说明 适用场景
minimal 最小思考 简单问答
low 低度思考 日常对话
medium 中度思考 一般推理
high 深度思考 (默认) 复杂任务

Gemini 2.5 系列 – thinking_budget 参数

数值 说明 适用场景
0 关闭思考 快速响应
-1 动态思考 (推荐) 自动调节
128-32768 指定 Token 数 精细控制

Cherry Studio 配置 Gemini Thinking 模式

Cherry Studio 是一款功能强大的 AI 客户端,支持 300+ 模型和多种 AI Provider。以下是在 Cherry Studio 中配置 Gemini Thinking 模式的详细步骤。

步骤 1:添加 Gemini API Provider

  1. 打开 Cherry Studio,进入 设置 → 服务商
  2. 找到 Gemini自定义 Provider
  3. 输入 API 配置信息:
API 地址: https://api.apiyi.com/v1
API Key: 你的 API易 密钥

💡 配置提示: 使用 API易 apiyi.com 作为 API 地址,可以获得更稳定的国内访问和统一的接口格式。

步骤 2:添加 Gemini Thinking 模型

点击底部的「管理」或「添加」按钮,手动添加以下模型:

添加的模型名称 说明
gemini-3-pro-preview Gemini 3 Pro 思考版
gemini-3-flash-preview Gemini 3 Flash 思考版
gemini-2.5-pro Gemini 2.5 Pro 思考版
gemini-2.5-flash Gemini 2.5 Flash 思考版

步骤 3:开启 Thinking Mode 开关

在聊天界面中:

  1. 点击右上角的 设置图标
  2. 找到 Thinking Mode 选项
  3. 将开关切换为 ON

gemini-thinking-mode-cherry-studio-chatbox-config-guide 图示

Cherry Studio 自定义参数配置

如果 UI 开关不生效,需要手动配置自定义参数:

对于 Gemini 3 模型

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

对于 Gemini 2.5 模型

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingBudget": -1,
      "includeThoughts": true
    }
  }
}

将上述 JSON 配置粘贴到 Cherry Studio 的 自定义参数 (Custom Parameters) 区域。

查看 Cherry Studio 完整配置截图说明

配置步骤详解:

  1. 打开模型设置: 点击对话框顶部的模型名称
  2. 进入高级设置: 滚动到「自定义参数」区域
  3. 粘贴 JSON: 复制上方对应模型的 JSON 配置
  4. 保存并测试: 发送一条消息验证思考过程是否显示

常见问题排查:

  • 确保 JSON 格式正确,无多余逗号
  • 确认模型名称与配置匹配
  • 检查 API Key 是否有效

🚀 快速开始: 推荐使用 API易 apiyi.com 平台获取 API Key,支持 Gemini 全系列模型,配置更简单。


Chatbox 配置 Gemini Thinking 模式

Chatbox 是另一款广受欢迎的 AI 桌面客户端,界面简洁,支持多平台。以下是在 Chatbox 中配置 Gemini Thinking 模式的方法。

步骤 1:配置 API Provider

  1. 打开 Chatbox,点击左下角 设置
  2. 选择 模型提供商 → 自定义
  3. 配置 API 信息:
名称: Gemini Thinking
API 类型: OpenAI Compatible
API Host: https://api.apiyi.com
API Key: sk-your-apiyi-key

步骤 2:选择 Thinking 模型

在模型选择器中输入或选择:

  • gemini-3-pro-preview – 最强推理能力
  • gemini-2.5-pro – 平衡性能与成本
  • gemini-2.5-flash – 快速响应

步骤 3:配置思考参数

Chatbox 支持通过 Extra Parameters 配置思考模式:

{
  "thinking_config": {
    "thinking_level": "high"
  }
}

或使用 thinking_budget:

{
  "thinking_config": {
    "thinking_budget": 8192
  }
}

Chatbox 思考过程显示设置

Chatbox 默认会折叠显示思考过程,你可以调整显示方式:

设置项 作用 推荐值
显示思考过程 展开/折叠思考内容 开启
思考过程样式 独立区块/内联显示 独立区块
自动折叠 长思考自动收起 开启
查看 Chatbox 配置代码示例
# 使用 OpenAI SDK 配置 Gemini Thinking
import openai

client = openai.OpenAI(
    api_key="sk-your-apiyi-key",
    base_url="https://api.apiyi.com/v1"  # API易 统一接口
)

response = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[
        {"role": "user", "content": "请解释为什么 1+1=2"}
    ],
    extra_body={
        "thinking_config": {
            "thinking_budget": 8192,
            "include_thoughts": True
        }
    }
)

# 输出思考过程和答案
print(response.choices[0].message.content)

Gemini Thinking 模式最佳实践

不同场景的思考深度配置

使用场景 推荐模型 思考配置 说明
数学证明 gemini-3-pro-preview thinking_level: high 需要严谨推理
代码调试 gemini-2.5-pro thinking_budget: 16384 复杂逻辑分析
日常问答 gemini-2.5-flash thinking_budget: -1 动态自适应
快速响应 gemini-2.5-flash-lite thinking_budget: 0 关闭思考
文章写作 gemini-3-flash-preview thinking_level: medium 平衡创意与效率

思考 Token 预算建议

简单问题: 0-1024 tokens
一般推理: 1024-4096 tokens
复杂任务: 4096-16384 tokens
极限推理: 16384-32768 tokens

💡 选择建议: 选择哪个思考深度主要取决于任务复杂度。我们建议通过 API易 apiyi.com 平台进行实际测试,以便找到最适合您场景的配置。该平台支持所有 Gemini Thinking 模型,便于快速对比效果。

Thinking Token 预算与任务复杂度 根据任务类型选择合适的思考深度

任务复杂度

Thinking Token 预算

0 1K 8K 16K 32K

简单问题 0 – 1,024 tokens

<!-- 示例任务 -->
<rect x="105" y="100" width="150" height="70" rx="6" fill="#1e293b" stroke="#22c55e" stroke-width="1" />
<text x="180" y="120" text-anchor="middle" fill="#22c55e" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="115" y="140" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 简单翻译</text>
<text x="115" y="155" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 信息查询</text>

<!-- 连接线 -->
<line x1="180" y1="170" x2="180" y2="280" stroke="#22c55e" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

一般推理 1K – 4K tokens

<!-- 示例任务 -->
<rect x="260" y="100" width="155" height="70" rx="6" fill="#1e293b" stroke="#3b82f6" stroke-width="1" />
<text x="337" y="120" text-anchor="middle" fill="#3b82f6" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="270" y="140" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 代码解释</text>
<text x="270" y="155" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 文章摘要</text>

<!-- 连接线 -->
<line x1="337" y1="170" x2="337" y2="230" stroke="#3b82f6" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

复杂任务 4K – 16K tokens

<!-- 示例任务 -->
<rect x="420" y="100" width="155" height="60" rx="6" fill="#1e293b" stroke="#f59e0b" stroke-width="1" />
<text x="497" y="118" text-anchor="middle" fill="#f59e0b" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="430" y="136" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 算法设计 • 调试分析</text>
<text x="430" y="151" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 方案对比 • 架构设计</text>

<!-- 连接线 -->
<line x1="497" y1="160" x2="497" y2="170" stroke="#f59e0b" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

极限推理 16K – 32K tokens

<!-- 示例任务 -->
<rect x="580" y="175" width="155" height="60" rx="6" fill="#1e293b" stroke="#ef4444" stroke-width="1" />
<text x="657" y="193" text-anchor="middle" fill="#ef4444" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">适用任务</text>
<text x="590" y="211" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 数学证明 • 复杂编程</text>
<text x="590" y="226" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• 深度推理 • 策略规划</text>

💡 推荐: 使用 thinking_budget: -1 (动态模式) 让模型自动调节思考深度

思考模式 vs 普通模式对比

对比维度 普通模式 Thinking 模式
响应速度 快 (1-3秒) 较慢 (3-10秒)
推理深度 浅层 深层多步骤
Token 消耗 中-高
准确率 (复杂任务) 60-70% 85-95%
可解释性 高 (可查看思考)
适用场景 简单问答 复杂推理任务

常见问题

Q1: Cherry Studio 开启 Thinking Mode 开关后不显示思考过程?

这是一个已知问题。部分 Provider 的 UI 开关可能不生效,需要手动在「自定义参数」中添加 JSON 配置:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

确保 includeThoughts 设置为 true,这是显示思考过程的关键参数。通过 API易 apiyi.com 平台调用时,默认已开启思考摘要返回。

Q2: Gemini 2.5 和 Gemini 3 的参数有什么区别?

两个系列使用不同的参数控制思考模式:

  • Gemini 3 系列: 使用 thinkingLevel 参数,值为 minimal/low/medium/high
  • Gemini 2.5 系列: 使用 thinkingBudget 参数,值为 0 到 32768 的数字

不能混用参数,否则 API 会返回错误。建议通过 API易 apiyi.com 统一接口调用,平台会自动处理参数兼容性。

Q3: 思考模式会增加多少 Token 消耗?

思考 Token 是额外计费的。以 Gemini 2.5 Pro 为例:

  • 默认思考预算: 8192 tokens
  • 最大思考预算: 32768 tokens

实际消耗取决于任务复杂度。对于简单问题,模型可能只使用几百个思考 Token;复杂问题可能用满预算。设置 thinkingBudget: -1 可让模型自动调节,是性价比最高的选择。

Q4: 如何只获取思考摘要而不是完整思考过程?

在 API 调用中设置 includeThoughts: true,返回的是思考摘要而非完整的内部思考 Token。摘要更简洁,适合在 UI 中展示。完整思考过程目前不对外开放。

Q5: 哪些任务最适合使用 Thinking 模式?

Thinking 模式特别适合需要多步推理的任务:

  • 数学证明和计算
  • 代码调试和算法设计
  • 逻辑推理和问题分析
  • 策略规划和决策分析

简单的信息查询、翻译、摘要等任务不需要开启 Thinking 模式,反而会增加延迟和成本。


总结

Gemini Thinking 模式是提升 AI 推理能力的强大功能。通过本文的配置教程,你已经学会了:

  1. 理解 Thinking 模式原理: 掌握 thinking_level 和 thinking_budget 参数的区别
  2. Cherry Studio 配置方法: 通过 UI 开关或自定义 JSON 参数启用思考模式
  3. Chatbox 配置方法: 使用 Extra Parameters 配置思考参数
  4. 最佳实践: 根据任务复杂度选择合适的思考深度

推荐通过 API易 apiyi.com 快速验证 Gemini Thinking 模式效果,平台提供统一的 OpenAI 兼容接口,支持所有 Gemini 2.5 和 3 系列模型,配置更简单,访问更稳定。


参考资料

  1. Google Gemini Thinking 官方文档: 完整的 API 参数说明

    • 链接: ai.google.dev/gemini-api/docs/thinking
  2. Cherry Studio 官方文档: 客户端配置指南

    • 链接: docs.cherry-ai.com
  3. Gemini 模型列表: 支持 Thinking 的模型清单

    • 链接: ai.google.dev/gemini-api/docs/models

作者: APIYI Team
技术支持: 如需获取 Gemini API 或技术咨询,请访问 API易 apiyi.com

发表评论