3ステップでGemini Thinkingモードを設定：Cherry StudioとChatboxの完全設定チュートリアル

AIに人間のように「考えてから答える」ようにさせたいと思いませんか？Gemini Thinking モードは、Google が新しく提供を開始した高度な推論機能で、モデルが回答する前に完全な思考プロセスを表示できるようにします。この記事では、主要な AI クライアントである Cherry Studio と Chatbox の 2 つで、Gemini Thinking モードを正しく設定する方法を詳しく解説します。

コアバリュー: この記事を読み終えると、Cherry Studio と Chatbox で Gemini の思考モードを有効にし、モデルの推論プロセスを確認して、複雑なタスクの解決効率を向上させる方法を習得できます。

Gemini Thinking モードの重要ポイント

Gemini Thinking モードは、Google が Gemini 2.5 および 3 シリーズのモデルで導入した高度な推論機能です。通常の対話とは異なり、Thinking モードではモデルが最終的な回答を出す前に内部で推論を行い、複雑なタスクの正確性を大幅に向上させます。

ポイント	説明	メリット
思考の可視化	モデルの推論プロセスを表示	AI がどのように結論を導き出したかを理解
推論能力の強化	多段階の論理推論	複雑な数学やプログラミングの問題を解決
思考の深さを制御	思考トークンの予算を調整	速度と精度のバランスを最適化
モデルの互換性	Gemini 2.5/3 全シリーズ	シーンに合わせて柔軟に選択可能

Gemini Thinking モード対応モデル

現在 Thinking モードをサポートしている Gemini モデルは以下の通りです：

モデル名	モデル ID	思考パラメータ	デフォルトの動作
Gemini 3 Pro	`gemini-3-pro-preview`	thinking_level	動的思考 (HIGH)
Gemini 3 Flash	`gemini-3-flash-preview`	thinking_level	動的思考 (HIGH)
Gemini 2.5 Pro	`gemini-2.5-pro`	thinking_budget	動的 (8192 tokens)
Gemini 2.5 Flash	`gemini-2.5-flash`	thinking_budget	動的 (-1)
Gemini 2.5 Flash-Lite	`gemini-2.5-flash-lite`	thinking_budget	デフォルト OFF (0)

🎯 テクニカルアドバイス: 実際の開発や利用においては、APIYI (apiyi.com) プラットフォームを通じて Gemini Thinking モデルを呼び出すことをお勧めします。このプラットフォームは OpenAI 互換のインターフェースを提供しているため、複雑な Google API 認証フローを処理する必要がありません。

Gemini Thinking モード API パラメータ詳細

Gemini モデルのバージョンによって、使用する思考制御パラメータが異なります。

Gemini 3 シリーズ – thinking_level パラメータ

レベル	説明	推奨シーン
`minimal`	最小限の思考	単純な質疑応答
`low`	低レベルの思考	日常的な会話
`medium`	中レベルの思考	一般的な推論
`high`	高レベルの思考 (デフォルト)	複雑なタスク

Gemini 2.5 シリーズ – thinking_budget パラメータ

数値	説明	推奨シーン
`0`	思考をオフにする	高速なレスポンス重視
`-1`	動的な思考 (推奨)	自動調整
`128-32768`	トークン数を指定	詳細な制御が必要な場合

Cherry Studio で Gemini Thinking モードを設定する

Cherry Studio は、300以上のモデルと多様な AI プロバイダーに対応した強力な AI クライアントです。以下に、Cherry Studio で Gemini Thinking モードを設定するための詳細な手順を説明します。

ステップ 1：Gemini API プロバイダーを追加する

Cherry Studio を開き、設定 → サービスプロバイダー へ移動します。
Gemini または カスタムプロバイダー を見つけます。
以下の API 設定情報を入力します。

API アドレス: https://api.apiyi.com/v1
API Key: あなたの APIYI キー

💡 設定のヒント: API アドレスに APIYI (apiyi.com) を使用することで、より安定したアクセスと統一されたインターフェース形式を利用できます。

ステップ 2：Gemini Thinking モデルを追加する

下部の「管理」または「追加」ボタンをクリックして、以下のモデルを手動で追加します。

追加するモデル名	説明
`gemini-3-pro-preview`	Gemini 3 Pro 思考版
`gemini-3-flash-preview`	Gemini 3 Flash 思考版
`gemini-2.5-pro`	Gemini 2.5 Pro 思考版
`gemini-2.5-flash`	Gemini 2.5 Flash 思考版

ステップ 3：Thinking Mode スイッチをオンにする

チャット画面にて：

右上の 設定アイコン をクリックします。
Thinking Mode オプションを探します。
スイッチを ON に切り替えます。

Cherry Studio カスタムパラメータ設定

UI のスイッチが反映されない場合は、手動でカスタムパラメータを設定する必要があります。

Gemini 3 モデルの場合:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

Gemini 2.5 モデルの場合:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingBudget": -1,
      "includeThoughts": true
    }
  }
}

上記の JSON 設定を、Cherry Studio の カスタムパラメータ (Custom Parameters) エリアに貼り付けてください。

Cherry Studio の詳細な設定手順を確認する

設定手順の詳細：

モデル設定を開く: チャットボックス上部のモデル名をクリックします。
詳細設定へ: 「カスタムパラメータ」セクションまでスクロールします。
JSON を貼り付ける: 上記の該当するモデルの JSON 設定をコピーします。
保存してテスト: メッセージを送信し、思考プロセスが表示されるか確認します。

よくあるトラブルシューティング：

JSON 形式が正しいか、余計なカンマがないか確認してください。
モデル名が設定と一致しているか確認してください。
API キーが有効であることを確認してください。

🚀 クイックスタート: Gemini 全シリーズのモデルをサポートし、設定も簡単な APIYI (apiyi.com) プラットフォームで API キーを取得することをお勧めします。

Chatbox で Gemini Thinking モードを設定する

Chatbox は、シンプルで使いやすいインターフェースを持ち、マルチプラットフォームに対応した人気の AI デスクトップクライアントです。以下は、Chatbox で Gemini Thinking モードを設定する方法です。

ステップ 1：API プロバイダーを設定する

Chatbox を開き、左下の設定をクリックします。
モデルプロバイダー → カスタム を選択します。
API 情報を設定します。

名前: Gemini Thinking
API タイプ: OpenAI Compatible
API Host: https://api.apiyi.com
API Key: sk-your-apiyi-key

ステップ 2：Thinking モデルを選択する

モデルセレクターで以下を入力または選択します：

gemini-3-pro-preview – 最強の推論能力
gemini-2.5-pro – 性能とコストのバランス
gemini-2.5-flash – 高速なレスポンス

ステップ 3：思考パラメータを設定する

Chatbox では Extra Parameters を通じて思考モードを設定できます。

{
  "thinking_config": {
    "thinking_level": "high"
  }
}

または thinking_budget を使用します：

{
  "thinking_config": {
    "thinking_budget": 8192
  }
}

Chatbox 思考プロセスの表示設定

Chatbox ではデフォルトで思考プロセスが折りたたまれて表示されます。表示方法は調整可能です。

設定項目	役割	推奨値
思考プロセスを表示	思考内容を展開/折りたたみ	オン
思考プロセスのスタイル	独立したブロック/インライン表示	独立したブロック
自動折りたたみ	長い思考を自動的に畳む	オン

Chatbox 設定コードの例を表示する

# OpenAI SDK を使用して Gemini Thinking を設定する
import openai

client = openai.OpenAI(
    api_key="sk-your-apiyi-key",
    base_url="https://api.apiyi.com/v1"  # APIYI 統一インターフェース
)

response = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[
        {"role": "user", "content": "なぜ 1+1=2 になるのか説明してください"}
    ],
    extra_body={
        "thinking_config": {
            "thinking_budget": 8192,
            "include_thoughts": True
        }
    }
)

# 思考プロセスと回答を出力
print(response.choices[0].message.content)

Gemini Thinking モードのベストプラクティス

シーン別の思考深度設定

利用シーン	推奨モデル	思考設定	説明
数学的証明	gemini-3-pro-preview	thinking_level: high	厳密な推論が必要
コードのデバッグ	gemini-2.5-pro	thinking_budget: 16384	複雑なロジックの分析
日常的なQA	gemini-2.5-flash	thinking_budget: -1	動的な適応
クイックレスポンス	gemini-2.5-flash-lite	thinking_budget: 0	思考をオフにする
ライティング・執筆	gemini-3-flash-preview	thinking_level: medium	創造性と効率のバランス

思考トークン予算の推奨値

簡単な質問: 0-1024 tokens
一般的な推論: 1024-4096 tokens
複雑なタスク: 4096-16384 tokens
高度な推論: 16384-32768 tokens

💡 選択のアドバイス: どの程度の思考の深さを選択するかは、主にタスクの複雑さに依存します。APIYI (apiyi.com) プラットフォームで実際にテストを行い、ご自身のユースケースに最適な設定を見つけることをお勧めします。このプラットフォームはすべての Gemini Thinking モデルをサポートしており、効果を素早く比較するのに便利です。

思考モード vs 通常モードの比較

比較項目	通常モード	Thinking モード
応答速度	速い (1-3秒)	やや遅い (3-10秒)
推論の深さ	浅い	深い・マルチステップ
トークン消費	低	中〜高
正確性 (複雑なタスク)	60-70%	85-95%
解釈性	低	高 (思考プロセスの確認が可能)
適用シーン	簡単なQA	複雑な推論タスク

よくある質問

Q1: Cherry Studio で Thinking Mode をオンにしても思考プロセスが表示されません。

これは既知の問題です。一部のプロバイダーでは UI のスイッチが機能しない場合があり、その場合は「カスタムパラメータ」に手動で以下の JSON 設定を追加する必要があります。

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

includeThoughts が true に設定されていることを確認してください。これは思考プロセスを表示するための重要なパラメータです。APIYI（apiyi.com）プラットフォーム経由で呼び出す場合、デフォルトで思考の要約が返されるよう設定されています。

Q2: Gemini 2.5 と Gemini 3 のパラメータにはどのような違いがありますか？

この2つのシリーズでは、思考モードを制御するために異なるパラメータを使用します。

Gemini 3 シリーズ: thinkingLevel パラメータを使用し、値は minimal / low / medium / high です。
Gemini 2.5 シリーズ: thinkingBudget パラメータを使用し、値は 0 から 32768 の数値です。

パラメータを混用すると API がエラーを返すため注意が必要です。APIYI（apiyi.com）の統合インターフェースを利用することをお勧めします。プラットフォーム側でパラメータの互換性が自動的に処理されます。

Q3: 思考モードによってトークン消費量はどのくらい増えますか？

思考トークンは別途課金されます。Gemini 2.5 Pro を例に挙げると以下の通りです。

デフォルトの思考予算（Budget）: 8192 トークン
最大思考予算: 32768 トークン

実際の消費量はタスクの複雑さに依存します。単純な問題であれば数百トークンで済むこともありますが、複雑な問題では予算を使い切ることもあります。thinkingBudget: -1 に設定すると、モデルが自動的に調整を行うため、最もコスパの良い選択肢となります。

Q4: 完全な思考プロセスではなく、思考の要約だけを取得するにはどうすればよいですか？

API 呼び出しで includeThoughts: true を設定すると、内部の完全な思考トークンではなく、思考の要約が返されます。要約はより簡潔で、UI での表示に適しています。現在、完全な思考プロセスの詳細は外部に公開されていません。

Q5: Thinking モードに最適なタスクは何ですか？

Thinking モードは、多段階の推論を必要とするタスクに特に適しています。

数学的な証明や計算
コードのデバッグやアルゴリズム設計
論理推論や問題分析
戦略立案や意思決定分析

単純な情報の検索、翻訳、要約などのタスクでは Thinking モードを有効にする必要はなく、むしろ遅延やコストが増大する可能性があります。

まとめ

Gemini の Thinking モードは、AI の推論能力を向上させる強力な機能です。本記事の設定チュートリアルを通じて、以下の内容を学習しました。

Thinking モードの原理を理解する: thinking_level と thinking_budget パラメータの違いを把握する。
Cherry Studio での設定方法: UI スイッチまたはカスタム JSON パラメータを使用して思考モードを有効にする。
Chatbox での設定方法: Extra Parameters を使用して思考パラメータを構成する。
ベストプラクティス: タスクの複雑さに応じて適切な思考深度を選択する。

Gemini Thinking モードの効果を素早く検証するには、APIYI（apiyi.com）の利用をお勧めします。OpenAI 互換の統合インターフェースを提供しており、すべての Gemini 2.5 および 3 シリーズの大規模言語モデルをサポートしています。設定がより簡単で、安定したアクセスが可能です。

参考資料

Google Gemini Thinking 公式ドキュメント: 完全な API パラメータ説明
- リンク: ai.google.dev/gemini-api/docs/thinking
Cherry Studio 公式ドキュメント: クライアント設定ガイド
- リンク: docs.cherry-ai.com
Gemini モデルリスト: Thinking をサポートするモデル一覧
- リンク: ai.google.dev/gemini-api/docs/models

著者: APIYI Team
テクニカルサポート: Gemini API の取得や技術的なご相談は、APIYI（apiyi.com）までお問い合わせください。