3 passos para configurar o modo Gemini Thinking: tutorial de configuração completo para Cherry Studio e Chatbox

Quer fazer a IA "pensar antes de responder" como um ser humano? O modo Gemini Thinking é o mais recente recurso de raciocínio profundo lançado pelo Google, permitindo que o modelo mostre todo o seu processo de pensamento antes de entregar a resposta. Este artigo detalha como configurar corretamente o modo Gemini Thinking em dois dos principais clientes de IA: Cherry Studio e Chatbox.

Valor central: Ao ler este artigo, você aprenderá a ativar o modo de pensamento do Gemini no Cherry Studio e no Chatbox, visualizar o processo de raciocínio do modelo e melhorar a eficácia na resolução de tarefas complexas.

gemini-thinking-mode-cherry-studio-chatbox-config-guide-pt-pt 图示


Pontos Principais do Modo Gemini Thinking

O modo Gemini Thinking é uma funcionalidade de raciocínio profundo introduzida pelo Google nas séries de modelos Gemini 2.5 e 3. Ao contrário de uma conversa comum, o modo Thinking faz com que o modelo realize um raciocínio interno antes de fornecer a resposta final, aumentando significativamente a precisão em tarefas complexas.

Ponto Chave Descrição Valor
Visualização do pensamento Mostra o processo de raciocínio do modelo Entender como a IA chegou à conclusão
Raciocínio aprimorado Raciocínio lógico em várias etapas Resolver problemas complexos de matemática e programação
Profundidade controlável Ajusta o orçamento de Tokens de pensamento Equilibrar velocidade e precisão
Compatibilidade de modelos Toda a série Gemini 2.5/3 Flexibilidade para escolher o melhor cenário

Modelos compatíveis com o Modo Gemini Thinking

Atualmente, os modelos Gemini que suportam o modo Thinking são:

Nome do Modelo ID do Modelo Parâmetro de Pensamento Comportamento Padrão
Gemini 3 Pro gemini-3-pro-preview thinking_level Pensamento dinâmico (HIGH)
Gemini 3 Flash gemini-3-flash-preview thinking_level Pensamento dinâmico (HIGH)
Gemini 2.5 Pro gemini-2.5-pro thinking_budget Dinâmico (8192 tokens)
Gemini 2.5 Flash gemini-2.5-flash thinking_budget Dinâmico (-1)
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite thinking_budget Desativado por padrão (0)

🎯 Sugestão Técnica: No desenvolvimento prático, recomendamos usar a plataforma APIYI (apiyi.com) para chamadas unificadas aos modelos Gemini Thinking. A plataforma oferece interfaces compatíveis com o formato OpenAI, eliminando a necessidade de lidar com processos complexos de autenticação da API do Google.

gemini-thinking-mode-cherry-studio-chatbox-config-guide-pt-pt 图示

Detalhes dos Parâmetros da API do Modo Gemini Thinking

Diferentes versões dos modelos Gemini utilizam parâmetros diferentes para controlar o pensamento:

Série Gemini 3 – Parâmetro thinking_level

Nível Descrição Cenário de Uso
minimal Pensamento mínimo Perguntas e respostas simples
low Pensamento baixo Diálogos cotidianos
medium Pensamento médio Raciocínio geral
high Pensamento profundo (padrão) Tarefas complexas

Série Gemini 2.5 – Parâmetro thinking_budget

Valor Descrição Cenário de Uso
0 Desativar pensamento Resposta rápida
-1 Pensamento dinâmico (recomendado) Ajuste automático
128-32768 Número específico de Tokens Controle fino

Configurando o Modo Gemini Thinking no Cherry Studio

O Cherry Studio é um cliente de IA poderoso que suporta mais de 300 modelos e diversos provedores de IA. Abaixo, detalhamos os passos para configurar o Modo Gemini Thinking no Cherry Studio.

Passo 1: Adicionar o Provedor de API do Gemini

  1. Abra o Cherry Studio e vá em Configurações → Provedores
  2. Encontre o Gemini ou Provedor Personalizado
  3. Insira as informações de configuração da API:
Endereço da API: https://api.apiyi.com/v1
Chave de API: Sua chave da APIYI

💡 Dica de configuração: Use a APIYI (apiyi.com) como endereço da API para obter um acesso mais estável e um formato de interface unificado.

Passo 2: Adicionar os Modelos Gemini Thinking

Clique no botão "Gerenciar" ou "Adicionar" na parte inferior para adicionar manualmente os seguintes modelos:

Nome do Modelo Adicionado Descrição
gemini-3-pro-preview Gemini 3 Pro (Versão Thinking)
gemini-3-flash-preview Gemini 3 Flash (Versão Thinking)
gemini-2.5-pro Gemini 2.5 Pro (Versão Thinking)
gemini-2.5-flash Gemini 2.5 Flash (Versão Thinking)

Passo 3: Ativar a Chave do Thinking Mode

Na interface de chat:

  1. Clique no ícone de configurações no canto superior direito
  2. Encontre a opção Thinking Mode
  3. Mude a chave para ON

gemini-thinking-mode-cherry-studio-chatbox-config-guide-pt-pt 图示

Configuração de Parâmetros Personalizados no Cherry Studio

Se a chave na interface (UI) não funcionar, você precisará configurar os parâmetros personalizados manualmente:

Para modelos Gemini 3:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

Para modelos Gemini 2.5:

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingBudget": -1,
      "includeThoughts": true
    }
  }
}

Cole a configuração JSON acima na área de Parâmetros Personalizados (Custom Parameters) do Cherry Studio.

Ver instruções detalhadas de configuração do Cherry Studio

Detalhes dos passos de configuração:

  1. Abrir configurações do modelo: Clique no nome do modelo no topo da caixa de diálogo.
  2. Acessar configurações avançadas: Role até a área de "Parâmetros Personalizados".
  3. Colar o JSON: Copie a configuração JSON correspondente ao modelo acima.
  4. Salvar e testar: Envie uma mensagem para verificar se o processo de pensamento é exibido.

Solução de Problemas Comuns:

  • Certifique-se de que o formato JSON está correto, sem vírgulas extras.
  • Confirme se o nome do modelo corresponde à configuração.
  • Verifique se a Chave de API é válida.

🚀 Começo Rápido: Recomendamos usar a plataforma APIYI (apiyi.com) para obter sua Chave de API. Ela suporta toda a linha de modelos Gemini e a configuração é mais simples.


Configurando o modo Gemini Thinking no Chatbox

O Chatbox é outro cliente desktop de IA amplamente popular, com uma interface limpa e suporte para várias plataformas. Veja a seguir como configurar o modo Gemini Thinking no Chatbox.

Passo 1: Configurar o Provedor de API

  1. Abra o Chatbox e clique em Configurações no canto inferior esquerdo.
  2. Selecione Provedor de Modelo → Custom (Personalizado).
  3. Configure as informações da API:
Nome: Gemini Thinking
Tipo de API: OpenAI Compatible
API Host: https://api.apiyi.com
API Key: sk-seu-token-apiyi

Passo 2: Selecionar o Modelo Thinking

No seletor de modelos, digite ou selecione:

  • gemini-3-pro-preview – Maior capacidade de raciocínio
  • gemini-2.5-pro – Equilíbrio entre desempenho e custo
  • gemini-2.5-flash – Resposta rápida

Passo 3: Configurar os Parâmetros de Pensamento

O Chatbox permite configurar o modo de pensamento através de Parâmetros Extras (Extra Parameters):

{
  "thinking_config": {
    "thinking_level": "high"
  }
}

Ou use o thinking_budget:

{
  "thinking_config": {
    "thinking_budget": 8192
  }
}

Configurações de Exibição do Processo de Pensamento no Chatbox

Por padrão, o Chatbox exibe o processo de pensamento de forma recolhida, mas você pode ajustar a exibição:

Item de Configuração Função Valor Recomendado
Mostrar processo de pensamento Expandir/recolher o conteúdo do pensamento Ativado
Estilo do processo de pensamento Bloco independente/Exibição em linha Bloco independente
Recolhimento automático Recolher automaticamente pensamentos longos Ativado
Ver exemplo de código de configuração no Chatbox
# Usando o SDK da OpenAI para configurar o Gemini Thinking
import openai

client = openai.OpenAI(
    api_key="sk-seu-token-apiyi",
    base_url="https://api.apiyi.com/v1"  # Interface unificada da APIYI
)

response = client.chat.completions.create(
    model="gemini-2.5-pro",
    messages=[
        {"role": "user", "content": "Por favor, explique por que 1+1=2"}
    ],
    extra_body={
        "thinking_config": {
            "thinking_budget": 8192,
            "include_thoughts": True
        }
    }
)

# Exibe o processo de pensamento e a resposta
print(response.choices[0].message.content)

Melhores Práticas para o Modo Gemini Thinking

Configuração da Profundidade de Pensamento para Diferentes Cenários

Cenário de Uso Modelo Recomendado Configuração de Pensamento Descrição
Prova Matemática gemini-3-pro-preview thinking_level: high Exige raciocínio rigoroso
Depuração de Código gemini-2.5-pro thinking_budget: 16384 Análise de lógica complexa
Perguntas e Respostas Diárias gemini-2.5-flash thinking_budget: -1 Adaptação dinâmica
Resposta Rápida gemini-2.5-flash-lite thinking_budget: 0 Desativa o pensamento
Escrita de Artigos gemini-3-flash-preview thinking_level: medium Equilíbrio entre criatividade e eficiência

Sugestões de Orçamento de Tokens para Pensamento (Thinking Tokens)

Perguntas simples: 0-1024 tokens
Raciocínio geral: 1024-4096 tokens
Tarefas complexas: 4096-16384 tokens
Raciocínio extremo: 16384-32768 tokens

💡 Dica de Escolha: A profundidade de pensamento depende principalmente da complexidade da tarefa. Recomendamos realizar testes práticos na plataforma APIYI (apiyi.com) para encontrar a configuração ideal para o seu caso. A plataforma suporta todos os modelos Gemini Thinking, facilitando a comparação rápida de resultados.

Orçamento de Thinking Tokens e Complexidade da Tarefa Escolha a profundidade de pensamento adequada com base no tipo de tarefa

Complexidade da Tarefa

Orçamento de Thinking Tokens

0 1K 8K 16K 32K

Perguntas simples 0 – 1.024 tokens

<!-- 示例任务 -->
<rect x="105" y="100" width="150" height="70" rx="6" fill="#1e293b" stroke="#22c55e" stroke-width="1" />
<text x="180" y="120" text-anchor="middle" fill="#22c55e" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">Tarefas aplicáveis</text>
<text x="115" y="140" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Tradução simples</text>
<text x="115" y="155" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Busca de informações</text>

<!-- 连接线 -->
<line x1="180" y1="170" x2="180" y2="280" stroke="#22c55e" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

Raciocínio geral 1K – 4K tokens

<!-- 示例任务 -->
<rect x="260" y="100" width="155" height="70" rx="6" fill="#1e293b" stroke="#3b82f6" stroke-width="1" />
<text x="337" y="120" text-anchor="middle" fill="#3b82f6" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">Tarefas aplicáveis</text>
<text x="270" y="140" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Explicação de código</text>
<text x="270" y="155" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Resumo de artigos</text>

<!-- 连接线 -->
<line x1="337" y1="170" x2="337" y2="230" stroke="#3b82f6" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

Tarefas complexas 4K – 16K tokens

<!-- 示例任务 -->
<rect x="420" y="100" width="155" height="60" rx="6" fill="#1e293b" stroke="#f59e0b" stroke-width="1" />
<text x="497" y="118" text-anchor="middle" fill="#f59e0b" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">Tarefas aplicáveis</text>
<text x="430" y="136" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Algoritmos • Depuração</text>
<text x="430" y="151" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Comparação • Arquitetura</text>

<!-- 连接线 -->
<line x1="497" y1="160" x2="497" y2="170" stroke="#f59e0b" stroke-width="1" stroke-dasharray="4,4" opacity="0.5" />

Raciocínio extremo 16K – 32K tokens

<!-- 示例任务 -->
<rect x="580" y="175" width="155" height="60" rx="6" fill="#1e293b" stroke="#ef4444" stroke-width="1" />
<text x="657" y="193" text-anchor="middle" fill="#ef4444" font-size="11" font-weight="bold" font-family="system-ui, sans-serif">Tarefas aplicáveis</text>
<text x="590" y="211" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Provas matemáticas • Programação complexa</text>
<text x="590" y="226" fill="#e2e8f0" font-size="9" font-family="system-ui, sans-serif">• Raciocínio profundo • Planejamento estratégico</text>

💡 Recomendação: use thinking_budget: -1 (modo dinâmico) para o modelo ajustar automaticamente a profundidade

Comparação: Modo Thinking vs. Modo Comum

Dimensão de Comparação Modo Comum Modo Thinking
Velocidade de Resposta Rápida (1-3 seg) Mais lenta (3-10 seg)
Profundidade de Raciocínio Superficial Profunda e multi-etapas
Consumo de Tokens Baixo Médio-Alto
Precisão (Tarefas Complexas) 60-70% 85-95%
Explicabilidade Baixa Alta (permite ver o raciocínio)
Cenários Aplicáveis Perguntas simples Tarefas de raciocínio complexo

Perguntas Frequentes

Q1: O Cherry Studio não exibe o processo de pensamento mesmo após ativar o Thinking Mode?

Este é um problema conhecido. A chave na interface de alguns provedores pode não funcionar corretamente, sendo necessário adicionar manualmente a configuração JSON em "Parâmetros Personalizados":

{
  "generationConfig": {
    "thinkingConfig": {
      "thinkingLevel": "high",
      "includeThoughts": true
    }
  }
}

Certifique-se de que includeThoughts esteja definido como true, pois este é o parâmetro crucial para exibir o processo de pensamento. Ao realizar chamadas através da plataforma APIYI (apiyi.com), o retorno do resumo do pensamento já vem ativado por padrão.

Q2: Qual é a diferença entre os parâmetros do Gemini 2.5 e do Gemini 3?

As duas séries utilizam parâmetros diferentes para controlar o modo de pensamento:

  • Série Gemini 3: Utiliza o parâmetro thinkingLevel, com os valores: minimal/low/medium/high.
  • Série Gemini 2.5: Utiliza o parâmetro thinkingBudget, com valores numéricos entre 0 e 32768.

Não é possível misturar os parâmetros, caso contrário, a API retornará um erro. Recomendamos utilizar a interface unificada da APIYI (apiyi.com), onde a plataforma processa automaticamente a compatibilidade dos parâmetros.

Q3: Quanto o modo de pensamento aumenta o consumo de Tokens?

Os Tokens de pensamento são cobrados adicionalmente. Tomando o Gemini 2.5 Pro como exemplo:

  • Orçamento de pensamento padrão: 8192 tokens
  • Orçamento de pensamento máximo: 32768 tokens

O consumo real depende da complexidade da tarefa. Para perguntas simples, o modelo pode usar apenas algumas centenas de tokens de pensamento; para questões complexas, pode esgotar o orçamento. Configurar thinkingBudget: -1 permite que o modelo se ajuste automaticamente, sendo a opção com melhor custo-benefício.

Q4: Como obter apenas o resumo do pensamento em vez do processo completo?

Ao configurar includeThoughts: true na chamada da API, o que é retornado é o resumo do pensamento, e não os tokens de pensamento internos completos. O resumo é mais conciso e ideal para exibição em interfaces de usuário (UI). O processo de pensamento completo não está disponível para o público no momento.

Q5: Quais tarefas são mais adequadas para o modo Thinking?

O modo Thinking é especialmente indicado para tarefas que exigem raciocínio em múltiplas etapas:

  • Provas matemáticas e cálculos complexos
  • Depuração de código (debugging) e design de algoritmos
  • Raciocínio lógico e análise de problemas
  • Planejamento estratégico e análise de decisão

Tarefas simples como consultas de informações, traduções ou resumos curtos não precisam do modo Thinking ativado, pois ele apenas aumentaria a latência e o custo.


Resumo

O modo Gemini Thinking é uma funcionalidade poderosa para elevar a capacidade de raciocínio do seu Modelo de Linguagem Grande. Através deste tutorial de configuração, você aprendeu:

  1. Entender os princípios do modo Thinking: Dominar a diferença entre os parâmetros thinking_level e thinking_budget.
  2. Métodos de configuração no Cherry Studio: Ativar o modo de pensamento via interface ou parâmetros JSON personalizados.
  3. Métodos de configuração no Chatbox: Utilizar os "Extra Parameters" para configurar os parâmetros de pensamento.
  4. Melhores Práticas: Escolher a profundidade de pensamento adequada de acordo com a complexidade da tarefa.

Recomendamos utilizar a APIYI (apiyi.com) para validar rapidamente os efeitos do modo Gemini Thinking. A plataforma oferece uma interface unificada compatível com OpenAI, suporte para todas as séries de modelos Gemini 2.5 e 3, com configuração simplificada e acesso mais estável.


Referências

  1. Documentação oficial do Google Gemini Thinking: Descrição completa dos parâmetros da API

    • Link: ai.google.dev/gemini-api/docs/thinking
  2. Documentação oficial do Cherry Studio: Guia de configuração do cliente

    • Link: docs.cherry-ai.com
  3. Lista de modelos Gemini: Lista de modelos compatíveis com o Thinking

    • Link: ai.google.dev/gemini-api/docs/models

Autor: Equipe APIYI
Suporte Técnico: Para obter a API do Gemini ou consultoria técnica, acesse APIYI em apiyi.com

Deixe um comentário