TL;DR
DeepSeek é uma poderosa família de modelos de IA de código aberto (de 1.5B a 671B de parâmetros) com capacidades de raciocínio excepcionais. OpenClaw é um assistente de IA de código aberto viral (mais de 170K estrelas no GitHub) que funciona inteiramente localmente. Ao combinar DeepSeek com OpenClaw via Ollama, você obtém um assistente de IA gratuito e focado na privacidade que rivaliza com alternativas pagas, sem custos de API, sem assinaturas, controle completo.
Introdução
Construir um assistente de IA pessoal nunca foi tão acessível. Entre custos de API, planos de assinatura e preocupações com privacidade, os desenvolvedores precisam de um caminho claro para começar com as capacidades de IA locais.
Se você estava procurando uma maneira de executar modelos de linguagem poderosos localmente sem gastar dinheiro em chamadas de API, você está no lugar certo. Este guia te orienta na configuração do DeepSeek, o impressionante modelo de código aberto da DeepSeek AI com OpenClaw, um assistente de IA de código aberto viral que oferece um agente de IA pessoal rodando inteiramente no seu hardware.
A melhor parte? Tanto DeepSeek quanto OpenClaw são gratuitos para usar. Sem cartão de crédito. Sem assinatura. Nenhum dado sai da sua máquina.
Seja você um desenvolvedor buscando automatizar tarefas, um entusiasta explorando IA local, ou uma empresa procurando soluções de IA com foco na privacidade, esta configuração oferece capacidades de nível empresarial a custo zero.
Por que DeepSeek + OpenClaw?
O Poder do DeepSeek
DeepSeek emergiu como uma das famílias de modelos de IA de código aberto mais capazes em 2026. Veja o que o destaca:

Raciocínio Excepcional
DeepSeek-R1 alcança desempenho que se aproxima de modelos líderes como OpenAI O3 e Gemini 2.5 Pro em tarefas de raciocínio. É particularmente forte em matemática, codificação e resolução de problemas complexos.
Variedade de Modelos
DeepSeek oferece modelos para cada caso de uso:
| Modelo | Parâmetros | Melhor Para |
|---|---|---|
| DeepSeek-R1 | 1.5B - 671B | Raciocínio e resolução de problemas |
| DeepSeek-V3 | 671B | Tarefas de propósito geral |
| DeepSeek-V3.1 | 671B | Pensamento híbrido/não-pensamento |
| DeepSeek-Coder | 1.3B - 236B | Tarefas de codificação |
Raciocínio Híbrido
Assim como o Qwen3, o DeepSeek-V3.1 suporta tanto o modo de pensamento (raciocínio Chain-of-Thought) quanto o modo sem pensamento (respostas diretas), permitindo que você escolha com base na sua tarefa.
Eficiência de Custo
Os modelos DeepSeek são de código aberto e gratuitos para executar localmente. Você paga apenas pelo hardware.
A Flexibilidade do OpenClaw
OpenClaw (anteriormente Clawdbot/Moltbot) é um agente de IA de código aberto com mais de 170.000 estrelas no GitHub.

Ele oferece:
- Integração multiplataforma: WhatsApp, Telegram, Discord, Slack e mais
- Ações autônomas: Enviar e-mails, gerenciar calendários, navegar na web, executar comandos
- Memória persistente: Lembra o contexto entre sessões
- Ecossistema de habilidades: Mais de 700 extensões construídas pela comunidade via ClawHub
- Focado na privacidade: Funciona inteiramente localmente
Por que esta Combinação Funciona
A combinação do poderoso raciocínio do DeepSeek com as capacidades de agente do OpenClaw cria um assistente de IA gratuito e privado que rivaliza com alternativas pagas:
- Zero custos de API
- Privacidade completa dos dados
- Comportamento personalizável
- Controle total sobre seu assistente de IA
- Acesso multiplataforma
Pré-requisitos
Antes de começar, certifique-se de ter:
- Um computador com RAM suficiente (veja os requisitos abaixo)
- Acesso de administrador/root para instalar software
- Conexão com a internet para downloads iniciais
- Familiaridade básica com linha de comando (explicaremos cada passo)
Requisitos de RAM por Modelo
| Modelo | RAM Mínima | RAM Recomendada |
|---|---|---|
| DeepSeek-R1 1.5B | 8GB | 8GB |
| DeepSeek-R1 7B | 16GB | 16GB |
| DeepSeek-R1 14B | 32GB | 32GB |
| DeepSeek-R1 32B | 64GB | 64GB |
| DeepSeek-R1 70B | 128GB | 128GB+ |
| DeepSeek-V3 671B | 256GB | 256GB+ |
Dica profissional: Comece com o modelo 7B se você tiver 16GB de RAM. Você sempre pode escalar mais tarde.
Instalando o Ollama
Ollama é a ponte que permite executar o DeepSeek localmente. Ele lida com o download do modelo, gerenciamento de memória e serviço de inferência.
Instalação no macOS
# Usando Homebrew (recomendado)
brew install ollama
# Ou usando o script de instalação
curl -fsSL https://ollama.ai/install.sh | sh
Instalação no Linux
# Usando o script de instalação
curl -fsSL https://ollama.ai/install.sh | sh
# Ou baixe o binário diretamente
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama
Instalação no Windows
Baixe e execute o instalador em ollama.
Verificando a Instalação
Após a instalação, verifique se o Ollama está funcionando:
ollama --version
Você deve ver uma saída como ollama version 0.5.0 ou similar.
Iniciando o Serviço Ollama
O Ollama é executado como um serviço em segundo plano. Ele deve iniciar automaticamente, mas você pode verificar:
# Verifique se o Ollama está rodando
ollama list
# Se não estiver rodando, inicie-o
ollama serve
Configurando Modelos DeepSeek
Agora vamos fazer o DeepSeek rodar na sua máquina.
Puxando DeepSeek-R1 (Recomendado)
DeepSeek-R1 é o modelo principal de raciocínio. Para a maioria dos usuários, recomendamos começar com o modelo de 7B ou 8B:
# Puxe o modelo 7B (recomendado para a maioria dos usuários)
ollama pull deepseek-r1:7b
# Ou puxe o modelo 8B para um desempenho ligeiramente melhor
ollama pull deepseek-r1:8b
# Para hardware mais potente, experimente o modelo 14B
ollama pull deepseek-r1:14b
Puxando DeepSeek-V3 (Propósito Geral)
Se você precisa de um modelo de propósito geral em vez de um focado em raciocínio:
# Puxe DeepSeek-V3 (requer RAM significativa)
ollama pull deepseek-v3:671b
Puxando Modelos Destilados (Baixo Recurso)
Para sistemas com RAM limitada, modelos destilados oferecem bom raciocínio em tamanhos menores:
# Puxe modelos destilados baseados na arquitetura Qwen
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:14b
Executando o Modelo
Teste se o modelo funciona:
# Modo de chat interativo
ollama run deepseek-r1:7b
Digite sua mensagem e pressione Enter. Digite /exit para sair.
Testando com Python
Veja como usar o DeepSeek programaticamente:
import requests
url = "http://localhost:11434/api/generate"
payload = {
"model": "deepseek-r1:7b",
"prompt": "Explique o que é DeepSeek R1 em uma frase",
"stream": False,
}
response = requests.post(url, json=payload).json()
print(response["response"])
Testando sua API Ollama com Apidog
Antes de integrar com o OpenClaw, você pode testar sua configuração DeepSeek usando o Apidog. Isso é especialmente útil para depurar e verificar se seus endpoints de API estão funcionando corretamente.
- Crie uma nova Requisição no Apidog
- Defina o método para POST
- Insira a URL:
http://localhost:11434/api/generate - Adicione Cabeçalhos:
Content-Type:application/json

Adicione o Corpo (JSON):
{
"model": "deepseek-r1:7b",
"prompt": "Olá, mundo!",
"stream": false
}
A interface visual do Apidog facilita o teste das respostas da sua API Ollama e a depuração de quaisquer problemas antes de conectar ao OpenClaw. Você também pode salvar esta requisição para testar diferentes prompts e configurações.

Usando a Biblioteca Python do Ollama
from ollama import Client
client = Client()
output = client.chat(
model="deepseek-r1:7b",
messages=[{"role": "user", "content": "Escreva um 'olá mundo' em Python"}]
)
print(output["message"]["content"])
Instalando o OpenClaw
Agora vamos instalar o OpenClaw para criar seu assistente de IA.
Instalação Rápida
# Usando npx (sem necessidade de instalação)
npx openclaw
# Ou usando o script de instalação
curl -fsSL https://openclaw.ai/install.sh | bash
Configuração Inicial
Execute o OpenClaw pela primeira vez:
npx openclaw

Isso o guiará pela configuração inicial:
- Configure sua primeira conexão de plataforma (Telegram, Discord, etc.)
- Configure preferências básicas
- Inicie o assistente
Verificando se o OpenClaw está Rodando
# Verifique o status do OpenClaw
openclaw status
Integrando DeepSeek com OpenClaw
Agora a mágica acontece, vamos conectar o DeepSeek como o cérebro do seu assistente OpenClaw.
Método 1: Usando Ollama como Backend
OpenClaw suporta nativamente o Ollama. Configure-o para usar o DeepSeek:
# Defina o OpenClaw para usar Ollama com DeepSeek-R1
ollama launch openclaw --model deepseek-r1
# Ou especifique um tamanho de modelo diferente
ollama launch openclaw --model deepseek-v3.1
Método 2: Configuração de Ambiente
Defina variáveis de ambiente para mais controle:
# Configure o endpoint do Ollama
export OLLAMA_HOST=http://localhost:11434
# Defina o modelo
export OLLAMA_MODEL=deepseek-r1
Método 3: Arquivo de Configuração
Crie ou edite ~/.openclaw/config.yaml:
models:
default: ollama/deepseek-r1:7b
ollama:
host: http://localhost:11434
model: deepseek-r1:7b
temperature: 0.7
top_p: 0.9
Testando a Integração
# Teste se o OpenClaw está usando DeepSeek
openclaw models status
Você deve ver uma saída confirmando que DeepSeek-R1 está ativo.
Converse através da sua Plataforma
Agora você pode conversar com o DeepSeek através de qualquer plataforma conectada:
Telegram:
Envie uma mensagem para o seu bot OpenClaw no Telegram.
Discord:
Mencione seu bot OpenClaw no Discord.
WhatsApp:
Envie uma mensagem para o seu número de WhatsApp configurado do OpenClaw.
A resposta virá do DeepSeek rodando localmente!
Configuração e Otimização
Ajuste sua configuração DeepSeek + OpenClaw com estas opções.
Temperatura e Top-P
Controle a criatividade da resposta:
# Em config.yaml
ollama:
temperature: 0.7 # 0.0 = focado, 1.0 = criativo
top_p: 0.9 # Amostragem por núcleo
top_k: 40 # Seleção de tokens
Comprimento do Contexto
Ajuste para conversas mais longas:
ollama:
context_size: 4096 # Aumente para contexto mais longo
Prompt do Sistema
Personalize o comportamento do DeepSeek:
ollama:
system_prompt: |
Você é um assistente de codificação útil.
Forneça exemplos de código claros e concisos.
Explique conceitos em termos simples.
Alternando Entre Modelos
Você pode alternar facilmente entre diferentes modelos DeepSeek com base nas suas necessidades:
# Mude para o modelo 14B para mais capacidade
openclaw models set ollama/deepseek-r1:14b
# Mude para V3 para tarefas gerais
openclaw models set ollama/deepseek-v3:671b
# Volte para 7B para velocidade
openclaw models set ollama/deepseek-r1:7b
Testando seu Assistente de IA
Testando via Ollama Diretamente
# Teste as capacidades de raciocínio do DeepSeek
ollama run deepseek-r1:7b "Resolva este problema: Se um trem viaja 120km em 2 horas, qual é a sua velocidade?"
Testando via OpenClaw
# Envie uma mensagem de teste através do OpenClaw
openclaw chat "Olá, quanto é 2 + 2?"
Testando Integrações de Plataforma
Uma vez que suas plataformas estejam configuradas:
Telegram:
Envie /start para o seu bot OpenClaw.
Discord:
Mencione seu bot com @seu-bot olá.
WhatsApp:
Envie uma mensagem para o seu número de WhatsApp configurado.
Monitorando Logs
Verifique os logs do OpenClaw para ver o que está acontecendo:
# Veja os logs recentes
openclaw logs --recent
# Veja os logs ao vivo
openclaw logs --follow
Dicas de Configuração Avançada
Aceleração por GPU
Se você tem uma GPU NVIDIA, habilite a aceleração CUDA:
# Verifique se a GPU é detectada
ollama list
# Execute com aceleração por GPU (automático se a GPU estiver disponível)
ollama run deepseek-r1:7b --gpu
Criando Modelos Personalizados
Use prompts do sistema para criar versões especializadas:
# Crie um Modelfile
echo 'FROM deepseek-r1:7b
SYSTEM """Você é um especialista em Python.
Forneça código limpo e compatível com PEP 8.
"""' > /tmp/python-expert
# Crie o modelo personalizado
ollama create python-expert -f /tmp/python-expert
# Use-o no OpenClaw
openclaw models set ollama/python-expert
Configuração Multi-Modelo
Execute diferentes modelos para diferentes tarefas:
# Em config.yaml - configure múltiplos presets de modelo
models:
default: ollama/deepseek-r1:7b
coding: ollama/deepseek-coder:7b
reasoning: ollama/deepseek-r1:14b
Em seguida, alterne entre eles:
# Use o modelo de codificação
openclaw models set coding
# Use o modelo de raciocínio para tarefas complexas
openclaw models set reasoning
Otimização de Desempenho
Para melhor desempenho:
- Feche aplicativos desnecessários para liberar RAM
- Use o menor modelo que atenda às suas necessidades
- Considere atualizar a RAM se você frequentemente atingir os limites
- Use armazenamento SSD para carregamento de modelo mais rápido
Monitoramento do Uso de Recursos
# Verifique o modelo atual e os recursos
openclaw status --verbose
# Monitore o Ollama diretamente
ollama list
Solucionando Problemas Comuns
O Modelo Não Carrega (Sem Memória)
Problema: O Ollama falha ao carregar o modelo devido à RAM insuficiente.
Solução:
- Use um modelo menor (7B em vez de 14B)
- Feche outros aplicativos para liberar RAM
- Adicione mais RAM ao seu sistema
Respostas Lentas
Problema: As respostas demoram muito.
Soluções:
- Use um modelo menor
- Habilite a aceleração por GPU
- Reduza o tamanho do contexto
- Use um drive de armazenamento mais rápido (SSD)
OpenClaw Não Consegue Conectar ao Ollama
Problema: OpenClaw reporta erros de conexão ao Ollama.
Soluções:
- Verifique se o Ollama está rodando:
ollama serve - Verifique o host na configuração (padrão:
http://localhost:11434) - Reinicie o Ollama:
pkill ollama && ollama serve
Problemas de Conexão com a Plataforma
Problema: Não consegue conectar Telegram/Discord/WhatsApp.
Soluções:
- Verifique se suas credenciais de API estão corretas
- Verifique o status da API da plataforma
- Revise os logs do OpenClaw para mensagens de erro específicas
FAQ
O DeepSeek é realmente gratuito para usar?
Sim, o DeepSeek é de código aberto e gratuito para rodar localmente. Você só precisa fornecer o hardware (computador com RAM). Sem taxas de API, sem assinaturas.
Posso usar o DeepSeek comercialmente com o OpenClaw?
Sim, tanto DeepSeek quanto OpenClaw possuem licenças permissivas que permitem o uso comercial. Sempre revise os termos de licença mais recentes.
E se eu não tiver uma GPU?
DeepSeek pode ser executado em sistemas apenas com CPU. Espere inferência mais lenta (alguns segundos por resposta em vez de milissegundos). Os modelos menores (1.5B-7B) funcionam razoavelmente bem na CPU.
Como escolho entre DeepSeek-R1 e DeepSeek-V3?
- DeepSeek-R1: Melhor para tarefas de raciocínio, matemática, codificação e resolução de problemas
- DeepSeek-V3: Melhor para conversação e tarefas de propósito geral
Posso executar vários modelos DeepSeek ao mesmo tempo?
Sim, mas cada modelo requer RAM adicional. Uma configuração típica pode executar o modelo 7B junto com um modelo especialista menor para tarefas específicas.
Como atualizo o DeepSeek para a versão mais recente?
ollama pull deepseek-r1:7b
Ollama atualizará automaticamente se uma versão mais recente estiver disponível.
Posso conectar o OpenClaw aos meus próprios aplicativos?
Sim, o OpenClaw fornece endpoints de API e webhooks para integrações personalizadas. Verifique a documentação do OpenClaw para detalhes.
Conclusão
Agora você tem um poderoso assistente de IA gratuito rodando localmente em sua máquina. DeepSeek fornece a inteligência, OpenClaw fornece a capacidade de agente, e Ollama faz tudo funcionar perfeitamente.
O que você pode fazer agora:
- Converse com o DeepSeek através do Telegram, Discord, WhatsApp ou outras plataformas
- Automatize tarefas como enviar e-mails e gerenciar calendários
- Construa fluxos de trabalho de IA personalizados com total privacidade
- Escale do menor modelo ao mais poderoso conforme suas necessidades crescem
A combinação de DeepSeek e OpenClaw oferece capacidades que custariam centenas de dólares por mês com alternativas na nuvemtudo rodando em hardware que você possui.
Próximos passos:
- Experimente diferentes tamanhos de modelo DeepSeek
- Explore o marketplace de habilidades do OpenClaw (ClawHub)
- Conecte plataformas adicionais ao seu assistente
- Crie prompts personalizados para casos de uso específicos
O único limite é a sua imaginação.
Pronto para construir aplicativos de IA profissionais? Baixe Apidog gratuitamente e teste suas integrações de serviço de IA com uma interface visual projetada para desenvolvedores. Experimente o conjunto de testes de API do Apidog para garantir que seus fluxos de trabalho de IA sejam robustos e confiáveis.
