Como Criar um Assistente de IA Local Gratuito com OpenClaw e DeepSeek

TL;DR

DeepSeek é uma poderosa família de modelos de IA de código aberto (de 1.5B a 671B de parâmetros) com capacidades de raciocínio excepcionais. OpenClaw é um assistente de IA de código aberto viral (mais de 170K estrelas no GitHub) que funciona inteiramente localmente. Ao combinar DeepSeek com OpenClaw via Ollama, você obtém um assistente de IA gratuito e focado na privacidade que rivaliza com alternativas pagas, sem custos de API, sem assinaturas, controle completo.

Introdução

Construir um assistente de IA pessoal nunca foi tão acessível. Entre custos de API, planos de assinatura e preocupações com privacidade, os desenvolvedores precisam de um caminho claro para começar com as capacidades de IA locais.

Se você estava procurando uma maneira de executar modelos de linguagem poderosos localmente sem gastar dinheiro em chamadas de API, você está no lugar certo. Este guia te orienta na configuração do DeepSeek, o impressionante modelo de código aberto da DeepSeek AI com OpenClaw, um assistente de IA de código aberto viral que oferece um agente de IA pessoal rodando inteiramente no seu hardware.

A melhor parte? Tanto DeepSeek quanto OpenClaw são gratuitos para usar. Sem cartão de crédito. Sem assinatura. Nenhum dado sai da sua máquina.

Seja você um desenvolvedor buscando automatizar tarefas, um entusiasta explorando IA local, ou uma empresa procurando soluções de IA com foco na privacidade, esta configuração oferece capacidades de nível empresarial a custo zero.

Por que DeepSeek + OpenClaw?

O Poder do DeepSeek

DeepSeek emergiu como uma das famílias de modelos de IA de código aberto mais capazes em 2026. Veja o que o destaca:

Raciocínio Excepcional
DeepSeek-R1 alcança desempenho que se aproxima de modelos líderes como OpenAI O3 e Gemini 2.5 Pro em tarefas de raciocínio. É particularmente forte em matemática, codificação e resolução de problemas complexos.

Variedade de Modelos
DeepSeek oferece modelos para cada caso de uso:

Modelo	Parâmetros	Melhor Para
DeepSeek-R1	1.5B - 671B	Raciocínio e resolução de problemas
DeepSeek-V3	671B	Tarefas de propósito geral
DeepSeek-V3.1	671B	Pensamento híbrido/não-pensamento
DeepSeek-Coder	1.3B - 236B	Tarefas de codificação

Raciocínio Híbrido
Assim como o Qwen3, o DeepSeek-V3.1 suporta tanto o modo de pensamento (raciocínio Chain-of-Thought) quanto o modo sem pensamento (respostas diretas), permitindo que você escolha com base na sua tarefa.

Eficiência de Custo
Os modelos DeepSeek são de código aberto e gratuitos para executar localmente. Você paga apenas pelo hardware.

A Flexibilidade do OpenClaw

OpenClaw (anteriormente Clawdbot/Moltbot) é um agente de IA de código aberto com mais de 170.000 estrelas no GitHub.

Ele oferece:

Integração multiplataforma: WhatsApp, Telegram, Discord, Slack e mais
Ações autônomas: Enviar e-mails, gerenciar calendários, navegar na web, executar comandos
Memória persistente: Lembra o contexto entre sessões
Ecossistema de habilidades: Mais de 700 extensões construídas pela comunidade via ClawHub
Focado na privacidade: Funciona inteiramente localmente

Por que esta Combinação Funciona

A combinação do poderoso raciocínio do DeepSeek com as capacidades de agente do OpenClaw cria um assistente de IA gratuito e privado que rivaliza com alternativas pagas:

Zero custos de API
Privacidade completa dos dados
Comportamento personalizável
Controle total sobre seu assistente de IA
Acesso multiplataforma

Pré-requisitos

Antes de começar, certifique-se de ter:

Um computador com RAM suficiente (veja os requisitos abaixo)
Acesso de administrador/root para instalar software
Conexão com a internet para downloads iniciais
Familiaridade básica com linha de comando (explicaremos cada passo)

Requisitos de RAM por Modelo

Modelo	RAM Mínima	RAM Recomendada
DeepSeek-R1 1.5B	8GB	8GB
DeepSeek-R1 7B	16GB	16GB
DeepSeek-R1 14B	32GB	32GB
DeepSeek-R1 32B	64GB	64GB
DeepSeek-R1 70B	128GB	128GB+
DeepSeek-V3 671B	256GB	256GB+

Dica profissional: Comece com o modelo 7B se você tiver 16GB de RAM. Você sempre pode escalar mais tarde.

Instalando o Ollama

Ollama é a ponte que permite executar o DeepSeek localmente. Ele lida com o download do modelo, gerenciamento de memória e serviço de inferência.

Instalação no macOS

# Usando Homebrew (recomendado)
brew install ollama

# Ou usando o script de instalação
curl -fsSL https://ollama.ai/install.sh | sh

Instalação no Linux

# Usando o script de instalação
curl -fsSL https://ollama.ai/install.sh | sh

# Ou baixe o binário diretamente
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Instalação no Windows

Baixe e execute o instalador em ollama.

Verificando a Instalação

Após a instalação, verifique se o Ollama está funcionando:

ollama --version

Você deve ver uma saída como ollama version 0.5.0 ou similar.

Iniciando o Serviço Ollama

O Ollama é executado como um serviço em segundo plano. Ele deve iniciar automaticamente, mas você pode verificar:

# Verifique se o Ollama está rodando
ollama list

# Se não estiver rodando, inicie-o
ollama serve

Configurando Modelos DeepSeek

Agora vamos fazer o DeepSeek rodar na sua máquina.

Puxando DeepSeek-R1 (Recomendado)

DeepSeek-R1 é o modelo principal de raciocínio. Para a maioria dos usuários, recomendamos começar com o modelo de 7B ou 8B:

# Puxe o modelo 7B (recomendado para a maioria dos usuários)
ollama pull deepseek-r1:7b

# Ou puxe o modelo 8B para um desempenho ligeiramente melhor
ollama pull deepseek-r1:8b

# Para hardware mais potente, experimente o modelo 14B
ollama pull deepseek-r1:14b

Puxando DeepSeek-V3 (Propósito Geral)

Se você precisa de um modelo de propósito geral em vez de um focado em raciocínio:

# Puxe DeepSeek-V3 (requer RAM significativa)
ollama pull deepseek-v3:671b

Puxando Modelos Destilados (Baixo Recurso)

Para sistemas com RAM limitada, modelos destilados oferecem bom raciocínio em tamanhos menores:

# Puxe modelos destilados baseados na arquitetura Qwen
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:14b

Executando o Modelo

Teste se o modelo funciona:

# Modo de chat interativo
ollama run deepseek-r1:7b

Digite sua mensagem e pressione Enter. Digite /exit para sair.

Testando com Python

Veja como usar o DeepSeek programaticamente:

import requests

url = "http://localhost:11434/api/generate"
payload = {
    "model": "deepseek-r1:7b",
    "prompt": "Explique o que é DeepSeek R1 em uma frase",
    "stream": False,
}
response = requests.post(url, json=payload).json()
print(response["response"])

Testando sua API Ollama com Apidog

Antes de integrar com o OpenClaw, você pode testar sua configuração DeepSeek usando o Apidog. Isso é especialmente útil para depurar e verificar se seus endpoints de API estão funcionando corretamente.

Crie uma nova Requisição no Apidog
Defina o método para POST
Insira a URL: http://localhost:11434/api/generate
Adicione Cabeçalhos:

Content-Type: application/json

Adicione o Corpo (JSON):

{
  "model": "deepseek-r1:7b",
  "prompt": "Olá, mundo!",
  "stream": false
}

A interface visual do Apidog facilita o teste das respostas da sua API Ollama e a depuração de quaisquer problemas antes de conectar ao OpenClaw. Você também pode salvar esta requisição para testar diferentes prompts e configurações.

Adicione o Corpo para enviar a requisição no Apidog

Usando a Biblioteca Python do Ollama

from ollama import Client

client = Client()
output = client.chat(
    model="deepseek-r1:7b",
    messages=[{"role": "user", "content": "Escreva um 'olá mundo' em Python"}]
)
print(output["message"]["content"])

Instalando o OpenClaw

Agora vamos instalar o OpenClaw para criar seu assistente de IA.

Instalação Rápida

# Usando npx (sem necessidade de instalação)
npx openclaw

# Ou usando o script de instalação
curl -fsSL https://openclaw.ai/install.sh | bash

Configuração Inicial

Execute o OpenClaw pela primeira vez:

npx openclaw

Isso o guiará pela configuração inicial:

Configure sua primeira conexão de plataforma (Telegram, Discord, etc.)
Configure preferências básicas
Inicie o assistente

Verificando se o OpenClaw está Rodando

# Verifique o status do OpenClaw
openclaw status

Integrando DeepSeek com OpenClaw

Agora a mágica acontece, vamos conectar o DeepSeek como o cérebro do seu assistente OpenClaw.

Método 1: Usando Ollama como Backend

OpenClaw suporta nativamente o Ollama. Configure-o para usar o DeepSeek:

# Defina o OpenClaw para usar Ollama com DeepSeek-R1
ollama launch openclaw --model deepseek-r1

# Ou especifique um tamanho de modelo diferente
ollama launch openclaw --model deepseek-v3.1

Método 2: Configuração de Ambiente

Defina variáveis de ambiente para mais controle:

# Configure o endpoint do Ollama
export OLLAMA_HOST=http://localhost:11434

# Defina o modelo
export OLLAMA_MODEL=deepseek-r1

Método 3: Arquivo de Configuração

Crie ou edite ~/.openclaw/config.yaml:

models:
  default: ollama/deepseek-r1:7b

ollama:
  host: http://localhost:11434
  model: deepseek-r1:7b
  temperature: 0.7
  top_p: 0.9

Testando a Integração

# Teste se o OpenClaw está usando DeepSeek
openclaw models status

Você deve ver uma saída confirmando que DeepSeek-R1 está ativo.

Converse através da sua Plataforma

Agora você pode conversar com o DeepSeek através de qualquer plataforma conectada:

Telegram:
Envie uma mensagem para o seu bot OpenClaw no Telegram.

Discord:
Mencione seu bot OpenClaw no Discord.

WhatsApp:
Envie uma mensagem para o seu número de WhatsApp configurado do OpenClaw.

A resposta virá do DeepSeek rodando localmente!

Configuração e Otimização

Ajuste sua configuração DeepSeek + OpenClaw com estas opções.

Temperatura e Top-P

Controle a criatividade da resposta:

# Em config.yaml
ollama:
  temperature: 0.7    # 0.0 = focado, 1.0 = criativo
  top_p: 0.9         # Amostragem por núcleo
  top_k: 40          # Seleção de tokens

Comprimento do Contexto

Ajuste para conversas mais longas:

ollama:
  context_size: 4096  # Aumente para contexto mais longo

Prompt do Sistema

Personalize o comportamento do DeepSeek:

ollama:
  system_prompt: |
    Você é um assistente de codificação útil.
    Forneça exemplos de código claros e concisos.
    Explique conceitos em termos simples.

Alternando Entre Modelos

Você pode alternar facilmente entre diferentes modelos DeepSeek com base nas suas necessidades:

# Mude para o modelo 14B para mais capacidade
openclaw models set ollama/deepseek-r1:14b

# Mude para V3 para tarefas gerais
openclaw models set ollama/deepseek-v3:671b

# Volte para 7B para velocidade
openclaw models set ollama/deepseek-r1:7b

Testando seu Assistente de IA

Testando via Ollama Diretamente

# Teste as capacidades de raciocínio do DeepSeek
ollama run deepseek-r1:7b "Resolva este problema: Se um trem viaja 120km em 2 horas, qual é a sua velocidade?"

Testando via OpenClaw

# Envie uma mensagem de teste através do OpenClaw
openclaw chat "Olá, quanto é 2 + 2?"

Testando Integrações de Plataforma

Uma vez que suas plataformas estejam configuradas:

Telegram:
Envie /start para o seu bot OpenClaw.

Discord:
Mencione seu bot com @seu-bot olá.

WhatsApp:
Envie uma mensagem para o seu número de WhatsApp configurado.

Monitorando Logs

Verifique os logs do OpenClaw para ver o que está acontecendo:

# Veja os logs recentes
openclaw logs --recent

# Veja os logs ao vivo
openclaw logs --follow

Dicas de Configuração Avançada

Aceleração por GPU

Se você tem uma GPU NVIDIA, habilite a aceleração CUDA:

# Verifique se a GPU é detectada
ollama list

# Execute com aceleração por GPU (automático se a GPU estiver disponível)
ollama run deepseek-r1:7b --gpu

Criando Modelos Personalizados

Use prompts do sistema para criar versões especializadas:

# Crie um Modelfile
echo 'FROM deepseek-r1:7b
SYSTEM """Você é um especialista em Python.
Forneça código limpo e compatível com PEP 8.
"""' > /tmp/python-expert

# Crie o modelo personalizado
ollama create python-expert -f /tmp/python-expert

# Use-o no OpenClaw
openclaw models set ollama/python-expert

Configuração Multi-Modelo

Execute diferentes modelos para diferentes tarefas:

# Em config.yaml - configure múltiplos presets de modelo
models:
  default: ollama/deepseek-r1:7b
  coding: ollama/deepseek-coder:7b
  reasoning: ollama/deepseek-r1:14b

Em seguida, alterne entre eles:

# Use o modelo de codificação
openclaw models set coding

# Use o modelo de raciocínio para tarefas complexas
openclaw models set reasoning

Otimização de Desempenho

Para melhor desempenho:

Feche aplicativos desnecessários para liberar RAM
Use o menor modelo que atenda às suas necessidades
Considere atualizar a RAM se você frequentemente atingir os limites
Use armazenamento SSD para carregamento de modelo mais rápido

Monitoramento do Uso de Recursos

# Verifique o modelo atual e os recursos
openclaw status --verbose

# Monitore o Ollama diretamente
ollama list

Solucionando Problemas Comuns

O Modelo Não Carrega (Sem Memória)

Problema: O Ollama falha ao carregar o modelo devido à RAM insuficiente.

Solução:

Use um modelo menor (7B em vez de 14B)
Feche outros aplicativos para liberar RAM
Adicione mais RAM ao seu sistema

Respostas Lentas

Problema: As respostas demoram muito.

Soluções:

Use um modelo menor
Habilite a aceleração por GPU
Reduza o tamanho do contexto
Use um drive de armazenamento mais rápido (SSD)

OpenClaw Não Consegue Conectar ao Ollama

Problema: OpenClaw reporta erros de conexão ao Ollama.

Soluções:

Verifique se o Ollama está rodando: ollama serve
Verifique o host na configuração (padrão: http://localhost:11434)
Reinicie o Ollama: pkill ollama && ollama serve

Problemas de Conexão com a Plataforma

Problema: Não consegue conectar Telegram/Discord/WhatsApp.

Soluções:

Verifique se suas credenciais de API estão corretas
Verifique o status da API da plataforma
Revise os logs do OpenClaw para mensagens de erro específicas

FAQ

O DeepSeek é realmente gratuito para usar?

Sim, o DeepSeek é de código aberto e gratuito para rodar localmente. Você só precisa fornecer o hardware (computador com RAM). Sem taxas de API, sem assinaturas.

Posso usar o DeepSeek comercialmente com o OpenClaw?

Sim, tanto DeepSeek quanto OpenClaw possuem licenças permissivas que permitem o uso comercial. Sempre revise os termos de licença mais recentes.

E se eu não tiver uma GPU?

DeepSeek pode ser executado em sistemas apenas com CPU. Espere inferência mais lenta (alguns segundos por resposta em vez de milissegundos). Os modelos menores (1.5B-7B) funcionam razoavelmente bem na CPU.

Como escolho entre DeepSeek-R1 e DeepSeek-V3?

DeepSeek-R1: Melhor para tarefas de raciocínio, matemática, codificação e resolução de problemas
DeepSeek-V3: Melhor para conversação e tarefas de propósito geral

Posso executar vários modelos DeepSeek ao mesmo tempo?

Sim, mas cada modelo requer RAM adicional. Uma configuração típica pode executar o modelo 7B junto com um modelo especialista menor para tarefas específicas.

Como atualizo o DeepSeek para a versão mais recente?

ollama pull deepseek-r1:7b

Ollama atualizará automaticamente se uma versão mais recente estiver disponível.

Posso conectar o OpenClaw aos meus próprios aplicativos?

Sim, o OpenClaw fornece endpoints de API e webhooks para integrações personalizadas. Verifique a documentação do OpenClaw para detalhes.

Conclusão

Agora você tem um poderoso assistente de IA gratuito rodando localmente em sua máquina. DeepSeek fornece a inteligência, OpenClaw fornece a capacidade de agente, e Ollama faz tudo funcionar perfeitamente.

O que você pode fazer agora:

Converse com o DeepSeek através do Telegram, Discord, WhatsApp ou outras plataformas
Automatize tarefas como enviar e-mails e gerenciar calendários
Construa fluxos de trabalho de IA personalizados com total privacidade
Escale do menor modelo ao mais poderoso conforme suas necessidades crescem

A combinação de DeepSeek e OpenClaw oferece capacidades que custariam centenas de dólares por mês com alternativas na nuvemtudo rodando em hardware que você possui.

Próximos passos:

Experimente diferentes tamanhos de modelo DeepSeek
Explore o marketplace de habilidades do OpenClaw (ClawHub)
Conecte plataformas adicionais ao seu assistente
Crie prompts personalizados para casos de uso específicos

O único limite é a sua imaginação.

Pronto para construir aplicativos de IA profissionais? Baixe Apidog gratuitamente e teste suas integrações de serviço de IA com uma interface visual projetada para desenvolvedores. Experimente o conjunto de testes de API do Apidog para garantir que seus fluxos de trabalho de IA sejam robustos e confiáveis.

button