Como Criar um Assistente de IA Local Gratuito com OpenClaw e DeepSeek

Ashley Innocent

Ashley Innocent

26 fevereiro 2026

Como Criar um Assistente de IA Local Gratuito com OpenClaw e DeepSeek

TL;DR

DeepSeek é uma poderosa família de modelos de IA de código aberto (de 1.5B a 671B de parâmetros) com capacidades de raciocínio excepcionais. OpenClaw é um assistente de IA de código aberto viral (mais de 170K estrelas no GitHub) que funciona inteiramente localmente. Ao combinar DeepSeek com OpenClaw via Ollama, você obtém um assistente de IA gratuito e focado na privacidade que rivaliza com alternativas pagas, sem custos de API, sem assinaturas, controle completo.

Introdução

Construir um assistente de IA pessoal nunca foi tão acessível. Entre custos de API, planos de assinatura e preocupações com privacidade, os desenvolvedores precisam de um caminho claro para começar com as capacidades de IA locais.

Se você estava procurando uma maneira de executar modelos de linguagem poderosos localmente sem gastar dinheiro em chamadas de API, você está no lugar certo. Este guia te orienta na configuração do DeepSeek, o impressionante modelo de código aberto da DeepSeek AI com OpenClaw, um assistente de IA de código aberto viral que oferece um agente de IA pessoal rodando inteiramente no seu hardware.

A melhor parte? Tanto DeepSeek quanto OpenClaw são gratuitos para usar. Sem cartão de crédito. Sem assinatura. Nenhum dado sai da sua máquina.

Seja você um desenvolvedor buscando automatizar tarefas, um entusiasta explorando IA local, ou uma empresa procurando soluções de IA com foco na privacidade, esta configuração oferece capacidades de nível empresarial a custo zero.

Por que DeepSeek + OpenClaw?

O Poder do DeepSeek

DeepSeek emergiu como uma das famílias de modelos de IA de código aberto mais capazes em 2026. Veja o que o destaca:

Logotipo Deepseek

Raciocínio Excepcional
DeepSeek-R1 alcança desempenho que se aproxima de modelos líderes como OpenAI O3 e Gemini 2.5 Pro em tarefas de raciocínio. É particularmente forte em matemática, codificação e resolução de problemas complexos.

Variedade de Modelos
DeepSeek oferece modelos para cada caso de uso:

ModeloParâmetrosMelhor Para
DeepSeek-R11.5B - 671BRaciocínio e resolução de problemas
DeepSeek-V3671BTarefas de propósito geral
DeepSeek-V3.1671BPensamento híbrido/não-pensamento
DeepSeek-Coder1.3B - 236BTarefas de codificação

Raciocínio Híbrido
Assim como o Qwen3, o DeepSeek-V3.1 suporta tanto o modo de pensamento (raciocínio Chain-of-Thought) quanto o modo sem pensamento (respostas diretas), permitindo que você escolha com base na sua tarefa.

Eficiência de Custo
Os modelos DeepSeek são de código aberto e gratuitos para executar localmente. Você paga apenas pelo hardware.

A Flexibilidade do OpenClaw

OpenClaw (anteriormente Clawdbot/Moltbot) é um agente de IA de código aberto com mais de 170.000 estrelas no GitHub.

Logotipo OpenClaw

Ele oferece:

Por que esta Combinação Funciona

A combinação do poderoso raciocínio do DeepSeek com as capacidades de agente do OpenClaw cria um assistente de IA gratuito e privado que rivaliza com alternativas pagas:

Pré-requisitos

Antes de começar, certifique-se de ter:

  1. Um computador com RAM suficiente (veja os requisitos abaixo)
  2. Acesso de administrador/root para instalar software
  3. Conexão com a internet para downloads iniciais
  4. Familiaridade básica com linha de comando (explicaremos cada passo)

Requisitos de RAM por Modelo

ModeloRAM MínimaRAM Recomendada
DeepSeek-R1 1.5B8GB8GB
DeepSeek-R1 7B16GB16GB
DeepSeek-R1 14B32GB32GB
DeepSeek-R1 32B64GB64GB
DeepSeek-R1 70B128GB128GB+
DeepSeek-V3 671B256GB256GB+

Dica profissional: Comece com o modelo 7B se você tiver 16GB de RAM. Você sempre pode escalar mais tarde.

Instalando o Ollama

Ollama é a ponte que permite executar o DeepSeek localmente. Ele lida com o download do modelo, gerenciamento de memória e serviço de inferência.

Instalação no macOS

# Usando Homebrew (recomendado)
brew install ollama

# Ou usando o script de instalação
curl -fsSL https://ollama.ai/install.sh | sh

Instalação no Linux

# Usando o script de instalação
curl -fsSL https://ollama.ai/install.sh | sh

# Ou baixe o binário diretamente
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Instalação no Windows

Baixe e execute o instalador em ollama.

Verificando a Instalação

Após a instalação, verifique se o Ollama está funcionando:

ollama --version

Você deve ver uma saída como ollama version 0.5.0 ou similar.

Iniciando o Serviço Ollama

O Ollama é executado como um serviço em segundo plano. Ele deve iniciar automaticamente, mas você pode verificar:

# Verifique se o Ollama está rodando
ollama list

# Se não estiver rodando, inicie-o
ollama serve

Configurando Modelos DeepSeek

Agora vamos fazer o DeepSeek rodar na sua máquina.

Puxando DeepSeek-R1 (Recomendado)

DeepSeek-R1 é o modelo principal de raciocínio. Para a maioria dos usuários, recomendamos começar com o modelo de 7B ou 8B:

# Puxe o modelo 7B (recomendado para a maioria dos usuários)
ollama pull deepseek-r1:7b

# Ou puxe o modelo 8B para um desempenho ligeiramente melhor
ollama pull deepseek-r1:8b

# Para hardware mais potente, experimente o modelo 14B
ollama pull deepseek-r1:14b

Puxando DeepSeek-V3 (Propósito Geral)

Se você precisa de um modelo de propósito geral em vez de um focado em raciocínio:

# Puxe DeepSeek-V3 (requer RAM significativa)
ollama pull deepseek-v3:671b

Puxando Modelos Destilados (Baixo Recurso)

Para sistemas com RAM limitada, modelos destilados oferecem bom raciocínio em tamanhos menores:

# Puxe modelos destilados baseados na arquitetura Qwen
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:14b

Executando o Modelo

Teste se o modelo funciona:

# Modo de chat interativo
ollama run deepseek-r1:7b

Digite sua mensagem e pressione Enter. Digite /exit para sair.

Testando com Python

Veja como usar o DeepSeek programaticamente:

import requests

url = "http://localhost:11434/api/generate"
payload = {
    "model": "deepseek-r1:7b",
    "prompt": "Explique o que é DeepSeek R1 em uma frase",
    "stream": False,
}
response = requests.post(url, json=payload).json()
print(response["response"])

Testando sua API Ollama com Apidog

Antes de integrar com o OpenClaw, você pode testar sua configuração DeepSeek usando o Apidog. Isso é especialmente útil para depurar e verificar se seus endpoints de API estão funcionando corretamente.

  1. Crie uma nova Requisição no Apidog
  2. Defina o método para POST
  3. Insira a URL: http://localhost:11434/api/generate
  4. Adicione Cabeçalhos:
Crie uma nova Requisição no Apidog

Adicione o Corpo (JSON):

{
  "model": "deepseek-r1:7b",
  "prompt": "Olá, mundo!",
  "stream": false
}

A interface visual do Apidog facilita o teste das respostas da sua API Ollama e a depuração de quaisquer problemas antes de conectar ao OpenClaw. Você também pode salvar esta requisição para testar diferentes prompts e configurações.

Adicione o Corpo para enviar a requisição no Apidog

Usando a Biblioteca Python do Ollama

from ollama import Client

client = Client()
output = client.chat(
    model="deepseek-r1:7b",
    messages=[{"role": "user", "content": "Escreva um 'olá mundo' em Python"}]
)
print(output["message"]["content"])

Instalando o OpenClaw

Agora vamos instalar o OpenClaw para criar seu assistente de IA.

Instalação Rápida

# Usando npx (sem necessidade de instalação)
npx openclaw

# Ou usando o script de instalação
curl -fsSL https://openclaw.ai/install.sh | bash

Configuração Inicial

Execute o OpenClaw pela primeira vez:

npx openclaw
Instalar OpenClaw

Isso o guiará pela configuração inicial:

  1. Configure sua primeira conexão de plataforma (Telegram, Discord, etc.)
  2. Configure preferências básicas
  3. Inicie o assistente

Verificando se o OpenClaw está Rodando

# Verifique o status do OpenClaw
openclaw status

Integrando DeepSeek com OpenClaw

Agora a mágica acontece, vamos conectar o DeepSeek como o cérebro do seu assistente OpenClaw.

Método 1: Usando Ollama como Backend

OpenClaw suporta nativamente o Ollama. Configure-o para usar o DeepSeek:

# Defina o OpenClaw para usar Ollama com DeepSeek-R1
ollama launch openclaw --model deepseek-r1

# Ou especifique um tamanho de modelo diferente
ollama launch openclaw --model deepseek-v3.1

Método 2: Configuração de Ambiente

Defina variáveis de ambiente para mais controle:

# Configure o endpoint do Ollama
export OLLAMA_HOST=http://localhost:11434

# Defina o modelo
export OLLAMA_MODEL=deepseek-r1

Método 3: Arquivo de Configuração

Crie ou edite ~/.openclaw/config.yaml:

models:
  default: ollama/deepseek-r1:7b

ollama:
  host: http://localhost:11434
  model: deepseek-r1:7b
  temperature: 0.7
  top_p: 0.9

Testando a Integração

# Teste se o OpenClaw está usando DeepSeek
openclaw models status

Você deve ver uma saída confirmando que DeepSeek-R1 está ativo.

Converse através da sua Plataforma

Agora você pode conversar com o DeepSeek através de qualquer plataforma conectada:

Telegram:
Envie uma mensagem para o seu bot OpenClaw no Telegram.

Discord:
Mencione seu bot OpenClaw no Discord.

WhatsApp:
Envie uma mensagem para o seu número de WhatsApp configurado do OpenClaw.

A resposta virá do DeepSeek rodando localmente!

Configuração e Otimização

Ajuste sua configuração DeepSeek + OpenClaw com estas opções.

Temperatura e Top-P

Controle a criatividade da resposta:

# Em config.yaml
ollama:
  temperature: 0.7    # 0.0 = focado, 1.0 = criativo
  top_p: 0.9         # Amostragem por núcleo
  top_k: 40          # Seleção de tokens

Comprimento do Contexto

Ajuste para conversas mais longas:

ollama:
  context_size: 4096  # Aumente para contexto mais longo

Prompt do Sistema

Personalize o comportamento do DeepSeek:

ollama:
  system_prompt: |
    Você é um assistente de codificação útil.
    Forneça exemplos de código claros e concisos.
    Explique conceitos em termos simples.

Alternando Entre Modelos

Você pode alternar facilmente entre diferentes modelos DeepSeek com base nas suas necessidades:

# Mude para o modelo 14B para mais capacidade
openclaw models set ollama/deepseek-r1:14b

# Mude para V3 para tarefas gerais
openclaw models set ollama/deepseek-v3:671b

# Volte para 7B para velocidade
openclaw models set ollama/deepseek-r1:7b

Testando seu Assistente de IA

Testando via Ollama Diretamente

# Teste as capacidades de raciocínio do DeepSeek
ollama run deepseek-r1:7b "Resolva este problema: Se um trem viaja 120km em 2 horas, qual é a sua velocidade?"

Testando via OpenClaw

# Envie uma mensagem de teste através do OpenClaw
openclaw chat "Olá, quanto é 2 + 2?"

Testando Integrações de Plataforma

Uma vez que suas plataformas estejam configuradas:

Telegram:
Envie /start para o seu bot OpenClaw.

Discord:
Mencione seu bot com @seu-bot olá.

WhatsApp:
Envie uma mensagem para o seu número de WhatsApp configurado.

Monitorando Logs

Verifique os logs do OpenClaw para ver o que está acontecendo:

# Veja os logs recentes
openclaw logs --recent

# Veja os logs ao vivo
openclaw logs --follow

Dicas de Configuração Avançada

Aceleração por GPU

Se você tem uma GPU NVIDIA, habilite a aceleração CUDA:

# Verifique se a GPU é detectada
ollama list

# Execute com aceleração por GPU (automático se a GPU estiver disponível)
ollama run deepseek-r1:7b --gpu

Criando Modelos Personalizados

Use prompts do sistema para criar versões especializadas:

# Crie um Modelfile
echo 'FROM deepseek-r1:7b
SYSTEM """Você é um especialista em Python.
Forneça código limpo e compatível com PEP 8.
"""' > /tmp/python-expert

# Crie o modelo personalizado
ollama create python-expert -f /tmp/python-expert

# Use-o no OpenClaw
openclaw models set ollama/python-expert

Configuração Multi-Modelo

Execute diferentes modelos para diferentes tarefas:

# Em config.yaml - configure múltiplos presets de modelo
models:
  default: ollama/deepseek-r1:7b
  coding: ollama/deepseek-coder:7b
  reasoning: ollama/deepseek-r1:14b

Em seguida, alterne entre eles:

# Use o modelo de codificação
openclaw models set coding

# Use o modelo de raciocínio para tarefas complexas
openclaw models set reasoning

Otimização de Desempenho

Para melhor desempenho:

  1. Feche aplicativos desnecessários para liberar RAM
  2. Use o menor modelo que atenda às suas necessidades
  3. Considere atualizar a RAM se você frequentemente atingir os limites
  4. Use armazenamento SSD para carregamento de modelo mais rápido

Monitoramento do Uso de Recursos

# Verifique o modelo atual e os recursos
openclaw status --verbose

# Monitore o Ollama diretamente
ollama list

Solucionando Problemas Comuns

O Modelo Não Carrega (Sem Memória)

Problema: O Ollama falha ao carregar o modelo devido à RAM insuficiente.

Solução:

Respostas Lentas

Problema: As respostas demoram muito.

Soluções:

OpenClaw Não Consegue Conectar ao Ollama

Problema: OpenClaw reporta erros de conexão ao Ollama.

Soluções:

Problemas de Conexão com a Plataforma

Problema: Não consegue conectar Telegram/Discord/WhatsApp.

Soluções:

FAQ

O DeepSeek é realmente gratuito para usar?

Sim, o DeepSeek é de código aberto e gratuito para rodar localmente. Você só precisa fornecer o hardware (computador com RAM). Sem taxas de API, sem assinaturas.

Posso usar o DeepSeek comercialmente com o OpenClaw?

Sim, tanto DeepSeek quanto OpenClaw possuem licenças permissivas que permitem o uso comercial. Sempre revise os termos de licença mais recentes.

E se eu não tiver uma GPU?

DeepSeek pode ser executado em sistemas apenas com CPU. Espere inferência mais lenta (alguns segundos por resposta em vez de milissegundos). Os modelos menores (1.5B-7B) funcionam razoavelmente bem na CPU.

Como escolho entre DeepSeek-R1 e DeepSeek-V3?

Posso executar vários modelos DeepSeek ao mesmo tempo?

Sim, mas cada modelo requer RAM adicional. Uma configuração típica pode executar o modelo 7B junto com um modelo especialista menor para tarefas específicas.

Como atualizo o DeepSeek para a versão mais recente?

ollama pull deepseek-r1:7b

Ollama atualizará automaticamente se uma versão mais recente estiver disponível.

Posso conectar o OpenClaw aos meus próprios aplicativos?

Sim, o OpenClaw fornece endpoints de API e webhooks para integrações personalizadas. Verifique a documentação do OpenClaw para detalhes.


Conclusão

Agora você tem um poderoso assistente de IA gratuito rodando localmente em sua máquina. DeepSeek fornece a inteligência, OpenClaw fornece a capacidade de agente, e Ollama faz tudo funcionar perfeitamente.

O que você pode fazer agora:

A combinação de DeepSeek e OpenClaw oferece capacidades que custariam centenas de dólares por mês com alternativas na nuvemtudo rodando em hardware que você possui.

Próximos passos:

  1. Experimente diferentes tamanhos de modelo DeepSeek
  2. Explore o marketplace de habilidades do OpenClaw (ClawHub)
  3. Conecte plataformas adicionais ao seu assistente
  4. Crie prompts personalizados para casos de uso específicos

O único limite é a sua imaginação.

Pronto para construir aplicativos de IA profissionais? Baixe Apidog gratuitamente e teste suas integrações de serviço de IA com uma interface visual projetada para desenvolvedores. Experimente o conjunto de testes de API do Apidog para garantir que seus fluxos de trabalho de IA sejam robustos e confiáveis.

button

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs