Como Executar OpenClaw com Ollama? Guia Completo

Resumo

Ollama é a maneira mais fácil de executar modelos de IA poderosos localmente. Combinado com o OpenClaw, ele cria um assistente de IA gratuito e focado na privacidade que rivaliza com alternativas pagas. Este guia o orientará na configuração do Ollama, na escolha do modelo certo e na integração com o OpenClaw para seu assistente pessoal de IA.

Introdução

Executar IA localmente já foi uma busca de entusiastas, exigindo configurações complexas e hardware caro. Ollama mudou isso. Com um simples comando de instalação e uma API intuitiva, Ollama torna a execução de modelos de IA localmente acessível a qualquer pessoa.

ollama launch openclaw --model qwen3.5:35b

Quando emparelhado com o OpenClaw, você obtém um assistente de IA poderoso que:

Não custa nada para operar (após a configuração inicial)
Mantém seus dados 100% privados
Funciona offline depois que os modelos são baixados
Oferece controle total de personalização

Este guia aborda tudo o que você precisa para começar.

Por que usar Ollama com OpenClaw

Benefícios da IA Local

Privacidade: Suas conversas nunca saem da sua máquina
Sem custos de API: Pague uma vez pelo hardware, use ilimitado
Acesso offline: Funciona sem internet
Controle total: Personalize modelos e prompts
Sem limites de taxa: Use o quanto quiser

Por que Ollama

Ollama se destaca por várias razões:

Instalação simples: Um comando para começar
Biblioteca de modelos: Mais de 100 modelos disponíveis
Multiplataforma: Funciona em macOS, Linux, Windows
API-first: Fácil integração com OpenClaw
Desenvolvimento ativo: Atualizações regulares e novos modelos

Pré-requisitos

Antes de começar, certifique-se de ter:

Requisitos de Hardware

Tamanho do Modelo	RAM Mínima	RAM Recomendada
7B params	8GB	16GB
14B params	16GB	32GB
32B params	32GB	64GB
70B params	64GB	128GB

Requisitos de Software

macOS 10.15+, Linux, ou Windows 10+
Acesso de Administrador/root para instalação
Conexão com a internet para downloads iniciais
Familiaridade com linha de comando

O que você vai precisar

Um computador que atenda aos requisitos de RAM
Internet para baixar modelos
Tempo para downloads iniciais de modelos (varia conforme o tamanho e a conexão)

Instalando Ollama

Instalação no macOS

O método mais fácil usa Homebrew:

brew install ollama

Ou use o script de instalação oficial:

curl -fsSL https://ollama.ai/install.sh | sh

Instalação no Linux

# Usando o script de instalação (recomendado)
curl -fsSL https://ollama.ai/install.sh | sh

# Ou baixe o binário diretamente
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Instalação no Windows

Baixe o instalador
Execute o instalador
Siga as instruções na tela

Verificando a Instalação

ollama --version

Você deverá ver uma saída como ollama version 0.15.0 ou mais recente.

Iniciando o Serviço Ollama

Ollama é executado como um serviço em segundo plano:

# Verifique se o Ollama está em execução
ollama list

# Inicie o Ollama se não estiver em execução
ollama serve

Verificar se o Ollama está em execução com o comando Ollama list

Escolhendo o Modelo Certo

Ollama suporta mais de 100 modelos. Veja como escolher:

Por Caso de Uso

Caso de Uso	Modelos Recomendados
Conversa geral	Qwen3.5, Llama 3.2, Mistral
Assistência de codificação	Qwen3.5-Coder, DeepSeek-Coder
Raciocínio/matemática	DeepSeek-R1, Qwen3.5
Hardware menor	Phi3.5, Gemma2.2B

Por Hardware

RAM Disponível	Recomendado
8GB	Modelos de 7B (Qwen3.5, Llama3.2, Mistral)
16GB	Modelos de 8-14B
32GB	Modelos de 14-32B
64GB+	Modelos de 70B+

Modelos Populares em 2026

Qwen3.5 — Excelente desempenho geral, forte raciocínio, bom para codificação. A escolha mais popular para OpenClaw em 2026.

DeepSeek-R1 — Modelo de raciocínio de código aberto que rivaliza com o GPT-4 em tarefas de matemática e lógica. Ótimo para resolução de problemas complexos.

Mistral — Leve, mas capaz. Excelente para sistemas com RAM limitada.

Instalando Modelos

Baixando Modelos

# Instale Qwen3.5 (recomendado para a maioria dos usuários)
ollama pull qwen2.5:7b

# Ou o mais recente Qwen3
ollama pull qwen3:7b

# DeepSeek-R1 para tarefas de raciocínio
ollama pull deepseek-r1:7b

# Llama 3.2
ollama pull llama3.2:7b

# Mistral
ollama pull mistral:7b

Tags de Modelo

Os modelos vêm em diferentes tamanhos:

# Diferentes tamanhos de parâmetros
ollama pull qwen2.5:3b    # Menor, mais rápido
ollama pull qwen2.5:7b    # Equilibrado
ollama pull qwen2.5:14b   # Mais capaz

Visualizando Modelos Instalados

ollama list

Isso mostra todos os modelos baixados e seus tamanhos.

Executando e Testando Modelos

Modo Interativo

# Converse com o modelo
ollama run qwen2.5:7b

Digite sua mensagem e pressione Enter. Digite /bye para sair.

Modo API

Ollama executa um servidor API na porta 11434 por padrão:

# Endpoint de geração
curl http://localhost:11434/api/generate -d {
  "model": "qwen2.5:7b",
  "prompt": "Hello, how are you?",
  "stream": false
}

Usando a Biblioteca Python

from ollama import Client

client = Client()
response = client.chat(
    model='qwen2.5:7b',
    messages=[
        {'role': 'user', 'content': 'Hello!'}
    ]
)
print(response['message']['content'])

Testando com Apidog

Antes de conectar ao OpenClaw, teste sua configuração do Ollama usando Apidog:

Crie uma nova requisição no Apidog
Defina o método como POST
Insira a URL: http://localhost:11434/api/generate
Adicione o cabeçalho: Content-Type: application/json

5. Adicione o corpo:

{
  "model": "qwen3-coder",
  "prompt": "What is 2 + 2?",
  "stream": false
}

Adicionar Corpo a uma requisição no Apidog

Isso verifica se sua configuração do Ollama funciona antes de integrar com o OpenClaw.

Integrando Ollama com OpenClaw

Agora vamos conectar Ollama ao OpenClaw.

Método 1: Configuração Rápida

# Configure o OpenClaw para usar Ollama com seu modelo
openclaw models set ollama/qwen2.5:7b

Método 2: Variáveis de Ambiente

# Configure o endpoint Ollama
export OLLAMA_HOST=http://localhost:11434

# Defina o modelo padrão
export OLLAMA_MODEL=qwen2.5:7b

Método 3: Arquivo de Configuração

Crie ou edite ~/.openclaw/config.yaml:

models:
  default: ollama/qwen2.5:7b

ollama:
  host: http://localhost:11434
  model: qwen2.5:7b
  temperature: 0.7
  top_p: 0.9

Verificando a Integração

# Verifique o status do modelo OpenClaw
openclaw models status

# Teste com uma mensagem
openclaw chat "Olá!"

Você deverá receber uma resposta do seu modelo local.

Opções de Configuração

Ajuste fino da sua configuração Ollama + OpenClaw:

Temperatura

Controla criatividade vs precisão:

ollama:
  temperature: 0.7    # 0.0 = preciso, 1.0 = criativo

Top-P e Top-K

Controla a diversidade da resposta:

ollama:
  top_p: 0.9         # Amostragem de núcleo
  top_k: 40          # Seleção de token

Tamanho do Contexto

Para conversas mais longas:

ollama:
  context_size: 4096  # O padrão é geralmente 2048 ou 4096

Prompt do Sistema

Personalize o comportamento do modelo:

ollama:
  system_prompt: |
    Você é um assistente de codificação útil.
    Forneça exemplos de código claros e concisos.
    Explique conceitos de forma simples.

Alternando Entre Modelos

Uma vantagem do Ollama é a fácil alternância de modelos:

# Mudar para DeepSeek-R1 para raciocínio
openclaw models set ollama/deepseek-r1:7b

# Mudar para Qwen-Coder para tarefas de codificação
openclaw models set ollama/qwen2.5-coder:7b

# Voltar ao modelo geral
openclaw models set ollama/qwen2.5:7b

Configuração de Múltiplos Modelos

Configure múltiplos modelos em config.yaml:

models:
  default: ollama/qwen2.5:7b
  coding: ollama/qwen2.5-coder:7b
  reasoning: ollama/deepseek-r1:7b

Em seguida, alterne entre eles:

openclaw models set coding
openclaw models set reasoning

Solução de Problemas

Modelo Não Carrega

Problema: Erros de falta de memória

Soluções:

Use um modelo menor (7B em vez de 14B)
Feche outros aplicativos para liberar RAM
Verifique a memória disponível com free -h (Linux) ou Monitor de Atividade (Mac)

Respostas Lentas

Problema: As respostas demoram muito

Soluções:

Use um modelo menor
Ative a aceleração da GPU (se disponível)
Reduza o tamanho do contexto
Use armazenamento SSD para os arquivos do modelo

Conexão Recusada

Problema: OpenClaw não consegue conectar ao Ollama

Soluções:

# Verifique se o Ollama está em execução
ollama serve

# Verifique a porta
curl http://localhost:11434

Modelo Não Encontrado

Problema: O modelo não existe no Ollama

Soluções:

# Baixe o modelo
ollama pull qwen2.5:7b

# Verifique os modelos disponíveis
ollama list

Conclusão

Você agora tem um assistente de IA poderoso e privado funcionando localmente. Ollama + OpenClaw oferece recursos que custariam mais de US$ 20/mês com alternativas em nuvem — tudo rodando no hardware que você controla.

O que você pode fazer agora:

Converse com sua IA através de múltiplas plataformas
Alterne entre modelos com base nas tarefas
Personalize prompts para comportamentos especializados
Execute offline depois que os modelos forem baixados

O único limite é o seu hardware.

Próximos passos:

Experimente diferentes modelos
Experimente Qwen3.5, DeepSeek-R1 e outros
Personalize seus prompts de sistema
Explore as habilidades do OpenClaw no ClawHub

Pronto para construir aplicações de IA profissionais? Baixe o Apidog gratuitamente e teste suas integrações de IA com uma interface visual projetada para desenvolvedores.

button

FAQ

Qual é o melhor modelo Ollama para OpenClaw?

Qwen3.5 é atualmente o mais popular — desempenho equilibrado com boas capacidades de raciocínio e codificação. DeepSeek-R1 se destaca em tarefas de raciocínio se essa for sua prioridade.

Posso executar vários modelos Ollama ao mesmo tempo?

Sim, mas cada modelo requer RAM. Uma configuração típica executa um modelo por vez, alternando conforme necessário.

Preciso de uma GPU?

Não, Ollama funciona na CPU. A aceleração da GPU o torna mais rápido, mas não é obrigatória. Modelos menores (7B) funcionam razoavelmente bem na CPU.

Como atualizo os modelos?

ollama pull model-name

Ollama atualiza automaticamente se uma versão mais recente estiver disponível.

Posso usar meus próprios modelos ajustados?

Sim, importe modelos personalizados usando a funcionalidade de importação do Ollama. Consulte a documentação do Ollama para detalhes.