Hướng Dẫn Chạy OpenClaw với Ollama

Ashley Innocent

Ashley Innocent

26 tháng 2 2026

Hướng Dẫn Chạy OpenClaw với Ollama

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

Tóm tắt

Ollama là cách dễ nhất để chạy các mô hình AI mạnh mẽ cục bộ. Kết hợp với OpenClaw, nó tạo ra một trợ lý AI miễn phí, tập trung vào quyền riêng tư, có thể cạnh tranh với các lựa chọn thay thế trả phí. Hướng dẫn này sẽ chỉ cho bạn cách thiết lập Ollama, chọn mô hình phù hợp và tích hợp nó với OpenClaw để có trợ lý AI cá nhân của bạn.

Giới thiệu

Chạy AI cục bộ từng là một thú vui của những người yêu thích công nghệ, đòi hỏi thiết lập phức tạp và phần cứng đắt tiền. Ollama đã thay đổi điều đó. Với một lệnh cài đặt đơn giản và API trực quan, Ollama giúp bất kỳ ai cũng có thể chạy các mô hình AI cục bộ.

ollama launch openclaw --model qwen3.5:35b

Khi kết hợp với OpenClaw, bạn sẽ có một trợ lý AI mạnh mẽ với các đặc điểm sau:

Hướng dẫn này bao gồm mọi thứ bạn cần để bắt đầu.

Tại sao nên sử dụng Ollama với OpenClaw

Lợi ích của AI cục bộ

Tại sao lại là Ollama

Ollama nổi bật vì một số lý do:

Điều kiện tiên quyết

Trước khi bắt đầu, hãy đảm bảo bạn có:

Yêu cầu phần cứng

Kích thước mô hìnhRAM tối thiểuRAM khuyến nghị
7B tham số8GB16GB
14B tham số16GB32GB
32B tham số32GB64GB
70B tham số64GB128GB

Yêu cầu phần mềm

Những gì bạn sẽ cần

  1. Một máy tính đáp ứng yêu cầu về RAM
  2. Internet để tải xuống các mô hình
  3. Thời gian để tải xuống các mô hình ban đầu (thay đổi tùy theo kích thước và kết nối)

Cài đặt Ollama

Cài đặt trên macOS

Phương pháp dễ nhất là sử dụng Homebrew:

brew install ollama

Hoặc sử dụng tập lệnh cài đặt chính thức:

curl -fsSL https://ollama.ai/install.sh | sh

Cài đặt trên Linux

# Sử dụng tập lệnh cài đặt (được khuyến nghị)
curl -fsSL https://ollama.ai/install.sh | sh

# Hoặc tải xuống tệp nhị phân trực tiếp
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Cài đặt trên Windows

  1. Tải xuống trình cài đặt
  2. Chạy trình cài đặt
  3. Làm theo hướng dẫn trên màn hình
Tải xuống Ollama

Xác minh cài đặt

ollama --version

Bạn sẽ thấy đầu ra như ollama version 0.15.0 hoặc mới hơn.

Phiên bản Ollama trên terminal

Khởi động dịch vụ Ollama

Ollama chạy như một dịch vụ nền:

# Kiểm tra xem Ollama có đang chạy không
ollama list

# Khởi động Ollama nếu chưa chạy
ollama serve
Kiểm tra xem ollama có đang chạy bằng lệnh Ollama list

Chọn mô hình phù hợp

Ollama hỗ trợ hơn 100 mô hình. Dưới đây là cách chọn:

Theo trường hợp sử dụng

Trường hợp sử dụngMô hình khuyến nghị
Trò chuyện chungQwen3.5, Llama 3.2, Mistral
Hỗ trợ viết codeQwen3.5-Coder, DeepSeek-Coder
Suy luận/toán họcDeepSeek-R1, Qwen3.5
Phần cứng nhỏ hơnPhi3.5, Gemma2.2B

Theo phần cứng

RAM khả dụngKhuyến nghị
8GBCác mô hình 7B (Qwen3.5, Llama3.2, Mistral)
16GBCác mô hình 8-14B
32GBCác mô hình 14-32B
64GB+Các mô hình 70B+

Các mô hình phổ biến vào năm 2026

Qwen3.5 — Hiệu suất toàn diện xuất sắc, khả năng suy luận mạnh mẽ, tốt cho việc viết mã. Là lựa chọn phổ biến nhất cho OpenClaw vào năm 2026.

DeepSeek-R1 — Mô hình suy luận mã nguồn mở có thể cạnh tranh với GPT-4 trong các tác vụ toán học và logic. Tuyệt vời cho việc giải quyết vấn đề phức tạp.

Mistral — Nhẹ nhưng có khả năng. Tuyệt vời cho các hệ thống có RAM hạn chế.

Cài đặt mô hình

Tải mô hình

# Cài đặt Qwen3.5 (được khuyến nghị cho hầu hết người dùng)
ollama pull qwen2.5:7b

# Hoặc Qwen3 mới nhất
ollama pull qwen3:7b

# DeepSeek-R1 cho các tác vụ suy luận
ollama pull deepseek-r1:7b

# Llama 3.2
ollama pull llama3.2:7b

# Mistral
ollama pull mistral:7b

Thẻ mô hình

Các mô hình có nhiều kích thước khác nhau:

# Các kích thước tham số khác nhau
ollama pull qwen2.5:3b    # Nhỏ hơn, nhanh hơn
ollama pull qwen2.5:7b    # Cân bằng
ollama pull qwen2.5:14b   # Mạnh mẽ hơn

Xem các mô hình đã cài đặt

ollama list

Điều này hiển thị tất cả các mô hình đã tải xuống và kích thước của chúng.

Chạy và kiểm tra mô hình

Chế độ tương tác

# Trò chuyện với mô hình
ollama run qwen2.5:7b

Nhập tin nhắn của bạn và nhấn Enter. Nhập /bye để thoát.

Chế độ API

Ollama chạy một máy chủ API trên cổng 11434 theo mặc định:

# Điểm cuối tạo
curl http://localhost:11434/api/generate -d {
  "model": "qwen2.5:7b",
  "prompt": "Hello, how are you?",
  "stream": false
}

Sử dụng thư viện Python

from ollama import Client

client = Client()
response = client.chat(
    model='qwen2.5:7b',
    messages=[
        {'role': 'user', 'content': 'Hello!'}
    ]
)
print(response['message']['content'])

Kiểm tra với Apidog

Trước khi kết nối với OpenClaw, hãy kiểm tra thiết lập Ollama của bạn bằng cách sử dụng Apidog:

  1. Tạo một yêu cầu mới trong Apidog
  2. Đặt phương thức là POST
  3. Nhập URL: http://localhost:11434/api/generate
  4. Thêm tiêu đề: Content-Type: application/json
Tạo yêu cầu trong Apidog

5. Thêm nội dung:

{
  "model": "qwen3-coder",
  "prompt": "What is 2 + 2?",
  "stream": false
}

Thêm nội dung vào yêu cầu trong Apidog

Điều này xác minh thiết lập Ollama của bạn hoạt động trước khi tích hợp với OpenClaw.

Tích hợp Ollama với OpenClaw

Bây giờ, hãy kết nối Ollama với OpenClaw.

Phương pháp 1: Cấu hình nhanh

# Đặt OpenClaw sử dụng Ollama với mô hình của bạn
openclaw models set ollama/qwen2.5:7b

Phương pháp 2: Biến môi trường

# Cấu hình điểm cuối Ollama
export OLLAMA_HOST=http://localhost:11434

# Đặt mô hình mặc định
export OLLAMA_MODEL=qwen2.5:7b

Phương pháp 3: Tệp cấu hình

Tạo hoặc chỉnh sửa ~/.openclaw/config.yaml:

models:
  default: ollama/qwen2.5:7b

ollama:
  host: http://localhost:11434
  model: qwen2.5:7b
  temperature: 0.7
  top_p: 0.9

Xác minh tích hợp

# Kiểm tra trạng thái mô hình OpenClaw
openclaw models status

# Kiểm tra bằng tin nhắn
openclaw chat "Hello!"

Bạn sẽ nhận được phản hồi từ mô hình cục bộ của mình.

Tùy chọn cấu hình

Tinh chỉnh thiết lập Ollama + OpenClaw của bạn:

Nhiệt độ (Temperature)

Kiểm soát sự sáng tạo so với độ chính xác:

ollama:
  temperature: 0.7    # 0.0 = chính xác, 1.0 = sáng tạo

Top-P và Top-K

Kiểm soát sự đa dạng của phản hồi:

ollama:
  top_p: 0.9         # Lấy mẫu hạt nhân
  top_k: 40          # Chọn mã thông báo

Độ dài ngữ cảnh

Đối với các cuộc hội thoại dài hơn:

ollama:
  context_size: 4096  # Mặc định thường là 2048 hoặc 4096

Lời nhắc hệ thống

Tùy chỉnh hành vi mô hình:

ollama:
  system_prompt: |
    Bạn là một trợ lý viết mã hữu ích.
    Cung cấp các ví dụ mã rõ ràng, súc tích.
    Giải thích các khái niệm một cách đơn giản.

Chuyển đổi giữa các mô hình

Một lợi thế của Ollama là dễ dàng chuyển đổi mô hình:

# Chuyển sang DeepSeek-R1 cho tác vụ suy luận
openclaw models set ollama/deepseek-r1:7b

# Chuyển sang Qwen-Coder cho tác vụ viết mã
openclaw models set ollama/qwen2.5-coder:7b

# Chuyển về mô hình chung
openclaw models set ollama/qwen2.5:7b

Thiết lập nhiều mô hình

Cấu hình nhiều mô hình trong config.yaml:

models:
  default: ollama/qwen2.5:7b
  coding: ollama/qwen2.5-coder:7b
  reasoning: ollama/deepseek-r1:7b

Sau đó chuyển đổi giữa chúng:

openclaw models set coding
openclaw models set reasoning

Khắc phục sự cố

Mô hình không tải được

Vấn đề: Lỗi hết bộ nhớ

Giải pháp:

Phản hồi chậm

Vấn đề: Phản hồi quá lâu

Giải pháp:

Kết nối bị từ chối

Vấn đề: OpenClaw không thể kết nối với Ollama

Giải pháp:

# Xác minh Ollama đang chạy
ollama serve

# Kiểm tra cổng
curl http://localhost:11434

Không tìm thấy mô hình

Vấn đề: Mô hình không tồn tại trong Ollama

Giải pháp:

# Tải mô hình
ollama pull qwen2.5:7b

# Kiểm tra các mô hình có sẵn
ollama list

Kết luận

Giờ đây, bạn đã có một trợ lý AI mạnh mẽ, riêng tư chạy cục bộ. Ollama + OpenClaw mang đến những khả năng mà với các lựa chọn thay thế đám mây sẽ tốn hơn 20 đô la/tháng — tất cả đều chạy trên phần cứng mà bạn kiểm soát.

Những gì bạn có thể làm bây giờ:

Giới hạn duy nhất là phần cứng của bạn.

Các bước tiếp theo:

  1. Thử nghiệm với các mô hình khác nhau
  2. Thử Qwen3.5, DeepSeek-R1 và các mô hình khác
  3. Tùy chỉnh lời nhắc hệ thống của bạn
  4. Khám phá các kỹ năng của OpenClaw trên ClawHub

Sẵn sàng xây dựng ứng dụng AI chuyên nghiệp? Tải xuống Apidog miễn phí và kiểm tra các tích hợp AI của bạn với giao diện trực quan được thiết kế cho các nhà phát triển.

button

Câu hỏi thường gặp

Mô hình Ollama nào tốt nhất cho OpenClaw?

Qwen3.5 hiện là mô hình phổ biến nhất — hiệu suất cân bằng với khả năng suy luận và viết mã tốt. DeepSeek-R1 vượt trội trong các tác vụ suy luận nếu đó là ưu tiên của bạn.

Tôi có thể chạy nhiều mô hình Ollama cùng lúc không?

Có, nhưng mỗi mô hình yêu cầu RAM. Một thiết lập điển hình chạy một mô hình tại một thời điểm, chuyển đổi khi cần thiết.

Tôi có cần GPU không?

Không, Ollama hoạt động trên CPU. Tăng tốc GPU giúp nó nhanh hơn nhưng không bắt buộc. Các mô hình nhỏ hơn (7B) hoạt động khá tốt trên CPU.

Làm cách nào để cập nhật mô hình?

ollama pull model-name

Ollama tự động cập nhật nếu có phiên bản mới hơn.

Tôi có thể sử dụng các mô hình đã tinh chỉnh của riêng mình không?

Có, bạn có thể nhập các mô hình tùy chỉnh bằng chức năng nhập của Ollama. Kiểm tra tài liệu của Ollama để biết chi tiết.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API

Hướng Dẫn Chạy OpenClaw với Ollama