Cách xây dựng trợ lý AI cục bộ miễn phí với OpenClaw và DeepSeek

Ashley Innocent

Ashley Innocent

26 tháng 2 2026

Cách xây dựng trợ lý AI cục bộ miễn phí với OpenClaw và DeepSeek

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

TL;DR

DeepSeek là một dòng mô hình AI mã nguồn mở mạnh mẽ (từ 1.5B đến 671B tham số) với khả năng suy luận vượt trội. OpenClaw là một trợ lý AI mã nguồn mở đang được lan truyền rộng rãi (hơn 170K lượt sao trên GitHub) hoạt động hoàn toàn cục bộ. Bằng cách kết hợp DeepSeek với OpenClaw thông qua Ollama, bạn sẽ có một trợ lý AI miễn phí, tập trung vào quyền riêng tư, có thể cạnh tranh với các lựa chọn trả phí, không tốn chi phí API, không đăng ký, kiểm soát hoàn toàn.

Giới thiệu

Việc xây dựng một trợ lý AI cá nhân chưa bao giờ dễ tiếp cận đến thế. Giữa chi phí API, các gói đăng ký và lo ngại về quyền riêng tư, các nhà phát triển cần một lộ trình rõ ràng để bắt đầu với các khả năng AI cục bộ.

Nếu bạn đang tìm kiếm cách để chạy các mô hình ngôn ngữ mạnh mẽ trên máy tính cục bộ mà không phải tốn tiền cho các lệnh gọi API, bạn đã đến đúng nơi. Hướng dẫn này sẽ hướng dẫn bạn cách thiết lập DeepSeek, mô hình mã nguồn mở ấn tượng từ DeepSeek AI, cùng với OpenClaw, một trợ lý AI mã nguồn mở đang được lan truyền rộng rãi, mang đến cho bạn một tác nhân AI cá nhân chạy hoàn toàn trên phần cứng của bạn.

Điều tuyệt vời nhất? Cả DeepSeek và OpenClaw đều miễn phí sử dụng. Không cần thẻ tín dụng. Không cần đăng ký. Không có dữ liệu nào rời khỏi máy của bạn.

Cho dù bạn là nhà phát triển muốn tự động hóa tác vụ, người có sở thích khám phá AI cục bộ, hay một doanh nghiệp đang tìm kiếm các giải pháp AI ưu tiên quyền riêng tư, thiết lập này đều mang lại khả năng cấp doanh nghiệp với chi phí bằng không.

Tại sao chọn DeepSeek + OpenClaw?

Sức mạnh của DeepSeek

DeepSeek đã nổi lên như một trong những dòng mô hình AI mã nguồn mở có năng lực nhất vào năm 2026. Đây là những điểm làm nó nổi bật:

Logo Deepseek

Khả năng suy luận vượt trội
DeepSeek-R1 đạt hiệu suất gần bằng các mô hình hàng đầu như OpenAI O3 và Gemini 2.5 Pro trong các tác vụ suy luận. Nó đặc biệt mạnh mẽ trong toán học, lập trình và giải quyết vấn đề phức tạp.

Đa dạng mô hình
DeepSeek cung cấp các mô hình cho mọi trường hợp sử dụng:

Mô hìnhTham sốTốt nhất cho
DeepSeek-R11.5B - 671BSuy luận và giải quyết vấn đề
DeepSeek-V3671BCác tác vụ tổng quát
DeepSeek-V3.1671BTư duy lai/không tư duy
DeepSeek-Coder1.3B - 236BCác tác vụ lập trình

Suy luận lai
Giống như Qwen3, DeepSeek-V3.1 hỗ trợ cả chế độ tư duy (suy luận theo chuỗi suy nghĩ) và chế độ không tư duy (trả lời trực tiếp), cho phép bạn lựa chọn dựa trên nhiệm vụ của mình.

Hiệu quả chi phí
Các mô hình DeepSeek là mã nguồn mở và miễn phí để chạy cục bộ. Bạn chỉ phải trả tiền cho phần cứng.

Tính linh hoạt của OpenClaw

OpenClaw (trước đây là Clawdbot/Moltbot) là một tác nhân AI mã nguồn mở với hơn 170.000 lượt sao trên GitHub.

Logo OpenClaw

Nó cung cấp:

Tại sao sự kết hợp này hiệu quả

Sự kết hợp giữa khả năng suy luận mạnh mẽ của DeepSeek với năng lực tác nhân của OpenClaw tạo ra một trợ lý AI miễn phí, riêng tư, có thể cạnh tranh với các lựa chọn trả phí:

Điều kiện tiên quyết

Trước khi bắt đầu, hãy đảm bảo bạn có:

  1. Một máy tính có đủ RAM (xem yêu cầu bên dưới)
  2. Quyền truy cập quản trị/root để cài đặt phần mềm
  3. Kết nối Internet để tải xuống ban đầu
  4. Kiến thức cơ bản về dòng lệnh (chúng tôi sẽ giải thích từng bước)

Yêu cầu RAM theo mô hình

Mô hìnhRAM tối thiểuRAM khuyến nghị
DeepSeek-R1 1.5B8GB8GB
DeepSeek-R1 7B16GB16GB
DeepSeek-R1 14B32GB32GB
DeepSeek-R1 32B64GB64GB
DeepSeek-R1 70B128GB128GB+
DeepSeek-V3 671B256GB256GB+

Mẹo chuyên nghiệp: Bắt đầu với mô hình 7B nếu bạn có 16GB RAM. Bạn luôn có thể nâng cấp sau này.

Cài đặt Ollama

Ollama là cầu nối cho phép bạn chạy DeepSeek cục bộ. Nó xử lý việc tải xuống mô hình, quản lý bộ nhớ và phục vụ suy luận.

Cài đặt trên macOS

# Sử dụng Homebrew (khuyến nghị)
brew install ollama

# Hoặc sử dụng tập lệnh cài đặt
curl -fsSL https://ollama.ai/install.sh | sh

Cài đặt trên Linux

# Sử dụng tập lệnh cài đặt
curl -fsSL https://ollama.ai/install.sh | sh

# Hoặc tải xuống tệp nhị phân trực tiếp
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Cài đặt trên Windows

Tải xuống và chạy trình cài đặt từ ollama.

Xác minh cài đặt

Sau khi cài đặt, hãy xác minh Ollama đang hoạt động:

ollama --version

Bạn sẽ thấy đầu ra như ollama version 0.5.0 hoặc tương tự.

Khởi động dịch vụ Ollama

Ollama chạy dưới dạng một dịch vụ nền. Nó sẽ tự động khởi động, nhưng bạn có thể xác minh:

# Kiểm tra xem Ollama có đang chạy không
ollama list

# Nếu không chạy, hãy khởi động nó
ollama serve

Thiết lập các mô hình DeepSeek

Bây giờ hãy chạy DeepSeek trên máy của bạn.

Tải DeepSeek-R1 (Khuyến nghị)

DeepSeek-R1 là mô hình suy luận chủ lực. Đối với hầu hết người dùng, chúng tôi khuyên bạn nên bắt đầu với mô hình 7B hoặc 8B:

# Tải mô hình 7B (khuyến nghị cho hầu hết người dùng)
ollama pull deepseek-r1:7b

# Hoặc tải mô hình 8B để có hiệu suất tốt hơn một chút
ollama pull deepseek-r1:8b

# Đối với phần cứng mạnh hơn, hãy thử mô hình 14B
ollama pull deepseek-r1:14b

Tải DeepSeek-V3 (Mục đích tổng quát)

Nếu bạn cần một mô hình đa năng thay vì một mô hình tập trung vào suy luận:

# Tải DeepSeek-V3 (yêu cầu nhiều RAM đáng kể)
ollama pull deepseek-v3:671b

Tải các mô hình chưng cất (Tài nguyên thấp)

Đối với các hệ thống có RAM hạn chế, các mô hình chưng cất mang lại khả năng suy luận tốt với kích thước nhỏ hơn:

# Tải các mô hình chưng cất dựa trên kiến trúc Qwen
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:14b

Chạy mô hình

Kiểm tra xem mô hình có hoạt động không:

# Chế độ trò chuyện tương tác
ollama run deepseek-r1:7b

Nhập tin nhắn của bạn và nhấn Enter. Nhập /exit để thoát.

Kiểm tra với Python

Đây là cách sử dụng DeepSeek theo chương trình:

import requests

url = "http://localhost:11434/api/generate"
payload = {
    "model": "deepseek-r1:7b",
    "prompt": "Explain what DeepSeek R1 is in one sentence",
    "stream": False,
}
response = requests.post(url, json=payload).json()
print(response["response"])

Kiểm tra API Ollama của bạn với Apidog

Trước khi tích hợp với OpenClaw, bạn có thể kiểm tra thiết lập DeepSeek của mình bằng Apidog. Điều này đặc biệt hữu ích để gỡ lỗi và xác minh các điểm cuối API của bạn hoạt động chính xác.

  1. Tạo yêu cầu mới trong Apidog
  2. Đặt phương thức là POST
  3. Nhập URL: http://localhost:11434/api/generate
  4. Thêm Tiêu đề:
Tạo yêu cầu mới trong Apidog

Thêm Nội dung (JSON):

{
  "model": "deepseek-r1:7b",
  "prompt": "Hello, world!",
  "stream": false
}

Giao diện trực quan của Apidog giúp bạn dễ dàng kiểm tra phản hồi API của Ollama và gỡ lỗi mọi sự cố trước khi kết nối với OpenClaw. Bạn cũng có thể lưu yêu cầu này để kiểm tra các lời nhắc và cấu hình khác nhau.

Thêm nội dung để gửi yêu cầu trong Apidog

Sử dụng thư viện Python của Ollama

from ollama import Client

client = Client()
output = client.chat(
    model="deepseek-r1:7b",
    messages=[{"role": "user", "content": "Write a hello world in Python"}]
)
print(output["message"]["content"])

Cài đặt OpenClaw

Bây giờ hãy cài đặt OpenClaw để tạo trợ lý AI của bạn.

Cài đặt nhanh

# Sử dụng npx (không cần cài đặt)
npx openclaw

# Hoặc sử dụng tập lệnh cài đặt
curl -fsSL https://openclaw.ai/install.sh | bash

Thiết lập ban đầu

Chạy OpenClaw lần đầu tiên:

npx openclaw
Cài đặt OpenClaw

Thao tác này sẽ hướng dẫn bạn cấu hình ban đầu:

  1. Thiết lập kết nối nền tảng đầu tiên của bạn (Telegram, Discord, v.v.)
  2. Cấu hình các tùy chọn cơ bản
  3. Khởi động trợ lý

Xác minh OpenClaw đang chạy

# Kiểm tra trạng thái OpenClaw
openclaw status

Tích hợp DeepSeek với OpenClaw

Bây giờ điều kỳ diệu sẽ xảy ra, chúng ta kết nối DeepSeek làm bộ não cho trợ lý OpenClaw của bạn.

Phương pháp 1: Sử dụng Ollama làm Backend

OpenClaw hỗ trợ Ollama nguyên bản. Cấu hình nó để sử dụng DeepSeek:

# Đặt OpenClaw sử dụng Ollama với DeepSeek-R1
ollama launch openclaw --model deepseek-r1

# Hoặc chỉ định kích thước mô hình khác
ollama launch openclaw --model deepseek-v3.1

Phương pháp 2: Cấu hình môi trường

Đặt biến môi trường để kiểm soát nhiều hơn:

# Cấu hình điểm cuối Ollama
export OLLAMA_HOST=http://localhost:11434

# Đặt mô hình
export OLLAMA_MODEL=deepseek-r1

Phương pháp 3: Tệp cấu hình

Tạo hoặc chỉnh sửa ~/.openclaw/config.yaml:

models:
  default: ollama/deepseek-r1:7b

ollama:
  host: http://localhost:11434
  model: deepseek-r1:7b
  temperature: 0.7
  top_p: 0.9

Kiểm tra tích hợp

# Kiểm tra xem OpenClaw có đang sử dụng DeepSeek không
openclaw models status

Bạn sẽ thấy đầu ra xác nhận DeepSeek-R1 đang hoạt động.

Trò chuyện qua nền tảng của bạn

Bây giờ bạn có thể trò chuyện với DeepSeek thông qua bất kỳ nền tảng đã kết nối nào:

Telegram:
Gửi tin nhắn đến bot OpenClaw của bạn trên Telegram.

Discord:
Đề cập bot OpenClaw của bạn trong Discord.

WhatsApp:
Nhắn tin đến số WhatsApp OpenClaw của bạn.

Phản hồi sẽ đến từ DeepSeek đang chạy cục bộ!

Cấu hình và Tối ưu hóa

Tinh chỉnh thiết lập DeepSeek + OpenClaw của bạn với các tùy chọn này.

Nhiệt độ và Top-P

Kiểm soát sự sáng tạo của phản hồi:

# Trong config.yaml
ollama:
  temperature: 0.7    # 0.0 = tập trung, 1.0 = sáng tạo
  top_p: 0.9         # Lấy mẫu hạt nhân
  top_k: 40          # Lựa chọn token

Độ dài ngữ cảnh

Điều chỉnh cho các cuộc trò chuyện dài hơn:

ollama:
  context_size: 4096  # Tăng để có ngữ cảnh dài hơn

Lời nhắc hệ thống

Tùy chỉnh hành vi của DeepSeek:

ollama:
  system_prompt: |
    Bạn là một trợ lý lập trình hữu ích.
    Bạn cung cấp các ví dụ code rõ ràng, súc tích.
    Bạn giải thích các khái niệm bằng ngôn ngữ đơn giản.

Chuyển đổi giữa các mô hình

Bạn có thể dễ dàng chuyển đổi giữa các mô hình DeepSeek khác nhau tùy theo nhu cầu của mình:

# Chuyển sang mô hình 14B để có nhiều khả năng hơn
openclaw models set ollama/deepseek-r1:14b

# Chuyển sang V3 cho các tác vụ tổng quát
openclaw models set ollama/deepseek-v3:671b

# Chuyển về 7B để tăng tốc độ
openclaw models set ollama/deepseek-r1:7b

Kiểm tra trợ lý AI của bạn

Kiểm tra trực tiếp qua Ollama

# Kiểm tra khả năng suy luận của DeepSeek
ollama run deepseek-r1:7b "Giải quyết vấn đề này: Nếu một đoàn tàu đi được 120km trong 2 giờ, tốc độ của nó là bao nhiêu?"

Kiểm tra qua OpenClaw

# Gửi tin nhắn thử nghiệm qua OpenClaw
openclaw chat "Xin chào, 2 + 2 bằng mấy?"

Kiểm tra tích hợp nền tảng

Khi các nền tảng của bạn đã được cấu hình:

Telegram:
Gửi /start đến bot OpenClaw của bạn.

Discord:
Đề cập bot của bạn bằng @your-bot hello.

WhatsApp:
Gửi tin nhắn đến số WhatsApp đã cấu hình của bạn.

Giám sát nhật ký

Kiểm tra nhật ký OpenClaw để xem điều gì đang xảy ra:

# Xem nhật ký gần đây
openclaw logs --recent

# Xem nhật ký trực tiếp
openclaw logs --follow

Mẹo thiết lập nâng cao

Tăng tốc GPU

Nếu bạn có GPU NVIDIA, hãy bật tăng tốc CUDA:

# Xác minh GPU được phát hiện
ollama list

# Chạy với tăng tốc GPU (tự động nếu có GPU)
ollama run deepseek-r1:7b --gpu

Tạo mô hình tùy chỉnh

Sử dụng lời nhắc hệ thống để tạo các phiên bản chuyên biệt:

# Tạo Modelfile
echo 'FROM deepseek-r1:7b
SYSTEM """Bạn là một chuyên gia Python.
Cung cấp code sạch, tuân thủ PEP 8.
"""' > /tmp/python-expert

# Tạo mô hình tùy chỉnh
ollama create python-expert -f /tmp/python-expert

# Sử dụng nó trong OpenClaw
openclaw models set ollama/python-expert

Thiết lập đa mô hình

Chạy các mô hình khác nhau cho các tác vụ khác nhau:

# Trong config.yaml - cấu hình nhiều cài đặt trước mô hình
models:
  default: ollama/deepseek-r1:7b
  coding: ollama/deepseek-coder:7b
  reasoning: ollama/deepseek-r1:14b

Sau đó chuyển đổi giữa chúng:

# Sử dụng mô hình lập trình
openclaw models set coding

# Sử dụng mô hình suy luận cho các tác vụ phức tạp
openclaw models set reasoning

Tối ưu hóa hiệu suất

Để có hiệu suất tốt hơn:

  1. Đóng các ứng dụng không cần thiết để giải phóng RAM
  2. Sử dụng mô hình nhỏ nhất đáp ứng nhu cầu của bạn
  3. Cân nhắc nâng cấp RAM nếu bạn thường xuyên đạt giới hạn
  4. Sử dụng ổ cứng SSD để tải mô hình nhanh hơn

Giám sát mức sử dụng tài nguyên

# Kiểm tra mô hình và tài nguyên hiện tại
openclaw status --verbose

# Giám sát Ollama trực tiếp
ollama list

Khắc phục sự cố thường gặp

Mô hình không tải được (Hết bộ nhớ)

Vấn đề: Ollama không tải được mô hình do không đủ RAM.

Giải pháp:

Phản hồi chậm

Vấn đề: Phản hồi mất quá nhiều thời gian.

Giải pháp:

OpenClaw không thể kết nối với Ollama

Vấn đề: OpenClaw báo cáo lỗi kết nối với Ollama.

Giải pháp:

Sự cố kết nối nền tảng

Vấn đề: Không thể kết nối Telegram/Discord/WhatsApp.

Giải pháp:

Câu hỏi thường gặp

DeepSeek có thực sự miễn phí để sử dụng không?

Có, DeepSeek là mã nguồn mở và miễn phí để chạy cục bộ. Bạn chỉ cần cung cấp phần cứng (máy tính có RAM). Không có phí API, không có đăng ký.

Tôi có thể sử dụng DeepSeek cho mục đích thương mại với OpenClaw không?

Có, cả DeepSeek và OpenClaw đều có giấy phép cho phép sử dụng thương mại. Luôn xem xét các điều khoản cấp phép mới nhất.

Điều gì sẽ xảy ra nếu tôi không có GPU?

DeepSeek có thể chạy trên các hệ thống chỉ có CPU. Hãy kỳ vọng suy luận chậm hơn (vài giây mỗi phản hồi thay vì mili giây). Các mô hình nhỏ hơn (1.5B-7B) hoạt động khá tốt trên CPU.

Làm cách nào để chọn giữa DeepSeek-R1 và DeepSeek-V3?

Tôi có thể chạy nhiều mô hình DeepSeek cùng một lúc không?

Có, nhưng mỗi mô hình yêu cầu thêm RAM. Một thiết lập điển hình có thể chạy mô hình 7B cùng với một mô hình chuyên biệt nhỏ hơn cho các tác vụ cụ thể.

Làm cách nào để cập nhật DeepSeek lên phiên bản mới nhất?

ollama pull deepseek-r1:7b

Ollama sẽ tự động cập nhật nếu có phiên bản mới hơn.

Tôi có thể kết nối OpenClaw với các ứng dụng của riêng mình không?

Có, OpenClaw cung cấp các điểm cuối API và webhook cho các tích hợp tùy chỉnh. Kiểm tra tài liệu OpenClaw để biết chi tiết.


Kết luận

Giờ đây, bạn đã có một trợ lý AI mạnh mẽ, miễn phí chạy cục bộ trên máy của mình. DeepSeek cung cấp trí thông minh, OpenClaw cung cấp khả năng tác nhân và Ollama giúp tất cả hoạt động trơn tru.

Những gì bạn có thể làm bây giờ:

Sự kết hợp giữa DeepSeek và OpenClaw mang lại các khả năng mà các giải pháp đám mây thay thế sẽ tốn hàng trăm đô la mỗi tháng – tất cả đều chạy trên phần cứng bạn sở hữu.

Các bước tiếp theo:

  1. Thử nghiệm với các kích thước mô hình DeepSeek khác nhau
  2. Khám phá thị trường kỹ năng của OpenClaw (ClawHub)
  3. Kết nối thêm các nền tảng khác với trợ lý của bạn
  4. Tạo lời nhắc tùy chỉnh cho các trường hợp sử dụng cụ thể

Giới hạn duy nhất là trí tưởng tượng của bạn.

Sẵn sàng xây dựng các ứng dụng AI chuyên nghiệp? Tải xuống Apidog miễn phí và kiểm tra các tích hợp dịch vụ AI của bạn với giao diện trực quan được thiết kế cho nhà phát triển. Hãy thử bộ công cụ kiểm tra API của Apidog để đảm bảo quy trình làm việc AI của bạn mạnh mẽ và đáng tin cậy.

button

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API