Cách xây dựng trợ lý AI cục bộ miễn phí với OpenClaw và DeepSeek

TL;DR

DeepSeek là một dòng mô hình AI mã nguồn mở mạnh mẽ (từ 1.5B đến 671B tham số) với khả năng suy luận vượt trội. OpenClaw là một trợ lý AI mã nguồn mở đang được lan truyền rộng rãi (hơn 170K lượt sao trên GitHub) hoạt động hoàn toàn cục bộ. Bằng cách kết hợp DeepSeek với OpenClaw thông qua Ollama, bạn sẽ có một trợ lý AI miễn phí, tập trung vào quyền riêng tư, có thể cạnh tranh với các lựa chọn trả phí, không tốn chi phí API, không đăng ký, kiểm soát hoàn toàn.

Giới thiệu

Việc xây dựng một trợ lý AI cá nhân chưa bao giờ dễ tiếp cận đến thế. Giữa chi phí API, các gói đăng ký và lo ngại về quyền riêng tư, các nhà phát triển cần một lộ trình rõ ràng để bắt đầu với các khả năng AI cục bộ.

Nếu bạn đang tìm kiếm cách để chạy các mô hình ngôn ngữ mạnh mẽ trên máy tính cục bộ mà không phải tốn tiền cho các lệnh gọi API, bạn đã đến đúng nơi. Hướng dẫn này sẽ hướng dẫn bạn cách thiết lập DeepSeek, mô hình mã nguồn mở ấn tượng từ DeepSeek AI, cùng với OpenClaw, một trợ lý AI mã nguồn mở đang được lan truyền rộng rãi, mang đến cho bạn một tác nhân AI cá nhân chạy hoàn toàn trên phần cứng của bạn.

Điều tuyệt vời nhất? Cả DeepSeek và OpenClaw đều miễn phí sử dụng. Không cần thẻ tín dụng. Không cần đăng ký. Không có dữ liệu nào rời khỏi máy của bạn.

Cho dù bạn là nhà phát triển muốn tự động hóa tác vụ, người có sở thích khám phá AI cục bộ, hay một doanh nghiệp đang tìm kiếm các giải pháp AI ưu tiên quyền riêng tư, thiết lập này đều mang lại khả năng cấp doanh nghiệp với chi phí bằng không.

Tại sao chọn DeepSeek + OpenClaw?

Sức mạnh của DeepSeek

DeepSeek đã nổi lên như một trong những dòng mô hình AI mã nguồn mở có năng lực nhất vào năm 2026. Đây là những điểm làm nó nổi bật:

Khả năng suy luận vượt trội
DeepSeek-R1 đạt hiệu suất gần bằng các mô hình hàng đầu như OpenAI O3 và Gemini 2.5 Pro trong các tác vụ suy luận. Nó đặc biệt mạnh mẽ trong toán học, lập trình và giải quyết vấn đề phức tạp.

Đa dạng mô hình
DeepSeek cung cấp các mô hình cho mọi trường hợp sử dụng:

Mô hình	Tham số	Tốt nhất cho
DeepSeek-R1	1.5B - 671B	Suy luận và giải quyết vấn đề
DeepSeek-V3	671B	Các tác vụ tổng quát
DeepSeek-V3.1	671B	Tư duy lai/không tư duy
DeepSeek-Coder	1.3B - 236B	Các tác vụ lập trình

Suy luận lai
Giống như Qwen3, DeepSeek-V3.1 hỗ trợ cả chế độ tư duy (suy luận theo chuỗi suy nghĩ) và chế độ không tư duy (trả lời trực tiếp), cho phép bạn lựa chọn dựa trên nhiệm vụ của mình.

Hiệu quả chi phí
Các mô hình DeepSeek là mã nguồn mở và miễn phí để chạy cục bộ. Bạn chỉ phải trả tiền cho phần cứng.

Tính linh hoạt của OpenClaw

OpenClaw (trước đây là Clawdbot/Moltbot) là một tác nhân AI mã nguồn mở với hơn 170.000 lượt sao trên GitHub.

Nó cung cấp:

Tích hợp đa nền tảng: WhatsApp, Telegram, Discord, Slack và nhiều hơn nữa
Hành động tự động: Gửi email, quản lý lịch, duyệt web, thực thi lệnh
Bộ nhớ liên tục: Ghi nhớ ngữ cảnh qua các phiên
Hệ sinh thái kỹ năng: Hơn 700 tiện ích mở rộng do cộng đồng xây dựng qua ClawHub
Tập trung vào quyền riêng tư: Chạy hoàn toàn cục bộ

Tại sao sự kết hợp này hiệu quả

Sự kết hợp giữa khả năng suy luận mạnh mẽ của DeepSeek với năng lực tác nhân của OpenClaw tạo ra một trợ lý AI miễn phí, riêng tư, có thể cạnh tranh với các lựa chọn trả phí:

Không tốn chi phí API
Bảo mật dữ liệu hoàn toàn
Hành vi có thể tùy chỉnh
Kiểm soát hoàn toàn trợ lý AI của bạn
Truy cập đa nền tảng

Điều kiện tiên quyết

Trước khi bắt đầu, hãy đảm bảo bạn có:

Một máy tính có đủ RAM (xem yêu cầu bên dưới)
Quyền truy cập quản trị/root để cài đặt phần mềm
Kết nối Internet để tải xuống ban đầu
Kiến thức cơ bản về dòng lệnh (chúng tôi sẽ giải thích từng bước)

Yêu cầu RAM theo mô hình

Mô hình	RAM tối thiểu	RAM khuyến nghị
DeepSeek-R1 1.5B	8GB	8GB
DeepSeek-R1 7B	16GB	16GB
DeepSeek-R1 14B	32GB	32GB
DeepSeek-R1 32B	64GB	64GB
DeepSeek-R1 70B	128GB	128GB+
DeepSeek-V3 671B	256GB	256GB+

Mẹo chuyên nghiệp: Bắt đầu với mô hình 7B nếu bạn có 16GB RAM. Bạn luôn có thể nâng cấp sau này.

Cài đặt Ollama

Ollama là cầu nối cho phép bạn chạy DeepSeek cục bộ. Nó xử lý việc tải xuống mô hình, quản lý bộ nhớ và phục vụ suy luận.

Cài đặt trên macOS

# Sử dụng Homebrew (khuyến nghị)
brew install ollama

# Hoặc sử dụng tập lệnh cài đặt
curl -fsSL https://ollama.ai/install.sh | sh

Cài đặt trên Linux

# Sử dụng tập lệnh cài đặt
curl -fsSL https://ollama.ai/install.sh | sh

# Hoặc tải xuống tệp nhị phân trực tiếp
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Cài đặt trên Windows

Tải xuống và chạy trình cài đặt từ ollama.

Xác minh cài đặt

Sau khi cài đặt, hãy xác minh Ollama đang hoạt động:

ollama --version

Bạn sẽ thấy đầu ra như ollama version 0.5.0 hoặc tương tự.

Khởi động dịch vụ Ollama

Ollama chạy dưới dạng một dịch vụ nền. Nó sẽ tự động khởi động, nhưng bạn có thể xác minh:

# Kiểm tra xem Ollama có đang chạy không
ollama list

# Nếu không chạy, hãy khởi động nó
ollama serve

Thiết lập các mô hình DeepSeek

Bây giờ hãy chạy DeepSeek trên máy của bạn.

Tải DeepSeek-R1 (Khuyến nghị)

DeepSeek-R1 là mô hình suy luận chủ lực. Đối với hầu hết người dùng, chúng tôi khuyên bạn nên bắt đầu với mô hình 7B hoặc 8B:

# Tải mô hình 7B (khuyến nghị cho hầu hết người dùng)
ollama pull deepseek-r1:7b

# Hoặc tải mô hình 8B để có hiệu suất tốt hơn một chút
ollama pull deepseek-r1:8b

# Đối với phần cứng mạnh hơn, hãy thử mô hình 14B
ollama pull deepseek-r1:14b

Tải DeepSeek-V3 (Mục đích tổng quát)

Nếu bạn cần một mô hình đa năng thay vì một mô hình tập trung vào suy luận:

# Tải DeepSeek-V3 (yêu cầu nhiều RAM đáng kể)
ollama pull deepseek-v3:671b

Tải các mô hình chưng cất (Tài nguyên thấp)

Đối với các hệ thống có RAM hạn chế, các mô hình chưng cất mang lại khả năng suy luận tốt với kích thước nhỏ hơn:

# Tải các mô hình chưng cất dựa trên kiến trúc Qwen
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:14b

Chạy mô hình

Kiểm tra xem mô hình có hoạt động không:

# Chế độ trò chuyện tương tác
ollama run deepseek-r1:7b

Nhập tin nhắn của bạn và nhấn Enter. Nhập /exit để thoát.

Kiểm tra với Python

Đây là cách sử dụng DeepSeek theo chương trình:

import requests

url = "http://localhost:11434/api/generate"
payload = {
    "model": "deepseek-r1:7b",
    "prompt": "Explain what DeepSeek R1 is in one sentence",
    "stream": False,
}
response = requests.post(url, json=payload).json()
print(response["response"])

Kiểm tra API Ollama của bạn với Apidog

Trước khi tích hợp với OpenClaw, bạn có thể kiểm tra thiết lập DeepSeek của mình bằng Apidog. Điều này đặc biệt hữu ích để gỡ lỗi và xác minh các điểm cuối API của bạn hoạt động chính xác.

Tạo yêu cầu mới trong Apidog
Đặt phương thức là POST
Nhập URL: http://localhost:11434/api/generate
Thêm Tiêu đề:

Content-Type: application/json

Thêm Nội dung (JSON):

{
  "model": "deepseek-r1:7b",
  "prompt": "Hello, world!",
  "stream": false
}

Giao diện trực quan của Apidog giúp bạn dễ dàng kiểm tra phản hồi API của Ollama và gỡ lỗi mọi sự cố trước khi kết nối với OpenClaw. Bạn cũng có thể lưu yêu cầu này để kiểm tra các lời nhắc và cấu hình khác nhau.

Thêm nội dung để gửi yêu cầu trong Apidog

Sử dụng thư viện Python của Ollama

from ollama import Client

client = Client()
output = client.chat(
    model="deepseek-r1:7b",
    messages=[{"role": "user", "content": "Write a hello world in Python"}]
)
print(output["message"]["content"])

Cài đặt OpenClaw

Bây giờ hãy cài đặt OpenClaw để tạo trợ lý AI của bạn.

Cài đặt nhanh

# Sử dụng npx (không cần cài đặt)
npx openclaw

# Hoặc sử dụng tập lệnh cài đặt
curl -fsSL https://openclaw.ai/install.sh | bash

Thiết lập ban đầu

Chạy OpenClaw lần đầu tiên:

npx openclaw

Thao tác này sẽ hướng dẫn bạn cấu hình ban đầu:

Thiết lập kết nối nền tảng đầu tiên của bạn (Telegram, Discord, v.v.)
Cấu hình các tùy chọn cơ bản
Khởi động trợ lý

Xác minh OpenClaw đang chạy

# Kiểm tra trạng thái OpenClaw
openclaw status

Tích hợp DeepSeek với OpenClaw

Bây giờ điều kỳ diệu sẽ xảy ra, chúng ta kết nối DeepSeek làm bộ não cho trợ lý OpenClaw của bạn.

Phương pháp 1: Sử dụng Ollama làm Backend

OpenClaw hỗ trợ Ollama nguyên bản. Cấu hình nó để sử dụng DeepSeek:

# Đặt OpenClaw sử dụng Ollama với DeepSeek-R1
ollama launch openclaw --model deepseek-r1

# Hoặc chỉ định kích thước mô hình khác
ollama launch openclaw --model deepseek-v3.1

Phương pháp 2: Cấu hình môi trường

Đặt biến môi trường để kiểm soát nhiều hơn:

# Cấu hình điểm cuối Ollama
export OLLAMA_HOST=http://localhost:11434

# Đặt mô hình
export OLLAMA_MODEL=deepseek-r1

Phương pháp 3: Tệp cấu hình

Tạo hoặc chỉnh sửa ~/.openclaw/config.yaml:

models:
  default: ollama/deepseek-r1:7b

ollama:
  host: http://localhost:11434
  model: deepseek-r1:7b
  temperature: 0.7
  top_p: 0.9

Kiểm tra tích hợp

# Kiểm tra xem OpenClaw có đang sử dụng DeepSeek không
openclaw models status

Bạn sẽ thấy đầu ra xác nhận DeepSeek-R1 đang hoạt động.

Trò chuyện qua nền tảng của bạn

Bây giờ bạn có thể trò chuyện với DeepSeek thông qua bất kỳ nền tảng đã kết nối nào:

Telegram:
Gửi tin nhắn đến bot OpenClaw của bạn trên Telegram.

Discord:
Đề cập bot OpenClaw của bạn trong Discord.

WhatsApp:
Nhắn tin đến số WhatsApp OpenClaw của bạn.

Phản hồi sẽ đến từ DeepSeek đang chạy cục bộ!

Cấu hình và Tối ưu hóa

Tinh chỉnh thiết lập DeepSeek + OpenClaw của bạn với các tùy chọn này.

Nhiệt độ và Top-P

Kiểm soát sự sáng tạo của phản hồi:

# Trong config.yaml
ollama:
  temperature: 0.7    # 0.0 = tập trung, 1.0 = sáng tạo
  top_p: 0.9         # Lấy mẫu hạt nhân
  top_k: 40          # Lựa chọn token

Độ dài ngữ cảnh

Điều chỉnh cho các cuộc trò chuyện dài hơn:

ollama:
  context_size: 4096  # Tăng để có ngữ cảnh dài hơn

Lời nhắc hệ thống

Tùy chỉnh hành vi của DeepSeek:

ollama:
  system_prompt: |
    Bạn là một trợ lý lập trình hữu ích.
    Bạn cung cấp các ví dụ code rõ ràng, súc tích.
    Bạn giải thích các khái niệm bằng ngôn ngữ đơn giản.

Chuyển đổi giữa các mô hình

Bạn có thể dễ dàng chuyển đổi giữa các mô hình DeepSeek khác nhau tùy theo nhu cầu của mình:

# Chuyển sang mô hình 14B để có nhiều khả năng hơn
openclaw models set ollama/deepseek-r1:14b

# Chuyển sang V3 cho các tác vụ tổng quát
openclaw models set ollama/deepseek-v3:671b

# Chuyển về 7B để tăng tốc độ
openclaw models set ollama/deepseek-r1:7b

Kiểm tra trợ lý AI của bạn

Kiểm tra trực tiếp qua Ollama

# Kiểm tra khả năng suy luận của DeepSeek
ollama run deepseek-r1:7b "Giải quyết vấn đề này: Nếu một đoàn tàu đi được 120km trong 2 giờ, tốc độ của nó là bao nhiêu?"

Kiểm tra qua OpenClaw

# Gửi tin nhắn thử nghiệm qua OpenClaw
openclaw chat "Xin chào, 2 + 2 bằng mấy?"

Kiểm tra tích hợp nền tảng

Khi các nền tảng của bạn đã được cấu hình:

Telegram:
Gửi /start đến bot OpenClaw của bạn.

Discord:
Đề cập bot của bạn bằng @your-bot hello.

WhatsApp:
Gửi tin nhắn đến số WhatsApp đã cấu hình của bạn.

Giám sát nhật ký

Kiểm tra nhật ký OpenClaw để xem điều gì đang xảy ra:

# Xem nhật ký gần đây
openclaw logs --recent

# Xem nhật ký trực tiếp
openclaw logs --follow

Mẹo thiết lập nâng cao

Tăng tốc GPU

Nếu bạn có GPU NVIDIA, hãy bật tăng tốc CUDA:

# Xác minh GPU được phát hiện
ollama list

# Chạy với tăng tốc GPU (tự động nếu có GPU)
ollama run deepseek-r1:7b --gpu

Tạo mô hình tùy chỉnh

Sử dụng lời nhắc hệ thống để tạo các phiên bản chuyên biệt:

# Tạo Modelfile
echo 'FROM deepseek-r1:7b
SYSTEM """Bạn là một chuyên gia Python.
Cung cấp code sạch, tuân thủ PEP 8.
"""' > /tmp/python-expert

# Tạo mô hình tùy chỉnh
ollama create python-expert -f /tmp/python-expert

# Sử dụng nó trong OpenClaw
openclaw models set ollama/python-expert

Thiết lập đa mô hình

Chạy các mô hình khác nhau cho các tác vụ khác nhau:

# Trong config.yaml - cấu hình nhiều cài đặt trước mô hình
models:
  default: ollama/deepseek-r1:7b
  coding: ollama/deepseek-coder:7b
  reasoning: ollama/deepseek-r1:14b

Sau đó chuyển đổi giữa chúng:

# Sử dụng mô hình lập trình
openclaw models set coding

# Sử dụng mô hình suy luận cho các tác vụ phức tạp
openclaw models set reasoning

Tối ưu hóa hiệu suất

Để có hiệu suất tốt hơn:

Đóng các ứng dụng không cần thiết để giải phóng RAM
Sử dụng mô hình nhỏ nhất đáp ứng nhu cầu của bạn
Cân nhắc nâng cấp RAM nếu bạn thường xuyên đạt giới hạn
Sử dụng ổ cứng SSD để tải mô hình nhanh hơn

Giám sát mức sử dụng tài nguyên

# Kiểm tra mô hình và tài nguyên hiện tại
openclaw status --verbose

# Giám sát Ollama trực tiếp
ollama list

Khắc phục sự cố thường gặp

Mô hình không tải được (Hết bộ nhớ)

Vấn đề: Ollama không tải được mô hình do không đủ RAM.

Giải pháp:

Sử dụng mô hình nhỏ hơn (7B thay vì 14B)
Đóng các ứng dụng khác để giải phóng RAM
Thêm RAM vào hệ thống của bạn

Phản hồi chậm

Vấn đề: Phản hồi mất quá nhiều thời gian.

Giải pháp:

Sử dụng mô hình nhỏ hơn
Bật tăng tốc GPU
Giảm kích thước ngữ cảnh
Sử dụng ổ đĩa lưu trữ nhanh hơn (SSD)

OpenClaw không thể kết nối với Ollama

Vấn đề: OpenClaw báo cáo lỗi kết nối với Ollama.

Giải pháp:

Xác minh Ollama đang chạy: ollama serve
Kiểm tra máy chủ trong cấu hình (mặc định: http://localhost:11434)
Khởi động lại Ollama: pkill ollama && ollama serve

Sự cố kết nối nền tảng

Vấn đề: Không thể kết nối Telegram/Discord/WhatsApp.

Giải pháp:

Xác minh thông tin xác thực API của bạn là chính xác
Kiểm tra trạng thái API của nền tảng
Xem lại nhật ký OpenClaw để biết các thông báo lỗi cụ thể

Câu hỏi thường gặp

DeepSeek có thực sự miễn phí để sử dụng không?

Có, DeepSeek là mã nguồn mở và miễn phí để chạy cục bộ. Bạn chỉ cần cung cấp phần cứng (máy tính có RAM). Không có phí API, không có đăng ký.

Tôi có thể sử dụng DeepSeek cho mục đích thương mại với OpenClaw không?

Có, cả DeepSeek và OpenClaw đều có giấy phép cho phép sử dụng thương mại. Luôn xem xét các điều khoản cấp phép mới nhất.

Điều gì sẽ xảy ra nếu tôi không có GPU?

DeepSeek có thể chạy trên các hệ thống chỉ có CPU. Hãy kỳ vọng suy luận chậm hơn (vài giây mỗi phản hồi thay vì mili giây). Các mô hình nhỏ hơn (1.5B-7B) hoạt động khá tốt trên CPU.

Làm cách nào để chọn giữa DeepSeek-R1 và DeepSeek-V3?

DeepSeek-R1: Tốt nhất cho các tác vụ suy luận, toán học, lập trình và giải quyết vấn đề
DeepSeek-V3: Tốt nhất cho các cuộc trò chuyện và tác vụ tổng quát

Tôi có thể chạy nhiều mô hình DeepSeek cùng một lúc không?

Có, nhưng mỗi mô hình yêu cầu thêm RAM. Một thiết lập điển hình có thể chạy mô hình 7B cùng với một mô hình chuyên biệt nhỏ hơn cho các tác vụ cụ thể.

Làm cách nào để cập nhật DeepSeek lên phiên bản mới nhất?

ollama pull deepseek-r1:7b

Ollama sẽ tự động cập nhật nếu có phiên bản mới hơn.

Tôi có thể kết nối OpenClaw với các ứng dụng của riêng mình không?

Có, OpenClaw cung cấp các điểm cuối API và webhook cho các tích hợp tùy chỉnh. Kiểm tra tài liệu OpenClaw để biết chi tiết.

Kết luận

Giờ đây, bạn đã có một trợ lý AI mạnh mẽ, miễn phí chạy cục bộ trên máy của mình. DeepSeek cung cấp trí thông minh, OpenClaw cung cấp khả năng tác nhân và Ollama giúp tất cả hoạt động trơn tru.

Những gì bạn có thể làm bây giờ:

Trò chuyện với DeepSeek qua Telegram, Discord, WhatsApp hoặc các nền tảng khác
Tự động hóa các tác vụ như gửi email và quản lý lịch
Xây dựng quy trình làm việc AI tùy chỉnh với quyền riêng tư hoàn toàn
Mở rộng từ mô hình nhỏ nhất đến mạnh nhất khi nhu cầu của bạn tăng lên

Sự kết hợp giữa DeepSeek và OpenClaw mang lại các khả năng mà các giải pháp đám mây thay thế sẽ tốn hàng trăm đô la mỗi tháng – tất cả đều chạy trên phần cứng bạn sở hữu.

Các bước tiếp theo:

Thử nghiệm với các kích thước mô hình DeepSeek khác nhau
Khám phá thị trường kỹ năng của OpenClaw (ClawHub)
Kết nối thêm các nền tảng khác với trợ lý của bạn
Tạo lời nhắc tùy chỉnh cho các trường hợp sử dụng cụ thể

Giới hạn duy nhất là trí tưởng tượng của bạn.

Sẵn sàng xây dựng các ứng dụng AI chuyên nghiệp? Tải xuống Apidog miễn phí và kiểm tra các tích hợp dịch vụ AI của bạn với giao diện trực quan được thiết kế cho nhà phát triển. Hãy thử bộ công cụ kiểm tra API của Apidog để đảm bảo quy trình làm việc AI của bạn mạnh mẽ và đáng tin cậy.

button