TL;DR
DeepSeek là một dòng mô hình AI mã nguồn mở mạnh mẽ (từ 1.5B đến 671B tham số) với khả năng suy luận vượt trội. OpenClaw là một trợ lý AI mã nguồn mở đang được lan truyền rộng rãi (hơn 170K lượt sao trên GitHub) hoạt động hoàn toàn cục bộ. Bằng cách kết hợp DeepSeek với OpenClaw thông qua Ollama, bạn sẽ có một trợ lý AI miễn phí, tập trung vào quyền riêng tư, có thể cạnh tranh với các lựa chọn trả phí, không tốn chi phí API, không đăng ký, kiểm soát hoàn toàn.
Giới thiệu
Việc xây dựng một trợ lý AI cá nhân chưa bao giờ dễ tiếp cận đến thế. Giữa chi phí API, các gói đăng ký và lo ngại về quyền riêng tư, các nhà phát triển cần một lộ trình rõ ràng để bắt đầu với các khả năng AI cục bộ.
Nếu bạn đang tìm kiếm cách để chạy các mô hình ngôn ngữ mạnh mẽ trên máy tính cục bộ mà không phải tốn tiền cho các lệnh gọi API, bạn đã đến đúng nơi. Hướng dẫn này sẽ hướng dẫn bạn cách thiết lập DeepSeek, mô hình mã nguồn mở ấn tượng từ DeepSeek AI, cùng với OpenClaw, một trợ lý AI mã nguồn mở đang được lan truyền rộng rãi, mang đến cho bạn một tác nhân AI cá nhân chạy hoàn toàn trên phần cứng của bạn.
Điều tuyệt vời nhất? Cả DeepSeek và OpenClaw đều miễn phí sử dụng. Không cần thẻ tín dụng. Không cần đăng ký. Không có dữ liệu nào rời khỏi máy của bạn.
Cho dù bạn là nhà phát triển muốn tự động hóa tác vụ, người có sở thích khám phá AI cục bộ, hay một doanh nghiệp đang tìm kiếm các giải pháp AI ưu tiên quyền riêng tư, thiết lập này đều mang lại khả năng cấp doanh nghiệp với chi phí bằng không.
Tại sao chọn DeepSeek + OpenClaw?
Sức mạnh của DeepSeek
DeepSeek đã nổi lên như một trong những dòng mô hình AI mã nguồn mở có năng lực nhất vào năm 2026. Đây là những điểm làm nó nổi bật:

Khả năng suy luận vượt trội
DeepSeek-R1 đạt hiệu suất gần bằng các mô hình hàng đầu như OpenAI O3 và Gemini 2.5 Pro trong các tác vụ suy luận. Nó đặc biệt mạnh mẽ trong toán học, lập trình và giải quyết vấn đề phức tạp.
Đa dạng mô hình
DeepSeek cung cấp các mô hình cho mọi trường hợp sử dụng:
| Mô hình | Tham số | Tốt nhất cho |
|---|---|---|
| DeepSeek-R1 | 1.5B - 671B | Suy luận và giải quyết vấn đề |
| DeepSeek-V3 | 671B | Các tác vụ tổng quát |
| DeepSeek-V3.1 | 671B | Tư duy lai/không tư duy |
| DeepSeek-Coder | 1.3B - 236B | Các tác vụ lập trình |
Suy luận lai
Giống như Qwen3, DeepSeek-V3.1 hỗ trợ cả chế độ tư duy (suy luận theo chuỗi suy nghĩ) và chế độ không tư duy (trả lời trực tiếp), cho phép bạn lựa chọn dựa trên nhiệm vụ của mình.
Hiệu quả chi phí
Các mô hình DeepSeek là mã nguồn mở và miễn phí để chạy cục bộ. Bạn chỉ phải trả tiền cho phần cứng.
Tính linh hoạt của OpenClaw
OpenClaw (trước đây là Clawdbot/Moltbot) là một tác nhân AI mã nguồn mở với hơn 170.000 lượt sao trên GitHub.

Nó cung cấp:
- Tích hợp đa nền tảng: WhatsApp, Telegram, Discord, Slack và nhiều hơn nữa
- Hành động tự động: Gửi email, quản lý lịch, duyệt web, thực thi lệnh
- Bộ nhớ liên tục: Ghi nhớ ngữ cảnh qua các phiên
- Hệ sinh thái kỹ năng: Hơn 700 tiện ích mở rộng do cộng đồng xây dựng qua ClawHub
- Tập trung vào quyền riêng tư: Chạy hoàn toàn cục bộ
Tại sao sự kết hợp này hiệu quả
Sự kết hợp giữa khả năng suy luận mạnh mẽ của DeepSeek với năng lực tác nhân của OpenClaw tạo ra một trợ lý AI miễn phí, riêng tư, có thể cạnh tranh với các lựa chọn trả phí:
- Không tốn chi phí API
- Bảo mật dữ liệu hoàn toàn
- Hành vi có thể tùy chỉnh
- Kiểm soát hoàn toàn trợ lý AI của bạn
- Truy cập đa nền tảng
Điều kiện tiên quyết
Trước khi bắt đầu, hãy đảm bảo bạn có:
- Một máy tính có đủ RAM (xem yêu cầu bên dưới)
- Quyền truy cập quản trị/root để cài đặt phần mềm
- Kết nối Internet để tải xuống ban đầu
- Kiến thức cơ bản về dòng lệnh (chúng tôi sẽ giải thích từng bước)
Yêu cầu RAM theo mô hình
| Mô hình | RAM tối thiểu | RAM khuyến nghị |
|---|---|---|
| DeepSeek-R1 1.5B | 8GB | 8GB |
| DeepSeek-R1 7B | 16GB | 16GB |
| DeepSeek-R1 14B | 32GB | 32GB |
| DeepSeek-R1 32B | 64GB | 64GB |
| DeepSeek-R1 70B | 128GB | 128GB+ |
| DeepSeek-V3 671B | 256GB | 256GB+ |
Mẹo chuyên nghiệp: Bắt đầu với mô hình 7B nếu bạn có 16GB RAM. Bạn luôn có thể nâng cấp sau này.
Cài đặt Ollama
Ollama là cầu nối cho phép bạn chạy DeepSeek cục bộ. Nó xử lý việc tải xuống mô hình, quản lý bộ nhớ và phục vụ suy luận.
Cài đặt trên macOS
# Sử dụng Homebrew (khuyến nghị)
brew install ollama
# Hoặc sử dụng tập lệnh cài đặt
curl -fsSL https://ollama.ai/install.sh | sh
Cài đặt trên Linux
# Sử dụng tập lệnh cài đặt
curl -fsSL https://ollama.ai/install.sh | sh
# Hoặc tải xuống tệp nhị phân trực tiếp
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama
Cài đặt trên Windows
Tải xuống và chạy trình cài đặt từ ollama.
Xác minh cài đặt
Sau khi cài đặt, hãy xác minh Ollama đang hoạt động:
ollama --version
Bạn sẽ thấy đầu ra như ollama version 0.5.0 hoặc tương tự.
Khởi động dịch vụ Ollama
Ollama chạy dưới dạng một dịch vụ nền. Nó sẽ tự động khởi động, nhưng bạn có thể xác minh:
# Kiểm tra xem Ollama có đang chạy không
ollama list
# Nếu không chạy, hãy khởi động nó
ollama serve
Thiết lập các mô hình DeepSeek
Bây giờ hãy chạy DeepSeek trên máy của bạn.
Tải DeepSeek-R1 (Khuyến nghị)
DeepSeek-R1 là mô hình suy luận chủ lực. Đối với hầu hết người dùng, chúng tôi khuyên bạn nên bắt đầu với mô hình 7B hoặc 8B:
# Tải mô hình 7B (khuyến nghị cho hầu hết người dùng)
ollama pull deepseek-r1:7b
# Hoặc tải mô hình 8B để có hiệu suất tốt hơn một chút
ollama pull deepseek-r1:8b
# Đối với phần cứng mạnh hơn, hãy thử mô hình 14B
ollama pull deepseek-r1:14b
Tải DeepSeek-V3 (Mục đích tổng quát)
Nếu bạn cần một mô hình đa năng thay vì một mô hình tập trung vào suy luận:
# Tải DeepSeek-V3 (yêu cầu nhiều RAM đáng kể)
ollama pull deepseek-v3:671b
Tải các mô hình chưng cất (Tài nguyên thấp)
Đối với các hệ thống có RAM hạn chế, các mô hình chưng cất mang lại khả năng suy luận tốt với kích thước nhỏ hơn:
# Tải các mô hình chưng cất dựa trên kiến trúc Qwen
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:14b
Chạy mô hình
Kiểm tra xem mô hình có hoạt động không:
# Chế độ trò chuyện tương tác
ollama run deepseek-r1:7b
Nhập tin nhắn của bạn và nhấn Enter. Nhập /exit để thoát.
Kiểm tra với Python
Đây là cách sử dụng DeepSeek theo chương trình:
import requests
url = "http://localhost:11434/api/generate"
payload = {
"model": "deepseek-r1:7b",
"prompt": "Explain what DeepSeek R1 is in one sentence",
"stream": False,
}
response = requests.post(url, json=payload).json()
print(response["response"])
Kiểm tra API Ollama của bạn với Apidog
Trước khi tích hợp với OpenClaw, bạn có thể kiểm tra thiết lập DeepSeek của mình bằng Apidog. Điều này đặc biệt hữu ích để gỡ lỗi và xác minh các điểm cuối API của bạn hoạt động chính xác.
- Tạo yêu cầu mới trong Apidog
- Đặt phương thức là POST
- Nhập URL:
http://localhost:11434/api/generate - Thêm Tiêu đề:
Content-Type:application/json

Thêm Nội dung (JSON):
{
"model": "deepseek-r1:7b",
"prompt": "Hello, world!",
"stream": false
}
Giao diện trực quan của Apidog giúp bạn dễ dàng kiểm tra phản hồi API của Ollama và gỡ lỗi mọi sự cố trước khi kết nối với OpenClaw. Bạn cũng có thể lưu yêu cầu này để kiểm tra các lời nhắc và cấu hình khác nhau.

Sử dụng thư viện Python của Ollama
from ollama import Client
client = Client()
output = client.chat(
model="deepseek-r1:7b",
messages=[{"role": "user", "content": "Write a hello world in Python"}]
)
print(output["message"]["content"])
Cài đặt OpenClaw
Bây giờ hãy cài đặt OpenClaw để tạo trợ lý AI của bạn.
Cài đặt nhanh
# Sử dụng npx (không cần cài đặt)
npx openclaw
# Hoặc sử dụng tập lệnh cài đặt
curl -fsSL https://openclaw.ai/install.sh | bash
Thiết lập ban đầu
Chạy OpenClaw lần đầu tiên:
npx openclaw

Thao tác này sẽ hướng dẫn bạn cấu hình ban đầu:
- Thiết lập kết nối nền tảng đầu tiên của bạn (Telegram, Discord, v.v.)
- Cấu hình các tùy chọn cơ bản
- Khởi động trợ lý
Xác minh OpenClaw đang chạy
# Kiểm tra trạng thái OpenClaw
openclaw status
Tích hợp DeepSeek với OpenClaw
Bây giờ điều kỳ diệu sẽ xảy ra, chúng ta kết nối DeepSeek làm bộ não cho trợ lý OpenClaw của bạn.
Phương pháp 1: Sử dụng Ollama làm Backend
OpenClaw hỗ trợ Ollama nguyên bản. Cấu hình nó để sử dụng DeepSeek:
# Đặt OpenClaw sử dụng Ollama với DeepSeek-R1
ollama launch openclaw --model deepseek-r1
# Hoặc chỉ định kích thước mô hình khác
ollama launch openclaw --model deepseek-v3.1
Phương pháp 2: Cấu hình môi trường
Đặt biến môi trường để kiểm soát nhiều hơn:
# Cấu hình điểm cuối Ollama
export OLLAMA_HOST=http://localhost:11434
# Đặt mô hình
export OLLAMA_MODEL=deepseek-r1
Phương pháp 3: Tệp cấu hình
Tạo hoặc chỉnh sửa ~/.openclaw/config.yaml:
models:
default: ollama/deepseek-r1:7b
ollama:
host: http://localhost:11434
model: deepseek-r1:7b
temperature: 0.7
top_p: 0.9
Kiểm tra tích hợp
# Kiểm tra xem OpenClaw có đang sử dụng DeepSeek không
openclaw models status
Bạn sẽ thấy đầu ra xác nhận DeepSeek-R1 đang hoạt động.
Trò chuyện qua nền tảng của bạn
Bây giờ bạn có thể trò chuyện với DeepSeek thông qua bất kỳ nền tảng đã kết nối nào:
Telegram:
Gửi tin nhắn đến bot OpenClaw của bạn trên Telegram.
Discord:
Đề cập bot OpenClaw của bạn trong Discord.
WhatsApp:
Nhắn tin đến số WhatsApp OpenClaw của bạn.
Phản hồi sẽ đến từ DeepSeek đang chạy cục bộ!
Cấu hình và Tối ưu hóa
Tinh chỉnh thiết lập DeepSeek + OpenClaw của bạn với các tùy chọn này.
Nhiệt độ và Top-P
Kiểm soát sự sáng tạo của phản hồi:
# Trong config.yaml
ollama:
temperature: 0.7 # 0.0 = tập trung, 1.0 = sáng tạo
top_p: 0.9 # Lấy mẫu hạt nhân
top_k: 40 # Lựa chọn token
Độ dài ngữ cảnh
Điều chỉnh cho các cuộc trò chuyện dài hơn:
ollama:
context_size: 4096 # Tăng để có ngữ cảnh dài hơn
Lời nhắc hệ thống
Tùy chỉnh hành vi của DeepSeek:
ollama:
system_prompt: |
Bạn là một trợ lý lập trình hữu ích.
Bạn cung cấp các ví dụ code rõ ràng, súc tích.
Bạn giải thích các khái niệm bằng ngôn ngữ đơn giản.
Chuyển đổi giữa các mô hình
Bạn có thể dễ dàng chuyển đổi giữa các mô hình DeepSeek khác nhau tùy theo nhu cầu của mình:
# Chuyển sang mô hình 14B để có nhiều khả năng hơn
openclaw models set ollama/deepseek-r1:14b
# Chuyển sang V3 cho các tác vụ tổng quát
openclaw models set ollama/deepseek-v3:671b
# Chuyển về 7B để tăng tốc độ
openclaw models set ollama/deepseek-r1:7b
Kiểm tra trợ lý AI của bạn
Kiểm tra trực tiếp qua Ollama
# Kiểm tra khả năng suy luận của DeepSeek
ollama run deepseek-r1:7b "Giải quyết vấn đề này: Nếu một đoàn tàu đi được 120km trong 2 giờ, tốc độ của nó là bao nhiêu?"
Kiểm tra qua OpenClaw
# Gửi tin nhắn thử nghiệm qua OpenClaw
openclaw chat "Xin chào, 2 + 2 bằng mấy?"
Kiểm tra tích hợp nền tảng
Khi các nền tảng của bạn đã được cấu hình:
Telegram:
Gửi /start đến bot OpenClaw của bạn.
Discord:
Đề cập bot của bạn bằng @your-bot hello.
WhatsApp:
Gửi tin nhắn đến số WhatsApp đã cấu hình của bạn.
Giám sát nhật ký
Kiểm tra nhật ký OpenClaw để xem điều gì đang xảy ra:
# Xem nhật ký gần đây
openclaw logs --recent
# Xem nhật ký trực tiếp
openclaw logs --follow
Mẹo thiết lập nâng cao
Tăng tốc GPU
Nếu bạn có GPU NVIDIA, hãy bật tăng tốc CUDA:
# Xác minh GPU được phát hiện
ollama list
# Chạy với tăng tốc GPU (tự động nếu có GPU)
ollama run deepseek-r1:7b --gpu
Tạo mô hình tùy chỉnh
Sử dụng lời nhắc hệ thống để tạo các phiên bản chuyên biệt:
# Tạo Modelfile
echo 'FROM deepseek-r1:7b
SYSTEM """Bạn là một chuyên gia Python.
Cung cấp code sạch, tuân thủ PEP 8.
"""' > /tmp/python-expert
# Tạo mô hình tùy chỉnh
ollama create python-expert -f /tmp/python-expert
# Sử dụng nó trong OpenClaw
openclaw models set ollama/python-expert
Thiết lập đa mô hình
Chạy các mô hình khác nhau cho các tác vụ khác nhau:
# Trong config.yaml - cấu hình nhiều cài đặt trước mô hình
models:
default: ollama/deepseek-r1:7b
coding: ollama/deepseek-coder:7b
reasoning: ollama/deepseek-r1:14b
Sau đó chuyển đổi giữa chúng:
# Sử dụng mô hình lập trình
openclaw models set coding
# Sử dụng mô hình suy luận cho các tác vụ phức tạp
openclaw models set reasoning
Tối ưu hóa hiệu suất
Để có hiệu suất tốt hơn:
- Đóng các ứng dụng không cần thiết để giải phóng RAM
- Sử dụng mô hình nhỏ nhất đáp ứng nhu cầu của bạn
- Cân nhắc nâng cấp RAM nếu bạn thường xuyên đạt giới hạn
- Sử dụng ổ cứng SSD để tải mô hình nhanh hơn
Giám sát mức sử dụng tài nguyên
# Kiểm tra mô hình và tài nguyên hiện tại
openclaw status --verbose
# Giám sát Ollama trực tiếp
ollama list
Khắc phục sự cố thường gặp
Mô hình không tải được (Hết bộ nhớ)
Vấn đề: Ollama không tải được mô hình do không đủ RAM.
Giải pháp:
- Sử dụng mô hình nhỏ hơn (7B thay vì 14B)
- Đóng các ứng dụng khác để giải phóng RAM
- Thêm RAM vào hệ thống của bạn
Phản hồi chậm
Vấn đề: Phản hồi mất quá nhiều thời gian.
Giải pháp:
- Sử dụng mô hình nhỏ hơn
- Bật tăng tốc GPU
- Giảm kích thước ngữ cảnh
- Sử dụng ổ đĩa lưu trữ nhanh hơn (SSD)
OpenClaw không thể kết nối với Ollama
Vấn đề: OpenClaw báo cáo lỗi kết nối với Ollama.
Giải pháp:
- Xác minh Ollama đang chạy:
ollama serve - Kiểm tra máy chủ trong cấu hình (mặc định:
http://localhost:11434) - Khởi động lại Ollama:
pkill ollama && ollama serve
Sự cố kết nối nền tảng
Vấn đề: Không thể kết nối Telegram/Discord/WhatsApp.
Giải pháp:
- Xác minh thông tin xác thực API của bạn là chính xác
- Kiểm tra trạng thái API của nền tảng
- Xem lại nhật ký OpenClaw để biết các thông báo lỗi cụ thể
Câu hỏi thường gặp
DeepSeek có thực sự miễn phí để sử dụng không?
Có, DeepSeek là mã nguồn mở và miễn phí để chạy cục bộ. Bạn chỉ cần cung cấp phần cứng (máy tính có RAM). Không có phí API, không có đăng ký.
Tôi có thể sử dụng DeepSeek cho mục đích thương mại với OpenClaw không?
Có, cả DeepSeek và OpenClaw đều có giấy phép cho phép sử dụng thương mại. Luôn xem xét các điều khoản cấp phép mới nhất.
Điều gì sẽ xảy ra nếu tôi không có GPU?
DeepSeek có thể chạy trên các hệ thống chỉ có CPU. Hãy kỳ vọng suy luận chậm hơn (vài giây mỗi phản hồi thay vì mili giây). Các mô hình nhỏ hơn (1.5B-7B) hoạt động khá tốt trên CPU.
Làm cách nào để chọn giữa DeepSeek-R1 và DeepSeek-V3?
- DeepSeek-R1: Tốt nhất cho các tác vụ suy luận, toán học, lập trình và giải quyết vấn đề
- DeepSeek-V3: Tốt nhất cho các cuộc trò chuyện và tác vụ tổng quát
Tôi có thể chạy nhiều mô hình DeepSeek cùng một lúc không?
Có, nhưng mỗi mô hình yêu cầu thêm RAM. Một thiết lập điển hình có thể chạy mô hình 7B cùng với một mô hình chuyên biệt nhỏ hơn cho các tác vụ cụ thể.
Làm cách nào để cập nhật DeepSeek lên phiên bản mới nhất?
ollama pull deepseek-r1:7b
Ollama sẽ tự động cập nhật nếu có phiên bản mới hơn.
Tôi có thể kết nối OpenClaw với các ứng dụng của riêng mình không?
Có, OpenClaw cung cấp các điểm cuối API và webhook cho các tích hợp tùy chỉnh. Kiểm tra tài liệu OpenClaw để biết chi tiết.
Kết luận
Giờ đây, bạn đã có một trợ lý AI mạnh mẽ, miễn phí chạy cục bộ trên máy của mình. DeepSeek cung cấp trí thông minh, OpenClaw cung cấp khả năng tác nhân và Ollama giúp tất cả hoạt động trơn tru.
Những gì bạn có thể làm bây giờ:
- Trò chuyện với DeepSeek qua Telegram, Discord, WhatsApp hoặc các nền tảng khác
- Tự động hóa các tác vụ như gửi email và quản lý lịch
- Xây dựng quy trình làm việc AI tùy chỉnh với quyền riêng tư hoàn toàn
- Mở rộng từ mô hình nhỏ nhất đến mạnh nhất khi nhu cầu của bạn tăng lên
Sự kết hợp giữa DeepSeek và OpenClaw mang lại các khả năng mà các giải pháp đám mây thay thế sẽ tốn hàng trăm đô la mỗi tháng – tất cả đều chạy trên phần cứng bạn sở hữu.
Các bước tiếp theo:
- Thử nghiệm với các kích thước mô hình DeepSeek khác nhau
- Khám phá thị trường kỹ năng của OpenClaw (ClawHub)
- Kết nối thêm các nền tảng khác với trợ lý của bạn
- Tạo lời nhắc tùy chỉnh cho các trường hợp sử dụng cụ thể
Giới hạn duy nhất là trí tưởng tượng của bạn.
Sẵn sàng xây dựng các ứng dụng AI chuyên nghiệp? Tải xuống Apidog miễn phí và kiểm tra các tích hợp dịch vụ AI của bạn với giao diện trực quan được thiết kế cho nhà phát triển. Hãy thử bộ công cụ kiểm tra API của Apidog để đảm bảo quy trình làm việc AI của bạn mạnh mẽ và đáng tin cậy.
