TÓM TẮT
Ollama kết hợp với DuckDuckGo có chi phí 0 đô la/tháng và hoạt động tốt cho mục đích sử dụng cá nhân. Groq kết hợp với Brave Search cung cấp phản hồi nhanh nhất trong khi vẫn miễn phí cho mức sử dụng vừa phải. OpenRouter kết hợp với DuckDuckGo cung cấp quyền truy cập vào hơn 100 mô hình với giá 5-20 đô la/tháng. Đối với quy trình kiểm thử API, hãy kết hợp bất kỳ lựa chọn nào trong số này với Apidog để thiết kế API trong khi OpenClaw tự động hóa kiểm thử.
Giới thiệu
Việc chạy một trợ lý AI không nên tốn hơn 100 đô la mỗi tháng. OpenClaw (trước đây là Clawdbot) là một trợ lý AI cá nhân mã nguồn mở có thể duyệt web, đọc tệp và chạy lệnh. Nhưng đây là vấn đề: trong khi phần mềm miễn phí, bạn vẫn phải trả tiền cho các API mô hình AI.
Hầu hết mọi người mặc định chọn các tùy chọn đắt tiền như GPT-4 hoặc Claude, làm phát sinh chi phí API từ 50-150 đô la/tháng. Nhưng bạn không cần phải làm vậy. Các LLM miễn phí và giá rẻ có thể cung cấp sức mạnh cho OpenClaw tốt như nhau cho hầu hết các tác vụ.
Tôi đã thử nghiệm mọi tùy chọn LLM miễn phí chính với OpenClaw trong tháng qua. Một số hoạt động rất tốt. Một số khác thất bại thảm hại. Hướng dẫn này chỉ cho bạn chính xác những sự kết hợp nào hiệu quả, cách thiết lập chúng và bạn sẽ thực sự chi tiêu bao nhiêu.
Bạn sẽ học được LLM miễn phí nào mang lại hiệu suất tốt nhất, cách tích hợp tìm kiếm web mà không cần khóa API và cách thiết lập một trợ lý AI miễn phí thực sự hoạt động.
OpenClaw là gì?
OpenClaw là một trợ lý AI cá nhân hoạt động 24/7 trên máy của bạn. Không giống như ChatGPT hay Claude, chỉ trò chuyện, OpenClaw thực hiện hành động. Nó có thể:
- Duyệt các trang web và tìm kiếm trên web
- Đọc và ghi tệp trên máy tính của bạn
- Chạy các lệnh terminal
- Thực thi mã và script
- Tương tác với các API
- Giám sát hệ thống và gửi cảnh báo
Hãy coi nó như một nhân viên AI không bao giờ ngủ. Bạn giao nhiệm vụ cho nó và nó hoàn thành chúng một cách tự động.
Phần mềm này hoàn toàn miễn phí và mã nguồn mở (giấy phép MIT). Chi phí duy nhất của bạn đến từ:
- API mô hình AI - LLM cung cấp năng lượng cho trợ lý
- API tìm kiếm web (tùy chọn) - Dành cho các tác vụ duyệt web và nghiên cứu
Hướng dẫn này tập trung vào việc giảm thiểu cả hai chi phí trong khi vẫn duy trì hiệu suất tốt.
Tại sao LLM miễn phí lại quan trọng
Chi phí trợ lý AI tăng lên nhanh chóng. Đây là mức sử dụng điển hình với các API trả phí:
- Claude Opus 4.6: 15 đô la cho mỗi triệu token đầu vào, 75 đô la cho mỗi triệu token đầu ra
- Gemini Pro: 0.00025 đô la cho mỗi 1K ký tự
Nếu OpenClaw thực hiện 100 lệnh gọi API mỗi ngày (kiểm tra email, duyệt tin tức, chạy tác vụ), bạn sẽ phải chi trả khoảng:
- Sử dụng nhẹ: 30-50 đô la/tháng
- Sử dụng vừa phải: 70-100 đô la/tháng
- Tự động hóa nặng: 150-300 đô la/tháng
Các LLM miễn phí thay đổi hoàn toàn phương trình này. Bạn có thể chạy OpenClaw 24/7 với giá 0-20 đô la/tháng thay vì hơn 100 đô la.
Câu hỏi không phải là liệu các LLM miễn phí có hoạt động hay không. Mà là loại nào hoạt động tốt nhất cho nhu cầu của bạn.
So sánh các tùy chọn LLM miễn phí
Tôi đã thử nghiệm năm tùy chọn LLM miễn phí với OpenClaw trong hơn 30 ngày. Đây là những gì tôi tìm thấy.
1. Ollama (Mô hình cục bộ)
Chi phí: 0 đô la/tháng (chạy trên máy tính của bạn)
Ollama cho phép bạn chạy các LLM cục bộ. Không có lệnh gọi API, không giới hạn sử dụng, không hóa đơn hàng tháng.
Ưu điểm:
- Không có chi phí phát sinh
- Bảo mật hoàn toàn (không có gì rời khỏi máy của bạn)
- Không giới hạn tốc độ
- Hoạt động ngoại tuyến
Nhược điểm:
- Yêu cầu phần cứng khá (16GB+ RAM cho các mô hình 7B, 32GB+ cho các mô hình 70B)
- Chậm hơn so với các API đám mây (5-15 giây mỗi phản hồi)
- Sử dụng tài nguyên tính toán cục bộ
Tốt nhất cho: Người dùng quan tâm đến quyền riêng tư, sử dụng không giới hạn, học hỏi và thử nghiệm
Hiệu suất thực tế: Llama 3.3 8B xử lý tốt 80% tác vụ OpenClaw của tôi. Tìm kiếm web, thao tác tệp và mã hóa đơn giản hoạt động tốt. Suy luận phức tạp và viết dài dòng gặp khó khăn so với các mô hình đám mây.
2. Groq
Chi phí: Tầng miễn phí (giới hạn rộng rãi)
Groq cung cấp khả năng suy luận LLM nhanh nhất hiện có. Phản hồi trả về trong 1-2 giây thay vì 5-10 giây.
Giới hạn tầng miễn phí:
- 14.400 yêu cầu mỗi ngày
- 30 yêu cầu mỗi phút
- Không yêu cầu thẻ tín dụng
Ưu điểm:
- Cực kỳ nhanh (nhanh hơn 10 lần so với hầu hết các API)
- Tầng miễn phí rộng rãi
- Thiết lập dễ dàng
- Lựa chọn mô hình tốt
Nhược điểm:
- Giới hạn tốc độ có thể bị đạt khi tự động hóa nặng
- Tầng miễn phí có thể thay đổi
- Yêu cầu kết nối internet
Tốt nhất cho: Các ứng dụng cần tốc độ, sử dụng hàng ngày vừa phải, phản hồi nhanh
Hiệu suất thực tế: Tốc độ của Groq khiến OpenClaw hoạt động nhanh nhạy. Các tác vụ mất 30 giây với Ollama hoàn thành trong 5 giây. Tầng miễn phí xử lý mức sử dụng hàng ngày của tôi (50-100 yêu cầu) mà không gặp vấn đề gì.
3. OpenRouter
Chi phí: Tầng miễn phí + trả tiền theo mức sử dụng (bắt đầu từ 0,001 đô la mỗi yêu cầu)
OpenRouter tổng hợp hơn 100 nhà cung cấp LLM vào một API duy nhất. Bạn có quyền truy cập vào mọi thứ từ GPT-4 đến các mô hình mã nguồn mở nhỏ.
Tầng miễn phí:
- 1 đô la tín dụng miễn phí cho người dùng mới
- Một số mô hình hoàn toàn miễn phí
- Chỉ trả tiền cho những gì bạn sử dụng
Ưu điểm:
- Đa dạng mô hình lớn
- Dễ dàng kiểm thử các mô hình khác nhau
- Giá cả cạnh tranh
- Các tùy chọn dự phòng nếu một mô hình thất bại
Nhược điểm:
- Giá cả phức tạp (thay đổi tùy theo mô hình)
- Tín dụng miễn phí sẽ hết
- Yêu cầu quản lý khóa API
Tốt nhất cho: Kiểm thử nhiều mô hình, linh hoạt, mở rộng dần dần
Hiệu suất thực tế: Tôi đã sử dụng OpenRouter để kiểm thử 10 mô hình khác nhau với OpenClaw. Llama 3.3 8B (miễn phí) hoạt động tốt cho các tác vụ cơ bản. Khi tôi cần chất lượng tốt hơn, tôi đã chuyển sang Qwen 2.5 72B (0,002 đô la mỗi yêu cầu) cho các tác vụ cụ thể. Tổng chi phí: 8 đô la cho tháng đó.
4. Mistral AI
Chi phí: Có tầng miễn phí
Mistral AI là một công ty AI châu Âu cung cấp các mô hình cạnh tranh.
Tầng miễn phí:
- Giới hạn yêu cầu mỗi tháng
- Ban đầu không yêu cầu thẻ tín dụng
- Tuân thủ GDPR
Ưu điểm:
- Nhà cung cấp châu Âu (tuân thủ GDPR)
- Chất lượng mô hình tốt
- Tầng miễn phí hợp lý
Nhược điểm:
- Tầng miễn phí nhỏ hơn Groq
- Ít tùy chọn mô hình hơn
- Ít tài liệu hơn
Tốt nhất cho: Người dùng châu Âu, yêu cầu GDPR, sử dụng vừa phải
Hiệu suất thực tế: Mixtral 8x7B hoạt động tốt trong các tác vụ suy luận. Thời gian phản hồi ở mức trung bình (3-5 giây). Tầng miễn phí kéo dài khoảng 2 tuần với mức sử dụng hàng ngày trước khi tôi đạt giới hạn.
5. Together AI
Chi phí: 25 đô la tín dụng miễn phí (hết hạn sau 3 tháng)
Together AI cung cấp khả năng suy luận nhanh cho các mô hình mã nguồn mở.
Tín dụng miễn phí:
- 25 đô la khi đăng ký
- Hết hạn sau 3 tháng
- Yêu cầu thẻ tín dụng
Ưu điểm:
- Tín dụng ban đầu hào phóng
- Suy luận nhanh
- Lựa chọn mô hình tốt
- API dễ sử dụng
Nhược điểm:
- Tín dụng hết hạn
- Yêu cầu thẻ tín dụng
- Không thực sự “miễn phí” về lâu dài
Tốt nhất cho: Kiểm thử và đánh giá, các dự án ngắn hạn, bằng chứng khái niệm
Hiệu suất thực tế: 25 đô la tín dụng kéo dài khoảng 6 tuần với mức sử dụng OpenClaw vừa phải. Hiệu suất ổn định trên tất cả các mô hình. Tốt để kiểm thử trước khi cam kết với một gói trả phí.
Bảng so sánh
| Nhà cung cấp | Chi phí | Tốc độ | Mô hình | Tầng miễn phí | Tốt nhất cho |
|---|---|---|---|---|---|
| Ollama | $0 | Chậm (5-15 giây) | 20+ cục bộ | Không giới hạn | Quyền riêng tư, sử dụng không giới hạn |
| Groq | $0 | Rất nhanh (1-2 giây) | 4 mô hình | 14.400/ngày | Tốc độ, sử dụng vừa phải |
| OpenRouter | $0-20 | Trung bình (3-5 giây) | 100+ | 1 đô la tín dụng | Linh hoạt, kiểm thử |
| Mistral AI | $0 | Trung bình (3-5 giây) | 3 mô hình | Giới hạn | GDPR, người dùng châu Âu |
| Together AI | 25 đô la tín dụng | Nhanh (2-3 giây) | 50+ | 25 đô la/3 tháng | Đánh giá, kiểm thử |
Hướng dẫn tích hợp tìm kiếm web
OpenClaw cần tìm kiếm web để duyệt internet, nghiên cứu các chủ đề và thu thập thông tin. Bạn có ba tùy chọn.
Tùy chọn 1: Tìm kiếm DuckDuckGo (Khuyến nghị cho chi phí bằng 0)
DuckDuckGo cung cấp tìm kiếm web miễn phí mà không cần khóa API.
Thiết lập:
- Không cần khóa API
- Không yêu cầu đăng ký
- Hoạt động ngay lập tức
Ưu điểm:
- Hoàn toàn miễn phí
- Không gặp rắc rối khi thiết lập
- Tập trung vào quyền riêng tư
- Không giới hạn tốc độ cho mục đích sử dụng cá nhân
Nhược điểm:
- Ít toàn diện hơn Google
- Không có tính năng tìm kiếm nâng cao
- Chất lượng kết quả thay đổi
Cấu hình:
# Trong tệp cấu hình OpenClaw của bạn
SEARCH_PROVIDER=duckduckgo
# Không cần khóa API
Tốt nhất cho: Thiết lập không tốn kém, người dùng quan tâm đến quyền riêng tư, sử dụng cá nhân
Tùy chọn 2: API Brave Search
Brave cung cấp một tầng miễn phí hào phóng với chất lượng tìm kiếm tốt hơn.
Thiết lập:
- Đăng ký tại brave.com/search/api
- Nhận khóa API miễn phí
- 2.000 yêu cầu/tháng miễn phí
Ưu điểm:
- Chất lượng tìm kiếm tốt hơn DuckDuckGo
- 2.000 yêu cầu miễn phí/tháng
- Chỉ mục tìm kiếm độc lập
- Tốt cho mức sử dụng vừa phải
Nhược điểm:
- Yêu cầu thiết lập khóa API
- Giới hạn tốc độ sau tầng miễn phí
- Các gói trả phí bắt đầu từ 3 đô la/tháng
Cấu hình:
# Trong tệp cấu hình OpenClaw của bạn
SEARCH_PROVIDER=brave
BRAVE_API_KEY=khóa_api_của_bạn
Tốt nhất cho: Chất lượng tìm kiếm tốt hơn, sử dụng vừa phải (dưới 2.000 lượt tìm kiếm/tháng)
Tùy chọn 3: SearXNG (Tự host)
SearXNG là một công cụ tìm kiếm siêu dữ liệu tự host, tổng hợp kết quả từ nhiều nguồn khác nhau.
Thiết lập:
- Triển khai SearXNG trên máy chủ của bạn
- Cấu hình OpenClaw để sử dụng phiên bản của bạn
- Không cần khóa API
Ưu điểm:
- Kiểm soát hoàn toàn
- Không giới hạn tốc độ
- Bảo mật tối đa
- Tổng hợp nhiều công cụ tìm kiếm
Nhược điểm:
- Yêu cầu thiết lập máy chủ
- Chi phí bảo trì
- Yêu cầu kiến thức kỹ thuật
Cấu hình:
# Trong tệp cấu hình OpenClaw của bạn
SEARCH_PROVIDER=searxng
SEARXNG_URL=https://phiên_bản_searxng_của_bạn.com
Tốt nhất cho: Người dùng kỹ thuật, bảo mật tối đa, tìm kiếm không giới hạn
Những sự kết hợp tốt nhất cho các trường hợp sử dụng khác nhau
Sau khi thử nghiệm mọi sự kết hợp, đây là các khuyến nghị của tôi.
Nhà vô địch về ngân sách: Ollama + DuckDuckGo
Tổng chi phí: 0 đô la/tháng
Thiết lập:
- Cài đặt Ollama cục bộ
- Sử dụng mô hình MiniMax M2.5
- Cấu hình tìm kiếm DuckDuckGo (không cần khóa API)
Hiệu suất:
- Thời gian phản hồi: 5-15 giây
- Chất lượng tìm kiếm: Tốt cho hầu hết các tác vụ
- Độ tin cậy: Tuyệt vời (không phụ thuộc API)
Tốt nhất cho:
- Sử dụng cá nhân
- Học hỏi và thử nghiệm
- Người dùng quan tâm đến quyền riêng tư
- Sử dụng không giới hạn mà không tốn chi phí
Hạn chế:
- Phản hồi chậm hơn
- Yêu cầu phần cứng khá
- Chất lượng thấp hơn cho các tác vụ phức tạp
Vua tốc độ: Groq + Brave Search
Tổng chi phí: 0-3 đô la/tháng
Thiết lập:
- Đăng ký Groq (miễn phí)
- Lấy khóa API Brave Search (tầng miễn phí)
- Sử dụng Llama 3.3 70B trên Groq
Hiệu suất:
- Thời gian phản hồi: 1-2 giây
- Chất lượng tìm kiếm: Tuyệt vời
- Độ tin cậy: Rất tốt
Tốt nhất cho:
- Phản hồi nhanh
- Sử dụng hàng ngày vừa phải (50-100 yêu cầu)
- Sử dụng chuyên nghiệp
- Các tác vụ nhạy cảm về thời gian
Hạn chế:
- Giới hạn tốc độ trên tầng miễn phí
- Yêu cầu kết nối internet
- Có thể cần gói trả phí cho việc sử dụng nặng
Chiến thắng về tính linh hoạt: OpenRouter + DuckDuckGo
Tổng chi phí: 5-20 đô la/tháng
Thiết lập:
