Tò mò về Agent Zero, khung AI mã nguồn mở đang làm mưa làm gió? Tôi đã thử nghiệm "con quái vật" này trên máy tính Windows của mình, và phải nói thật—đó là một trải nghiệm cực kỳ thú vị! Chạy trong một container Docker an toàn, Agent Zero cho phép bạn tạo ra các tác nhân AI để viết mã, duyệt web, và thậm chí lập kế hoạch chuyến đi, tất cả chỉ với một giao diện Web UI mượt mà. Trong bài đánh giá này, tôi sẽ chia sẻ kinh nghiệm của mình khi thiết lập, tùy chỉnh nó với mô hình Qwen3 của Ollama, và thử nghiệm nó với các câu lệnh như kiểm tra giá S&P 500 và xây dựng trò chơi Flappy Bird. Nó có tuyệt vời như nghe có vẻ không? Hãy cùng tìm hiểu nhé!
Bạn muốn một nền tảng Tích hợp, Tất cả trong Một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn, và thay thế Postman với mức giá phải chăng hơn nhiều!
Agent Zero là gì? Trợ thủ AI của bạn
Agent Zero giống như có một trợ lý siêu thông minh sống trong một container Docker. Đây là một khung dựa trên Python để tạo ra các tác nhân AI tự động có thể viết mã, tìm kiếm web và xử lý nhiều tác vụ cùng lúc. Đây là lý do tại sao nó thú vị:
- Siêu linh hoạt: Tùy chỉnh tác nhân bằng các câu lệnh (prompt), công cụ hoặc mô hình như OpenAI hoặc Ollama.
- Thiết lập an toàn: Docker giữ mọi thứ được cô lập, vì vậy không cần lo lắng về các lệnh nguy hiểm.
- Bậc thầy đa nhiệm: Chạy các tác vụ khác nhau trong các cuộc trò chuyện riêng biệt—như viết mã một trò chơi và lập kế hoạch một chuyến đi.
- Miễn phí và mã nguồn mở: Với hơn 3.4K sao trên GitHub, nó được cộng đồng phát triển và hoàn toàn miễn phí.
- Web UI kỳ diệu: Giao diện đầy màu sắc giúp tương tác với các tác nhân trở nên dễ dàng.
Tôi đã cài đặt nó chỉ trong 20 phút, và những khả năng của nó đã làm tôi kinh ngạc. Sẵn sàng thử chưa? Hãy cùng thiết lập nào!
Cách cài đặt Agent Zero: Hướng dẫn từng bước
Cài đặt Agent Zero rất dễ dàng với Docker. Tôi đã sử dụng Windows, nhưng các bước này cũng hoạt động cho macOS và Linux. Đây là cách để bắt đầu chỉ trong khoảng 15 phút.
1. Các điều kiện tiên quyết
Bạn sẽ cần:
- Đã cài đặt Docker Desktop (chúng ta sẽ đề cập đến điều này ở phần tiếp theo).
- Kỹ năng cơ bản về terminal hoặc command prompt.
- Tùy chọn: Khóa API cho các nhà cung cấp AI (ví dụ: OpenAI) hoặc Ollama cho các mô hình cục bộ.
2. Cài đặt Docker Desktop
Docker là nơi Agent Zero hoạt động để đảm bảo tính nhất quán và bảo mật.

- Truy cập trang tải xuống của Docker.
- Tải xuống trình cài đặt cho hệ điều hành của bạn.
- Chạy nó với các cài đặt mặc định. Trên macOS, kéo Docker vào Applications.
- Người dùng Linux: Chọn Docker Desktop hoặc Docker CE. Đối với Docker CE, thêm người dùng của bạn vào nhóm Docker:
sudo usermod -aG docker $USER
Đăng xuất và đăng nhập lại.
- Khởi chạy Docker Desktop và đảm bảo nó đang chạy.
3. Tải và chạy ảnh Docker của Agent Zero
Đã đến lúc tải Agent Zero!
- Mở terminal của bạn (Command Prompt trên Windows).
- Tải ảnh mới nhất:
docker pull frdel/agent-zero-run
Hoặc, trong Docker Desktop:
- Vào tab Images, tìm kiếm "frdel/agent-zero-run," và nhấp vào Pull.

- Tạo một thư mục cục bộ cho dữ liệu của Agent Zero (prompts, memory, v.v.):
- Windows:
C:\agent-zero-data
- macOS/Linux:
~/agent-zero-data
- Chạy container:
docker run -p 50080:80 -v /path/to/agent-zero-data:/a0 frdel/agent-zero-run
Thay thế /path/to/agent-zero-data
bằng đường dẫn của bạn (ví dụ: C:\agent-zero-data
).
Hoặc, trong Docker Desktop:
- Nhấp vào Run trên ảnh đã tải, đặt cổng (50080), và ánh xạ thư mục dữ liệu của bạn.
- Docker bắt đầu, và bạn sẽ nhận được một liên kết như
http://localhost:32768
hoặchttp://localhost:50080
.

4. Truy cập Web UI của Agent Zero
- Mở trình duyệt của bạn và điều hướng đến liên kết được cung cấp (ví dụ:
http://localhost:50080
). - Web UI sẽ hiện lên, sẵn sàng cho bạn khám phá.

5. Cấu hình Agent Zero
Nhấp vào biểu tượng bánh răng Cài đặt để tùy chỉnh:

- Hành vi tác nhân: Chọn các thư mục con prompt cho các tác vụ (ví dụ: viết mã, duyệt web).
- Bộ nhớ: Đặt thư mục để lưu trữ kiến thức của tác nhân.
- Nhà cung cấp LLM: Chọn OpenAI, Ollama hoặc các nhà cung cấp khác. Thêm khóa API nếu cần.
- Xác thực: Đặt mật khẩu root cho UI và Docker để bảo mật.
- Chuyển giọng nói thành văn bản: Bật nhập liệu bằng giọng nói để trò chuyện rảnh tay.
Tôi đã tùy chỉnh nó chỉ trong 5 phút—thật dễ dàng!
6. Bắt đầu sử dụng Agent Zero
- Trò chuyện với các tác nhân trong giao diện trò chuyện của Web UI.
- Chạy nhiều tác vụ trong các cuộc trò chuyện riêng biệt (ví dụ: viết mã và thậm chí lập kế hoạch chuyến đi).

- Kiểm tra nhật ký trong thư mục
logs/
(định dạng HTML) để gỡ lỗi.
7. Cập nhật Agent Zero
Để có các tính năng mới nhất:
- Dừng và xóa container:
docker stop agent-zero
docker rm agent-zero
- Xóa ảnh cũ:
docker rmi frdel/agent-zero-run
- Tải và chạy lại:
docker pull frdel/agent-zero-run
docker run -p 50080:80 -v /path/to/agent-zero-data:/a0 frdel/agent-zero-run

8. Tùy chọn: Chạy LLM cục bộ với Ollama
Muốn sử dụng các mô hình cục bộ? Ollama sẽ giúp bạn.
- Tải Ollama từ ollama.ai cho hệ điều hành của bạn.
- Xác minh cài đặt:
ollama
- Tải một mô hình (ví dụ: Qwen3 hoặc Deepseek):
ollama run qwen3

- Liệt kê các mô hình:
ollama list

- Trong Cài đặt của Agent Zero, chọn Ollama làm nhà cung cấp và chọn Qwen3.
Tôi đã sử dụng Qwen3, và nó hoạt động khá tốt!
Thiết lập Ollama với Agent Zero: Kinh nghiệm của tôi
Sau khi cài đặt Agent Zero, tôi đã tìm hiểu về Ollama để chạy các mô hình cục bộ. Tôi đã tải Ollama từ trang web của họ, cài đặt trên Windows và kiểm tra nó bằng lệnh ollama
trong terminal. Sau đó, tôi đã tải Qwen3 bằng lệnh ollama run qwen3
—mô hình mới nhất của họ thật mạnh mẽ! Tôi đã xác nhận nó đã sẵn sàng bằng lệnh ollama list
. Trong Cài đặt của Agent Zero, tôi đã chọn Ollama, chọn Qwen3 và tùy chỉnh một vài tùy chọn:
- Cài đặt tác nhân: Chọn mô hình trình duyệt, chuyển giọng nói thành văn bản và mô hình trò chuyện của tôi.
- Dịch vụ bên ngoài: Thêm khóa API của Google để thử nghiệm miễn phí (không tốn phí, tuyệt vời!).
- Cấu hình: Điều chỉnh thư mục bộ nhớ và prompt cho các tác vụ của tôi.

Quá trình thiết lập diễn ra suôn sẻ, và tôi đã sẵn sàng thử nghiệm khả năng của Agent Zero!
Kiểm thử Agent Zero: Sức mạnh của Prompt
Tôi đã đưa ra một loạt các prompt cho Agent Zero để xem nó có thể làm gì, và nó đã không làm tôi thất vọng. Phần tốt nhất? Tôi có thể chạy hai tác vụ hoàn toàn khác nhau trong các cuộc trò chuyện riêng biệt—như viết mã một trò chơi và kiểm tra giá cổ phiếu. Đây là những gì tôi đã thử:
Prompt 1: Lập kế hoạch tài chính và du lịch
- "Giá S&P 500 hôm nay là bao nhiêu?" Nó đã kiểm tra web và cho tôi một mức giá (kiểm tra thẻ tài chính ở trên để xem giá SPY hôm nay là 593.05 USD). Chính xác!
- "Lập kế hoạch chuyến đi đến Tokyo." Nó đã soạn thảo một lịch trình 7 ngày với Shibuya, Akihabara và các quán ramen—rất chi tiết!
Dữ liệu thực tế (tính đến ngày 6 tháng 6):

Phản hồi từ Agent Zero (dữ liệu tính đến ngày 5 tháng 6):

Prompt 2: Viết mã trò chơi và công cụ HTML
- "Tạo một trò chơi Flappy Bird đơn giản bằng HTML." Agent Zero đã tạo ra một trò chơi hoạt động với canvas và JavaScript cho vật lý của chim. Tôi đã chơi nó trong trình duyệt—gây nghiện!
- "Tạo một trò chơi Whack-a-Mole bằng HTML." Nó đã cung cấp một trò chơi dựa trên lưới với các nốt ruồi có thể nhấp và bộ đếm điểm. Thật vui!
- "Tạo một công cụ tạo bảng màu bằng HTML." Tôi đã nhận được một công cụ đẹp mắt với các ô màu ngẫu nhiên và mã hex—hoàn hảo cho các dự án thiết kế.

Prompt 3: Duyệt web
- "Duyệt web và chụp ảnh màn hình Google và giá S&P 500." Nó đã điều hướng đến Google, chụp ảnh màn hình và lấy giá cổ phiếu từ một trang web tài chính. Các hình ảnh được lưu vào thư mục dữ liệu của tôi—ấn tượng!

Chạy các tác vụ này song song giống như có hai AI làm việc cho tôi. Mô hình Qwen3 của Agent Zero rất nhanh, và Web UI khiến việc sử dụng nó trở nên thú vị.
Đánh giá Agent Zero: Ưu điểm và Nhược điểm
Sau một tuần sử dụng Agent Zero, đây là đánh giá của tôi về những điểm mạnh và điểm yếu của nó.
Ưu điểm: Tại sao tôi thích nó
- Thiết lập đơn giản: Docker Desktop và Web UI làm cho việc này trở nên dễ dàng. Tôi đã có thể viết mã trò chơi trong 20 phút!
- Khả năng đa nhiệm kỳ diệu: Chạy mã hóa Flappy Bird và lập kế hoạch chuyến đi Tokyo cùng lúc? Vâng, thật tuyệt vời!
- Sức mạnh cục bộ với Ollama: Qwen3 chạy mượt mà trên máy của tôi, không tốn chi phí đám mây.
- Thiên đường tùy chỉnh: Từ khóa API của Google đến chuyển giọng nói thành văn bản, tôi đã tùy chỉnh nó theo nhu cầu của mình.
- Không khí cộng đồng: 3.4K sao trên GitHub và Discord hoạt động tích cực giúp nó luôn mới mẻ.
Nhược điểm: Một vài trở ngại
- Cần tinh chỉnh Prompt: Để có kết quả hoàn hảo (ví dụ: định dạng chính xác giá S&P 500) cần phải tinh chỉnh prompt.
- Yêu cầu phần cứng: Các mô hình cục bộ như Qwen3 cần 8GB+ RAM. Máy tính xách tay của tôi hơi ì ạch một chút.
- Tài liệu có thể cải thiện: Một số cài đặt (ví dụ: mô hình nhúng) cần hướng dẫn rõ ràng hơn. Thư mục
docs/
trên GitHub có giúp ích. - Lỗi nhỏ: Tính năng chụp ảnh màn hình bị lỗi một lần, nhưng nhật ký đã giúp tôi gỡ lỗi.
Kết luận cuối cùng: Agent Zero có đáng giá không?
Agent Zero là một khung AI miễn phí xuất sắc, vượt trội so với kỳ vọng. Thiết lập Docker cực kỳ đơn giản, Web UI trực quan, và việc chạy Qwen3 qua Ollama giúp nó hoạt động cục bộ và nhanh chóng. Khả năng đa nhiệm giữa các cuộc trò chuyện (viết mã trò chơi trong khi lập kế hoạch chuyến đi) mang lại cảm giác tương lai, và các tùy chọn tùy chỉnh là vô tận. Chắc chắn, bạn sẽ cần thành thạo các prompt và có phần cứng đủ mạnh cho các mô hình cục bộ, nhưng cộng đồng luôn sẵn sàng hỗ trợ bạn. So với các công cụ AI đắt tiền, Agent Zero mang lại giá trị cho cả nhà phát triển và những người có sở thích.
Hãy thử Agent Zero—nó miễn phí, mạnh mẽ và mang lại niềm vui bất tận. Chia sẻ các dự án của bạn trên X hoặc GitHub—tôi rất hào hứng muốn xem bạn tạo ra những gì!
Bạn muốn một nền tảng Tích hợp, Tất cả trong Một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn, và thay thế Postman với mức giá phải chăng hơn nhiều!