AgenticSeek: Chạy AI Manus cục bộ

Ashley Innocent

Ashley Innocent

24 tháng 5 2025

AgenticSeek: Chạy AI Manus cục bộ

Giới thiệu

Trong kỷ nguyên mà các trợ lý AI ngày càng mạnh mẽ nhưng thường yêu cầu kết nối đám mây và gây lo ngại về quyền riêng tư, AgenticSeek nổi lên như một giải pháp hấp dẫn cho người dùng muốn có khả năng của các công cụ AI tiên tiến như Manus AI trong khi vẫn duy trì toàn quyền kiểm soát dữ liệu của họ. Hướng dẫn toàn diện này sẽ hướng dẫn bạn mọi thứ cần biết về cách thiết lập, cấu hình và sử dụng AgenticSeek một cách hiệu quả.

AgenticSeek là một trợ lý AI hoạt động 100% cục bộ, kết hợp tương tác bằng giọng nói, duyệt web tự động, tạo mã và khả năng lập kế hoạch tác vụ. Không giống như các giải pháp thay thế dựa trên đám mây, nó chạy hoàn toàn trên phần cứng của bạn, đảm bảo các cuộc trò chuyện, tệp và tìm kiếm của bạn luôn riêng tư. Cho dù bạn là nhà phát triển đang tìm kiếm một trợ lý viết mã, một nhà nghiên cứu cần tự động hóa web hay chỉ đơn giản là người coi trọng quyền riêng tư, hướng dẫn này sẽ giúp bạn khai thác toàn bộ tiềm năng của AgenticSeek.

💡
Bạn muốn một công cụ Kiểm thử API tuyệt vời có thể tạo ra Tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, Tất cả trong Một cho Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
button

Điều gì khiến AgenticSeek đặc biệt

Quyền riêng tư hoàn toàn và Hoạt động cục bộ

Ưu điểm quan trọng nhất của AgenticSeek là cam kết về quyền riêng tư. Mọi thành phần—từ mô hình ngôn ngữ đến nhận dạng giọng nói và chuyển văn bản thành giọng nói—đều chạy cục bộ trên máy của bạn. Điều này có nghĩa là:

Khả năng AI đa phương thức

AgenticSeek không chỉ là một chatbot; nó là một hệ thống AI toàn diện có thể:

Định tuyến tác nhân thông minh

Một trong những tính năng nổi bật của AgenticSeek là khả năng tự động chọn tác nhân tốt nhất cho từng tác vụ. Khi bạn đưa ra yêu cầu, hệ thống sẽ phân tích truy vấn của bạn và định tuyến nó đến tác nhân chuyên biệt phù hợp nhất, cho dù đó là tác nhân duyệt web, tác nhân viết mã hay tác nhân lập kế hoạch tác vụ.

Lịch sử sao Github của Agenticseek

Kho lưu trữ Github của Agenticseek:

Điều kiện tiên quyết và Yêu cầu phần cứng

Trước khi đi sâu vào cài đặt, điều quan trọng là phải hiểu các yêu cầu phần cứng để chạy AgenticSeek hiệu quả.

Yêu cầu hệ thống tối thiểu

Yêu cầu phần cứng LLM

Hiệu suất của AgenticSeek phụ thuộc nhiều vào mô hình ngôn ngữ bạn chọn chạy cục bộ:

Kích thước mô hình Yêu cầu GPU Lưu ý về hiệu suất
7B 8GB VRAM Không khuyến nghị - hiệu suất kém và thường xuyên lỗi
14B 12GB VRAM (RTX 3060 hoặc tương đương) Có thể sử dụng cho các tác vụ đơn giản, có thể gặp khó khăn với các hoạt động phức tạp
32B 24GB VRAM (RTX 4090 hoặc tương đương) Hiệu suất tốt cho hầu hết các tác vụ
70B+ 48GB+ VRAM (Mac Studio M2 Ultra hoặc tương đương) Hiệu suất xuất sắc, khuyến nghị cho người dùng chuyên sâu

Các mô hình được khuyến nghị

AgenticSeek hoạt động tốt nhất với các mô hình tập trung vào suy luận như:

Quá trình cài đặt

Bước 1: Sao chép và Thiết lập ban đầu

Đầu tiên, sao chép kho lưu trữ AgenticSeek và thiết lập cấu hình cơ bản:

git clone https://github.com/Fosowl/agenticSeek.git
cd agenticSeek
mv .env.example .env

Bước 2: Tạo môi trường ảo

Điều quan trọng là sử dụng Python 3.10 cụ thể để tránh xung đột phụ thuộc:

python3 -m venv agentic_seek_env
source agentic_seek_env/bin/activate
# Trên Windows: agentic_seek_env\Scripts\activate

Bước 3: Cài đặt các phụ thuộc

Đối với Linux/macOS (Cài đặt tự động):

./install.sh

Đối với Windows:

./install.bat

Cài đặt thủ công (nếu tự động thất bại):

Linux:

sudo apt update
sudo apt install -y alsa-utils portaudio19-dev python3-pyaudio libgtk-3-dev libnotify-dev libgconf-2-4 libnss3 libxss1
sudo apt install -y chromium-chromedriver
pip3 install -r requirements.txt

macOS:

brew update
brew install --cask chromedriver
brew install portaudio
python3 -m pip install --upgrade pip
pip3 install --upgrade setuptools wheel
pip3 install -r requirements.txt

Windows:

pip install pyreadline3
pip install pyaudio
pip3 install -r requirements.txt

Lưu ý: Đối với Windows, bạn sẽ cần tải xuống ChromeDriver thủ công từ trang web chính thức của Chrome và thêm nó vào PATH của bạn.

Bước 4: Thiết lập Nhà cung cấp LLM cục bộ

Lựa chọn phổ biến nhất là Ollama vì dễ sử dụng:

# Cài đặt và khởi động Ollama
ollama serve

# Tải một mô hình được khuyến nghị
ollama pull deepseek-r1:14b  # Điều chỉnh kích thước dựa trên phần cứng của bạn

Thiết lập cấu hình

Hiểu về config.ini

Trọng tâm của cấu hình AgenticSeek nằm trong tệp config.ini. Dưới đây là phân tích chi tiết từng cài đặt:

[MAIN]
is_local = True
provider_name = ollama
provider_model = deepseek-r1:14b
provider_server_address = 127.0.0.1:11434
agent_name = Jarvis
recover_last_session = True
save_session = True
speak = True
listen = False
work_dir = /Users/yourname/Documents/ai_workspace
jarvis_personality = False
languages = en zh

[BROWSER]
headless_browser = True
stealth_mode = True

Giải thích các tùy chọn cấu hình chính

Cài đặt cốt lõi:

Cá tính và Tương tác:

Cài đặt trình duyệt:

Thiết lập không gian làm việc của bạn

Chọn một thư mục chuyên dụng để AgenticSeek làm việc. Đây phải là một vị trí mà bạn cảm thấy thoải mái khi để AI tạo, sửa đổi và tổ chức tệp:

mkdir ~/Documents/agentic_workspace

Cập nhật config.ini của bạn với đường dẫn này:

work_dir = /Users/yourname/Documents/agentic_workspace

Bắt đầu: Lần chạy đầu tiên

Khởi động các dịch vụ

Trước khi chạy AgenticSeek, bạn cần khởi động các dịch vụ hỗ trợ:

# Kích hoạt môi trường ảo của bạn
source agentic_seek_env/bin/activate

# Khởi động các dịch vụ (SearxNG cho tìm kiếm web, Redis, giao diện người dùng)
sudo ./start_services.sh  # Linux/macOS
# hoặc
start_services.cmd  # Windows

Tùy chọn 1: Giao diện dòng lệnh (CLI)

Giao diện CLI hoàn hảo cho người dùng thích tương tác dựa trên terminal:

python3 cli.py

Cài đặt CLI được khuyến nghị:

Tùy chọn 2: Giao diện web

Để có trải nghiệm trực quan hơn, hãy sử dụng giao diện web:

# Khởi động backend
python3 api.py

Sau đó mở trình duyệt của bạn và điều hướng đến http://localhost:3000/

Cài đặt giao diện web được khuyến nghị:

Hiểu về khả năng của AgenticSeek

Duyệt web và Nghiên cứu

AgenticSeek có thể tự động duyệt internet để thu thập thông tin. Dưới đây là các ví dụ về các truy vấn hiệu quả:

Truy vấn tốt: "Tìm kiếm trên web 10 ngôn ngữ lập trình hàng đầu năm 2024 và lưu bản tóm tắt vào programming_trends.txt"

Tránh: "Ngôn ngữ lập trình phổ biến là gì?" (quá mơ hồ, không chỉ rõ cần tìm kiếm web)

AI có thể:

Tạo và Thực thi mã

AgenticSeek xuất sắc trong việc viết và chạy mã bằng nhiều ngôn ngữ:

Ví dụ yêu cầu:

AI sẽ:

Lập kế hoạch và Thực hiện tác vụ

Đối với các tác vụ phức tạp, AgenticSeek có thể chia chúng thành các bước có thể quản lý:

Ví dụ: "Lập kế hoạch cho chuyến đi cuối tuần đến Paris, bao gồm chuyến bay, khách sạn và các hoạt động. Nghiên cứu các tùy chọn và lưu các khuyến nghị vào paris_trip.txt"

AI sẽ:

  1. Nghiên cứu các tùy chọn chuyến bay
  2. Tìm kiếm các khách sạn được khuyến nghị
  3. Khám phá các hoạt động và nhà hàng phổ biến
  4. Tổng hợp mọi thứ vào một tài liệu có tổ chức

Quản lý tệp

AgenticSeek có thể làm việc với các tệp cục bộ của bạn:

Các tính năng nâng cao

Tương tác bằng giọng nói

Để bật các tính năng giọng nói, hãy cấu hình các cài đặt này:

speak = True  # Bật chuyển văn bản thành giọng nói
listen = True  # Bật chuyển lời nói thành văn bản (chỉ CLI)
agent_name = Friday  # Từ đánh thức để kích hoạt giọng nói

Sử dụng lệnh thoại:

  1. Nói tên của tác nhân (ví dụ: "Friday")
  2. Chờ bản chép lời xuất hiện
  3. Nói yêu cầu của bạn rõ ràng
  4. Kết thúc bằng một cụm từ xác nhận như "do it," "go ahead," hoặc "execute"

Các cụm từ xác nhận được hỗ trợ:

Hỗ trợ đa ngôn ngữ

AgenticSeek hỗ trợ nhiều ngôn ngữ cho tính năng chuyển văn bản thành giọng nói:

languages = en zh fr es  # Tiếng Anh, Tiếng Trung, Tiếng Pháp, Tiếng Tây Ban Nha

Ngôn ngữ đầu tiên trong danh sách sẽ trở thành ngôn ngữ mặc định cho tính năng chuyển văn bản thành giọng nói.

Quản lý phiên

Kiểm soát cách AgenticSeek xử lý lịch sử cuộc trò chuyện:

recover_last_session = True  # Tiếp tục cuộc trò chuyện trước đó
save_session = True  # Ghi nhớ cuộc trò chuyện hiện tại

Điều này đặc biệt hữu ích cho các dự án kéo dài hoặc khi bạn cần tiếp tục công việc qua nhiều phiên.

Các mẫu sử dụng hiệu quả

Thực hành tốt nhất cho các truy vấn

Cụ thể về các hành động:

Chỉ định các thao tác tệp:

Các chỉ báo tìm kiếm web:

Ví dụ về quy trình làm việc tối ưu

Dự án nghiên cứu:

  1. "Tìm kiếm trên web các phát triển AI gần đây vào năm 2024"
  2. "Tóm tắt các phát hiện và lưu vào ai_developments_2024.txt"
  3. "Tạo một script Python để trực quan hóa các xu hướng được đề cập trong bản tóm tắt"

Tác vụ phát triển:

  1. "Tạo cấu trúc dự án Python mới cho một web scraper"
  2. "Viết module scraping chính bằng BeautifulSoup"
  3. "Thêm xử lý lỗi và ghi nhật ký vào scraper"
  4. "Viết các bài kiểm tra đơn vị cho các hàm scraping"

Phân tích dữ liệu:

  1. "Đọc tệp sales_data.csv trong không gian làm việc của tôi"
  2. "Phân tích dữ liệu để tìm xu hướng và mẫu"
  3. "Tạo biểu đồ trực quan hiển thị xu hướng bán hàng hàng tháng"
  4. "Tạo một báo cáo với các hiểu biết sâu sắc và lưu dưới dạng sales_analysis.txt"

Khắc phục sự cố thường gặp

Sự cố ChromeDriver

Lỗi: Phiên bản không khớp giữa Chrome và ChromeDriver

Giải pháp:

  1. Kiểm tra phiên bản Chrome của bạn: google-chrome --version
  2. Tải xuống ChromeDriver phù hợp từ https://developer.chrome.com/docs/chromedriver/downloads
  3. Thay thế ChromeDriver hiện có bằng phiên bản mới

Sự cố kết nối

Lỗi: "No connection adapters were found"

Giải pháp: Đảm bảo địa chỉ nhà cung cấp của bạn bao gồm giao thức:

provider_server_address = http://127.0.0.1:11434

Lỗi URL cơ sở SearxNG

Giải pháp: Đảm bảo bạn đã đổi tên .env.example thành .env, hoặc xuất biến môi trường:

export SEARXNG_BASE_URL="http://127.0.0.1:8080"

Sự cố hiệu suất

Hiệu suất AI kém:

Duyệt web chậm:

Các tùy chọn cấu hình nâng cao

Sử dụng các nhà cung cấp LLM khác nhau

Thiết lập Ollama:

provider_name = ollama
provider_model = deepseek-r1:32b
provider_server_address = 127.0.0.1:11434

Thiết lập LM Studio:

provider_name = lm-studio
provider_model = your-model-name
provider_server_address = http://127.0.0.1:1234

Thiết lập máy chủ từ xa:
Nếu bạn có một máy chủ mạnh mẽ đang chạy LLM:

provider_name = server
provider_model = deepseek-r1:70b
provider_server_address = your-server-ip:3333

Các tùy chọn nhà cung cấp API

Đối với người dùng không có đủ phần cứng, các nhà cung cấp API có sẵn:

is_local = False
provider_name = deepseek
provider_model = deepseek-chat

Xuất khóa API của bạn:

export DEEPSEEK_API_KEY="your-api-key-here"

Mẹo sử dụng tối ưu

Tối ưu hóa phần cứng

  1. Quản lý bộ nhớ GPU: Đóng các ứng dụng không cần thiết để giải phóng VRAM
  2. Chọn mô hình: Bắt đầu với các mô hình nhỏ hơn và nâng cấp khi cần thiết
  3. Sử dụng RAM: Giám sát bộ nhớ hệ thống, đặc biệt với các mô hình lớn hơn

Tối ưu hóa truy vấn

  1. Rõ ràng: Luôn chỉ định nếu bạn muốn tìm kiếm web, thao tác tệp hoặc tạo mã
  2. Chia nhỏ các tác vụ phức tạp: Đối với các quy trình nhiều bước, cung cấp hướng dẫn từng bước rõ ràng
  3. Sử dụng tên tệp cụ thể: Luôn chỉ định tên tệp và vị trí chính xác

Hiệu quả quy trình làm việc

  1. Tổ chức không gian làm việc của bạn: Giữ work_dir của bạn được tổ chức với cấu trúc thư mục rõ ràng
  2. Sử dụng quản lý phiên: Bật lưu phiên cho các dự án kéo dài
  3. Kiểm tra lệnh thoại: Thực hành lệnh thoại trong môi trường yên tĩnh để nhận dạng tốt hơn

Kết luận

AgenticSeek đại diện cho một bước tiến đáng kể trong hỗ trợ AI chú trọng đến quyền riêng tư. Bằng cách làm theo hướng dẫn toàn diện này, giờ đây bạn sẽ có một trợ lý AI cục bộ đầy đủ chức năng có khả năng duyệt web, tạo mã, lập kế hoạch tác vụ và tương tác bằng giọng nói—tất cả trong khi giữ dữ liệu của bạn hoàn toàn riêng tư.

Hãy nhớ rằng AgenticSeek là một dự án đang phát triển. Khi sử dụng nó, bạn sẽ khám phá ra các khả năng mới và các mẫu sử dụng tối ưu. Chìa khóa thành công là cụ thể trong các yêu cầu của bạn, hiểu điểm mạnh của hệ thống và tận dụng kiến trúc đa tác nhân của nó.

Cho dù bạn đang sử dụng AgenticSeek cho nghiên cứu, phát triển hay các tác vụ năng suất chung, sự kết hợp giữa quyền riêng tư, khả năng và hoạt động cục bộ của nó làm cho nó trở thành một giải pháp thay thế mạnh mẽ cho các trợ lý AI dựa trên đám mây. Bắt đầu với các tác vụ đơn giản để làm quen với hệ thống, sau đó dần dần khám phá các quy trình làm việc phức tạp hơn khi bạn cảm thấy thoải mái với các khả năng của nó.

Tương lai của hỗ trợ AI là cục bộ, riêng tư và nằm dưới sự kiểm soát hoàn toàn của bạn—và AgenticSeek đang dẫn đầu trong việc biến tương lai đó trở nên khả thi cho mọi người.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API