Giới thiệu
Trong kỷ nguyên mà các trợ lý AI ngày càng mạnh mẽ nhưng thường yêu cầu kết nối đám mây và gây lo ngại về quyền riêng tư, AgenticSeek nổi lên như một giải pháp hấp dẫn cho người dùng muốn có khả năng của các công cụ AI tiên tiến như Manus AI trong khi vẫn duy trì toàn quyền kiểm soát dữ liệu của họ. Hướng dẫn toàn diện này sẽ hướng dẫn bạn mọi thứ cần biết về cách thiết lập, cấu hình và sử dụng AgenticSeek một cách hiệu quả.
AgenticSeek là một trợ lý AI hoạt động 100% cục bộ, kết hợp tương tác bằng giọng nói, duyệt web tự động, tạo mã và khả năng lập kế hoạch tác vụ. Không giống như các giải pháp thay thế dựa trên đám mây, nó chạy hoàn toàn trên phần cứng của bạn, đảm bảo các cuộc trò chuyện, tệp và tìm kiếm của bạn luôn riêng tư. Cho dù bạn là nhà phát triển đang tìm kiếm một trợ lý viết mã, một nhà nghiên cứu cần tự động hóa web hay chỉ đơn giản là người coi trọng quyền riêng tư, hướng dẫn này sẽ giúp bạn khai thác toàn bộ tiềm năng của AgenticSeek.
Bạn muốn một nền tảng tích hợp, Tất cả trong Một cho Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
Điều gì khiến AgenticSeek đặc biệt

Quyền riêng tư hoàn toàn và Hoạt động cục bộ
Ưu điểm quan trọng nhất của AgenticSeek là cam kết về quyền riêng tư. Mọi thành phần—từ mô hình ngôn ngữ đến nhận dạng giọng nói và chuyển văn bản thành giọng nói—đều chạy cục bộ trên máy của bạn. Điều này có nghĩa là:
- Không có dữ liệu nào rời khỏi thiết bị của bạn
- Không phụ thuộc vào đám mây hoặc yêu cầu internet cho chức năng cốt lõi
- Hoàn toàn kiểm soát các tương tác AI của bạn
- Không có phí đăng ký hoặc chi phí API cho hoạt động cục bộ
Khả năng AI đa phương thức
AgenticSeek không chỉ là một chatbot; nó là một hệ thống AI toàn diện có thể:
- Duyệt web tự động: Tìm kiếm, đọc bài viết, trích xuất thông tin và thậm chí điền biểu mẫu web
- Viết và thực thi mã: Tạo chương trình bằng Python, Go, Java, C và các ngôn ngữ khác
- Lập kế hoạch và thực hiện các tác vụ phức tạp: Chia các dự án lớn thành các bước nhỏ hơn có thể quản lý bằng cách sử dụng nhiều tác nhân chuyên biệt
- Tương tác bằng giọng nói: Khả năng chuyển lời nói thành văn bản và chuyển văn bản thành lời nói tự nhiên
- Quản lý tệp: Làm việc với các tệp và thư mục cục bộ của bạn
Định tuyến tác nhân thông minh
Một trong những tính năng nổi bật của AgenticSeek là khả năng tự động chọn tác nhân tốt nhất cho từng tác vụ. Khi bạn đưa ra yêu cầu, hệ thống sẽ phân tích truy vấn của bạn và định tuyến nó đến tác nhân chuyên biệt phù hợp nhất, cho dù đó là tác nhân duyệt web, tác nhân viết mã hay tác nhân lập kế hoạch tác vụ.

Kho lưu trữ Github của Agenticseek:

Điều kiện tiên quyết và Yêu cầu phần cứng
Trước khi đi sâu vào cài đặt, điều quan trọng là phải hiểu các yêu cầu phần cứng để chạy AgenticSeek hiệu quả.
Yêu cầu hệ thống tối thiểu
- Hệ điều hành: Linux, macOS hoặc Windows
- Python: Phiên bản 3.10 (được khuyến nghị đặc biệt)
- Trình duyệt Chrome: Phiên bản mới nhất
- Docker: Để chạy các dịch vụ hỗ trợ
- Bộ nhớ: Khuyến nghị ít nhất 16GB RAM
Yêu cầu phần cứng LLM
Hiệu suất của AgenticSeek phụ thuộc nhiều vào mô hình ngôn ngữ bạn chọn chạy cục bộ:
Kích thước mô hình | Yêu cầu GPU | Lưu ý về hiệu suất |
---|---|---|
7B | 8GB VRAM | Không khuyến nghị - hiệu suất kém và thường xuyên lỗi |
14B | 12GB VRAM (RTX 3060 hoặc tương đương) | Có thể sử dụng cho các tác vụ đơn giản, có thể gặp khó khăn với các hoạt động phức tạp |
32B | 24GB VRAM (RTX 4090 hoặc tương đương) | Hiệu suất tốt cho hầu hết các tác vụ |
70B+ | 48GB+ VRAM (Mac Studio M2 Ultra hoặc tương đương) | Hiệu suất xuất sắc, khuyến nghị cho người dùng chuyên sâu |
Các mô hình được khuyến nghị
AgenticSeek hoạt động tốt nhất với các mô hình tập trung vào suy luận như:
- Deepseek R1: Tuyệt vời cho suy luận và sử dụng công cụ
- Qwen: Hiệu suất mạnh mẽ trên nhiều tác vụ
- Các mô hình Llama: Hiệu suất tổng quát tốt
Quá trình cài đặt
Bước 1: Sao chép và Thiết lập ban đầu
Đầu tiên, sao chép kho lưu trữ AgenticSeek và thiết lập cấu hình cơ bản:
git clone https://github.com/Fosowl/agenticSeek.git
cd agenticSeek
mv .env.example .env
Bước 2: Tạo môi trường ảo
Điều quan trọng là sử dụng Python 3.10 cụ thể để tránh xung đột phụ thuộc:
python3 -m venv agentic_seek_env
source agentic_seek_env/bin/activate
# Trên Windows: agentic_seek_env\Scripts\activate
Bước 3: Cài đặt các phụ thuộc
Đối với Linux/macOS (Cài đặt tự động):
./install.sh
Đối với Windows:
./install.bat
Cài đặt thủ công (nếu tự động thất bại):
Linux:
sudo apt update
sudo apt install -y alsa-utils portaudio19-dev python3-pyaudio libgtk-3-dev libnotify-dev libgconf-2-4 libnss3 libxss1
sudo apt install -y chromium-chromedriver
pip3 install -r requirements.txt
macOS:
brew update
brew install --cask chromedriver
brew install portaudio
python3 -m pip install --upgrade pip
pip3 install --upgrade setuptools wheel
pip3 install -r requirements.txt
Windows:
pip install pyreadline3
pip install pyaudio
pip3 install -r requirements.txt
Lưu ý: Đối với Windows, bạn sẽ cần tải xuống ChromeDriver thủ công từ trang web chính thức của Chrome và thêm nó vào PATH của bạn.
Bước 4: Thiết lập Nhà cung cấp LLM cục bộ
Lựa chọn phổ biến nhất là Ollama vì dễ sử dụng:
# Cài đặt và khởi động Ollama
ollama serve
# Tải một mô hình được khuyến nghị
ollama pull deepseek-r1:14b # Điều chỉnh kích thước dựa trên phần cứng của bạn
Thiết lập cấu hình
Hiểu về config.ini
Trọng tâm của cấu hình AgenticSeek nằm trong tệp config.ini
. Dưới đây là phân tích chi tiết từng cài đặt:
[MAIN]
is_local = True
provider_name = ollama
provider_model = deepseek-r1:14b
provider_server_address = 127.0.0.1:11434
agent_name = Jarvis
recover_last_session = True
save_session = True
speak = True
listen = False
work_dir = /Users/yourname/Documents/ai_workspace
jarvis_personality = False
languages = en zh
[BROWSER]
headless_browser = True
stealth_mode = True
Giải thích các tùy chọn cấu hình chính
Cài đặt cốt lõi:
is_local
: Đặt làTrue
cho hoạt động cục bộ,False
cho các nhà cung cấp APIprovider_name
: Chọn từollama
,lm-studio
,openai
, v.v.provider_model
: Mô hình cụ thể để sử dụng (ví dụ:deepseek-r1:14b
)work_dir
: Thư mục nơi AgenticSeek có thể đọc/ghi tệp
Cá tính và Tương tác:
agent_name
: Tên cho trợ lý AI của bạn (được sử dụng làm từ đánh thức cho giọng nói)speak
: Bật đầu ra chuyển văn bản thành giọng nóilisten
: Bật đầu vào chuyển lời nói thành văn bản (chỉ CLI)jarvis_personality
: Sử dụng tính cách đàm thoại hơn, giống Jarvis
Cài đặt trình duyệt:
headless_browser
: Chạy trình duyệt không hiển thị cửa sổ (khuyến nghị cho giao diện web)stealth_mode
: Sử dụng Selenium không bị phát hiện để tránh bị phát hiện là bot
Thiết lập không gian làm việc của bạn
Chọn một thư mục chuyên dụng để AgenticSeek làm việc. Đây phải là một vị trí mà bạn cảm thấy thoải mái khi để AI tạo, sửa đổi và tổ chức tệp:
mkdir ~/Documents/agentic_workspace
Cập nhật config.ini
của bạn với đường dẫn này:
work_dir = /Users/yourname/Documents/agentic_workspace
Bắt đầu: Lần chạy đầu tiên
Khởi động các dịch vụ
Trước khi chạy AgenticSeek, bạn cần khởi động các dịch vụ hỗ trợ:
# Kích hoạt môi trường ảo của bạn
source agentic_seek_env/bin/activate
# Khởi động các dịch vụ (SearxNG cho tìm kiếm web, Redis, giao diện người dùng)
sudo ./start_services.sh # Linux/macOS
# hoặc
start_services.cmd # Windows
Tùy chọn 1: Giao diện dòng lệnh (CLI)
Giao diện CLI hoàn hảo cho người dùng thích tương tác dựa trên terminal:
python3 cli.py
Cài đặt CLI được khuyến nghị:
- Đặt
headless_browser = False
trong config.ini để xem các hành động của trình duyệt - Đặt
speak = True
để có phản hồi bằng giọng nói - Đặt
listen = True
nếu bạn muốn nhập bằng giọng nói
Tùy chọn 2: Giao diện web
Để có trải nghiệm trực quan hơn, hãy sử dụng giao diện web:
# Khởi động backend
python3 api.py
Sau đó mở trình duyệt của bạn và điều hướng đến http://localhost:3000/
Cài đặt giao diện web được khuyến nghị:
- Đặt
headless_browser = True
để có hiệu suất tốt hơn - Giữ
speak = False
trừ khi bạn muốn âm thanh trong trình duyệt của mình
Hiểu về khả năng của AgenticSeek
Duyệt web và Nghiên cứu
AgenticSeek có thể tự động duyệt internet để thu thập thông tin. Dưới đây là các ví dụ về các truy vấn hiệu quả:
Truy vấn tốt: "Tìm kiếm trên web 10 ngôn ngữ lập trình hàng đầu năm 2024 và lưu bản tóm tắt vào programming_trends.txt"
Tránh: "Ngôn ngữ lập trình phổ biến là gì?" (quá mơ hồ, không chỉ rõ cần tìm kiếm web)
AI có thể:
- Tìm kiếm bằng SearxNG (công cụ tìm kiếm tập trung vào quyền riêng tư)
- Điều hướng các trang web và trích xuất thông tin
- Điền biểu mẫu web (tính năng thử nghiệm)
- Tải xuống và lưu nội dung
Tạo và Thực thi mã
AgenticSeek xuất sắc trong việc viết và chạy mã bằng nhiều ngôn ngữ:
Ví dụ yêu cầu:
- "Viết một script Python để phân tích dữ liệu CSV và tạo biểu đồ trực quan"
- "Tạo một chương trình Go triển khai máy chủ REST API"
- "Viết một chương trình C để sắp xếp mảng bằng thuật toán quicksort"
AI sẽ:
- Tạo mã hoàn chỉnh, có thể chạy được
- Thêm các import và phụ thuộc cần thiết
- Kiểm tra mã và sửa các lỗi cơ bản
- Lưu tệp trong không gian làm việc được chỉ định của bạn
Lập kế hoạch và Thực hiện tác vụ
Đối với các tác vụ phức tạp, AgenticSeek có thể chia chúng thành các bước có thể quản lý:
Ví dụ: "Lập kế hoạch cho chuyến đi cuối tuần đến Paris, bao gồm chuyến bay, khách sạn và các hoạt động. Nghiên cứu các tùy chọn và lưu các khuyến nghị vào paris_trip.txt"
AI sẽ:
- Nghiên cứu các tùy chọn chuyến bay
- Tìm kiếm các khách sạn được khuyến nghị
- Khám phá các hoạt động và nhà hàng phổ biến
- Tổng hợp mọi thứ vào một tài liệu có tổ chức
Quản lý tệp
AgenticSeek có thể làm việc với các tệp cục bộ của bạn:
- Đọc và phân tích tài liệu
- Tổ chức và đổi tên tệp
- Tạo tệp và thư mục mới
- Xử lý dữ liệu từ các tệp hiện có
Các tính năng nâng cao
Tương tác bằng giọng nói
Để bật các tính năng giọng nói, hãy cấu hình các cài đặt này:
speak = True # Bật chuyển văn bản thành giọng nói
listen = True # Bật chuyển lời nói thành văn bản (chỉ CLI)
agent_name = Friday # Từ đánh thức để kích hoạt giọng nói
Sử dụng lệnh thoại:
- Nói tên của tác nhân (ví dụ: "Friday")
- Chờ bản chép lời xuất hiện
- Nói yêu cầu của bạn rõ ràng
- Kết thúc bằng một cụm từ xác nhận như "do it," "go ahead," hoặc "execute"
Các cụm từ xác nhận được hỗ trợ:
- "do it"
- "go ahead"
- "execute"
- "run"
- "start"
- "thanks"
- "please"
- "proceed"
Hỗ trợ đa ngôn ngữ
AgenticSeek hỗ trợ nhiều ngôn ngữ cho tính năng chuyển văn bản thành giọng nói:
languages = en zh fr es # Tiếng Anh, Tiếng Trung, Tiếng Pháp, Tiếng Tây Ban Nha
Ngôn ngữ đầu tiên trong danh sách sẽ trở thành ngôn ngữ mặc định cho tính năng chuyển văn bản thành giọng nói.
Quản lý phiên
Kiểm soát cách AgenticSeek xử lý lịch sử cuộc trò chuyện:
recover_last_session = True # Tiếp tục cuộc trò chuyện trước đó
save_session = True # Ghi nhớ cuộc trò chuyện hiện tại
Điều này đặc biệt hữu ích cho các dự án kéo dài hoặc khi bạn cần tiếp tục công việc qua nhiều phiên.
Các mẫu sử dụng hiệu quả
Thực hành tốt nhất cho các truy vấn
Cụ thể về các hành động:
- Thay vì: "Nói cho tôi biết về Python"
- Sử dụng: "Tìm kiếm trên web các hướng dẫn Python và lưu 5 liên kết hàng đầu vào python_resources.txt"
Chỉ định các thao tác tệp:
- "Lưu kết quả vào filename.txt"
- "Tạo một thư mục mới tên là project_name"
- "Đọc dữ liệu từ existing_file.csv và phân tích nó"
Các chỉ báo tìm kiếm web:
- Luôn đề cập "search the web" hoặc "browse the internet" khi bạn muốn nghiên cứu trực tuyến
- Cụ thể về thông tin bạn đang tìm kiếm
Ví dụ về quy trình làm việc tối ưu
Dự án nghiên cứu:
- "Tìm kiếm trên web các phát triển AI gần đây vào năm 2024"
- "Tóm tắt các phát hiện và lưu vào ai_developments_2024.txt"
- "Tạo một script Python để trực quan hóa các xu hướng được đề cập trong bản tóm tắt"
Tác vụ phát triển:
- "Tạo cấu trúc dự án Python mới cho một web scraper"
- "Viết module scraping chính bằng BeautifulSoup"
- "Thêm xử lý lỗi và ghi nhật ký vào scraper"
- "Viết các bài kiểm tra đơn vị cho các hàm scraping"
Phân tích dữ liệu:
- "Đọc tệp sales_data.csv trong không gian làm việc của tôi"
- "Phân tích dữ liệu để tìm xu hướng và mẫu"
- "Tạo biểu đồ trực quan hiển thị xu hướng bán hàng hàng tháng"
- "Tạo một báo cáo với các hiểu biết sâu sắc và lưu dưới dạng sales_analysis.txt"
Khắc phục sự cố thường gặp
Sự cố ChromeDriver
Lỗi: Phiên bản không khớp giữa Chrome và ChromeDriver
Giải pháp:
- Kiểm tra phiên bản Chrome của bạn:
google-chrome --version
- Tải xuống ChromeDriver phù hợp từ https://developer.chrome.com/docs/chromedriver/downloads
- Thay thế ChromeDriver hiện có bằng phiên bản mới
Sự cố kết nối
Lỗi: "No connection adapters were found"
Giải pháp: Đảm bảo địa chỉ nhà cung cấp của bạn bao gồm giao thức:
provider_server_address = http://127.0.0.1:11434
Lỗi URL cơ sở SearxNG
Giải pháp: Đảm bảo bạn đã đổi tên .env.example
thành .env
, hoặc xuất biến môi trường:
export SEARXNG_BASE_URL="http://127.0.0.1:8080"
Sự cố hiệu suất
Hiệu suất AI kém:
- Sử dụng các mô hình lớn hơn (32B+ nếu có thể)
- Đảm bảo đủ VRAM/RAM
- Kiểm tra xem nhà cung cấp LLM của bạn có đang chạy đúng cách không
Duyệt web chậm:
- Bật stealth_mode để tương thích tốt hơn
- Đặt headless_browser = True để hoạt động nhanh hơn
- Kiểm tra kết nối internet của bạn
Các tùy chọn cấu hình nâng cao
Sử dụng các nhà cung cấp LLM khác nhau
Thiết lập Ollama:
provider_name = ollama
provider_model = deepseek-r1:32b
provider_server_address = 127.0.0.1:11434
Thiết lập LM Studio:
provider_name = lm-studio
provider_model = your-model-name
provider_server_address = http://127.0.0.1:1234
Thiết lập máy chủ từ xa:
Nếu bạn có một máy chủ mạnh mẽ đang chạy LLM:
provider_name = server
provider_model = deepseek-r1:70b
provider_server_address = your-server-ip:3333
Các tùy chọn nhà cung cấp API
Đối với người dùng không có đủ phần cứng, các nhà cung cấp API có sẵn:
is_local = False
provider_name = deepseek
provider_model = deepseek-chat
Xuất khóa API của bạn:
export DEEPSEEK_API_KEY="your-api-key-here"
Mẹo sử dụng tối ưu
Tối ưu hóa phần cứng
- Quản lý bộ nhớ GPU: Đóng các ứng dụng không cần thiết để giải phóng VRAM
- Chọn mô hình: Bắt đầu với các mô hình nhỏ hơn và nâng cấp khi cần thiết
- Sử dụng RAM: Giám sát bộ nhớ hệ thống, đặc biệt với các mô hình lớn hơn
Tối ưu hóa truy vấn
- Rõ ràng: Luôn chỉ định nếu bạn muốn tìm kiếm web, thao tác tệp hoặc tạo mã
- Chia nhỏ các tác vụ phức tạp: Đối với các quy trình nhiều bước, cung cấp hướng dẫn từng bước rõ ràng
- Sử dụng tên tệp cụ thể: Luôn chỉ định tên tệp và vị trí chính xác
Hiệu quả quy trình làm việc
- Tổ chức không gian làm việc của bạn: Giữ work_dir của bạn được tổ chức với cấu trúc thư mục rõ ràng
- Sử dụng quản lý phiên: Bật lưu phiên cho các dự án kéo dài
- Kiểm tra lệnh thoại: Thực hành lệnh thoại trong môi trường yên tĩnh để nhận dạng tốt hơn
Kết luận
AgenticSeek đại diện cho một bước tiến đáng kể trong hỗ trợ AI chú trọng đến quyền riêng tư. Bằng cách làm theo hướng dẫn toàn diện này, giờ đây bạn sẽ có một trợ lý AI cục bộ đầy đủ chức năng có khả năng duyệt web, tạo mã, lập kế hoạch tác vụ và tương tác bằng giọng nói—tất cả trong khi giữ dữ liệu của bạn hoàn toàn riêng tư.
Hãy nhớ rằng AgenticSeek là một dự án đang phát triển. Khi sử dụng nó, bạn sẽ khám phá ra các khả năng mới và các mẫu sử dụng tối ưu. Chìa khóa thành công là cụ thể trong các yêu cầu của bạn, hiểu điểm mạnh của hệ thống và tận dụng kiến trúc đa tác nhân của nó.
Cho dù bạn đang sử dụng AgenticSeek cho nghiên cứu, phát triển hay các tác vụ năng suất chung, sự kết hợp giữa quyền riêng tư, khả năng và hoạt động cục bộ của nó làm cho nó trở thành một giải pháp thay thế mạnh mẽ cho các trợ lý AI dựa trên đám mây. Bắt đầu với các tác vụ đơn giản để làm quen với hệ thống, sau đó dần dần khám phá các quy trình làm việc phức tạp hơn khi bạn cảm thấy thoải mái với các khả năng của nó.
Tương lai của hỗ trợ AI là cục bộ, riêng tư và nằm dưới sự kiểm soát hoàn toàn của bạn—và AgenticSeek đang dẫn đầu trong việc biến tương lai đó trở nên khả thi cho mọi người.