Bạn đã bao giờ nghĩ đến việc tạo ra một tác nhân nghiên cứu sâu mã nguồn mở riêng của mình thay vì phụ thuộc vào các tùy chọn độc quyền như Nghiên cứu Sâu của OpenAI và Nghiên cứu Sâu của Google? Với các máy chủ Giao thức Ngữ cảnh Mô hình (MCP) mạnh mẽ như Suy nghĩ Đệ quy và Exa, bạn có thể xây dựng một giải pháp ấn tượng và mạnh mẽ thay thế cho các công cụ độc quyền.

Trong hướng dẫn này, chúng tôi sẽ hướng dẫn bạn thiết lập và vận hành tác nhân nghiên cứu riêng của bạn chỉ với hai máy chủ MCP:
✅ Suy nghĩ Đệ quy – cho lý luận và phân tích có cấu trúc
✅ Exa – cho tìm kiếm web mạnh mẽ được hỗ trợ bởi AI
Chúng tôi sẽ làm việc với Windsurf IDE và tích hợp mô hình AI mà bạn chọn. Đối với hướng dẫn này, tôi sẽ sử dụng DeepSeek V3, nhưng bạn cũng có thể chọn các mô hình như:
- Claude Sonnet 3.5 hoặc 3.7 (từ Anthropic)
- GPT-4o hoặc GPT-3.5 (từ OpenAI)
- O3-mini và những người khác
Chúng ta hãy bắt đầu! 🚀
Tác nhân nghiên cứu sâu mã nguồn mở là gì?
Vậy, công cụ "tác nhân nghiên cứu sâu mã nguồn mở" thực sự là gì mà chúng tôi sẽ làm việc trên đó? Về bản chất, tác nhân nghiên cứu sâu mã nguồn mở là một công cụ được thiết kế để tự động hóa các nhiệm vụ nghiên cứu bằng cách tận dụng sức mạnh của Giao thức Ngữ cảnh Mô hình (MCP). Nó kết hợp sức mạnh của lý luận hỗ trợ bởi AI với khả năng tìm kiếm web, cho phép bạn thu thập, phân tích và tóm tắt thông tin từ nhiều nguồn một cách hiệu quả.
Dưới đây là cách thức hoạt động của nó:
- Công cụ kết nối với một máy chủ MCP, chẳng hạn như Suy nghĩ Đệ quy hoặc Exa, để xử lý các truy vấn nghiên cứu một cách thông minh.
- Nó tích hợp với các mô hình AI để diễn giải, tóm tắt và tạo ra những hiểu biết từ thông tin thu thập được.
- Nó sử dụng khả năng tìm kiếm web để lấy dữ liệu liên quan, đảm bảo rằng nghiên cứu của bạn là toàn diện và được cập nhật.
- Vì nó được xây dựng bằng các thành phần mã nguồn mở, bạn có toàn quyền kiểm soát dữ liệu của mình, đảm bảo tính minh bạch và tùy chỉnh.
Tác nhân nghiên cứu sâu mã nguồn mở này phù hợp với ai?
Tác nhân nghiên cứu sâu này lý tưởng cho:
1. Nghiên cứu viên & Học giả – Nhanh chóng thu thập và phân tích thông tin từ nhiều nguồn để hỗ trợ cho việc viết học thuật, đánh giá tài liệu, hoặc khám phá khoa học.
2. Nhà báo & Nhà văn – Tự động hóa nghiên cứu nền, kiểm tra sự thật, và chọn lọc nội dung cho các bài viết, báo cáo, hoặc báo chí điều tra.
3. Nhà phát triển & Người yêu thích AI – Thử nghiệm với quy trình làm việc hỗ trợ bởi AI, xây dựng trợ lý nghiên cứu tùy chỉnh, hoặc tích hợp các máy chủ MCP vào dự án của họ.
4. Nhà phân tích & Nhà hoạch định chính sách – Truy xuất các hiểu biết từ các tập dữ liệu, báo cáo, và nguồn tin tức để thông báo quyết định.
5. Sinh viên & Người học suốt đời – Tinh giản các buổi học bằng cách tóm tắt các khái niệm chính và tạo ra các giải thích được cấu trúc tốt.
Khi nào tác nhân nghiên cứu sâu mã nguồn mở là hữu ích nhất?
1. Xử lý Nghiên cứu Quy mô Lớn – Khi xử lý một lượng lớn thông tin từ nhiều nguồn, một tác nhân nghiên cứu hỗ trợ bởi AI có thể tiết kiệm thời gian và công sức.
2. Tự động hóa các Nhiệm vụ Nghiên cứu Lặp đi Lặp lại – Nếu bạn thường xuyên thực hiện các tìm kiếm tương tự, công cụ này có thể tự động hóa quy trình, giảm công việc thủ công.
3. Đảm bảo Nghiên cứu Không Thiên kiến & Minh bạch – Không giống như các công cụ nghiên cứu nguồn đóng, một giải pháp mã nguồn mở cho phép bạn xác minh cách thức dữ liệu được xử lý và duy trì toàn quyền kiểm soát quy trình của bạn.
4. Làm việc với các Mô hình AI Tùy chỉnh – Nếu bạn thích sử dụng một LLM (như DeepSeek v3) cụ thể hoặc cần các mô hình AI theo miền, công cụ này cho phép bạn tích hợp mô hình bạn chọn.
5. Tăng cường Năng suất – Bằng cách kết hợp lý luận hỗ trợ bởi AI với tìm kiếm web, bạn nhận được những hiểu biết được tổ chức tốt nhanh hơn so với các phương pháp nghiên cứu truyền thống.
Cách Thiết lập Tác nhân Nghiên cứu Sâu Mã Nguồn Mở của Bạn
Yêu cầu tiên quyết:
- Windsurf IDE: phiên bản mới nhất của Windsurf có thể được cài đặt từ trang web chính thức.
- Node.js: v20 hoặc cao hơn được khuyến nghị.
- npm: nên có phiên bản mới nhất của npm, tuy nhiên bạn có thể ổn với v7.
Bước 1: Tạo một Thư mục Dự án Mới
Tạo một Thư mục Mới: Bắt đầu bằng cách tạo một thư mục mới cho dự án của bạn, ví dụ: deep_researcher.
Mở bằng Windsurf IDE: Mở thư mục này bằng Windsurf IDE, hỗ trợ tích hợp máy chủ MCP.
Bước 2: Cài đặt Máy chủ MCP Suy nghĩ Đệ quy
Cài đặt Suy nghĩ Đệ quy MCP: Chạy lệnh dưới đây để cài đặt và cấu hình máy chủ MCP Suy nghĩ Đệ quy. Điều này sẽ tự động thiết lập máy chủ mà không yêu cầu thay đổi cấu hình thủ công.
npx -y @smithery/cli@latest install @smithery-ai/server-sequential-thinking --client windsurf --config "{}"Xác minh Cấu hình: Kiểm tra tệp mcp_config.json trong thư mục cấu hình của Windsurf .codeium(nếu bạn không nhớ nơi bạn đã cài đặt windsurf, hãy thử tìm ở: C:/Users/You/.codeium/windsurf/mcp_config.json) để đảm bảo máy chủ Suy nghĩ Đệ quy được cấu hình đúng. Nó nên có dạng như sau:
# tệp mcp_config.json
{
"mcpServers": {
"server-sequential-thinking": {
"command": "cmd",
"args": [
"/c",
"npx",
"-y",
"@smithery/cli@latest",
"run",
"@smithery-ai/server-sequential-thinking",
"--config",
"\"{}\""
]
}
}
}Nếu tệp trống, hãy truy cập kho lưu trữ GitHub của họ để biết cấu hình cập nhật hoặc đơn giản là sao chép và dán cấu hình ở trên.
Kiểm tra Máy chủ: Kiểm tra máy chủ MCP Suy nghĩ Đệ quy bằng cách chạy các lệnh mẫu, chẳng hạn như:
# Đầu vào mẫu
>> Sử dụng suy nghĩ đệ quy để giúp tôi phát triển một trò chơi Python Flappy Bird đơn giản.Bước 3: Thiết lập Máy chủ Tìm kiếm Web Exa MCP
Tạo một Tài khoản Exa và nhận API Key:
Truy cập trang web chính thức của Exa, tạo tài khoản và nhận mã API miễn phí từ phần "Mã API" trong hồ sơ của bạn.

Nhân bản Kho lưu trữ Máy chủ Exa MCP: Nhân bản kho lưu trữ máy chủ Exa MCP từ GitHub:
git clone https://github.com/exa-labs/exa-mcp-server.git cd exa-mcp-serverCài đặt Các Thư Viện và Xây Dựng Dự Án:
Để cài đặt tất cả các thư viện bằng npm, chạy lệnh:
npm installXây dựng dự án:
npm run buildTạo Liên Kết Toàn Cầu:
Chạy lệnh sau để làm cho máy chủ Exa có thể thực thi từ bất kỳ đâu bằng cách chạy:
npm linkCấu hình Máy chủ Exa trong Windsurf:
Cập nhật tệp mcp_config.json với cấu hình mới nhất từ kho lưu trữ GitHub của Exa. Thay thế văn bản mẫu bằng mã API thực tế của bạn. Nó nên có dạng như sau:
# tệp mcp_config.json
{
"mcpServers": {
"server-sequential-thinking": {
"command": "cmd",
"args": [
"/c",
"npx",
"-y",
"@smithery/cli@latest",
"run",
"@smithery-ai/server-sequential-thinking",
"--config",
"\"{}\""
]
},
"exa": {
"command": "npx",
"args": ["C:/Research_agent/exa-mcp-server/build/index.js"],
"env": {
"EXA_API_KEY": "YOUR_API_KEY"
}
}
}
}Kiểm tra Máy chủ Exa: để xác minh rằng máy chủ Exa đang hoạt động bằng cách chạy các lệnh mẫu, chẳng hạn như:
# Đầu vào mẫu
>> Tìm các bài viết blog về AGI.Sử dụng Tác nhân Nghiên cứu Sâu Mã Nguồn Mở của Bạn
Bây giờ cả hai máy chủ MCP đã được thiết lập và cấu hình đúng cách, bạn có thể sử dụng chúng để tạo ra một công cụ nghiên cứu sâu. Dưới đây là một ví dụ về lệnh mẫu để kiểm tra thiết lập của bạn:
# Đầu vào mẫu
>> Khi sử dụng suy nghĩ đệ quy, hãy sử dụng càng nhiều bước càng tốt. Mỗi bước của suy nghĩ đệ quy phải sử dụng các nhánh, isRevision và needsMoreThoughts, và mỗi nhánh phải có ít nhất 3 bước. Trước mỗi bước của suy nghĩ đệ quy, hãy dùng Exa để tìm kiếm 3 trang web liên quan và sau đó suy nghĩ về nội dung của các trang web đó. Câu trả lời cuối cùng nên đủ dài và được cấu trúc tốt. Câu hỏi: Siêu hình học là gì?Lệnh này sẽ tạo ra một phản hồi có cấu trúc với các liên kết tìm kiếm được sử dụng bởi mô hình để trả lời câu hỏi của bạn.
Các liên kết tìm kiếm trên web:

Kết quả mẫu:

Tính năng và Lợi ích
Tính Linh hoạt và Kiểm soát:
Bằng cách sử dụng các máy chủ MCP mã nguồn mở, bạn duy trì toàn quyền kiểm soát quy trình nghiên cứu và quyền riêng tư dữ liệu của mình.
Tùy chỉnh:
Bạn có thể chọn từ nhiều mô hình AI như DeepSeek v3, Claude Sonnet 3.5 hoặc GPT 4o, cho phép bạn tùy chỉnh công cụ nghiên cứu của mình theo nhu cầu cụ thể.
Hiệu quả Chi phí:
Vận hành các máy chủ MCP của riêng bạn có thể hiệu quả hơn về mặt chi phí so với việc phụ thuộc vào các dịch vụ độc quyền, đặc biệt là đối với các nhiệm vụ nghiên cứu thường xuyên hoặc quy mô lớn.
Để làm gì khi tác nhân nghiên cứu sâu mã nguồn mở không hoạt động
Khi thiết lập và sử dụng tác nhân nghiên cứu sâu mã nguồn mở của bạn với các máy chủ MCP, bạn có thể gặp một số vấn đề. Dưới đây là một số vấn đề phổ biến và giải pháp của chúng:
Máy chủ MCP không được cấu hình đúng:
Nếu máy chủ MCP của bạn không hoạt động như mong đợi, hãy kiểm tra các tệp cấu hình (ví dụ: mcp_config.json) để tìm lỗi. Đảm bảo rằng các mã API được thiết lập đúng và máy chủ được liên kết chính xác.
Các vấn đề về Mã API:
Nếu bạn gặp lỗi liên quan đến các mã API, hãy xác minh rằng chúng được nhập đúng trong các tệp cấu hình của bạn. Ngoài ra, hãy kiểm tra xem các mã API của bạn có bị hết hạn hoặc bạn có vượt quá giới hạn sử dụng hay không.
Mô hình không phản hồi:
Nếu mô hình AI của bạn không phản hồi, hãy đảm bảo rằng nó được cài đặt và cấu hình chính xác. Kiểm tra có bất kỳ bản cập nhật nào cho mô hình hoặc các phụ thuộc của nó.
Kết quả tìm kiếm web không được tìm thấy:
Nếu kết quả tìm kiếm web không được trả về, hãy kiểm tra kết nối internet của bạn và đảm bảo rằng API tìm kiếm (ví dụ: Exa) đang hoạt động đúng cách.
Kết luận
Xây dựng một tác nhân nghiên cứu sâu mã nguồn mở bằng cách sử dụng các máy chủ MCP như Suy nghĩ Đệ quy và Exa mang lại một giải pháp mạnh mẽ thay thế cho các công cụ độc quyền. Bằng cách tích hợp những máy chủ này với Windsurf IDE và mô hình AI mà bạn lựa chọn, bạn có thể tạo ra một công cụ nghiên cứu linh hoạt và hiệu quả về chi phí, vừa đảm bảo quyền riêng tư và kiểm soát dữ liệu của bạn.
