Cách xây dựng công cụ nghiên cứu sâu mã nguồn mở với API Gemini

中村 拓也

中村 拓也

22 tháng 6 2025

Cách xây dựng công cụ nghiên cứu sâu mã nguồn mở với API Gemini

Bạn đã bao giờ mong muốn có thể tận dụng sức mạnh của AI cho việc nghiên cứu sâu sắc hơn, nhưng cảm thấy bị giới hạn bởi các giải pháp mã nguồn đóng và lo ngại về quyền riêng tư dữ liệu? Chà, hãy chuẩn bị xắn tay áo lên vì trong bài viết này, chúng ta sẽ xây dựng Công Cụ Nghiên Cứu Sâu Mở hoàn toàn của riêng mình, được hỗ trợ bởi Gemini API!

Đúng vậy, chúng ta đang tạo ra một trung tâm nghiên cứu hoàn toàn nằm trong tầm kiểm soát của bạn. Bạn có thể tưởng tượng nó như một trợ lý nghiên cứu AI tận tay bạn, sẵn sàng tìm hiểu sâu về bất kỳ chủ đề nào mà bạn đặt ra. Và điểm tốt nhất? Chúng ta sẽ tận dụng Gemini API để có được phân tích chính xác và sâu sắc. Hãy cùng bắt đầu!


💡
Trước khi bắt đầu, đây là một mẹo nhanh: Tích hợp Apidog MCP Server vào IDE hỗ trợ AI của bạn sẽ nâng cao trải nghiệm lập trình bằng cách cung cấp truy cập trực tiếp vào các thông số API từ các dự án Apidog. Điều này cho phép trợ lý AI của bạn tạo và chỉnh sửa mã, tìm kiếm tài liệu API, tạo mô hình dữ liệu và DTO, và thêm nhận xét liên quan — tất cả đều phù hợp với thiết kế API của bạn.
button
apidog mcp

Công Cụ Nghiên Cứu Sâu Mở Là Gì?

Công Cụ Nghiên Cứu Sâu Mở là về việc kiểm soát quy trình nghiên cứu của bạn. Nó liên quan đến việc tận dụng sức mạnh của AI trong khi vẫn duy trì tính minh bạch, quyền riêng tư, và khả năng tùy chỉnh các công cụ của bạn để phù hợp với nhu cầu cụ thể của bạn. Bằng cách xây dựng công cụ nghiên cứu của riêng mình, chúng ta tránh được các hạn chế và thiên kiến tiềm ẩn của các giải pháp mã nguồn đóng và đảm bảo rằng dữ liệu của chúng ta vẫn an toàn. MCP có thể hỗ trợ quá trình này, đảm bảo tích hợp đúng cách với các API và chức năng khác nhau để nâng cao hiệu suất.

Tại Sao Sử Dụng Gemini API Cho Nghiên Cứu Sâu?

Gemini API cung cấp một cách tiếp cận tiên tiến về trí tuệ nhân tạo, cho phép các tương tác giữa người và máy trở nên trực quan và hiệu quả hơn. Nó nổi bật không chỉ bằng cách cung cấp những hiểu biết dựa trên văn bản mà còn hỗ trợ các đầu vào đa phương thức, cho phép hiểu biết phong phú hơn về tài liệu nghiên cứu thông qua hình ảnh, video và âm thanh. Điều này làm cho nó đặc biệt quý giá cho các dự án nghiên cứu toàn diện yêu cầu phân tích các loại dữ liệu đa dạng. Thêm vào đó, thiết kế linh hoạt của API và hỗ trợ mạnh mẽ từ các nhà phát triển khuyến khích đổi mới và tùy chỉnh, cho phép các nhà nghiên cứu tùy chỉnh công cụ để đáp ứng các nhu cầu và ngữ cảnh cụ thể của họ, cuối cùng tạo điều kiện cho việc hiểu sâu hơn và tinh tế hơn về các chủ đề phức tạp.

Các Tính Năng Chính Của Công Cụ Nghiên Cứu Sâu Mở Của Chúng Tôi

Trước khi đi vào quy trình xây dựng, hãy cùng xem một số tính năng mà chúng tôi sẽ đưa vào hoạt động:

Bắt Đầu Với Công Cụ Nghiên Cứu Sâu Mở

Sẵn sàng xây dựng trợ lý nghiên cứu AI của riêng bạn? Đây là những gì bạn cần để bắt đầu:

1. Nhận Khóa API Gemini: Đầu tiên và quan trọng nhất, bạn sẽ cần một khóa API Gemini để truy cập vào sức mạnh của các mô hình AI của Google. Hãy vào Google AI Studio và đăng ký để có một khóa API. Hãy giữ khóa này an toàn và bảo mật – đó là hộ chiếu của bạn đến thế giới của Gemini!

website google deep mind

2. Triển Khai Chỉ Với Một Cú Nhấp (Tùy Chọn): Để bắt đầu nhanh nhất có thể, bạn có thể sử dụng các tùy chọn triển khai chỉ với một cú nhấp:

website varcel
website cloaudflare

Các tùy chọn này sẽ giúp bạn khởi động công cụ nghiên cứu trong vài phút, nhưng để trải nghiệm tùy chỉnh đầy đủ, chúng ta sẽ tập trung vào phát triển cục bộ.

Phát Triển Công Cụ Nghiên Cứu Sâu Mở

Hãy cùng khám phá quá trình xây dựng! Thực hiện theo các bước này để khởi động Deep Research trong trình duyệt cục bộ của bạn.

Yêu Cầu Đầu Vào

Trước khi chúng ta bắt đầu, hãy đảm bảo bạn đã cài đặt những thứ sau trên hệ thống của mình:

website node js

Cài Đặt

1. Sao Chép kho lưu trữ:

git clone https://github.com/u14app/deep-research.git
cd deep-research

Điều này sẽ tải xuống mã từ GitHub và chuyển bạn vào thư mục dự án.

2. Cài Đặt các phụ thuộc:

pnpm install  # hoặc npm install hoặc yarn install

Lệnh này sẽ cài đặt tất cả các gói cần thiết cho dự án.

3. Thiết Lập Biến Môi Trường:

Đây là một bước quan trọng! Bạn sẽ cần tạo một tệp .env trong thư mục gốc của dự án và cấu hình các biến môi trường sau:

# (Tùy Chọn) Khóa API Gemini phía máy chủ (Cần thiết cho các cuộc gọi API phía máy chủ)
GOOGLE_GENERATIVE_AI_API_KEY=YOUR_GEMINI_API_KEY

# (Tùy Chọn) Địa chỉ URL Proxy API phía máy chủ. Mặc định, `https://generativelanguage.googleapis.com`
API_PROXY_BASE_URL=

# (Tùy Chọn) Mật khẩu truy cập API phía máy chủ cho bảo mật được cải thiện
ACCESS_PASSWORD=

# (Tùy Chọn) Mã script được nhúng có thể được sử dụng cho thống kê hoặc theo dõi lỗi.
HEAD_SCRIPTS=

Thay thế YOUR_GEMINI_API_KEY bằng khóa API thực tế mà bạn nhận được từ Google AI Studio.

Lưu Ý Quan Trọng Về Biến Môi Trường:

Nhắc Nhở Về Quyền Riêng Tư: Những biến môi trường này chủ yếu được sử dụng cho các cuộc gọi API phía máy chủ. Khi sử dụng chế độ API cục bộ, không cần khóa API hay cấu hình phía máy chủ nào, càng làm tăng cường quyền riêng tư của bạn.
Hỗ Trợ Đa Khóa: Hỗ trợ nhiều khóa, mỗi khóa được phân tách bằng ,, tức là key1,key2,key3. Cloudflare không thể sử dụng đa khóa trong thời gian này vì mã triển khai chính thức không hỗ trợ Next.js 15.

4. Chạy máy chủ phát triển:

pnpm dev  # hoặc npm run dev hoặc yarn dev

Điều này sẽ khởi động máy chủ phát triển, và bạn có thể truy cập Deep Research trong trình duyệt của mình tại http://localhost:3000.

đặt câu hỏi cho công cụ nghiên cứu sâu
kết quả công cụ nghiên cứu sâu

Triển Khai Công Cụ Nghiên Cứu Sâu Mở

Khi bạn đã hài lòng với thiết lập cục bộ của mình, bạn có thể triển khai công cụ nghiên cứu của mình lên đám mây! Dưới đây là một vài lựa chọn phổ biến:

1. Vercel: Triển khai với Vercel (Đây thường là lựa chọn dễ nhất).

2. Cloudflare: Hiện tại dự án hỗ trợ triển khai lên Cloudflare, nhưng bạn cần làm theo Hướng dẫn triển khai lên Cloudflare Pages để thực hiện.

3. Docker:

docker pull xiangfa/deep-research:latest
docker run -d --name deep-research -p 3333:3000 xiangfa/deep-research

Bạn cũng có thể chỉ định các biến môi trường:

docker run -d --name deep-research \
   -p 3333:3000 \
   -e GOOGLE_GENERATIVE_AI_API_KEY=AIzaSy... \
   -e ACCESS_PASSWORD=your-password \
   xiangfa/deep-research
docker build -t deep-research .
docker run -d --name deep-research -p 3333:3000 deep-research
version: '3.9'
services:
   deep-research:
      image: xiangfa/deep-research
      container_name: deep-research
      environment:
         - GOOGLE_GENERATIVE_AI_API_KEY=AIzaSy...
         - ACCESS_PASSWORD=your-password
      ports:
         - 3333:3000

Rồi sau đó xây dựng docker compose của riêng bạn:

docker compose -f docker-compose.yml build

4. Triển Khai Tĩnh:

pnpm build:export

Cấu Hình Công Cụ Nghiên Cứu Sâu Mở

Như đã đề cập trong phần "Bắt Đầu Với Công Cụ Nghiên Cứu Sâu Mở", Deep Research sử dụng các biến môi trường sau cho cấu hình API phía máy chủ:

Các biến này chỉ yêu cầu nếu bạn có ý định sử dụng chức năng gọi API phía máy chủ. Đối với các cuộc gọi API cục bộ, không cần cấu hình nào ngoài việc thiết lập dự án.

Hãy nhớ luôn giữ bí mật các khóa API và mật khẩu của bạn!

Kết Luận: Tăng Cường Nghiên Cứu Của Bạn Với AI

Bây giờ bạn đã xây dựng thành công công cụ Nghiên Cứu Sâu Mở của riêng mình được hỗ trợ bởi Gemini API! Đây là một bước tiến lớn để mở khóa toàn bộ tiềm năng của AI trong quy trình nghiên cứu của bạn.

Bằng cách xây dựng công cụ của riêng mình, bạn có được quyền kiểm soát hoàn toàn dữ liệu của mình, tùy chỉnh quy trình làm việc và đóng góp vào cộng đồng mã nguồn mở. Hãy thử nghiệm với các mô hình nghiên cứu khác nhau, khám phá khả năng của Gemini API và tạo ra các công cụ tùy chỉnh để thực sự cá nhân hóa trải nghiệm nghiên cứu của bạn.

Tương lai của nghiên cứu là thông minh và mở. Hãy chấp nhận Công Cụ Nghiên Cứu Sâu Mở và trang bị cho mình những kiến thức bạn cần!

button
Hình ảnh Apidog Ui

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API