SDK OpenAI Agents hiện hỗ trợ MCP (Model Context Protocol), một bước đột phá trong khả năng tương tác của AI. Điều này cho phép các nhà phát triển kết nối các mô hình AI với các công cụ và nguồn dữ liệu bên ngoài một cách hiệu quả. Trong hướng dẫn kỹ thuật này, chúng tôi sẽ hướng dẫn bạn cách xây dựng MCP Servers với SDK OpenAI Agents để nâng cao các ứng dụng AI của bạn.
MCP Servers là gì và tại sao lại sử dụng chúng với SDK OpenAI Agents?
MCP Servers chuẩn hóa cách các ứng dụng cung cấp ngữ cảnh cho các mô hình ngôn ngữ lớn (LLMs). Chúng hoạt động như một bộ kết nối toàn cầu, giống như một cổng USB-C, cho các ứng dụng AI. SDK OpenAI Agents tích hợp MCP Servers để cho phép các agent truy cập các công cụ và dữ liệu bên ngoài. Sử dụng MCP Servers đảm bảo tương tác liền mạch giữa agent AI của bạn và các tài nguyên từ xa hoặc cục bộ. Việc tích hợp này giảm bớt độ phức tạp trong việc gọi công cụ và nâng cao chức năng của agent.
Điều kiện tiên quyết để xây dựng MCP Servers với SDK OpenAI Agents
Đảm bảo bạn đã cài đặt Python 3.8 hoặc cao hơn trên hệ thống của mình. Cài đặt SDK OpenAI Agents bằng pip: pip install openai-agents
. Thiết lập Node.js để chạy các lệnh máy chủ MCP như npx
cho một số ví dụ nhất định. Tạo một thư mục dự án và khởi tạo một môi trường ảo để quản lý phụ thuộc. Có hiểu biết cơ bản về lập trình bất đồng bộ trong Python, vì SDK sử dụng async/await
.
Bước 1: Thiết lập môi trường phát triển của bạn cho MCP Servers
Tạo một thư mục mới cho dự án của bạn bằng cách sử dụng mkdir mcp-agent-project && cd mcp-agent-project
. Khởi tạo một môi trường ảo Python với python -m venv venv && source venv/bin/activate
. Cài đặt các phụ thuộc cần thiết: pip install openai-agents pyyaml
. Thiết lập một tệp cấu hình có tên mcp_agent.config.yaml
để xác định các MCP Servers. Thêm một cấu hình cơ bản vào tệp YAML:
mcp:
servers:
filesystem:
command: npx
args: ["-y", "@modelcontextprotocol/server-filesystem", "."]
Cấu hình này chỉ vào một máy chủ MCP filesystem để truy cập các tệp cục bộ.
Bước 2: Hiểu các loại MCP Servers trong SDK OpenAI Agents
MCP Servers có hai loại: stdio và HTTP qua SSE. Các máy chủ stdio chạy cục bộ như một quy trình con của ứng dụng của bạn. Các máy chủ HTTP qua SSE hoạt động từ xa và kết nối qua URL. SDK OpenAI Agents cung cấp các lớp MCPServerStdio
và MCPServerSse
để xử lý các máy chủ này. Các máy chủ stdio lý tưởng cho phát triển cục bộ, trong khi các máy chủ SSE phù hợp với các hệ thống phân tán. Chọn loại máy chủ dựa trên kiến trúc ứng dụng của bạn và các yêu cầu về độ trễ.
Tận dụng Apidog để đơn giản hóa việc phát triển MCP Servers và SDK OpenAI Agents
Apidog là một công cụ mạnh mẽ giúp đơn giản hóa quá trình phát triển API, làm cho nó trở thành bạn đồng hành tuyệt vời khi xây dựng MCP Servers với SDK OpenAI Agents. Vì MCP Servers thường liên quan đến việc tương tác với các API—cho dù là cho các máy chủ HTTP qua SSE từ xa hay kiểm tra các lệnh gọi công cụ—Apidog có thể nâng cao quy trình làm việc của bạn.
Apidog cung cấp giao diện thân thiện với người dùng để kiểm tra, tài liệu và quản lý các API, đảm bảo rằng các MCP Servers của bạn giao tiếp hiệu quả với các công cụ bên ngoài. Thêm vào đó, tính năng "Vibe Coding (qua MCP)" của Apidog cho phép trợ lý lập trình AI của bạn truy cập trực tiếp tài liệu API, giảm thiểu việc chuyển đổi ngữ cảnh và nâng cao năng suất. Ví dụ, khi cấu hình một máy chủ MCP để gọi API thời tiết, Apidog có thể giúp bạn kiểm tra điểm cuối và tạo trường hợp thử nghiệm cho các phản hồi lỗi. Tải xuống Apidog miễn phí để đơn giản hóa các nhiệm vụ liên quan đến API của bạn và tập trung vào việc xây dựng các MCP Servers mạnh mẽ với SDK OpenAI Agents.

Bước 3: Kết nối một MCP Server với Agent OpenAI của bạn
Nhập khẩu các lớp cần thiết từ SDK OpenAI Agents: from openai_agents import Agent, MCPServerStdio
. Định nghĩa một máy chủ MCP bằng cách sử dụng lớp MCPServerStdio
với lệnh filesystem. Sử dụng một trình quản lý ngữ cảnh async để khởi tạo máy chủ:
async with MCPServerStdio(params={"command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "."]}) as server:
tools = await server.list_tools()
agent = Agent(name="FileAgent", instructions="Truy cập các công cụ filesystem", mcp_servers=[server])
Cài đặt này cho phép agent sử dụng các công cụ filesystem một cách linh hoạt trong quá trình thực thi.
Bước 4: Tối ưu hóa hiệu suất với việc lưu cache công cụ
MCP Servers gọi list_tools()
mỗi khi một agent chạy, điều này có thể tạo ra độ trễ. Bật lưu cache công cụ để giảm thiểu độ trễ này bằng cách thiết lập cache_tools_list=True
trong MCPServerStdio
. Hãy cẩn thận—việc lưu cache giả định rằng danh sách công cụ sẽ không thay đổi trong quá trình chạy. Làm mất hiệu lực cache nếu các công cụ được cập nhật: await server.invalidate_tools_cache()
. Việc lưu cache hoạt động cho cả máy chủ stdio và SSE, cải thiện hiệu suất cho các máy chủ từ xa. Kiểm tra ứng dụng của bạn để đảm bảo rằng việc lưu cache không làm hỏng việc cập nhật công cụ động.
Bước 5: Xây dựng và kiểm tra MCP Server của bạn với ví dụ từ SDK OpenAI Agents
Khám phá năm ví dụ thực tiễn để xây dựng MCP Servers với SDK OpenAI Agents. Những ví dụ này cho thấy các trường hợp sử dụng và cấu hình máy chủ khác nhau. Mỗi ví dụ bao gồm các đoạn mã và giải thích để làm rõ. Hãy theo dõi để thấy cách MCP Servers nâng cao khả năng của agent. Đảm bảo bạn đã thiết lập môi trường như mô tả trong Bước 1 trước khi tiếp tục. Kiểm tra từng ví dụ để hiểu cách SDK tương tác với MCP Servers.
Ví dụ 1: Tích hợp nhiều MCP Servers
Để cho phép một agent tương tác với cả hệ thống tệp cục bộ và một không gian làm việc Slack, bạn có thể cấu hình nhiều MCP servers. Điều này bao gồm việc thiết lập một máy chủ MCP Filesystem và một máy chủ MCP Slack, và sau đó phối hợp chúng bằng cách sử dụng SDK OpenAI Agents. Các bước chi tiết và ví dụ mã có sẵn trong bài viết của DEV Community.
Ví dụ 2: Mở rộng SDK Agents với hỗ trợ MCP
Nâng cao SDK OpenAI Agents bằng cách kết hợp hỗ trợ máy chủ MCP thông qua phần mở rộng openai-agents-mcp
. Phần mở rộng này cho phép tích hợp liền mạch các máy chủ MCP và công cụ của chúng vào trong khuôn khổ SDK Agents. Hướng dẫn cài đặt và cấu hình, cùng với các ứng dụng mẫu, có thể được tìm thấy trong kho GitHub.
Ví dụ 3: Phát triển một Agent mã SPARC với máy chủ MCP
Xây dựng một khuôn khổ agent lập trình thông minh tự động hóa và đơn giản hóa các nhiệm vụ phát triển phần mềm. Bằng cách tích hợp SDK OpenAI Agents với khả năng MCP, Agent mã SPARC có thể phân tích các mẫu mã, đề xuất cải tiến, thực hiện thay đổi và duy trì kiểm soát phiên bản. Thông tin thêm và chi tiết triển khai có thể được tìm thấy trong bài viết của Cộng đồng nhà phát triển OpenAI.
Ví dụ 4: Xây dựng một hệ thống đa agent để hỗ trợ làm bài tập
Phát triển một hệ thống đa agent nơi các agent thực hiện các vai trò khác nhau, chẳng hạn như xác minh các truy vấn liên quan đến bài tập, xác định môn học và cung cấp câu trả lời. Hệ thống này sử dụng SDK OpenAI Agents cho việc phối hợp các agent và các MCP servers để truy cập các công cụ và tài nguyên chuyên biệt. Một hướng dẫn toàn diện với các chi tiết triển khai được cung cấp trong bài viết của Tạp chí Venture.

Ví dụ 5: Tạo một agent đặt chỗ thông minh
Kết hợp SDK OpenAI Agents với các công cụ MCP AutoGen và tính năng lưu trữ để xây dựng một agent đặt chỗ thông minh, nhạy cảm với ngữ cảnh. Việc tích hợp này cho phép agent quản lý sở thích của người dùng và tương tác với các công cụ chuyên biệt để tối ưu hóa hiệu suất.

Bước 6: Gỡ lỗi và giám sát các MCP Servers của bạn
Kiểm tra nhật ký máy chủ MCP để tìm lỗi trong quá trình thực thi công cụ. Sử dụng bảng điều khiển theo dõi của SDK OpenAI Agents để giám sát các lệnh gọi công cụ, như được nhấn mạnh trong các bài đăng gần đây trên X. Kiểm tra các trường hợp cạnh, chẳng hạn như tên công cụ không hợp lệ hoặc máy chủ ngừng hoạt động, để đảm bảo tính ổn định. Giám sát độ trễ khi sử dụng các máy chủ SSE từ xa và tối ưu hóa với việc lưu cache nếu cần. Sử dụng các công cụ như AgentOps để theo dõi thời gian thực. Gỡ lỗi các vấn đề bằng cách tách biệt máy chủ MCP và kiểm tra đầu ra list_tools()
của nó.

Bước 7: Triển khai máy chủ MCP và ứng dụng agent của bạn
Đóng gói ứng dụng của bạn bằng cách sử dụng một công cụ như PyInstaller
để phân phối. Triển khai các MCP Servers từ xa trên một nhà cung cấp đám mây như AWS hoặc Azure để mở rộng quy mô. Đảm bảo rằng tệp mcp_agent.config.yaml
của bạn đã được bao gồm trong quá trình triển khai. Thiết lập các biến môi trường cho dữ liệu nhạy cảm, chẳng hạn như khóa API, trong môi trường sản xuất. Kiểm tra ứng dụng đã triển khai để xác nhận agent có thể truy cập các MCP Servers. Giám sát ứng dụng trong sản xuất bằng cách sử dụng các công cụ ghi log và quan sát.
Kết luận
Xây dựng các MCP Servers với SDK OpenAI Agents mở ra những cách thức mới để nâng cao các agent AI. Những ví dụ ở trên cho thấy sự linh hoạt của sự kết hợp này. Thử nghiệm với các MCP Servers khác nhau để phù hợp với nhu cầu dự án của bạn. Chia sẻ các sản phẩm sáng tạo của bạn với cộng đồng nhà phát triển để truyền cảm hứng cho người khác. Tiếp tục khám phá tài liệu SDK OpenAI Agents để biết thêm các tính năng nâng cao.