TradingAgents: Khung Giao Dịch LLM Mã Nguồn Mở

Ashley Innocent

Ashley Innocent

7 tháng 5 2026

TradingAgents: Khung Giao Dịch LLM Mã Nguồn Mở

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

Hầu hết các framework LLM đa tác nhân hứa hẹn nhiều hơn những gì chúng mang lại. TradingAgents là một trong số ít ngoại lệ: được Tauric Research công bố mã nguồn mở cùng với một bài báo trên arXiv, hiện đã ở phiên bản 0.2.4 và cung cấp loại phân tách vai trò rõ ràng mà các framework khác mô tả nhưng hiếm khi triển khai. Hệ thống này mô phỏng một bàn nghiên cứu thực tế: các nhà phân tích cơ bản, tâm lý thị trường, tin tức và kỹ thuật cung cấp thông tin cho một cuộc tranh luận nghiên cứu giữa phe Mua/Bán, sau đó đến một Nhà giao dịch, rồi đến một ủy ban Quản lý Rủi ro, kết thúc bằng một quyết định có cấu trúc được ghi lại để kiểm toán.

Bài đánh giá này sẽ đi sâu vào những gì TradingAgents thực sự làm, những gì đã được phát hành trong v0.2.4, cách nó so sánh với LangGraph và CrewAI, và cách kiểm tra các lớp LLM và dữ liệu thị trường bên dưới bằng Apidog. Nếu bạn đã tìm hiểu sâu về lớp hợp đồng tác nhân, hướng dẫn agents.md của chúng tôi dành cho các nhóm API sẽ kết hợp tự nhiên với bài đăng này.

TL;DR (Tóm tắt)

TradingAgents thực sự là gì

Framework này là một package Python và CLI phân tách quy trình giao dịch thành các vai trò chuyên biệt. Mỗi vai trò là một tác nhân LLM được nhắc với mô tả công việc, được cấp quyền truy cập vào một bộ công cụ tập trung và được điều phối bởi LangGraph. Các quyết định chảy qua các giai đoạn: thu thập dữ liệu, tranh luận, quyết định, ghi nhật ký.

README mô tả đây là mã nghiên cứu, không phải lời khuyên đầu tư. Khung này rất quan trọng. Vấn đề là để nghiên cứu cách hợp tác đa tác nhân thay đổi kết quả so với các thiết lập một lời nhắc, chứ không phải để xuất một bot giao dịch sản xuất từ máy tính xách tay của bạn.

Điều thú vị từ góc độ kỹ thuật là sự phân tách vai trò rõ ràng đến mức nào. Nhà phân tích Cơ bản đánh giá tài chính công ty. Nhà phân tích Tâm lý thị trường chấm điểm mạng xã hội. Nhà phân tích Tin tức giám sát các chỉ số kinh tế vĩ mô. Nhà phân tích Kỹ thuật tính toán MACD và RSI. Các nhà nghiên cứu Mua và Bán tranh luận. Nhà giao dịch đọc báo cáo của mọi người và đưa ra quyết định. Quản lý Rủi ro kiểm tra quyết định dựa trên các ràng buộc. Mỗi tác nhân có một công việc và một bộ công cụ.

Đây là cùng một mẫu mà bạn sẽ thiết kế cho bất kỳ quy trình làm việc tác nhân phức tạp nào: vai trò chuyên biệt, giai đoạn tranh luận, giai đoạn ra quyết định và bước xác minh. TradingAgents là một triển khai tham chiếu hoạt động mà bạn có thể đọc trong một buổi chiều.

Những gì v0.2.4 đã mang lại

Bản phát hành tháng 4 năm 2026 có ý nghĩa đối với những người dùng tò mò về sản xuất.

Các tác nhân đầu ra có cấu trúc. Người quản lý nghiên cứu, Nhà giao dịch và Người quản lý danh mục đầu tư hiện phát ra đầu ra có cấu trúc thông qua OpenAI Responses API hoặc kênh sử dụng công cụ của Anthropic. Điều này thay thế việc phân tích văn bản tự do cũ bằng JSON có kiểu dữ liệu, giúp tự động hóa hạ nguồn đáng tin cậy.

Khả năng tiếp tục từ checkpoint của LangGraph. Các lần chạy dài có thể tạm dừng và khởi động lại từ một checkpoint đã lưu. Nếu một API dữ liệu thị trường bị giới hạn tốc độ hoặc một nhà cung cấp LLM trả về lỗi 429, lần chạy sẽ không bắt đầu lại từ đầu.

Nhật ký quyết định bền vững. Mọi quyết định mà Nhà giao dịch đưa ra đều được ghi vào nhật ký SQLite với lý do, đầu vào và dấu thời gian. Bạn có được một dấu vết kiểm toán mà bạn có thể xem xét hoặc đưa trở lại vào đánh giá.

Hỗ trợ đa nhà cung cấp. v0.2.4 đã thêm DeepSeek, Qwen, GLM và Azure OpenAI vào ma trận hiện có của OpenAI, Anthropic, Gemini và Grok. Nếu bạn muốn khả năng suy luận rẻ nhất trên mỗi token, bạn có thể chuyển sang DeepSeek V4 thông qua endpoint tương thích OpenAI của nó. Nếu bạn cần ngữ cảnh dài hoặc tầm nhìn, hãy chuyển sang Gemini.

Hỗ trợ Docker và sửa lỗi UTF-8 trên Windows. Có vẻ nhàm chán nhưng quan trọng: framework hiện đi kèm với một Dockerfile và lỗi mã hóa đường dẫn Windows từ v0.2.3 đã được khắc phục.

Kiến trúc tác nhân chi tiết

Một lần chạy TradingAgents hoàn chỉnh trông như thế này.

  1. CLI chấp nhận một mã chứng khoán và phạm vi ngày.
  2. Nhóm Nhà phân tích phân tán: mỗi trong bốn nhà phân tích độc lập tìm nạp dữ liệu cho mã chứng khoán và viết báo cáo.
  3. Nhóm Nghiên cứu nhận bốn báo cáo. Nhà nghiên cứu phe Mua viết một luận điểm dài. Nhà nghiên cứu phe Bán viết một luận điểm ngắn. Họ tranh luận.
  4. Người quản lý nghiên cứu tổng hợp cuộc tranh luận thành một khuyến nghị.
  5. Nhà giao dịch nhận khuyến nghị, kiểm tra với nhật ký quyết định bền vững và tạo ra một kế hoạch giao dịch.
  6. Nhóm Quản lý Rủi ro xem xét. Ba tác nhân rủi ro (Năng động, Thận trọng, Trung lập) phản đối kế hoạch từ các góc độ khác nhau.
  7. Người quản lý danh mục đầu tư hoặc phê duyệt hoặc gửi lại kế hoạch để xem xét lại.
  8. Quyết định cuối cùng được ghi vào nhật ký SQLite.

Phần lớn chi phí LLM nằm ở bước 3 và 6, nơi nhiều tác nhân tranh luận. Đây cũng là nơi các mô hình nhỏ bộc lộ điểm yếu: một mô hình 7B chạy cuộc tranh luận Mua/Bán tạo ra các lập luận ồn ào, lặp đi lặp lại. Một mô hình suy luận (chế độ tư duy của DeepSeek V4, GPT-5.5, Claude 4.5) tạo ra các cuộc đối thoại có cấu trúc giống như một cuộc họp nghiên cứu thực sự.

Tại sao nên kiểm tra lớp LLM bằng công cụ API

Khi bạn chạy TradingAgents, hai bề mặt có thể gặp lỗi trong sản xuất: các API dữ liệu thị trường (Yahoo Finance, FinnHub, Polygon, OpenBB) và các API nhà cung cấp LLM.

Phía dữ liệu thị trường khá lộn xộn. Các gói miễn phí có giới hạn tốc độ không nhất quán, các trường không được ghi lại xuất hiện và biến mất, và ranh giới ngày giao dịch khác nhau giữa các nhà cung cấp. Một lần chạy hoạt động vào thứ Ba có thể tự động hỏng vào thứ Tư vì một nhà cung cấp đã đổi tên regularMarketTime thành regular_market_time.

Phía LLM cũng lộn xộn, theo một cách khác. Chế độ tư duy của DeepSeek V4 làm tăng gấp đôi chi phí của bạn; OpenAI Responses API có những đặc điểm riêng; việc sử dụng công cụ của Anthropic trả về các khối nội dung mà một số trình phân tích hạ nguồn khó xử lý.

Cả hai bề mặt đều muốn điều tương tự từ bạn: một bộ sưu tập yêu cầu chuẩn có thể lưu, phát lại với các xác nhận. Đó chính xác là chức năng của Apidog. Chúng tôi đã trình bày cùng một mẫu kiểm thử ở cấp độ giao thức trong sổ tay kiểm thử máy chủ MCP.

Mô phỏng các API dữ liệu thị trường trong Apidog

Ba bước để loại bỏ sự không ổn định của nhà cung cấp khỏi các lần chạy thử nghiệm TradingAgents của bạn.

Bước 1: định nghĩa các endpoint upstream. Trong một dự án Apidog, hãy thêm các endpoint Yahoo Finance, FinnHub, Polygon hoặc OpenBB mà TradingAgents gọi. README cho mỗi thông số công cụ liệt kê các URL chính xác. Lưu mỗi endpoint dưới dạng một yêu cầu với các nội dung phản hồi mẫu được lấy từ các phản hồi thực.

Bước 2: bật máy chủ mô phỏng. Máy chủ mô phỏng của Apidog trả về các phản hồi mẫu trên cùng các đường dẫn URL mà nhà cung cấp thực sử dụng. Hướng cấu hình công cụ của TradingAgents đến URL mô phỏng. Nhà phân tích Cơ bản giờ đây chạy với dữ liệu xác định; các thử nghiệm của bạn không còn phụ thuộc vào giới hạn tốc độ của Yahoo.

Bước 3: nắm bắt sự thay đổi của nhà cung cấp. Mỗi tuần một lần, phát lại các endpoint trực tiếp và so sánh sự khác biệt về cấu trúc phản hồi với các mẫu đã lưu của bạn. Apidog làm nổi bật bất kỳ trường nào được thêm, xóa hoặc đổi tên. Đây là cách bạn phát hiện việc đổi tên regularMarketTime trước khi nó làm hỏng một lần chạy.

Chúng tôi sử dụng mẫu chính xác trong phát triển API theo hướng hợp đồng, mô tả quy trình làm việc rộng hơn.

Kiểm tra lớp nhà cung cấp LLM

Lớp nhà cung cấp cần ba điều được kiểm tra trước khi bạn tăng cường các lần chạy.

Chi phí trên mỗi vai trò. Chạy một mã chứng khoán duy nhất qua tất cả bốn nhà phân tích và cuộc tranh luận. Ghi lại số lượng token trên mỗi tác nhân trong nhật ký yêu cầu của Apidog. Cuộc tranh luận Mua/Bán thường tốn kém hơn 3-5 lần so với các nhà phân tích; nếu không, mô hình đang bị đoản mạch.

Cấu trúc đầu ra. Các tác nhân đầu ra có cấu trúc của v0.2.4 (Người quản lý nghiên cứu, Nhà giao dịch, Người quản lý danh mục đầu tư) phải luôn trả về JSON được định dạng tốt. Thêm các xác nhận JSONPath trong Apidog để xác minh. Một lỗi hồi quy ở đây là âm thầm và tàn khốc; bạn chỉ phát hiện ra khi mã hạ nguồn gặp sự cố.

Sự tương đồng giữa các nhà cung cấp. Khi bạn chuyển từ OpenAI sang DeepSeek V4 để kiểm tra chi phí, các quyết định của Nhà giao dịch có thể khác nhau trong từng lần chạy riêng lẻ nhưng sẽ hội tụ về các kết luận tương tự qua nhiều lần chạy. Chạy 50 mã chứng khoán qua cả hai nhà cung cấp, so sánh nhật ký quyết định bền vững và định lượng sự sai lệch. Hướng dẫn API DeepSeek V4 của chúng tôi bao gồm cấu trúc yêu cầu; hướng dẫn API GPT-5.5 của chúng tôi bao gồm phía OpenAI. Chức năng so sánh phản hồi của Apidog giúp việc so sánh trở nên trực quan.

Một lần chạy TradingAgents tối thiểu

Hướng dẫn nhanh của README trông đại khái như thế này.

git clone https://github.com/TauricResearch/TradingAgents
cd TradingAgents
pip install -r requirements.txt

export OPENAI_API_KEY="sk-..."
export FINNHUB_API_KEY="..."

python -m tradingagents.cli \
  --ticker AAPL \
  --date 2026-04-30 \
  --models gpt-5.5 \
  --rounds 2

Hai vòng tranh luận là lần chạy có ý nghĩa nhỏ nhất. Đầu ra được lưu vào tradingagents/results/ dưới dạng JSON cộng với tóm tắt quyết định định dạng markdown.

Để chuyển sang DeepSeek V4 Pro cho các vai trò đòi hỏi suy luận nhiều, hãy đặt cờ --models và trỏ client OpenAI đến URL cơ sở của DeepSeek thông qua cấu hình nhà cung cấp của framework:

export DEEPSEEK_API_KEY="sk-..."

python -m tradingagents.cli \
  --ticker AAPL \
  --date 2026-04-30 \
  --models deepseek-v4-pro \
  --provider deepseek \
  --rounds 2

Mẫu tương tự hoạt động với Qwen 3.6, GLM 5 hoặc bất kỳ mô hình cục bộ nào được phục vụ bởi Ollama hoặc vLLM. Bài đăng về các LLM cục bộ tốt nhất năm 2026 của chúng tôi đề cập đến phía phục vụ cục bộ.

Các lỗi thường gặp

Những điều này xuất hiện trong luồng vấn đề trên GitHub.

Apidog phù hợp ở đâu trong quy trình phát triển

Ba vị trí cụ thể mà Apidog thể hiện giá trị của mình trong một dự án TradingAgents.

Đầu tiên là bề mặt thiết kế. Trước khi bạn kết nối framework với các nhà cung cấp trực tiếp, hãy phác thảo từng endpoint dữ liệu thị trường trong Apidog dưới dạng một yêu cầu với các nội dung ví dụ. Chế độ xem schema buộc bạn phải trung thực về những trường nào framework thực sự sử dụng. Nhiều nhóm phát hiện ra rằng họ đang trả tiền cho một gói Polygon mà họ hầu như không sử dụng.

Thứ hai là CI cục bộ. Máy chủ mô phỏng của Apidog thay thế cho mọi nhà cung cấp trong khi các bài kiểm thử đơn vị chạy, do đó bộ kiểm thử duy trì dưới năm giây và không còn phụ thuộc vào giờ thị trường cuối tuần. Chúng tôi đã đề cập đến mẫu chính xác này trong kiểm thử API không cần Postman.

Thứ ba là so sánh hồi quy (regression diffing). Mỗi lần chạy hàng tuần, phát lại các endpoint trực tiếp so với các mẫu đã lưu của bạn. Apidog làm nổi bật việc đổi tên trường và sự sai lệch về cấu trúc. Đây là cảnh báo rẻ nhất có thể cho tình huống “lớp dữ liệu bị hỏng và các tác nhân bắt đầu tạo ra các con số ảo tưởng”

Tại sao điều này quan trọng ngoài lĩnh vực giao dịch

TradingAgents là ví dụ mã nguồn mở rõ ràng nhất về phân tách tác nhân mà chúng ta có hiện nay. Mẫu này có thể chuyển trực tiếp sang:

Nếu bạn đang thiết kế bất kỳ quy trình làm việc tác nhân nhiều bước nào, hãy đọc mã TradingAgents trước. Sự phân tách vai trò, giai đoạn tranh luận, các quyết định đầu ra có cấu trúc và nhật ký bền vững là những mẫu có thể tái sử dụng. Chúng cũng là những mẫu có thể kiểm thử, đó là lý do kết hợp framework này với Apidog.

Các trường hợp sử dụng trong thực tế

Một sinh viên nghiên cứu định lượng sử dụng TradingAgents để so sánh DeepSeek V4 với GPT-5.5 và Claude 4.5 trên cùng một rổ 30 mã chứng khoán. Apidog ghi lại mọi yêu cầu và phản hồi để việc so sánh có thể được tái tạo.

Một kỹ sư fintech sử dụng mẫu đa tác nhân (không phải mã giao dịch) để chạy đánh giá mã trên các dịch vụ nội bộ. Các tác nhân chuyên biệt kiểm tra bảo mật, hiệu suất, đặt tên. Một bộ tổng hợp viết bình luận PR. Tổng chi phí đánh giá cho mỗi PR: khoảng 0,04 đô la.

Một nhà phát triển độc lập chạy TradingAgents hàng đêm trên danh sách theo dõi 10 mã chứng khoán ghi lại mọi quyết định vào Postgres để kiểm tra sau này. Máy chủ mô phỏng Apidog thay thế cho các nhà cung cấp dữ liệu thị trường trực tiếp trong các lần chạy thử nghiệm cuối tuần.

Kết luận

TradingAgents là một ví dụ hoạt động, được kiến trúc tốt về cách xây dựng một hệ thống LLM đa tác nhân tạo ra các quyết định có cấu trúc thay vì trò chuyện. v0.2.4 làm cho nó trở nên gần gũi với sản xuất hơn: đầu ra có cấu trúc, tiếp tục từ checkpoint, dấu vết kiểm toán, hỗ trợ đa nhà cung cấp. Tất cả những điều đó đều không có ý nghĩa nếu bạn không thể kiểm tra các lớp LLM và dữ liệu thị trường bên dưới. Đó là nơi việc kết hợp nó với Apidog thể hiện giá trị của nó.

Năm điểm rút ra:

Bước tiếp theo: clone repo, chạy một mã chứng khoán duy nhất với LLM bạn ưa thích, và chuyển các cuộc gọi upstream qua một máy chủ mô phỏng Apidog. Bạn sẽ biết trong vòng một giờ liệu framework này có phù hợp với quy trình làm việc của bạn hay không.

Câu hỏi thường gặp

TradingAgents có an toàn để sử dụng với tiền thật không?

Repo nêu rõ đây là mã nghiên cứu và không phải lời khuyên tài chính. Hãy coi đầu ra của nó như một giả thuyết. Bất kỳ ai triển khai nó với một sàn môi giới trực tiếp đều tự chịu rủi ro cá nhân; những người duy trì không tán thành điều đó.

Nhà cung cấp LLM nào mang lại sự cân bằng tốt nhất giữa chi phí và chất lượng?

Đối với hầu hết các khối lượng công việc vào đầu năm 2026, DeepSeek V4 Flash với chế độ tư duy vượt trội hơn GPT-5.5 về chi phí một cách đáng kể và tương đương về chất lượng tranh luận Mua/Bán. Xem hướng dẫn API DeepSeek V4 của chúng tôi để biết cấu trúc yêu cầu.

Tôi có thể chạy TradingAgents trên các mô hình cục bộ không?

Có. v0.2.0 đã thêm hỗ trợ đa nhà cung cấp; Ollama, vLLM và LM Studio đều phục vụ các endpoint tương thích OpenAI mà framework sử dụng. Xem bài đăng về các LLM cục bộ tốt nhất năm 2026 của chúng tôi để biết lựa chọn mô hình.

Làm thế nào để tôi mô phỏng các API dữ liệu thị trường?

Định nghĩa từng endpoint của nhà cung cấp trong Apidog, bật máy chủ mô phỏng và trỏ cấu hình công cụ của framework đến URL mô phỏng. Mẫu tương tự được ghi lại trong các công cụ kiểm thử API dành cho kỹ sư QA.

Cấu hình phần cứng tối thiểu để chạy cái này là gì?

Nếu bạn đang gọi các LLM được lưu trữ (OpenAI, Anthropic, DeepSeek), bất kỳ máy tính xách tay nào có Python 3.10+ đều có thể chạy nó. Nếu bạn phục vụ các mô hình cục bộ, phần cứng tối thiểu theo dõi mô hình: một GPU 24 GB chạy DeepSeek V4 Flash hoặc Qwen 3.6 32B; một GPU 8 GB chạy Llama 5.1 8B. Chất lượng giảm với các mô hình nhỏ hơn.

Nó có hỗ trợ mô phỏng ngoài giờ và cuối tuần không?

Các nhà cung cấp dữ liệu thị trường trả về dữ liệu lịch sử; framework có thể chạy bất kỳ ngày nào bạn chọn. Giao dịch trực tiếp là một vấn đề khác mà framework này không giải quyết một cách rõ ràng.

Nó so sánh thế nào với các framework đa tác nhân khác?

TradingAgents được thiết kế đặc biệt cho lĩnh vực giao dịch. CrewAI, AutoGen và bản thân LangGraph là các framework đa năng. Nếu bạn muốn học mẫu này và áp dụng nó ở nơi khác, hãy đọc TradingAgents; nếu bạn muốn xây dựng một hệ thống tác nhân chung, hãy bắt đầu với mã LangGraph cơ bản.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API