Quy Trình Làm Việc Động Claude Code: Chạy Hàng Trăm Tiểu Tác Tử Song Song với Opus 4.8

Claude Opus 4.8 được phát hành với một tính năng nổi bật cho Claude Code: Quy trình làm việc động (Dynamic Workflows). Trong một phiên, một tác nhân điều phối (orchestrating agent) có thể tạo ra hàng trăm tác nhân phụ song song (parallel subagents) để giải quyết một nhiệm vụ lớn, phân nhánh: tái cấu trúc trên hàng chục tệp, chạy một ma trận thử nghiệm rộng lớn, hoặc khám phá nhiều lộ trình giải pháp cùng lúc. Nó trông như phép thuật trong terminal. Bên dưới, đó là hai thành phần cụ thể hoạt động cùng nhau.

Hướng dẫn này sẽ phân tích cách Quy trình làm việc động thực sự hoạt động, khi nào nên sử dụng chúng và cách xây dựng mô hình điều phối tương tự thông qua API thô. Đối với mô hình, hãy xem Claude Opus 4.8 là gì. Để biết thêm về kiến trúc tác nhân, bài phân tích kiến trúc khai thác tác nhân của Claude Code của chúng tôi là tài liệu bổ sung.

nút

Quy trình làm việc động thực sự là gì

Trong Claude Code, Quy trình làm việc động xuất hiện dưới dạng một chế độ gọi là ultracode trong menu effort. Đây là phần đáng để hiểu: ultracode không phải là một cấp độ effort API mới. Đó là sự kết hợp của hai điều đã tồn tại trong Opus 4.8:

Cấp độ effort xhigh
Thông báo hệ thống giữa cuộc trò chuyện (Mid-conversation system messages)

Kết hợp lại, những yếu tố đó mang lại cho một tác nhân điều phối cả chiều sâu lập luận để lập kế hoạch cho một công việc lớn và quyền cho phép khởi chạy các tác nhân làm việc khi công việc diễn ra. Đó là toàn bộ thủ thuật. Mọi thứ khác là cách nối dây (wiring) của Claude Code.

Thành phần 1: Cấp độ `effort` `xhigh`

Tham số effort kiểm soát số lượng token mà Opus 4.8 chi tiêu cho một phản hồi, bao gồm cả các cuộc gọi công cụ. xhigh là cấp độ mà Anthropic khuyến nghị cho công việc mã hóa và tác nhân dài hạn; nó được điều chỉnh cho các chạy kéo dài hơn 30 phút với ngân sách token lên đến hàng triệu.

Đối với Quy trình làm việc động, chiều sâu đó rất quan trọng vì tác nhân điều phối phải thực hiện lập kế hoạch thực sự: chia nhiệm vụ thành các đơn vị độc lập, quyết định số lượng tác nhân làm việc cần tạo và hợp nhất kết quả của chúng. Các cấp độ effort thấp hơn giới hạn phạm vi công việc và thực hiện ít cuộc gọi công cụ hơn, điều này trái ngược với những gì một tác nhân điều phối cần. Khi bạn chạy xhigh, hãy đặt một giá trị max_tokens lớn (64K là một điểm khởi đầu hợp lý) để mô hình có không gian để suy nghĩ và phối hợp.

Thành phần 2: Thông báo hệ thống giữa cuộc trò chuyện

Đây là khả năng API Messages mới giúp toàn bộ quá trình này trở nên khả thi. Trước Opus 4.8, một lời nhắc hệ thống (system prompt) nằm ở đầu cuộc trò chuyện và cố định. Bây giờ bạn có thể đặt một mục hệ thống ở giữa mảng messages, đưa vào các hướng dẫn hoặc quyền mới giữa nhiệm vụ.

Đó là điều cấp cho tác nhân điều phối quyền cho phép khởi chạy các quy trình làm việc đa tác nhân sau khi cuộc trò chuyện bắt đầu, thay vì phải đàm phán trước. Anthropic tài liệu hóa cơ chế này trong thông báo hệ thống giữa cuộc trò chuyện. Đó là một thay đổi nhỏ về API nhưng mang lại hậu quả lớn: các tác nhân giờ đây có thể có được các khả năng mới giữa quá trình chạy dựa trên những gì chúng khám phá.

Bật nó trong Claude Code

Trong Claude Code, Quy trình làm việc động nằm sau tùy chọn ultracode trong menu effort. Việc chọn nó sẽ đặt effort thành xhigh và cấp quyền cho phiên để tạo ra các tác nhân phụ song song thông qua thông báo hệ thống giữa cuộc trò chuyện. Từ đó, bạn mô tả một nhiệm vụ lớn và để tác nhân điều phối phân chia nó.

Một vài điều xảy ra tự động:

Claude lên kế hoạch cho nhiệm vụ và quyết định cách chia nhỏ nó
Nó khởi chạy các tác nhân làm việc song song, mỗi tác nhân được gán cho một phần của công việc
Kết quả được truyền về và hợp nhất vào phiên chính

Nếu bạn đã thiết lập Claude Code với một kế hoạch, hướng dẫn thiết lập Claude Agent SDK với Claude plan của chúng tôi bao gồm cấu hình xung quanh.

Khi nào nên sử dụng Quy trình làm việc động (và khi nào không nên)

Quy trình làm việc động tỏa sáng trong các công việc rộng lớn, có thể song song hóa:

Tái cấu trúc một mẫu trên nhiều tệp cùng lúc
Tạo và chạy một ma trận thử nghiệm lớn
Khám phá nhiều phương pháp triển khai song song, sau đó so sánh
Phân tích codebase quy mô lớn, trong đó mỗi tác nhân làm việc xử lý một mô-đun

Chúng là công cụ sai lầm cho các nhiệm vụ hẹp, tuần tự. Việc tạo ra hàng trăm tác nhân phụ cho một thay đổi trên một tệp sẽ đốt token mà không mang lại lợi ích nào, và các tác nhân làm việc song song không thể giúp ích khi mỗi bước phụ thuộc vào bước trước đó. Chi phí là có thật: hàng trăm tác nhân phụ xhigh có nghĩa là hàng triệu token. Hãy điều chỉnh mô hình phù hợp với hình dạng của công việc.

Xây dựng điều tương tự thông qua API

Bạn không cần Claude Code để xây dựng điều phối. Hai thành phần tương tự có sẵn trên Messages API thô, và Anthropic cung cấp một ví dụ đã làm trong xây dựng chế độ điều phối. Hình dạng là:

Chạy một cuộc gọi điều phối ở cấp độ effort xhigh để lên kế hoạch cho nhiệm vụ
Sử dụng thông báo hệ thống giữa cuộc trò chuyện để cấp quyền cho tác nhân điều phối điều động các tác nhân làm việc
Phân tán các cuộc gọi tác nhân làm việc song song, mỗi cuộc gọi được gán cho một đơn vị công việc
Thu thập kết quả và đưa chúng trở lại tác nhân điều phối để hợp nhất

import anthropic

client = anthropic.Anthropic()

orchestrator = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=64000,
    output_config={"effort": "xhigh"},
    thinking={"type": "adaptive"},
    messages=[
        {"role": "user", "content": "Plan a refactor of the auth module across all 14 services."},
    ],
)

Mỗi tác nhân làm việc là một cuộc gọi Messages riêng biệt mà bạn có thể chạy đồng thời, thường ở cấp độ effort thấp hơn vì công việc của nó hẹp. Nếu bạn đang cân nhắc điều này so với cơ sở hạ tầng tác nhân được lưu trữ của Anthropic, hướng dẫn tác nhân được quản lý so với Agent SDK sẽ trình bày các đánh đổi.

Chi phí và kiểm soát

Các tác nhân phụ song song làm tăng nhanh chi phí token. Một Quy trình làm việc động khởi chạy 200 tác nhân làm việc, mỗi tác nhân chi tiêu hàng chục nghìn token ở cấp độ xhigh, sẽ tốn kém thực sự. Ba thói quen giúp duy trì sự hợp lý:

Giới hạn phạm vi tác nhân làm việc chặt chẽ và chạy chúng ở cấp độ effort medium hoặc low khi tác vụ phụ cho phép
Giới hạn max_tokens cho mỗi tác nhân làm việc để một tác nhân chạy quá mức không thể làm cạn kiệt ngân sách của bạn
Lưu trữ bộ đệm ngữ cảnh chung để lời nhắc hệ thống lặp lại không bị tính phí đầy đủ cho mỗi tác nhân làm việc

Phân tích giá của Opus 4.8 có các phép tính về cấp độ effort và bộ đệm. Tóm lại: điều phối rất mạnh mẽ, nhưng hóa đơn sẽ tăng theo số lượng tác nhân, vì vậy hãy coi việc song song hóa là một lựa chọn có chủ ý.

Kiểm tra quá trình điều phối của bạn với Apidog

Khi bạn xây dựng điều phối thông qua API, phần khó gỡ lỗi là quá trình phân tán (fan-out): liệu các tác nhân làm việc có nhận được ngữ cảnh được giới hạn đúng cách không, phản hồi của chúng có đúng định dạng mà bước hợp nhất của bạn mong đợi không, và thông báo hệ thống giữa cuộc trò chuyện của bạn có được gửi đúng cách không? Bạn không muốn phát hiện ra lỗi sau 200 cuộc gọi tác nhân làm việc trực tiếp.

Apidog cho phép bạn kiểm tra từng phần riêng biệt:

Lưu yêu cầu điều phối và kiểm tra phân tích nhiệm vụ đã lên kế hoạch trước khi bạn điều động bất cứ điều gì
Giả lập điểm cuối của tác nhân làm việc để bạn có thể kiểm tra logic phân tán và hợp nhất của mình mà không tốn token cho hàng trăm cuộc gọi thực
Thêm các xác nhận về định dạng phản hồi của tác nhân làm việc để một tải trọng lệch lạc sẽ thất bại rõ ràng
Phát lại một cuộc gọi tác nhân làm việc duy nhất ở các cấp độ effort khác nhau để điều chỉnh chi phí cho mỗi tác nhân làm việc

Tải xuống Apidog, xây dựng các yêu cầu điều phối và tác nhân làm việc đối với https://api.anthropic.com/v1/messages, và xác thực vòng lặp trên các mock trước. Hướng dẫn API Opus 4.8 có yêu cầu cơ bản để bắt đầu. Khi logic đã ổn định trên các mock, hãy chuyển sang điểm cuối trực tiếp.

nút

Câu hỏi thường gặp

Quy trình làm việc động trong Claude Code là gì? Một tính năng cho phép một phiên khởi chạy hàng trăm tác nhân phụ song song để xử lý các nhiệm vụ lớn, phân nhánh. Nó được hỗ trợ bởi cấp độ effort xhigh cùng với thông báo hệ thống giữa cuộc trò chuyện trên Opus 4.8.

Ultracode có phải là một cấp độ effort riêng biệt không? Không. Ultracode là tên mà Claude Code đặt cho cấp độ effort xhigh kết hợp với quyền cho phép khởi chạy các quy trình làm việc đa tác nhân. Các cấp độ effort của API vẫn là low, medium, high, xhigh và max.

Thông báo hệ thống giữa cuộc trò chuyện là gì? Một thay đổi API Messages trong Opus 4.8 cho phép bạn đặt một mục hệ thống ở giữa cuộc trò chuyện, đưa vào các hướng dẫn hoặc quyền mới giữa nhiệm vụ. Đó là điều cho phép tác nhân điều phối tạo ra các tác nhân làm việc sau khi một quá trình chạy bắt đầu.

Tôi có thể xây dựng Quy trình làm việc động mà không cần Claude Code không? Có. Sử dụng cấp độ effort xhigh cùng với thông báo hệ thống giữa cuộc trò chuyện trên Messages API thô. Anthropic công bố một ví dụ điều phối đã làm trong tài liệu của họ.

Quy trình làm việc động có tốn kém không? Có thể. Hàng trăm tác nhân phụ xhigh cộng lại thành hàng triệu token. Giới hạn phạm vi tác nhân làm việc chặt chẽ, giảm cấp độ effort của chúng nếu có thể, và lưu trữ bộ đệm ngữ cảnh chung để kiểm soát chi phí.

Khi nào tôi nên tránh Quy trình làm việc động? Đối với các nhiệm vụ hẹp hoặc tuần tự nghiêm ngặt. Các tác nhân làm việc song song không mang lại giá trị nào khi mỗi bước phụ thuộc vào bước trước đó, và chúng lãng phí token cho các công việc nhỏ.