ClawSweeper: Bot Codex của OpenClaw Phân Loại 7000 Vấn Đề GitHub Không Đóng Nhầm

OpenClaw, dự án trợ lý AI mã nguồn mở, đã tích lũy hơn 7.000 vấn đề và yêu cầu kéo mở (open issues and pull requests) tính đến tháng 4 năm 2026. Hầu hết các nhà bảo trì (maintainers) ở vị trí đó sẽ hoặc tuyên bố phá sản bộ theo dõi lỗi (bug-tracker bankruptcy) hoặc thuê một đội phân loại. Các nhà bảo trì OpenClaw đã xây dựng một bot thay thế. ClawSweeper hiện xem xét mọi vấn đề và PR đang mở theo lịch trình luân phiên, soạn thảo một đề xuất đóng do Codex tạo ra khi có bằng chứng mạnh mẽ, và áp dụng các hành động đóng đó thông qua một luồng thực thi riêng biệt chỉ chạy khi đề xuất vẫn còn hiệu lực.

Đây cũng là một nghiên cứu điển hình về sự kiềm chế. ClawSweeper không tự động đóng dựa trên phỏng đoán, không bao giờ chạm vào các mục do người bảo trì tạo ra, và từ chối áp dụng bất kỳ thay đổi nào nếu quá trình xem xét cơ bản để lại rác trong cây làm việc.

💡

Đối với các nhóm API đang chạy SDK mã nguồn mở song song với các sản phẩm thương mại của họ, thiết kế này là một tài liệu tham khảo hữu ích ngay cả khi bạn không bao giờ áp dụng chính bot đó. Nếu bạn duy trì tài liệu API công khai trong Apidog và nhân bản cùng một đặc tả OpenAPI vào một kho GitHub để cộng đồng đóng góp, bạn có lẽ đã chứng kiến các vấn đề cũ tồn đọng theo cùng một cách.

nút

Hướng dẫn này sẽ trình bày những gì ClawSweeper làm, cách ba luồng hoạt động cùng nhau, các quy tắc an toàn giúp nó không đóng những thứ không nên, và cấu hình Codex cung cấp sức mạnh cho mỗi lần xem xét. Để có thông tin nền về mô hình thực hiện công việc nặng nhọc, hãy xem GPT-5.5 là gì.

TL;DR

ClawSweeper là bot bảo trì của OpenClaw cho openclaw/openclaw, quét khoảng 7.000 mục đang mở theo lịch trình luân phiên.
Ba luồng: một bộ lập lịch chọn những gì cần xem xét, luồng xem xét soạn thảo các đề xuất đóng, luồng áp dụng thực thi chúng cứ sau 15 phút.
Codex với gpt-5.5, khả năng lý luận cao, cấp dịch vụ nhanh và thời gian chờ 10 phút cho mỗi mục sẽ viết các bản xem xét.
Các hành động đóng chỉ xảy ra trong sáu trường hợp hẹp: đã được triển khai, không thể tái tạo, trùng lặp, ngoài phạm vi, không mạch lạc hoặc cũ hơn 60 ngày.
Các mục do người bảo trì tạo, các mục có PR tham chiếu đang mở và các nhãn được bảo vệ không bao giờ bị tự động đóng.
Bot đã đóng tổng cộng 10.217 mục thông qua tự động hóa, nhưng tuần gần đây nhất cho thấy tỷ lệ đóng 0,1% trên mỗi lần xem xét; nó thiên về việc giữ các mục đang mở.
Giấy phép là MIT, ngăn xếp là TypeScript trên Node 24 với pnpm, và các hoạt động chạy thông qua một ứng dụng GitHub.

Vấn đề bảo trì mà ClawSweeper giải quyết

OpenClaw tự định nghĩa là "trợ lý AI cá nhân của bạn. Bất kỳ HĐH nào. Bất kỳ nền tảng nào. Theo phong cách tôm hùm." Định vị này đã thu hút một cộng đồng rộng lớn nhanh chóng: 3.546 vấn đề đang mở và 3.457 yêu cầu kéo đang mở tính đến ảnh chụp bảng điều khiển gần đây nhất vào ngày 27 tháng 4 năm 2026. Rất nhiều trong số các mục đó đề cập đến hành vi đã được sửa ba bản phát hành trước, trùng lặp các chủ đề cũ hơn hoặc mô tả các tính năng hiện phù hợp hơn với hệ sinh thái plugin và kỹ năng của OpenClaw hơn là với kho lõi.

Phân loại thủ công với số lượng lớn như vậy là không thực tế. Đóng sai cũng tốn kém, vì những người đóng góp cảm thấy bị bỏ qua sẽ ngừng đóng góp. ClawSweeper giải quyết vấn đề này bằng cách tách bước quyết định đóng cái gì khỏi bước thực thi hành động đóng, và bằng cách dành phần lớn năng lượng của mình cho những mục mà câu trả lời rõ ràng là trùng lặp hoặc không mạch lạc.

Ba luồng

ClawSweeper chia thành ba quy trình độc lập. Mỗi quy trình ghi nhật ký vào thư mục báo cáo riêng và có thể được tạm dừng mà không ảnh hưởng đến các quy trình khác.

Bộ lập lịch

Bộ lập lịch quyết định vấn đề và PR nào được xem xét và với tần suất nào. Từ README: "Các mục mới và hoạt động nhận được nhiều sự chú ý hơn; các mục cũ ít hoạt động hơn sẽ chuyển sang tần suất chậm hơn." Trên thực tế, điều đó có nghĩa là các mục nóng được xem xét mỗi giờ, các mục dưới 30 ngày tuổi hàng ngày và các vấn đề cũ hơn hàng tuần. Tần suất này là có chủ đích. Bạn muốn xem xét lại một báo cáo lỗi mới thường xuyên, phòng khi có thêm bằng chứng, và một báo cáo cũ hiếm khi, vì câu trả lời khó có thể thay đổi.

Luồng xem xét

Luồng xem xét là nơi Codex chứng tỏ giá trị của mình. ClawSweeper chọn một mục, xây dựng một phần ngữ cảnh (context shard) với tiêu đề, nội dung, bình luận và ảnh chụp nhanh trạng thái kho lưu trữ trên main, sau đó chuyển phần ngữ cảnh đó cho Codex. Codex trả về một báo cáo markdown có cấu trúc với một trong ba phán quyết: giữ mở, đóng vì X, hoặc bằng chứng không đủ. README thẳng thắn về phạm vi: "Xem xét chỉ là đề xuất. Nó không bao giờ đóng các mục."

Các báo cáo nằm trong items/ cho đến khi luồng áp dụng sử dụng chúng, và điều đó mang lại cho hệ thống tính năng an toàn của nó. Con người có thể đọc mọi đề xuất đóng trong kho lưu trữ trước khi nó được thực hiện.

Luồng áp dụng

Luồng áp dụng chạy cứ sau 15 phút. Nó duyệt qua items/, lấy báo cáo gần đây nhất cho mỗi vấn đề hoặc PR đang mở, và xác thực lại đề xuất: liệu báo cáo có còn nhất quán với trạng thái hiện tại của vấn đề không (không có bình luận mới, không có nhãn của người bảo trì, không có PR tham chiếu nào được mở trong giờ qua), và nó có đủ mới để hành động không? Nếu có, luồng áp dụng sẽ đóng mục đó, đăng lời giải thích do Codex tạo ra làm bình luận, và chuyển báo cáo vào closed/. Nếu có bất cứ điều gì thay đổi, báo cáo sẽ bị loại bỏ và bộ lập lịch sẽ xem xét lại mục đó trong lần chạy tiếp theo.

Sự phân chia này là lựa chọn thiết kế quan trọng nhất trong dự án. Codex không bao giờ chạm trực tiếp vào GitHub, và luồng áp dụng không bao giờ suy luận về mức độ xứng đáng để đóng; nó thực thi đề xuất trong các điều kiện mới.

Các quy tắc đóng

ClawSweeper chỉ đề xuất đóng đối với các mục thuộc một trong sáu nhóm hẹp, lấy trực tiếp từ README:

“đã được triển khai trên main hiện tại”
“không thể tái tạo trên main hiện tại”
“trùng lặp hoặc bị thay thế bởi một vấn đề/PR chính tắc”
“cụ thể nhưng không thể thực hiện trong kho mã nguồn này” (phù hợp hơn cho kỹ năng ClawHub hoặc công việc plugin)
“quá không mạch lạc đến mức không thể thực hiện hành động nào”
“vấn đề cũ hơn 60 ngày với quá ít dữ liệu để xác minh”

Mọi tình huống khác, bao gồm các lỗi có thể tái tạo, các yêu cầu tính năng hợp lệ, các bản tái tạo một phần và các công việc thực tế nhưng không được ưu tiên, đều giữ cho mục đó mở. Tỷ lệ đóng 0,1% trong lần xem xét gần đây nhất (4 đề xuất đóng trên 3.478 vấn đề được xem xét) cho bạn biết mức độ hung hăng của lời nhắc khi tránh các sai sót dương tính giả.

Một vài biện pháp bảo vệ được đặt lên trên các quy tắc đóng:

Các mục do người bảo trì tạo không bao giờ bị đóng. Nếu người bảo trì tạo một vấn đề, bot sẽ bỏ qua nó bất kể sự cũ kỹ.
PR tham chiếu đang mở chặn hành động đóng. Nếu vấn đề #4321 có một PR đang mở với Closes #4321 trong nội dung, ClawSweeper sẽ đợi.
Các nhãn được bảo vệ hoàn toàn bỏ qua bot. Gắn thẻ một vấn đề keep-open (hoặc bất kỳ danh sách nhãn nào mà người bảo trì cấu hình) và bộ lập lịch sẽ bỏ qua nó.

Cấu hình Codex

Cấu hình Codex là phần đáng giá nhất để bất kỳ nhóm nào xây dựng hệ thống tự động hóa của riêng mình đều có thể học hỏi:

gpt-5.5

Một vài chi tiết quan trọng ở đây. Chế độ lý luận cao phát hiện các bản trùng lặp mà một người thường thấy rõ sau hai mươi giây nhưng yêu cầu truy tìm năm luồng liên kết để xác minh. Cấp dịch vụ nhanh giúp chi phí có thể dự đoán được với lượng tồn đọng 7.000 mục. Thời gian chờ 10 phút là một lệnh chấm dứt cứng, không phải cảnh báo; một mục mất nhiều thời gian hơn sẽ bị bỏ qua cho lần chạy tiếp theo thay vì chặn hàng đợi.

Môi trường Codex cũng chạy mà không có mã thông báo ghi GitHub. README nêu rõ: "Các bản xem xét thất bại nếu Codex để lại các thay đổi được theo dõi hoặc không được theo dõi." Điều đó buộc người xem xét phải hành xử như một nhà phân tích chỉ đọc; bất kỳ tác dụng phụ nào cũng là lỗi, không phải tính năng.

Nếu bạn muốn sử dụng cùng một mô hình một cách tương tác trước khi kết nối nó vào một bot, CLI của Codex là con đường miễn phí dễ nhất đến GPT-5.5. Để biết mô hình chi phí cho truy cập API có lập trình, hãy xem bảng giá GPT-5.5 và hướng dẫn sử dụng API GPT-5.5.

Cài đặt cục bộ

Nhân bản (clone) ClawSweeper và chạy nó cục bộ rất đơn giản. Repo yêu cầu Node 24 và pnpm qua corepack:

git clone https://github.com/openclaw/clawsweeper.git
cd clawsweeper
source ~/.profile
corepack enable
pnpm install
pnpm run build

Một vài bí mật cần phải có trước khi các luồng bắt đầu:

OPENAI_API_KEY: xác thực Codex cho luồng xem xét.
CLAWSWEEPER_APP_ID: ID ứng dụng GitHub (3306130 cho cài đặt sản xuất).
CLAWSWEEPER_APP_PRIVATE_KEY: khóa riêng được sử dụng để tạo mã thông báo cài đặt có thời hạn ngắn.
OPENCLAW_GH_TOKEN: tùy chọn, sẽ quay lại sử dụng mã thông báo truy cập cá nhân khi đường dẫn Ứng dụng thất bại.

Bạn có thể chạy luồng xem xét đối với bất kỳ kho lưu trữ nào bạn sở hữu. Luồng áp dụng cố ý giới hạn các hoạt động ghi của mình đối với openclaw/openclaw trừ khi bạn cấu hình lại quyền của Ứng dụng GitHub.

Đối với các nhóm ưa thích khóa API trả phí nhưng muốn có cùng hành vi Codex, các con đường GPT-5.5 miễn phí phác thảo các lựa chọn thay thế thông qua tín dụng dùng thử hoặc cổng tổng hợp.

Ảnh chụp bảng điều khiển

README đi kèm với một bảng điều khiển công khai cập nhật sau mỗi lần áp dụng. Theo ảnh chụp gần đây nhất:

Tổng cộng 7.003 mục đang mở (3.546 vấn đề + 3.457 PR)
3.478 vấn đề được xem xét trong 7 ngày qua
4 đề xuất đóng vấn đề (0,1% trong số các vấn đề được xem xét)
Tổng cộng 10.217 mục đã được đóng tự động kể từ khi ra mắt

Con số 0,1% là một điều đáng nói. ClawSweeper không tối ưu hóa cho việc "hòm thư vấn đề bằng 0"; nó đang tối ưu hóa cho "không bao giờ đóng thứ gì mà người đóng góp sẽ bảo vệ nếu được hỏi." Với hơn 10.000 hành động đóng, lập trường bảo thủ đó là điều đã giữ cho dự án đủ đáng tin cậy để những người đóng góp tiếp tục mở các vấn đề mới.

Tại sao điều này quan trọng đối với các nhóm API

Hầu hết các sản phẩm API trên GitHub đều theo cùng một quỹ đạo như OpenClaw. SDK hoặc đặc tả nằm trong một kho lưu trữ công khai, trình theo dõi vấn đề đầy rẫy các báo cáo lỗi và yêu cầu tính năng hỗn hợp, và việc phân loại bị chậm trễ. Nếu bạn xuất bản một đặc tả OpenAPI từ Apidog và chấp nhận đóng góp từ cộng đồng trên GitHub, kiến trúc ClawSweeper có thể di động được. Các phần có giá trị không phải là các lời nhắc (prompts), vì chúng gắn liền với miền của OpenClaw. Các phần có giá trị là sự tách biệt luồng, các quy tắc đóng cứng rắn và chính sách chạy Codex mà không có quyền ghi.

Bạn có thể thực hiện cách tiếp cận tương tự trong ba bước:

Chạy một công việc xem xét do Codex điều khiển trên một mẫu của trình theo dõi của bạn. Yêu cầu nó tạo ra các báo cáo markdown mà không cần commit bất cứ điều gì.
Thêm các quy tắc an toàn: không bao giờ đóng các mục của người bảo trì, tôn trọng các nhãn được bảo vệ, ưu tiên các PR đang mở.
Chỉ thêm luồng áp dụng khi các báo cáo xem xét trông đúng khi được đọc bằng tay. Kết nối nó để đóng nhiều nhất một vài mục mỗi ngày cho đến khi niềm tin được xây dựng.

Nếu bạn đang xác thực bề mặt API mà các vấn đề đó mô tả, Apidog sẽ xử lý phía hợp đồng. Cùng một tài liệu OpenAPI điều khiển các máy chủ giả lập, các bài kiểm tra tự động và các tài liệu mà người đóng góp của bạn đọc trước khi gửi lỗi. Việc ghép nối một bot phân loại với một đặc tả được phiên bản hóa chặt chẽ thường cắt giảm một nửa tỷ lệ vấn đề trùng lặp trước khi bot chạy. Tải xuống Apidog nếu bạn muốn bắt đầu với kỷ luật đặc tả.

Giới hạn và các đánh đổi thiết kế

Một vài điều ClawSweeper cố ý không làm:

Nó không viết mã. Không có PR, không có bản vá, không có bình luận xem xét gợi ý sửa lỗi. Công việc đó thuộc về các bot OpenClaw khác.
Nó không lý luận về mức độ ưu tiên. Việc đóng là nhị phân; không có gì bị "giảm ưu tiên" hoặc gắn nhãn bởi bot.
Nó không học hỏi từ các hành động đóng trước đây. Mỗi lần xem xét bắt đầu mới từ main. Các quyết định trước đó chỉ hiển thị dưới dạng báo cáo lịch sử trong closed/, không phải dưới dạng dữ liệu tinh chỉnh.

Những đánh đổi này là lý do tại sao bot luôn có thể dự đoán được. Chúng cũng để lại chỗ cho các hệ thống tự động hóa liền kề, như bot gắn nhãn, bot gửi ping cho PR cũ hoặc bot soạn thảo ghi chú phát hành, mà không giẫm lên phạm vi hẹp của ClawSweeper.

FAQ

ClawSweeper đóng các vấn đề tự động với tần suất như thế nào?Luồng áp dụng chạy cứ sau 15 phút, nhưng hầu hết các chu kỳ không tạo ra hành động đóng nào. Tỷ lệ đóng 0,1% trên mỗi lần xem xét vào ngày 27 tháng 4 năm 2026 có nghĩa là khoảng 4 hành động đóng trên 3.478 vấn đề được xem xét trong một tuần. Để biết thông tin nền về mô hình đằng sau các bản xem xét, hãy xem GPT-5.5 là gì.

Tôi có thể chạy ClawSweeper trên kho lưu trữ của riêng mình không?Có. Sao chép kho lưu trữ, cấu hình Ứng dụng GitHub của riêng bạn với quyền đọc/ghi trên mục tiêu, và trỏ CLAWSWEEPER_APP_ID và CLAWSWEEPER_APP_PRIVATE_KEY vào đó. Xem xét các kho lưu trữ của người khác mặc định là chỉ đọc.

ClawSweeper có yêu cầu gói trả phí của OpenAI không?Luồng xem xét xác thực thông qua OPENAI_API_KEY, đây là một thông tin xác thực API trả phí. Nếu bạn chỉ muốn chạy các bản xem xét một cách tương tác thay vì ở quy mô lớn, CLI của Codex trên gói ChatGPT miễn phí vẫn hoạt động.

Điều gì ngăn Codex đóng các lỗi thực sự?Ba điều. Danh sách quy tắc đóng hẹp, các loại trừ của người bảo trì và nhãn được bảo vệ, và bước xác thực lại của luồng áp dụng sẽ loại bỏ bất kỳ đề xuất nào mà vấn đề cơ bản đã thay đổi kể từ khi xem xét.

ClawSweeper có phải là mã nguồn mở không?Có, được cấp phép MIT, với mã nguồn trên GitHub tại openclaw/clawsweeper. Dự án mẹ OpenClaw là một kho lưu trữ riêng biệt với hướng dẫn đóng góp riêng.