Tóm tắt
GitHub sẽ bắt đầu sử dụng dữ liệu tương tác Copilot của bạn để đào tạo mô hình AI vào ngày 24 tháng 4 năm 2026. Các đoạn mã, cuộc trò chuyện và quyết định chấp nhận của bạn sẽ trở thành dữ liệu đào tạo trừ khi bạn tự mình từ chối. Thay đổi cài đặt của bạn tại github.com/settings/copilot trước thời hạn để giữ mã của bạn riêng tư.
Giới thiệu
Quy trình làm việc phát triển của bạn sắp trở thành dữ liệu đào tạo của người khác.
Vào ngày 24 tháng 4 năm 2026, chính sách Copilot cập nhật của GitHub sẽ có hiệu lực. Thay đổi này cho phép Microsoft và GitHub sử dụng mọi thứ bạn nhập vào Copilot: các đoạn mã, câu hỏi gỡ lỗi, yêu cầu tái cấu trúc, làm tài liệu đào tạo cho các mô hình AI thế hệ tiếp theo của họ. Điều này bao gồm cả mã độc quyền từ các kho lưu trữ riêng tư của công ty bạn.
Hầu hết các nhà phát triển sẽ không nhận được thông báo trực tiếp. Họ sẽ tiếp tục làm việc, không hề hay biết rằng tài sản trí tuệ của họ trở thành một phần của kho dữ liệu đào tạo của GitHub với mỗi lần tương tác với Copilot.
Nếu bạn quản lý một nhóm phát triển hoặc làm việc với các cơ sở mã nhạy cảm, hãy đánh dấu trang này và chia sẻ nó với trưởng nhóm kỹ thuật của bạn. Thời hạn từ chối sắp kết thúc.
Điều gì đã thay đổi trong chính sách Copilot của GitHub
Thông báo của GitHub định hình việc cập nhật chính sách này như một sự cải thiện để "cá nhân hóa và nâng cao" trải nghiệm Copilot. Việc sử dụng dữ liệu này vượt xa sự cá nhân hóa.
Lộ trình chính sách
Ngày 24 tháng 4 năm 2026 là ngày chính sách có hiệu lực. Sau ngày này, GitHub sẽ mặc định bạn đồng ý trừ khi bạn tự mình từ chối thông qua cài đặt tài khoản của mình.
Thông báo ban đầu nêu rõ GitHub sẽ sử dụng "dữ liệu tương tác" để đào tạo các mô hình AI trong tương lai. Ngôn ngữ này nghe có vẻ vô hại cho đến khi bạn xem xét "dữ liệu tương tác" bao gồm những gì.
Những gì GitHub thu thập
Dữ liệu tương tác Copilot của GitHub bao gồm:
Loại dữ liệu | Nội dung bao gồm | Rủi ro quyền riêng tư |
|---|---|---|
Đoạn mã | Bất kỳ mã nào bạn viết hoặc sửa đổi với sự hỗ trợ của Copilot | Thuật toán độc quyền, logic nghiệp vụ, tích hợp API |
Cuộc trò chuyện qua chat | Toàn bộ ngữ cảnh của các phiên Copilot Chat | Các quyết định kiến trúc, quy trình gỡ lỗi, thiết kế hệ thống |
Quyết định chấp nhận | Những gợi ý bạn chấp nhận hoặc từ chối | Tín hiệu đào tạo cho những gì cấu thành mã "tốt" |
Ngữ cảnh tệp | Mã xung quanh khi Copilot tạo gợi ý | Sơ đồ cơ sở dữ liệu, luồng xác thực, API nội bộ |
Mẫu sửa lỗi | Cách bạn sửa đổi đầu ra của Copilot | Tiêu chuẩn mã hóa và thực hành bảo mật của nhóm bạn |
Dữ liệu này đào tạo các mô hình thế hệ tiếp theo của GitHub. Sau khi được tích hợp, các mẫu mã của bạn trở thành một phần của trọng số mô hình và có thể xuất hiện trong các gợi ý cho người dùng khác, bao gồm cả đối thủ cạnh tranh.
Tại sao cài đặt mặc định lại quan trọng
Thông báo của GitHub sử dụng ngôn ngữ như "xem xét bản cập nhật này và quản lý tùy chọn của bạn". Cách diễn đạt này đặt gánh nặng lên người dùng trong việc tự tìm hiểu và kích hoạt các biện pháp bảo vệ quyền riêng tư.
Cài đặt mặc định sau ngày 24 tháng 4: đã chọn tham gia.
Cấu trúc này tạo ra cái mà các nhà nghiên cứu quyền riêng tư gọi là "mẫu tối" (dark patterns): các lựa chọn thiết kế khiến hành vi bảo vệ quyền riêng tư trở nên khó khăn trong khi việc chia sẻ dữ liệu lại dễ dàng. Hầu hết người dùng không bao giờ thay đổi các cài đặt mặc định, đặc biệt đối với các công cụ họ sử dụng hàng ngày.
Để dễ hình dung, khoảng 15-20% người dùng thường từ chối thu thập dữ liệu khi được trình bày các lựa chọn rõ ràng. Cách tiếp cận của GitHub giả định điều ngược lại: hơn 80% sẽ vẫn chọn tham gia theo mặc định.
Từng bước: Cách từ chối thu thập dữ liệu GitHub Copilot
Việc từ chối mất chưa đầy hai phút. Thực hiện theo các bước sau trước ngày 24 tháng 4.
Phương pháp 1: Cài đặt tài khoản cá nhân
Điều hướng đến cài đặt Copilot
- Truy cập github.com
- Nhấp vào biểu tượng hồ sơ của bạn (góc trên bên phải)
- Chọn "Settings" (Cài đặt) từ menu thả xuống
- Nhấp vào "Copilot" trong thanh bên trái

Tìm phần sử dụng dữ liệu
- Cuộn đến "Privacy" (Quyền riêng tư)
- Tìm tùy chọn có nhãn "Allow GitHub to use my data for AI model training" (Cho phép GitHub sử dụng dữ liệu của tôi để đào tạo mô hình AI)

- Tắt tùy chọn
- Xác minh rằng cài đặt hiển thị là đã tắt
Xác nhận thay đổi
- Có thể mất tới 30 phút để các thay đổi có hiệu lực.
- Khởi động lại trình soạn thảo mã của bạn để các thay đổi có hiệu lực ngay lập tức.
Phương pháp 2: Cài đặt toàn tổ chức (Dành cho Quản trị viên)
Nếu bạn quản lý một Tổ chức GitHub, bạn có thể áp dụng cài đặt từ chối cho tất cả các thành viên:
Truy cập cài đặt Tổ chức
- Truy cập trang chính của tổ chức bạn
- Nhấp vào "Settings" (Cài đặt) trong điều hướng tổ chức
- Chọn "Copilot" từ menu bên trái
Cấu hình chính sách dữ liệu
- Tìm "Copilot data usage policies" (Chính sách sử dụng dữ liệu Copilot)
- Chọn "Disable interaction data collection for all members" (Tắt thu thập dữ liệu tương tác cho tất cả thành viên)
- Lưu thay đổi
Thông báo cho nhóm của bạn
- Tài liệu hóa thay đổi chính sách trong wiki nội bộ của bạn
- Thông báo cho các nhà phát triển qua Slack hoặc email
- Thêm vào danh sách kiểm tra khi giới thiệu nhân viên mới
Các bước xác minh
Sau khi từ chối, hãy xác minh cài đặt của bạn đã có hiệu lực:
# Không có xác minh CLI, nhưng bạn có thể:
# 1. Kiểm tra trang cài đặt hiển thị đã bỏ chọn
# 2. Xem lại dữ liệu tải xuống của GitHub (Settings > Privacy > Download your data)
# 3. Theo dõi hành vi của Copilot để phát hiện bất kỳ thay đổi nàoQuan trọng: Việc từ chối không xóa dữ liệu đã được thu thập. Nó chỉ ngăn chặn việc thu thập trong tương lai kể từ thời điểm bạn thay đổi cài đặt.
Cân nhắc về Doanh nghiệp và Tuân thủ
Nếu bạn làm việc trong một ngành được quản lý hoặc xử lý dữ liệu khách hàng nhạy cảm, thay đổi chính sách của GitHub sẽ đưa ra các yếu tố rủi ro bổ sung.
Các ngành yêu cầu xem xét kỹ lưỡng hơn
Ngành | Quy định | Mối quan ngại |
|---|---|---|
Y tế | HIPAA | Lộ PHI qua bình luận mã hoặc tên biến |
Tài chính | SOC 2, GDPR | Logic giao dịch khách hàng, mẫu xử lý PII |
Chính phủ | FedRAMP, ITAR | Kiến trúc hệ thống mật, giao thức bảo mật |
Phần mềm dịch vụ cho doanh nghiệp (Enterprise SaaS) | Hợp đồng khách hàng | Thuật toán độc quyền, lợi thế cạnh tranh |
Những câu hỏi cần đặt ra cho nhóm pháp lý của bạn
Trước ngày 24 tháng 4, hãy sắp xếp một cuộc đánh giá với cố vấn pháp lý hoặc tuân thủ của bạn:
- Thỏa thuận MSA hiện tại của chúng ta với GitHub có đề cập đến việc sử dụng dữ liệu đào tạo AI không?
- Hợp đồng với khách hàng có cấm chia sẻ mã với các dịch vụ AI của bên thứ ba không?
- Có trách nhiệm pháp lý nào nếu mã độc quyền xuất hiện trong các gợi ý của đối thủ cạnh tranh không?
- Chúng ta có nên theo đuổi một thỏa thuận doanh nghiệp với các hạn chế dữ liệu rõ ràng không?
Các tùy chọn GitHub Enterprise
Khách hàng GitHub Enterprise có thể có thêm sức mạnh đàm phán. Liên hệ với đại diện tài khoản GitHub của bạn để thảo luận:
- Đảm bảo hợp đồng chống lại việc sử dụng dữ liệu đào tạo
- Các phiên bản mô hình riêng tư cho các khối lượng công việc được quy định
- Ghi nhật ký kiểm tra nâng cao để báo cáo tuân thủ
- Chính sách lưu giữ dữ liệu tùy chỉnh
Apidog cho quyền riêng tư trong phát triển API
Đối với các nhóm xây dựng và thử nghiệm API, quyền riêng tư không chỉ dừng lại ở việc hoàn thành mã. Apidog cung cấp một giải pháp thay thế ưu tiên quyền riêng tư cho các công cụ phát triển API dựa trên đám mây:
- Kiến trúc ưu tiên cục bộ: Thông số kỹ thuật API của bạn vẫn nằm trên máy của bạn
- Không đào tạo trên dữ liệu khách hàng: Apidog không sử dụng định nghĩa API của bạn để đào tạo mô hình
- Các tùy chọn tự lưu trữ: Chủ quyền dữ liệu hoàn toàn cho các môi trường được quy định
- Cộng tác nhóm mà không bị lộ: Chia sẻ thông số kỹ thuật nội bộ mà không cần quyền truy cập của bên thứ ba

Khi đánh giá các công cụ phát triển được hỗ trợ bởi AI, hãy hỏi: "Dữ liệu của tôi đi đâu và được sử dụng như thế nào?" Câu trả lời phải rõ ràng, được ghi lại và có tính ràng buộc pháp lý.
Điều gì xảy ra nếu bạn không từ chối
Sau ngày 24 tháng 4, nếu bạn vẫn chọn tham gia:
Mã của bạn đi vào quy trình đào tạo
- Dữ liệu tương tác được xử lý liên tục
- Không có thông báo khi dữ liệu của bạn được sử dụng
- Không có cơ chế yêu cầu xóa sau này
Các kịch bản rò rỉ tiềm ẩn
- Đối thủ cạnh tranh gợi ý Copilot với ngữ cảnh tương tự
- Mô hình của GitHub tạo ra các gợi ý giống mã của bạn
- Không có dấu vết kiểm toán nào cho thấy dữ liệu đào tạo nào đã ảnh hưởng đến đầu ra
Các vấn đề phức tạp về tuân thủ
- Các cuộc kiểm toán của khách hàng có thể gắn cờ việc sử dụng dữ liệu đào tạo AI
- Yêu cầu từ cơ quan quản lý cần lập bản đồ dữ liệu mà bạn không thể cung cấp
- Vi phạm hợp đồng có thể kích hoạt thông báo vi phạm
Bạn có thể từ chối sau này không?
Có, nhưng có những hạn chế:
- Dữ liệu tương lai: Ngừng thu thập từ nay về sau
- Dữ liệu lịch sử: Đã được tích hợp vào các mô hình; không đảm bảo xóa
- Đào tạo lại mô hình: Ngay cả khi bị xóa khỏi tập dữ liệu, trọng số mô hình vẫn giữ lại các mẫu đã học
Cách tiếp cận tốt nhất: từ chối trước ngày 24 tháng 4.
Kết luận
Thay đổi chính sách Copilot của GitHub có hiệu lực vào ngày 24 tháng 4. Dữ liệu tương tác của bạn: đoạn mã, cuộc trò chuyện, mẫu chấp nhận, sẽ trở thành tài liệu đào tạo cho các mô hình AI của GitHub trừ khi bạn tự mình từ chối.
Hai phút cần thiết để từ chối sẽ bảo vệ tài sản trí tuệ của bạn, mã độc quyền của nhóm bạn và vị thế tuân thủ của tổ chức bạn. Đừng đợi đến ngày 25 tháng 4 để phát hiện mã của bạn đã đào tạo trợ lý AI của đối thủ cạnh tranh.
Đối với các nhóm xây dựng API muốn có công cụ mạnh mẽ mà không phải đánh đổi quyền riêng tư, hãy khám phá Apidog: nền tảng phát triển API tất cả trong một giúp giữ thông số kỹ thuật của bạn riêng tư theo mặc định.
