Context Engineering là gì: Giải thích rõ ràng

Ashley Goolam

Ashley Goolam

10 tháng 7 2025

Context Engineering là gì: Giải thích rõ ràng

Bạn đã bao giờ tự hỏi tại sao trợ lý AI của mình đôi khi hoàn thành tốt một nhiệm vụ và đôi khi lại hoàn toàn bỏ lỡ mục tiêu chưa? Tiết lộ: không phải lúc nào cũng là do sự thông minh của AI—mà thường là do **ngữ cảnh** bạn cung cấp cho nó. Chào mừng bạn đến với thế giới của **Kỹ thuật Ngữ cảnh** (Context Engineering), người hùng thầm lặng trong việc xây dựng các hệ thống AI thông minh hơn, đáng tin cậy hơn. Trong hướng dẫn này, chúng ta sẽ khám phá ngữ cảnh là gì, **Kỹ thuật Ngữ cảnh** bao gồm những gì, nó khác biệt thế nào so với kỹ thuật nhắc lệnh (prompt engineering), vai trò của nó trong AI tác nhân (agentic AI), và một số kỹ thuật tuyệt vời để làm cho AI của bạn tỏa sáng. Hãy sẵn sàng, và cùng biến AI thành phép màu!

💡
Bạn muốn một công cụ kiểm thử API tuyệt vời có thể tạo ra Tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn, và thay thế Postman với mức giá phải chăng hơn nhiều!
button

Ngữ cảnh là gì?

Hãy tưởng tượng bạn đang nhờ một người bạn lên kế hoạch cho một bữa tiệc tối. Nếu bạn chỉ nói, “Lên kế hoạch bữa tối đi,” họ có thể bối rối—món Ý hay sushi? Ăn chay hay ăn thịt? Ở nhà bạn hay nhà hàng? Bây giờ, nếu bạn thêm, “Đó là cho câu lạc bộ sách ăn chay của tôi, tại nhà tôi, ngân sách 50 đô la,” người bạn của bạn sẽ có một bức tranh rõ ràng. Thông tin bổ sung đó? Đó chính là **ngữ cảnh**—những chi tiết nền tảng giúp một nhiệm vụ có thể thực hiện được.

Trong thế giới AI, ngữ cảnh là tất cả những gì mô hình “thấy” trước khi nó phản hồi. Nó không chỉ là lời nhắc của bạn (ví dụ: “Viết một tweet”). Nó bao gồm:

Nếu không có ngữ cảnh phù hợp, ngay cả mô hình ngôn ngữ lớn (LLM) cao cấp nhất như Claude hay Gemini cũng giống như một đầu bếp không có nguyên liệu—hoàn toàn không biết gì. **Kỹ thuật Ngữ cảnh** là về việc sắp xếp thông tin này để giúp AI của bạn thành công.

what is context

Kỹ thuật Ngữ cảnh là gì?

Hãy hình dung **Kỹ thuật Ngữ cảnh** như nghệ thuật và khoa học xây dựng một “bản tóm tắt” hoàn hảo cho AI của bạn. Nó không phải là việc điều chỉnh một lời nhắc duy nhất để nghe có vẻ thông minh—mà là việc thiết kế một hệ thống cung cấp thông tin đúng, ở định dạng đúng, vào đúng thời điểm. Như Tobi Lutke, CEO của Shopify, đã nói, đó là “nghệ thuật cung cấp tất cả ngữ cảnh để nhiệm vụ có thể được giải quyết một cách hợp lý bởi LLM.”

Hãy nghĩ về cửa sổ ngữ cảnh của LLM như bộ nhớ ngắn hạn của nó (giống như RAM trong máy tính). Nó bị giới hạn—có thể là 8.000 hoặc 128.000 token—vì vậy bạn không thể chỉ đổ mọi thứ vào và hy vọng điều tốt nhất. **Kỹ thuật Ngữ cảnh** bao gồm việc lựa chọn, tổ chức và quản lý thông tin đó một cách chiến lược để làm cho phản hồi của AI chính xác, phù hợp và nhất quán. Nó giống như một đầu bếp chọn đúng gia vị cho món ăn, chứ không phải toàn bộ tủ đựng đồ ăn.

Tại sao điều này lại quan trọng? Bởi vì hầu hết các thất bại của AI không phải do mô hình “ngu ngốc.” Chúng là do **thất bại về ngữ cảnh**—dữ liệu bị thiếu, nhiễu không liên quan hoặc đầu vào được định dạng kém. Cho dù bạn đang xây dựng một chatbot, một trợ lý mã hóa hay một AI doanh nghiệp, **Kỹ thuật Ngữ cảnh** là chìa khóa để mở khóa hiệu suất đáng tin cậy.

Kỹ thuật Ngữ cảnh so với Kỹ thuật Nhắc lệnh

Bạn có thể đang nghĩ, “Đây chẳng phải là kỹ thuật nhắc lệnh với các bước bổ sung sao?” Không hẳn! Kỹ thuật nhắc lệnh giống như viết một hướng dẫn đơn lẻ, súc tích: “Viết một tweet giống Elon Musk.” Nó là một tập hợp con của **Kỹ thuật Ngữ cảnh**, vốn có cách tiếp cận rộng hơn, ở cấp độ hệ thống. Đây là cách chúng khác nhau:

Ví dụ, một chatbot được kỹ thuật nhắc lệnh có thể phản hồi “Đặt cuộc họp” bằng một câu trả lời chung chung. Một chatbot được kỹ thuật ngữ cảnh sẽ kéo lịch, sở thích nhóm và các cuộc họp trong quá khứ của bạn để đề xuất thời gian hoàn hảo. Kỹ thuật nhắc lệnh là một nốt nhạc đơn lẻ; **Kỹ thuật Ngữ cảnh** là cả một bản giao hưởng.

Kỹ thuật Ngữ cảnh cho các tác nhân AI

Các tác nhân AI—hãy nghĩ đến các bot tự động xử lý hỗ trợ khách hàng hoặc các tác vụ mã hóa—là nơi **Kỹ thuật Ngữ cảnh** thực sự phát huy sức mạnh của nó. Không giống như các chatbot đơn giản, các tác nhân xử lý các tác vụ nhiều bước, xử lý các công cụ và duy trì bộ nhớ qua các phiên. Nếu không có ngữ cảnh phù hợp, chúng giống như một GPS không có bản đồ.

Andrej Karpathy so sánh LLM với một CPU, với cửa sổ ngữ cảnh như RAM. **Kỹ thuật Ngữ cảnh** sắp xếp những gì đi vào RAM đó, đảm bảo các tác nhân có những gì họ cần ở mỗi bước. Ví dụ, một tác nhân hỗ trợ khách hàng có thể cần:

Ngữ cảnh kém dẫn đến “nhầm lẫn ngữ cảnh” (AI chọn sai công cụ) hoặc “nhiễm độc ngữ cảnh” (ảo giác được tái chế). **Kỹ thuật Ngữ cảnh** ngăn chặn những điều này bằng cách cập nhật ngữ cảnh một cách linh hoạt, lọc nhiễu và ưu tiên sự liên quan. Các công cụ như LangGraph (từ LangChain) giúp điều này dễ dàng hơn bằng cách cung cấp quyền kiểm soát chính xác đối với luồng ngữ cảnh trong các quy trình làm việc của tác nhân.

context engineering for agents

Hãy lấy một tác nhân mã hóa như Claude Code. Nó không chỉ tự động hoàn thành—nó cần ngữ cảnh về cơ sở mã của bạn, các cam kết gần đây và phong cách mã hóa. **Kỹ thuật Ngữ cảnh** đảm bảo nó kéo đúng tệp và định dạng chúng một cách dễ hiểu, biến nó thành một cộng tác viên thực sự.

Các kỹ thuật và chiến lược cho Kỹ thuật Ngữ cảnh

Vậy, làm thế nào để bạn thực sự *thực hiện* **Kỹ thuật Ngữ cảnh**? Hãy cùng phân tích bốn chiến lược chính—viết, chọn, nén và cô lập—Đây là bộ công cụ của bạn để tạo ra các hệ thống AI tuyệt vời.

techniques

1. Viết: Tạo và duy trì ngữ cảnh

Viết ngữ cảnh là về việc tạo và lưu thông tin bên ngoài cửa sổ ngữ cảnh để hướng dẫn AI. Điều này bao gồm:

Viết ngữ cảnh giống như để lại các ghi chú dán cho AI của bạn tham khảo sau này, giữ cho nó đi đúng hướng cho các tác vụ phức tạp.

write

2. Chọn: Truy xuất ngữ cảnh phù hợp

Chọn ngữ cảnh có nghĩa là chỉ lấy thông tin liên quan nhất. Quá nhiều nhiễu, AI sẽ bị phân tâm; quá ít, nó sẽ không được thông báo. Các kỹ thuật chính bao gồm:

Chọn ngữ cảnh giống như sắp xếp một danh sách phát—bạn chọn những bản hit phù hợp với tâm trạng, chứ không phải mọi bài hát bạn có.

3. Nén: Đưa ngữ cảnh vào giới hạn

Cửa sổ ngữ cảnh là hữu hạn, vì vậy nén là rất quan trọng. Bạn không thể nhét cả một thư viện vào 32.000 token! Các kỹ thuật nén bao gồm:

Nén giống như đóng gói một chiếc vali—bạn giữ những thứ cần thiết và bỏ lại những chiếc tất thừa.

compress

4. Cô lập: Tránh xung đột ngữ cảnh

Cô lập ngữ cảnh ngăn chặn sự nhầm lẫn bằng cách giữ thông tin không liên quan riêng biệt. Điều này rất quan trọng đối với các hệ thống đa tác nhân hoặc các tác vụ nhiều lượt. Các kỹ thuật bao gồm:

Cô lập ngữ cảnh giống như sắp xếp bàn làm việc của bạn—giữ bút trong một ngăn kéo và giấy tờ trong ngăn kéo khác để tránh lộn xộn.

isolate

Tại sao Kỹ thuật Ngữ cảnh lại quan trọng

**Kỹ thuật Ngữ cảnh** là tương lai của AI bởi vì nó chuyển trọng tâm từ việc tinh chỉnh mô hình sang thiết kế đầu vào. Khi LLM trở nên thông minh hơn, nút thắt cổ chai không phải là khả năng lý luận của chúng—mà là chất lượng ngữ cảnh của chúng. Đây là lý do tại sao nó lại quan trọng:

Các framework như LangChain và LlamaIndex đang làm cho **Kỹ thuật Ngữ cảnh** dễ dàng hơn bằng cách cung cấp các công cụ cho RAG, quản lý bộ nhớ và chuỗi nhắc lệnh. Ví dụ, framework Workflows của LlamaIndex, chia các tác vụ thành các bước, mỗi bước có ngữ cảnh được tối ưu hóa, ngăn ngừa quá tải.

Thách thức và Con đường phía trước

**Kỹ thuật Ngữ cảnh** không phải không có những trở ngại. Cân bằng độ rộng (đủ thông tin) và sự liên quan (không có nhiễu) là điều khó khăn. Quá nhiều ngữ cảnh có nguy cơ gây “phân tâm ngữ cảnh,” nơi AI tập trung vào các chi tiết không liên quan. Quá ít, và nó sẽ không biết gì. Việc chấm điểm mức độ liên quan tự động (ví dụ: sử dụng BM25 hoặc độ tương đồng cosin) đang được nghiên cứu để giải quyết vấn đề này.

Một thách thức khác là chi phí tính toán. Việc lắp ráp ngữ cảnh theo thời gian thực—truy xuất, tóm tắt, định dạng—có thể chậm và tốn kém. Các kỹ sư phải tối ưu hóa độ trễ và khả năng mở rộng, đặc biệt đối với các hệ thống đa người dùng.

Nhìn về phía trước, **Kỹ thuật Ngữ cảnh** đang phát triển. Các mô hình trong tương lai có thể yêu cầu các định dạng ngữ cảnh cụ thể một cách linh hoạt, hoặc các tác nhân có thể tự kiểm tra ngữ cảnh của mình để tìm lỗi. Các mẫu ngữ cảnh tiêu chuẩn hóa (như JSON cho dữ liệu) có thể xuất hiện, làm cho các hệ thống AI có thể tương tác được. Như Andrej Karpathy nói, “Ngữ cảnh là bản cập nhật trọng số mới”—đó là cách chúng ta “lập trình” AI mà không cần đào tạo lại.

Kết luận

Phù, thật là một hành trình! **Kỹ thuật Ngữ cảnh** giống như trao cho AI của bạn một siêu năng lực: khả năng hiểu, lý luận và hành động với độ chính xác. Bằng cách sắp xếp ngữ cảnh phù hợp—thông qua việc viết, chọn, nén và cô lập—bạn biến một LLM chung chung thành một đối tác được tùy chỉnh, đáng tin cậy. Cho dù bạn đang xây dựng một chatbot, trợ lý mã hóa hay AI doanh nghiệp, việc nắm vững **Kỹ thuật Ngữ cảnh** là tấm vé để bạn đạt được hiệu suất cấp độ tiếp theo.

Sẵn sàng thử chưa? Bắt đầu từ những điều nhỏ: thêm một lời nhắc hệ thống rõ ràng, thử nghiệm với RAG, hoặc tóm tắt các đầu vào dài. Các công cụ như LangChain và LlamaIndex là những người bạn của bạn.

💡
Bạn muốn một công cụ kiểm thử API tuyệt vời có thể tạo ra Tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn, và thay thế Postman với mức giá phải chăng hơn nhiều!
button

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API