Context Engineering là gì: Giải thích rõ ràng

Bạn đã bao giờ tự hỏi tại sao trợ lý AI của mình đôi khi hoàn thành tốt một nhiệm vụ và đôi khi lại hoàn toàn bỏ lỡ mục tiêu chưa? Tiết lộ: không phải lúc nào cũng là do sự thông minh của AI—mà thường là do **ngữ cảnh** bạn cung cấp cho nó. Chào mừng bạn đến với thế giới của **Kỹ thuật Ngữ cảnh** (Context Engineering), người hùng thầm lặng trong việc xây dựng các hệ thống AI thông minh hơn, đáng tin cậy hơn. Trong hướng dẫn này, chúng ta sẽ khám phá ngữ cảnh là gì, **Kỹ thuật Ngữ cảnh** bao gồm những gì, nó khác biệt thế nào so với kỹ thuật nhắc lệnh (prompt engineering), vai trò của nó trong AI tác nhân (agentic AI), và một số kỹ thuật tuyệt vời để làm cho AI của bạn tỏa sáng. Hãy sẵn sàng, và cùng biến AI thành phép màu!

💡

Bạn muốn một công cụ kiểm thử API tuyệt vời có thể tạo ra Tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn, và thay thế Postman với mức giá phải chăng hơn nhiều!

button

Ngữ cảnh là gì?

Hãy tưởng tượng bạn đang nhờ một người bạn lên kế hoạch cho một bữa tiệc tối. Nếu bạn chỉ nói, “Lên kế hoạch bữa tối đi,” họ có thể bối rối—món Ý hay sushi? Ăn chay hay ăn thịt? Ở nhà bạn hay nhà hàng? Bây giờ, nếu bạn thêm, “Đó là cho câu lạc bộ sách ăn chay của tôi, tại nhà tôi, ngân sách 50 đô la,” người bạn của bạn sẽ có một bức tranh rõ ràng. Thông tin bổ sung đó? Đó chính là **ngữ cảnh**—những chi tiết nền tảng giúp một nhiệm vụ có thể thực hiện được.

Trong thế giới AI, ngữ cảnh là tất cả những gì mô hình “thấy” trước khi nó phản hồi. Nó không chỉ là lời nhắc của bạn (ví dụ: “Viết một tweet”). Nó bao gồm:

**Hướng dẫn hệ thống**: Các quy tắc như “Hành động như một gia sư thân thiện” hoặc “Chỉ xuất ra JSON.”
**Lời nhắc của người dùng**: Câu hỏi hoặc nhiệm vụ cụ thể, như “Tóm tắt bài viết này.”
**Lịch sử cuộc trò chuyện**: Các tương tác trong quá khứ để giữ mọi thứ mạch lạc.
**Dữ liệu bên ngoài**: Tài liệu, cơ sở dữ liệu hoặc kết quả API được cung cấp cho mô hình.
**Công cụ**: Quyền truy cập vào những thứ như tìm kiếm web hoặc máy tính.

Nếu không có ngữ cảnh phù hợp, ngay cả mô hình ngôn ngữ lớn (LLM) cao cấp nhất như Claude hay Gemini cũng giống như một đầu bếp không có nguyên liệu—hoàn toàn không biết gì. **Kỹ thuật Ngữ cảnh** là về việc sắp xếp thông tin này để giúp AI của bạn thành công.

Kỹ thuật Ngữ cảnh là gì?

Hãy hình dung **Kỹ thuật Ngữ cảnh** như nghệ thuật và khoa học xây dựng một “bản tóm tắt” hoàn hảo cho AI của bạn. Nó không phải là việc điều chỉnh một lời nhắc duy nhất để nghe có vẻ thông minh—mà là việc thiết kế một hệ thống cung cấp thông tin đúng, ở định dạng đúng, vào đúng thời điểm. Như Tobi Lutke, CEO của Shopify, đã nói, đó là “nghệ thuật cung cấp tất cả ngữ cảnh để nhiệm vụ có thể được giải quyết một cách hợp lý bởi LLM.”

Hãy nghĩ về cửa sổ ngữ cảnh của LLM như bộ nhớ ngắn hạn của nó (giống như RAM trong máy tính). Nó bị giới hạn—có thể là 8.000 hoặc 128.000 token—vì vậy bạn không thể chỉ đổ mọi thứ vào và hy vọng điều tốt nhất. **Kỹ thuật Ngữ cảnh** bao gồm việc lựa chọn, tổ chức và quản lý thông tin đó một cách chiến lược để làm cho phản hồi của AI chính xác, phù hợp và nhất quán. Nó giống như một đầu bếp chọn đúng gia vị cho món ăn, chứ không phải toàn bộ tủ đựng đồ ăn.

Tại sao điều này lại quan trọng? Bởi vì hầu hết các thất bại của AI không phải do mô hình “ngu ngốc.” Chúng là do **thất bại về ngữ cảnh**—dữ liệu bị thiếu, nhiễu không liên quan hoặc đầu vào được định dạng kém. Cho dù bạn đang xây dựng một chatbot, một trợ lý mã hóa hay một AI doanh nghiệp, **Kỹ thuật Ngữ cảnh** là chìa khóa để mở khóa hiệu suất đáng tin cậy.

Kỹ thuật Ngữ cảnh so với Kỹ thuật Nhắc lệnh

Bạn có thể đang nghĩ, “Đây chẳng phải là kỹ thuật nhắc lệnh với các bước bổ sung sao?” Không hẳn! Kỹ thuật nhắc lệnh giống như viết một hướng dẫn đơn lẻ, súc tích: “Viết một tweet giống Elon Musk.” Nó là một tập hợp con của **Kỹ thuật Ngữ cảnh**, vốn có cách tiếp cận rộng hơn, ở cấp độ hệ thống. Đây là cách chúng khác nhau:

**Kỹ thuật Nhắc lệnh**: Tập trung vào việc tạo ra các hướng dẫn một lần. Nó liên quan đến cách diễn đạt, như thêm “Suy nghĩ từng bước” để có được lý luận tốt hơn. Nó tuyệt vời cho các tác vụ nhanh chóng nhưng lại kém hiệu quả đối với các quy trình làm việc phức tạp, nhiều bước.
**Kỹ thuật Ngữ cảnh**: Thiết kế toàn bộ “hệ sinh thái thông tin” xung quanh mô hình. Nó bao gồm các lời nhắc nhưng cũng quản lý lịch sử cuộc trò chuyện, truy xuất dữ liệu bên ngoài, tích hợp công cụ và tối ưu hóa cửa sổ ngữ cảnh. Nó liên quan đến những gì mô hình *biết*, không chỉ những gì bạn *nói*.

Ví dụ, một chatbot được kỹ thuật nhắc lệnh có thể phản hồi “Đặt cuộc họp” bằng một câu trả lời chung chung. Một chatbot được kỹ thuật ngữ cảnh sẽ kéo lịch, sở thích nhóm và các cuộc họp trong quá khứ của bạn để đề xuất thời gian hoàn hảo. Kỹ thuật nhắc lệnh là một nốt nhạc đơn lẻ; **Kỹ thuật Ngữ cảnh** là cả một bản giao hưởng.

Kỹ thuật Ngữ cảnh cho các tác nhân AI

Các tác nhân AI—hãy nghĩ đến các bot tự động xử lý hỗ trợ khách hàng hoặc các tác vụ mã hóa—là nơi **Kỹ thuật Ngữ cảnh** thực sự phát huy sức mạnh của nó. Không giống như các chatbot đơn giản, các tác nhân xử lý các tác vụ nhiều bước, xử lý các công cụ và duy trì bộ nhớ qua các phiên. Nếu không có ngữ cảnh phù hợp, chúng giống như một GPS không có bản đồ.

Andrej Karpathy so sánh LLM với một CPU, với cửa sổ ngữ cảnh như RAM. **Kỹ thuật Ngữ cảnh** sắp xếp những gì đi vào RAM đó, đảm bảo các tác nhân có những gì họ cần ở mỗi bước. Ví dụ, một tác nhân hỗ trợ khách hàng có thể cần:

**Lịch sử người dùng**: Các yêu cầu trước đó để tránh lặp lại các giải pháp.
**Cơ sở tri thức**: Câu hỏi thường gặp hoặc hướng dẫn sử dụng để có câu trả lời chính xác.
**Công cụ**: Quyền truy cập vào CRM để kiểm tra trạng thái đơn hàng.

Ngữ cảnh kém dẫn đến “nhầm lẫn ngữ cảnh” (AI chọn sai công cụ) hoặc “nhiễm độc ngữ cảnh” (ảo giác được tái chế). **Kỹ thuật Ngữ cảnh** ngăn chặn những điều này bằng cách cập nhật ngữ cảnh một cách linh hoạt, lọc nhiễu và ưu tiên sự liên quan. Các công cụ như LangGraph (từ LangChain) giúp điều này dễ dàng hơn bằng cách cung cấp quyền kiểm soát chính xác đối với luồng ngữ cảnh trong các quy trình làm việc của tác nhân.

Hãy lấy một tác nhân mã hóa như Claude Code. Nó không chỉ tự động hoàn thành—nó cần ngữ cảnh về cơ sở mã của bạn, các cam kết gần đây và phong cách mã hóa. **Kỹ thuật Ngữ cảnh** đảm bảo nó kéo đúng tệp và định dạng chúng một cách dễ hiểu, biến nó thành một cộng tác viên thực sự.

Các kỹ thuật và chiến lược cho Kỹ thuật Ngữ cảnh

Vậy, làm thế nào để bạn thực sự *thực hiện* **Kỹ thuật Ngữ cảnh**? Hãy cùng phân tích bốn chiến lược chính—viết, chọn, nén và cô lập—Đây là bộ công cụ của bạn để tạo ra các hệ thống AI tuyệt vời.

1. Viết: Tạo và duy trì ngữ cảnh

Viết ngữ cảnh là về việc tạo và lưu thông tin bên ngoài cửa sổ ngữ cảnh để hướng dẫn AI. Điều này bao gồm:

**Lời nhắc hệ thống**: Xác định vai trò của AI, như “Bạn là trợ lý pháp lý” hoặc “Chỉ xuất ra JSON.” Hướng dẫn rõ ràng đặt ra tông điệu.
**Ghi chú**: Sử dụng một “sổ nháp” để lưu trữ các kế hoạch hoặc các bước trung gian. Ví dụ, nhà nghiên cứu đa tác nhân của Anthropic lưu chiến lược của mình vào bộ nhớ, đảm bảo nó tồn tại qua giới hạn cửa sổ ngữ cảnh.
**Ví dụ vài lần (Few-Shot Examples)**: Cung cấp các ví dụ đầu vào và đầu ra để cho AI thấy những gì bạn muốn. Ví dụ, bao gồm một tweet mẫu để hướng dẫn tông điệu.

Viết ngữ cảnh giống như để lại các ghi chú dán cho AI của bạn tham khảo sau này, giữ cho nó đi đúng hướng cho các tác vụ phức tạp.

2. Chọn: Truy xuất ngữ cảnh phù hợp

Chọn ngữ cảnh có nghĩa là chỉ lấy thông tin liên quan nhất. Quá nhiều nhiễu, AI sẽ bị phân tâm; quá ít, nó sẽ không được thông báo. Các kỹ thuật chính bao gồm:

**Tạo sinh được tăng cường truy xuất (RAG)**: Kéo các tài liệu liên quan từ cơ sở tri thức (ví dụ: một kho vector) bằng cách sử dụng tìm kiếm ngữ nghĩa. Ví dụ, một bot hỗ trợ truy xuất các câu hỏi thường gặp phù hợp với truy vấn của người dùng. RAG giảm ảo giác bằng cách đặt AI trên dữ liệu thực.
**Lựa chọn công cụ**: Sử dụng RAG để chọn đúng công cụ cho một tác vụ. Các nghiên cứu cho thấy điều này có thể tăng gấp ba lần độ chính xác lựa chọn công cụ bằng cách khớp các công cụ với ý định của truy vấn.
**Xếp hạng**: Sắp xếp ngữ cảnh theo mức độ liên quan hoặc độ mới. Đối với các tác vụ nhạy cảm về thời gian, ưu tiên dữ liệu mới hơn để tránh các phản hồi lỗi thời.

Chọn ngữ cảnh giống như sắp xếp một danh sách phát—bạn chọn những bản hit phù hợp với tâm trạng, chứ không phải mọi bài hát bạn có.

3. Nén: Đưa ngữ cảnh vào giới hạn

Cửa sổ ngữ cảnh là hữu hạn, vì vậy nén là rất quan trọng. Bạn không thể nhét cả một thư viện vào 32.000 token! Các kỹ thuật nén bao gồm:

**Tóm tắt**: Cô đọng các tài liệu dài hoặc lịch sử cuộc trò chuyện. Tính năng “tự động nén” của Claude Code tóm tắt các tương tác khi cửa sổ ngữ cảnh đạt 95%.
**Tóm tắt đệ quy**: Tóm tắt các bản tóm tắt để tiết kiệm nhiều không gian hơn, lý tưởng cho các cuộc trò chuyện dài.
**Cắt tỉa**: Cắt bỏ thông tin không liên quan hoặc dư thừa. Drew Breunig gọi đây là “cắt tỉa” để giữ cho ngữ cảnh gọn gàng và tập trung.
**Phân đoạn**: Chia các đầu vào lớn thành các phần nhỏ hơn để xử lý lặp lại, đảm bảo AI không bị nghẽn bởi dữ liệu lớn.

Nén giống như đóng gói một chiếc vali—bạn giữ những thứ cần thiết và bỏ lại những chiếc tất thừa.

4. Cô lập: Tránh xung đột ngữ cảnh

Cô lập ngữ cảnh ngăn chặn sự nhầm lẫn bằng cách giữ thông tin không liên quan riêng biệt. Điều này rất quan trọng đối với các hệ thống đa tác nhân hoặc các tác vụ nhiều lượt. Các kỹ thuật bao gồm:

**Ngữ cảnh mô-đun**: Gán ngữ cảnh cụ thể cho từng tác vụ hoặc tác nhân. Ví dụ, một tác nhân xử lý các truy vấn của người dùng, một tác nhân khác xử lý thanh toán, mỗi tác nhân có ngữ cảnh riêng.
**Phân vùng ngữ cảnh**: Tách bộ nhớ ngắn hạn (các cuộc trò chuyện gần đây) khỏi bộ nhớ dài hạn (tùy chọn người dùng) để tránh trùng lặp.
**Cô lập công cụ**: Giới hạn các công cụ cho những công cụ liên quan đến từng tác vụ để tránh “nhầm lẫn ngữ cảnh,” nơi AI chọn sai công cụ.

Cô lập ngữ cảnh giống như sắp xếp bàn làm việc của bạn—giữ bút trong một ngăn kéo và giấy tờ trong ngăn kéo khác để tránh lộn xộn.

Tại sao Kỹ thuật Ngữ cảnh lại quan trọng

**Kỹ thuật Ngữ cảnh** là tương lai của AI bởi vì nó chuyển trọng tâm từ việc tinh chỉnh mô hình sang thiết kế đầu vào. Khi LLM trở nên thông minh hơn, nút thắt cổ chai không phải là khả năng lý luận của chúng—mà là chất lượng ngữ cảnh của chúng. Đây là lý do tại sao nó lại quan trọng:

**Giảm ảo giác**: Đặt AI trên dữ liệu thực thông qua RAG giúp giảm các câu trả lời bịa đặt.
**Mở rộng quy mô cho sự phức tạp**: Các tác nhân xử lý các tác vụ nhiều bước cần ngữ cảnh động, được quản lý tốt để duy trì sự mạch lạc.
**Tiết kiệm chi phí**: Ngữ cảnh hiệu quả (thông qua nén và lựa chọn) giảm việc sử dụng token, giảm chi phí API.
**Cho phép cá nhân hóa**: Bộ nhớ dài hạn cho phép AI ghi nhớ sở thích của người dùng, làm cho các tương tác cảm thấy được cá nhân hóa.

Các framework như LangChain và LlamaIndex đang làm cho **Kỹ thuật Ngữ cảnh** dễ dàng hơn bằng cách cung cấp các công cụ cho RAG, quản lý bộ nhớ và chuỗi nhắc lệnh. Ví dụ, framework Workflows của LlamaIndex, chia các tác vụ thành các bước, mỗi bước có ngữ cảnh được tối ưu hóa, ngăn ngừa quá tải.

Thách thức và Con đường phía trước

**Kỹ thuật Ngữ cảnh** không phải không có những trở ngại. Cân bằng độ rộng (đủ thông tin) và sự liên quan (không có nhiễu) là điều khó khăn. Quá nhiều ngữ cảnh có nguy cơ gây “phân tâm ngữ cảnh,” nơi AI tập trung vào các chi tiết không liên quan. Quá ít, và nó sẽ không biết gì. Việc chấm điểm mức độ liên quan tự động (ví dụ: sử dụng BM25 hoặc độ tương đồng cosin) đang được nghiên cứu để giải quyết vấn đề này.

Một thách thức khác là chi phí tính toán. Việc lắp ráp ngữ cảnh theo thời gian thực—truy xuất, tóm tắt, định dạng—có thể chậm và tốn kém. Các kỹ sư phải tối ưu hóa độ trễ và khả năng mở rộng, đặc biệt đối với các hệ thống đa người dùng.

Nhìn về phía trước, **Kỹ thuật Ngữ cảnh** đang phát triển. Các mô hình trong tương lai có thể yêu cầu các định dạng ngữ cảnh cụ thể một cách linh hoạt, hoặc các tác nhân có thể tự kiểm tra ngữ cảnh của mình để tìm lỗi. Các mẫu ngữ cảnh tiêu chuẩn hóa (như JSON cho dữ liệu) có thể xuất hiện, làm cho các hệ thống AI có thể tương tác được. Như Andrej Karpathy nói, “Ngữ cảnh là bản cập nhật trọng số mới”—đó là cách chúng ta “lập trình” AI mà không cần đào tạo lại.

Kết luận

Phù, thật là một hành trình! **Kỹ thuật Ngữ cảnh** giống như trao cho AI của bạn một siêu năng lực: khả năng hiểu, lý luận và hành động với độ chính xác. Bằng cách sắp xếp ngữ cảnh phù hợp—thông qua việc viết, chọn, nén và cô lập—bạn biến một LLM chung chung thành một đối tác được tùy chỉnh, đáng tin cậy. Cho dù bạn đang xây dựng một chatbot, trợ lý mã hóa hay AI doanh nghiệp, việc nắm vững **Kỹ thuật Ngữ cảnh** là tấm vé để bạn đạt được hiệu suất cấp độ tiếp theo.

Sẵn sàng thử chưa? Bắt đầu từ những điều nhỏ: thêm một lời nhắc hệ thống rõ ràng, thử nghiệm với RAG, hoặc tóm tắt các đầu vào dài. Các công cụ như LangChain và LlamaIndex là những người bạn của bạn.

💡

button