Hướng Dẫn Sử Dụng Claude-mem để Lưu Trữ Bộ Nhớ Trong Code Claude

Ashley Goolam

Ashley Goolam

4 tháng 2 2026

Hướng Dẫn Sử Dụng Claude-mem để Lưu Trữ Bộ Nhớ Trong Code Claude

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

Điều gì sẽ xảy ra nếu trợ lý AI của bạn ghi nhớ mọi quyết định kiến trúc, sửa lỗi và phiên tái cấu trúc trong suốt nhiều tuần phát triển? Claude-mem loại bỏ sự gián đoạn do mất ngữ cảnh bằng cách tự động ghi lại các quan sát về việc sử dụng công cụ, nén chúng thành các tóm tắt ngữ nghĩa và đưa lịch sử liên quan vào mỗi phiên Claude Code mới.

Vấn đề: Mất trí nhớ ngữ cảnh trong phát triển hỗ trợ bởi AI

Mỗi phiên Claude Code bắt đầu như một trang giấy trắng. Khi bạn đóng terminal hoặc ngắt kết nối khỏi phiên, Claude quên mọi thứ; cấu trúc dự án của bạn, các quyết định tái cấu trúc gần đây, các phát hiện gỡ lỗi và các mẫu kiến trúc. Điều này buộc bạn phải lặp đi lặp lại việc giải thích cơ sở mã của mình, tiêu tốn token vào ngữ cảnh dư thừa và phá vỡ sự liên tục của quy trình làm việc.

Các nhà phát triển hiện đang khắc phục điều này bằng cách tự duy trì các tệp CLAUDE.md, ghi chú vào các tài liệu riêng biệt hoặc giải thích lại ngữ cảnh dự án khi bắt đầu mỗi phiên. Những cách tiếp cận này dễ vỡ, tốn thời gian và không bao giờ nắm bắt được toàn bộ sự phong phú trong lịch sử phát triển của bạn. Claude-mem giải quyết vấn đề này bằng cách tự động quan sát mọi lời gọi công cụ, nén đầu ra thành các bộ nhớ ngữ nghĩa có thể tìm kiếm và truy xuất ngữ cảnh liên quan một cách thông minh khi bạn cần.

💡
Bạn muốn một công cụ kiểm thử API tuyệt vời giúp tạo tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, tất cả trong một để nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
nút

Tìm hiểu kiến trúc của Claude-mem

Claude-mem hoạt động như một hệ thống nén bộ nhớ liên tục, tích hợp vào vòng đời của Claude Code. Nó thu thập đầu ra công cụ—thường là 1.000 đến 10.000 token—và nén chúng thành các quan sát ngữ nghĩa khoảng 500 token bằng cách sử dụng Claude's Agent SDK. Các quan sát này được phân loại theo loại (quyết định, sửa lỗi, tính năng, tái cấu trúc, khám phá, thay đổi) và được gắn thẻ với các khái niệm và tham chiếu tệp liên quan, sau đó được lưu trữ trong một cơ sở dữ liệu SQLite cục bộ với khả năng tìm kiếm toàn văn.

Hệ thống sử dụng năm hook vòng đời để nắm bắt ngữ cảnh:

Kiến trúc này cho phép tiết lộ dần dần—một hệ thống truy xuất bộ nhớ theo lớp cân bằng giữa phạm vi bao phủ và hiệu quả token. Thay vì đổ toàn bộ lịch sử của bạn vào ngữ cảnh, Claude-mem truy xuất các quan sát theo lớp, tiết kiệm khoảng 2.250 token mỗi phiên so với quản lý ngữ cảnh thủ công.

Cài đặt và Yêu cầu hệ thống

Claude-mem yêu cầu Node.js 18.0.0 trở lên, Claude Code mới nhất có hỗ trợ plugin và Bun làm runtime JavaScript và trình quản lý tiến trình (tự động cài đặt nếu thiếu). SQLite 3 được gói kèm để lưu trữ liên tục. Plugin hoạt động đa nền tảng trên Windows, macOS và Linux.

mã claude

Cài đặt nhanh

Cài đặt Claude-mem trực tiếp từ marketplace plugin bằng hai lệnh:

/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem

Khởi động lại Claude Code sau khi cài đặt. Plugin tự động tải xuống các binary được xây dựng sẵn, cài đặt các phụ thuộc bao gồm Bun và SQLite, cấu hình các hook để quản lý vòng đời phiên, và tự động khởi động dịch vụ worker trong phiên đầu tiên của bạn.

claude-mem từ marketplace plugin của claude code

Cài đặt nâng cao từ mã nguồn

Để phát triển hoặc kiểm thử, hãy clone và xây dựng từ mã nguồn trên github:

git clone https://github.com/thedotmack/claude-mem.git
cd claude-mem
npm install
npm run build
npm run worker:start

Cách tiếp cận này hữu ích nếu bạn cần sửa đổi plugin hoặc chạy các tính năng beta như Chế độ Vô tận (Endless Mode).

claude-mem trên github

Xác minh sau cài đặt

Sau khi cài đặt, hãy xác minh mọi thứ đang hoạt động:

cat plugin/hooks/hooks.json
curl http://localhost:37777/api/health
npm run worker:logs

Kiểm tra truy xuất ngữ cảnh bằng cách bắt đầu một phiên Claude Code mới. Bạn sẽ thấy ngữ cảnh từ các phiên trước được tự động tải trong lời nhắc ban đầu.

Lưu trữ dữ liệu và cấu hình

Claude-mem lưu trữ tất cả dữ liệu cục bộ trong ~/.claude-mem/:

Ghi đè thư mục dữ liệu mặc định bằng một biến môi trường:

export CLAUDE_MEM_DATA_DIR=/custom/path

Tùy chọn cấu hình

Các cài đặt được quản lý trong ~/.claude-mem/settings.json (tự động tạo khi chạy lần đầu). Các cấu hình chính bao gồm:

Cách Claude-mem thu thập và xử lý ngữ cảnh

Khi bạn sử dụng Claude Code với claude-mem được bật, hệ thống sẽ tự động thu thập mọi lời gọi công cụ. Dù Claude đọc tệp, thực thi lệnh bash, tìm kiếm bằng các mẫu glob, hay chỉnh sửa mã, claude-mem đều quan sát đầu vào và đầu ra.

Dịch vụ worker xử lý các quan sát này và trích xuất:

Việc nén này diễn ra tự động mà không cần can thiệp thủ công. Đầu ra công cụ thô có thể là 5.000 token, nhưng quan sát ngữ nghĩa được lưu trữ trong cơ sở dữ liệu chỉ khoảng 500 token—giữ nguyên ý nghĩa trong khi loại bỏ nhiễu.

Tóm tắt phiên

Khi Claude hoàn tất phản hồi (kích hoạt hook Stop), claude-mem sẽ tự động tạo một tóm tắt phiên chứa:

Các tóm tắt này được chèn vào các phiên tương lai cùng với các quan sát riêng lẻ, cung cấp cả chi tiết cụ thể và ngữ cảnh kể chuyện cấp cao.

Sử dụng công cụ tìm kiếm MCP để truy vấn bộ nhớ của bạn

Claude-mem cung cấp bốn công cụ MCP tuân theo một mẫu quy trình làm việc 3 lớp hiệu quả token. Thiết kế này truy xuất ngữ cảnh dần dần, giảm thiểu việc sử dụng token trong khi tối đa hóa mức độ liên quan.

Quy trình làm việc 3 lớp

  1. search: Lấy một chỉ mục nhỏ gọn với các ID (~50-100 token mỗi kết quả)
  2. timeline: Lấy ngữ cảnh theo trình tự thời gian xung quanh các kết quả thú vị
  3. get_observations: Chỉ tìm nạp chi tiết đầy đủ cho các ID đã lọc (~500-1.000 token mỗi kết quả)

Cách tiếp cận này giúp tiết kiệm khoảng 10 lần token bằng cách lọc trước khi tìm nạp chi tiết đầy đủ.

Các công cụ MCP khả dụng

  1. search: Tìm kiếm chỉ mục bộ nhớ bằng các truy vấn toàn văn. Lọc theo loại, ngày hoặc dự án.
  2. timeline: Lấy ngữ cảnh theo trình tự thời gian xung quanh một quan sát hoặc truy vấn cụ thể. Hữu ích để hiểu điều gì đã dẫn đến một quyết định hoặc sửa lỗi cụ thể.
  3. get_observations: Tìm nạp chi tiết quan sát đầy đủ theo ID. Luôn gộp nhiều ID trong một lệnh gọi duy nhất để giảm thiểu chi phí.
  4. __IMPORTANT: Tài liệu quy trình làm việc luôn hiển thị với Claude, giải thích cách sử dụng hệ thống bộ nhớ một cách hiệu quả.

Các mẫu sử dụng ví dụ

Tìm một bản sửa lỗi cụ thể:

// Bước 1: Tìm lỗi
search(query="authentication bug", type="bugfix", limit=10)

// Bước 2: Xem lại chỉ mục, xác định các ID liên quan (ví dụ: #123, #456)

// Bước 3: Tìm nạp chi tiết đầy đủ cho các quan sát liên quan
get_observations(ids=[123, 456])

Khám phá các quyết định kiến trúc gần đây:

search(query="database schema", type="decision", limit=5)

Tìm mọi thứ liên quan đến một tệp cụ thể:

search(query="worker-service.ts", limit=20)

Truy vấn ngôn ngữ tự nhiên

Bạn có thể hỏi Claude một cách tự nhiên về lịch sử dự án của mình:

Claude tự động gọi các công cụ MCP thích hợp để truy xuất ngữ cảnh liên quan, trình bày các phát hiện với các trích dẫn URI claude-mem:// tham chiếu đến các quan sát cụ thể.

Tệp ngữ cảnh thư mục và Tự động tạo CLAUDE.md

Claude-mem tự động tạo các tệp CLAUDE.md trong các thư mục dự án, tạo ra các dòng thời gian hoạt động bổ sung cho cơ sở dữ liệu bộ nhớ toàn cầu.

Cách hoạt động của ngữ cảnh thư mục

Khi bạn làm việc với các tệp trong một thư mục, claude-mem:

  1. Xác định các đường dẫn thư mục duy nhất từ các tệp đã chạm
  2. Truy vấn các quan sát gần đây có liên quan đến từng thư mục
  3. Tạo một dòng thời gian hoạt động được định dạng
  4. Ghi nó vào CLAUDE.md trong thư mục đó (bên trong các thẻ <claude-mem-context>)

CLAUDE.md của mỗi thư mục chứa một phần Hoạt động gần đây hiển thị ID quan sát, dấu thời gian, chỉ báo loại (sửa lỗi, tính năng, khám phá), tiêu đề ngắn gọn và số lượng token ước tính.

Bảo toàn nội dung người dùng

Nội dung được tạo tự động được gói trong các thẻ <claude-mem-context>. Bất kỳ nội dung nào bạn viết bên ngoài các thẻ này đều được bảo toàn khi tệp được tạo lại. Điều này cho phép bạn:

Cấu trúc CLAUDE.md ví dụ:

# Module xác thực

Thư mục này chứa tất cả mã liên quan đến xác thực.
Tuân theo các mẫu đã thiết lập cho các nhà cung cấp xác thực mới.

<claude-mem-context>
# Hoạt động gần đây

| ID | Thời gian | Loại | Tiêu đề | Token |
|----|-----------|------|---------|--------|
| #1234 | 4:30 PM | 🔵 | Đã triển khai xác thực người dùng | ~250 |
| #1235 | 4:45 PM | 🔴 | Đã sửa lỗi chuyển hướng đăng nhập | ~180 |
</claude-mem-context>

## Ghi chú thủ công

- Các nhà cung cấp OAuth nằm trong /providers/
- Xử lý phiên sử dụng Redis

Kiểm soát quyền riêng tư và Bảo mật

Claude-mem cung cấp các kiểm soát quyền riêng tư chi tiết để ngăn dữ liệu nhạy cảm xâm nhập vào hệ thống bộ nhớ.

Thẻ nội dung riêng tư

Gói nội dung nhạy cảm trong các thẻ <private> để loại trừ nó khỏi bộ nhớ:

<private>
API_KEY=sk-live-abc123xyz789
DATABASE_PASSWORD=supersecret456
</private>

Quá trình xử lý biên đảm bảo nội dung riêng tư không bao giờ đến được cơ sở dữ liệu. Điều này rất quan trọng đối với các khóa API, thông tin đăng nhập và logic độc quyền.

Hệ thống quyền riêng tư thẻ kép

Claude-mem sử dụng cách tiếp cận thẻ kép:

Giao diện người dùng trình xem web và Giám sát thời gian thực

Claude-mem chạy một trình xem web tại http://localhost:37777 để hiển thị luồng bộ nhớ theo thời gian thực. Giao diện hiển thị:

Giao diện người dùng này là tùy chọn cho việc sử dụng cơ bản nhưng vô giá để hiểu claude-mem thu thập gì và cách nó tổ chức lịch sử phát triển của bạn.

Tính năng Beta: Chế độ Vô tận (Endless Mode)

Kênh beta cung cấp Chế độ Vô tận (Endless Mode), một kiến trúc bộ nhớ mô phỏng sinh học cho các phiên kéo dài. Thay vì đạt giới hạn ngữ cảnh sau 50 lần sử dụng công cụ, Chế độ Vô tận hứa hẹn khoảng 1.000 lần sử dụng—tăng gấp 20 lần. Nó đạt được điều này bằng cách nén đầu ra công cụ trong thời gian thực, giảm token khoảng 95% và thay đổi tỷ lệ từ bậc hai O(N²) thành bậc nhất O(N).

Đánh đổi: Việc tạo quan sát thêm 60-90 giây cho mỗi lần gọi công cụ. Đối với các phiên viết mã sâu sắc, suy tư kéo dài nhiều ngày hoặc nhiều tuần, độ trễ này có thể chấp nhận được. Đối với việc sử dụng công cụ nhanh chóng, nó có thể gây cản trở.

Bật các tính năng beta từ giao diện người dùng trình xem web tại http://localhost:37777 → Cài đặt → Kênh phiên bản.

Khắc phục sự cố thường gặp

Dịch vụ Worker không khởi động

Nếu worker không khởi động được trên cổng 37777:

lsof -i :37777
export CLAUDE_MEM_WORKER_PORT=8080
bun plugin/scripts/worker-service.cjs

Bộ nhớ không được lưu

Nếu Claude không nhớ các phiên trước:

npm run worker:status
ls -la ~/.claude-mem/claude-mem.db
npm run worker:logs

Các vấn đề về chèn ngữ cảnh

Nếu quá nhiều hoặc quá ít ngữ cảnh xuất hiện khi bắt đầu phiên:

Điều chỉnh giới hạn quan sát:

export CLAUDE_MEM_CONTEXT_OBSERVATIONS=10  # Giảm
export CLAUDE_MEM_CONTEXT_OBSERVATIONS=100 # Tăng

Tệp CLAUDE.md trống

Nếu claude-mem tạo các tệp CLAUDE.md trống trong toàn bộ dự án của bạn, đây là một vấn đề đã biết trong v9.0.5. Các giải pháp khắc phục hiện tại bao gồm xóa thủ công các thư mục đã tạo, thêm các mẫu vào .gitignore hoặc chờ bản sửa lỗi trong bản phát hành tiếp theo.

Tích hợp Claude Desktop

Claude-mem hoạt động với Claude Desktop thông qua cấu hình máy chủ MCP. Thêm máy chủ mcp-search vào cấu hình Claude Desktop của bạn, trỏ đến script máy chủ MCP trong cài đặt claude-mem và khởi động lại Claude Desktop.

Sau khi cấu hình, hãy hỏi một cách tự nhiên về công việc đã qua:

Sử dụng trình xem web tại localhost:37777 để xác minh bộ nhớ đang được ghi lại và kiểm tra nhật ký Claude Desktop nếu kết nối thất bại.

claude desktop

Lệnh quản lý Worker thủ công

Từ thư mục claude-mem, bạn có thể quản lý dịch vụ worker:

npm run worker:start    # Khởi động dịch vụ worker
npm run worker:stop     # Dừng dịch vụ worker
npm run worker:restart  # Khởi động lại dịch vụ worker
npm run worker:logs     # Xem nhật ký worker
npm run worker:status   # Kiểm tra trạng thái worker

Kết luận

Claude-mem biến Claude Code từ một trợ lý không trạng thái thành một đối tác phát triển bền bỉ, tích lũy kiến thức về cơ sở mã của bạn theo thời gian. Bằng cách tự động thu thập việc sử dụng công cụ, nén các quan sát thành bộ nhớ có thể tìm kiếm và truy xuất ngữ cảnh liên quan một cách thông minh, nó loại bỏ việc xây dựng ngữ cảnh lặp đi lặp lại làm chậm quá trình phát triển hỗ trợ bởi AI.

Kiến trúc tiết lộ dần dần của hệ thống—truy xuất theo lớp với các công cụ MCP, các tệp CLAUDE.md dựa trên thư mục và kiểm soát quyền riêng tư—cung cấp hiệu quả token cao gấp khoảng 10 lần so với quản lý ngữ cảnh thủ công, đồng thời duy trì hoàn toàn tính cục bộ và bảo mật dữ liệu.

Khi xây dựng API hoặc làm việc với các dịch vụ bên ngoài trong quy trình làm việc được tăng cường bởi Claude-mem của bạn, hãy tối ưu hóa việc kiểm thử với Apidog. Nó cung cấp kiểm thử API trực quan, tạo tài liệu tự động và gỡ lỗi cộng tác, bổ sung cho thiết lập bộ nhớ liên tục của bạn.

nút

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API