Điều gì sẽ xảy ra nếu trợ lý AI của bạn ghi nhớ mọi quyết định kiến trúc, sửa lỗi và phiên tái cấu trúc trong suốt nhiều tuần phát triển? Claude-mem loại bỏ sự gián đoạn do mất ngữ cảnh bằng cách tự động ghi lại các quan sát về việc sử dụng công cụ, nén chúng thành các tóm tắt ngữ nghĩa và đưa lịch sử liên quan vào mỗi phiên Claude Code mới.
Vấn đề: Mất trí nhớ ngữ cảnh trong phát triển hỗ trợ bởi AI
Mỗi phiên Claude Code bắt đầu như một trang giấy trắng. Khi bạn đóng terminal hoặc ngắt kết nối khỏi phiên, Claude quên mọi thứ; cấu trúc dự án của bạn, các quyết định tái cấu trúc gần đây, các phát hiện gỡ lỗi và các mẫu kiến trúc. Điều này buộc bạn phải lặp đi lặp lại việc giải thích cơ sở mã của mình, tiêu tốn token vào ngữ cảnh dư thừa và phá vỡ sự liên tục của quy trình làm việc.
Các nhà phát triển hiện đang khắc phục điều này bằng cách tự duy trì các tệp CLAUDE.md, ghi chú vào các tài liệu riêng biệt hoặc giải thích lại ngữ cảnh dự án khi bắt đầu mỗi phiên. Những cách tiếp cận này dễ vỡ, tốn thời gian và không bao giờ nắm bắt được toàn bộ sự phong phú trong lịch sử phát triển của bạn. Claude-mem giải quyết vấn đề này bằng cách tự động quan sát mọi lời gọi công cụ, nén đầu ra thành các bộ nhớ ngữ nghĩa có thể tìm kiếm và truy xuất ngữ cảnh liên quan một cách thông minh khi bạn cần.
Bạn muốn một nền tảng tích hợp, tất cả trong một để nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
Tìm hiểu kiến trúc của Claude-mem
Claude-mem hoạt động như một hệ thống nén bộ nhớ liên tục, tích hợp vào vòng đời của Claude Code. Nó thu thập đầu ra công cụ—thường là 1.000 đến 10.000 token—và nén chúng thành các quan sát ngữ nghĩa khoảng 500 token bằng cách sử dụng Claude's Agent SDK. Các quan sát này được phân loại theo loại (quyết định, sửa lỗi, tính năng, tái cấu trúc, khám phá, thay đổi) và được gắn thẻ với các khái niệm và tham chiếu tệp liên quan, sau đó được lưu trữ trong một cơ sở dữ liệu SQLite cục bộ với khả năng tìm kiếm toàn văn.
Hệ thống sử dụng năm hook vòng đời để nắm bắt ngữ cảnh:
- SessionStart: Chèn ngữ cảnh từ các phiên trước khi bạn bắt đầu
- UserPromptSubmit: Ghi lại các truy vấn của bạn để nhận dạng mẫu
- PostToolUse: Quan sát mọi lần thực thi công cụ và đầu ra của nó
- Stop: Tạo tóm tắt phiên khi Claude hoàn tất phản hồi
- SessionEnd: Hoàn tất lưu trữ phiên và dọn dẹp
Kiến trúc này cho phép tiết lộ dần dần—một hệ thống truy xuất bộ nhớ theo lớp cân bằng giữa phạm vi bao phủ và hiệu quả token. Thay vì đổ toàn bộ lịch sử của bạn vào ngữ cảnh, Claude-mem truy xuất các quan sát theo lớp, tiết kiệm khoảng 2.250 token mỗi phiên so với quản lý ngữ cảnh thủ công.
Cài đặt và Yêu cầu hệ thống
Claude-mem yêu cầu Node.js 18.0.0 trở lên, Claude Code mới nhất có hỗ trợ plugin và Bun làm runtime JavaScript và trình quản lý tiến trình (tự động cài đặt nếu thiếu). SQLite 3 được gói kèm để lưu trữ liên tục. Plugin hoạt động đa nền tảng trên Windows, macOS và Linux.

Cài đặt nhanh
Cài đặt Claude-mem trực tiếp từ marketplace plugin bằng hai lệnh:
/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem
Khởi động lại Claude Code sau khi cài đặt. Plugin tự động tải xuống các binary được xây dựng sẵn, cài đặt các phụ thuộc bao gồm Bun và SQLite, cấu hình các hook để quản lý vòng đời phiên, và tự động khởi động dịch vụ worker trong phiên đầu tiên của bạn.

Cài đặt nâng cao từ mã nguồn
Để phát triển hoặc kiểm thử, hãy clone và xây dựng từ mã nguồn trên github:
git clone https://github.com/thedotmack/claude-mem.git
cd claude-mem
npm install
npm run build
npm run worker:start
Cách tiếp cận này hữu ích nếu bạn cần sửa đổi plugin hoặc chạy các tính năng beta như Chế độ Vô tận (Endless Mode).

Xác minh sau cài đặt
Sau khi cài đặt, hãy xác minh mọi thứ đang hoạt động:
- Kiểm tra cài đặt plugin:
cat plugin/hooks/hooks.json
- Xác minh dịch vụ worker đang chạy:
curl http://localhost:37777/api/health
- Xem nhật ký worker gần đây:
npm run worker:logs
Kiểm tra truy xuất ngữ cảnh bằng cách bắt đầu một phiên Claude Code mới. Bạn sẽ thấy ngữ cảnh từ các phiên trước được tự động tải trong lời nhắc ban đầu.
Lưu trữ dữ liệu và cấu hình
Claude-mem lưu trữ tất cả dữ liệu cục bộ trong ~/.claude-mem/:
- Cơ sở dữ liệu:
~/.claude-mem/claude-mem.db(SQLite với tìm kiếm FTS5) - Tệp PID:
~/.claude-mem/.worker.pid - Tệp cổng:
~/.claude-mem/.worker.port - Nhật ký:
~/.claude-mem/logs/worker-YYYY-MM-DD.log - Cài đặt:
~/.claude-mem/settings.json
Ghi đè thư mục dữ liệu mặc định bằng một biến môi trường:
export CLAUDE_MEM_DATA_DIR=/custom/path
Tùy chọn cấu hình
Các cài đặt được quản lý trong ~/.claude-mem/settings.json (tự động tạo khi chạy lần đầu). Các cấu hình chính bao gồm:
CLAUDE_MEM_CONTEXT_OBSERVATIONS: Số lượng quan sát được chèn khi bắt đầu phiên (mặc định: 50)CLAUDE_MEM_FOLDER_INDEX_ENABLED: Bật/tắt các tệp CLAUDE.md được tự động tạo trong các thư mục- Lựa chọn mô hình để nén bằng AI
- Cài đặt cổng và host của worker
- Cấu hình cấp độ nhật ký
Cách Claude-mem thu thập và xử lý ngữ cảnh
Khi bạn sử dụng Claude Code với claude-mem được bật, hệ thống sẽ tự động thu thập mọi lời gọi công cụ. Dù Claude đọc tệp, thực thi lệnh bash, tìm kiếm bằng các mẫu glob, hay chỉnh sửa mã, claude-mem đều quan sát đầu vào và đầu ra.
Dịch vụ worker xử lý các quan sát này và trích xuất:
- Tiêu đề: Mô tả ngắn gọn về những gì đã xảy ra
- Phụ đề: Ngữ cảnh bổ sung
- Diễn giải: Giải thích chi tiết về hoạt động
- Sự thật: Những bài học chính dưới dạng dấu đầu dòng
- Khái niệm: Các thẻ và danh mục liên quan để tìm kiếm
- Loại: Phân loại (quyết định, sửa lỗi, tính năng, tái cấu trúc, khám phá, thay đổi)
- Tệp: Các tệp đã được đọc hoặc sửa đổi
Việc nén này diễn ra tự động mà không cần can thiệp thủ công. Đầu ra công cụ thô có thể là 5.000 token, nhưng quan sát ngữ nghĩa được lưu trữ trong cơ sở dữ liệu chỉ khoảng 500 token—giữ nguyên ý nghĩa trong khi loại bỏ nhiễu.
Tóm tắt phiên
Khi Claude hoàn tất phản hồi (kích hoạt hook Stop), claude-mem sẽ tự động tạo một tóm tắt phiên chứa:
- Yêu cầu: Những gì bạn đã hỏi
- Đã điều tra: Những gì Claude đã khám phá để trả lời
- Đã học được: Những khám phá và hiểu biết chính
- Đã hoàn thành: Những gì đã đạt được
- Các bước tiếp theo: Các hành động tiếp theo được đề xuất
Các tóm tắt này được chèn vào các phiên tương lai cùng với các quan sát riêng lẻ, cung cấp cả chi tiết cụ thể và ngữ cảnh kể chuyện cấp cao.
Sử dụng công cụ tìm kiếm MCP để truy vấn bộ nhớ của bạn
Claude-mem cung cấp bốn công cụ MCP tuân theo một mẫu quy trình làm việc 3 lớp hiệu quả token. Thiết kế này truy xuất ngữ cảnh dần dần, giảm thiểu việc sử dụng token trong khi tối đa hóa mức độ liên quan.
Quy trình làm việc 3 lớp
search: Lấy một chỉ mục nhỏ gọn với các ID (~50-100 token mỗi kết quả)timeline: Lấy ngữ cảnh theo trình tự thời gian xung quanh các kết quả thú vịget_observations: Chỉ tìm nạp chi tiết đầy đủ cho các ID đã lọc (~500-1.000 token mỗi kết quả)
Cách tiếp cận này giúp tiết kiệm khoảng 10 lần token bằng cách lọc trước khi tìm nạp chi tiết đầy đủ.
Các công cụ MCP khả dụng
search: Tìm kiếm chỉ mục bộ nhớ bằng các truy vấn toàn văn. Lọc theo loại, ngày hoặc dự án.timeline: Lấy ngữ cảnh theo trình tự thời gian xung quanh một quan sát hoặc truy vấn cụ thể. Hữu ích để hiểu điều gì đã dẫn đến một quyết định hoặc sửa lỗi cụ thể.get_observations: Tìm nạp chi tiết quan sát đầy đủ theo ID. Luôn gộp nhiều ID trong một lệnh gọi duy nhất để giảm thiểu chi phí.__IMPORTANT: Tài liệu quy trình làm việc luôn hiển thị với Claude, giải thích cách sử dụng hệ thống bộ nhớ một cách hiệu quả.
Các mẫu sử dụng ví dụ
Tìm một bản sửa lỗi cụ thể:
// Bước 1: Tìm lỗi
search(query="authentication bug", type="bugfix", limit=10)
// Bước 2: Xem lại chỉ mục, xác định các ID liên quan (ví dụ: #123, #456)
// Bước 3: Tìm nạp chi tiết đầy đủ cho các quan sát liên quan
get_observations(ids=[123, 456])
Khám phá các quyết định kiến trúc gần đây:
search(query="database schema", type="decision", limit=5)
Tìm mọi thứ liên quan đến một tệp cụ thể:
search(query="worker-service.ts", limit=20)
Truy vấn ngôn ngữ tự nhiên
Bạn có thể hỏi Claude một cách tự nhiên về lịch sử dự án của mình:
- "Chúng ta đã quyết định gì về việc xử lý lỗi?"
- "Chúng ta đã triển khai xác thực như thế nào?"
- "Chúng ta đã sửa những lỗi nào trong lớp API?"
- "Cho tôi xem các thay đổi đối với lược đồ cơ sở dữ liệu"
Claude tự động gọi các công cụ MCP thích hợp để truy xuất ngữ cảnh liên quan, trình bày các phát hiện với các trích dẫn URI claude-mem:// tham chiếu đến các quan sát cụ thể.
Tệp ngữ cảnh thư mục và Tự động tạo CLAUDE.md
Claude-mem tự động tạo các tệp CLAUDE.md trong các thư mục dự án, tạo ra các dòng thời gian hoạt động bổ sung cho cơ sở dữ liệu bộ nhớ toàn cầu.
Cách hoạt động của ngữ cảnh thư mục
Khi bạn làm việc với các tệp trong một thư mục, claude-mem:
- Xác định các đường dẫn thư mục duy nhất từ các tệp đã chạm
- Truy vấn các quan sát gần đây có liên quan đến từng thư mục
- Tạo một dòng thời gian hoạt động được định dạng
- Ghi nó vào CLAUDE.md trong thư mục đó (bên trong các thẻ
<claude-mem-context>)
CLAUDE.md của mỗi thư mục chứa một phần Hoạt động gần đây hiển thị ID quan sát, dấu thời gian, chỉ báo loại (sửa lỗi, tính năng, khám phá), tiêu đề ngắn gọn và số lượng token ước tính.
Bảo toàn nội dung người dùng
Nội dung được tạo tự động được gói trong các thẻ <claude-mem-context>. Bất kỳ nội dung nào bạn viết bên ngoài các thẻ này đều được bảo toàn khi tệp được tạo lại. Điều này cho phép bạn:
- Thêm tài liệu của riêng bạn ở trên hoặc dưới phần được tạo
- Viết hướng dẫn dành riêng cho thư mục cho Claude
- Bao gồm các ghi chú hoặc quy ước kiến trúc
Cấu trúc CLAUDE.md ví dụ:
# Module xác thực
Thư mục này chứa tất cả mã liên quan đến xác thực.
Tuân theo các mẫu đã thiết lập cho các nhà cung cấp xác thực mới.
<claude-mem-context>
# Hoạt động gần đây
| ID | Thời gian | Loại | Tiêu đề | Token |
|----|-----------|------|---------|--------|
| #1234 | 4:30 PM | 🔵 | Đã triển khai xác thực người dùng | ~250 |
| #1235 | 4:45 PM | 🔴 | Đã sửa lỗi chuyển hướng đăng nhập | ~180 |
</claude-mem-context>
## Ghi chú thủ công
- Các nhà cung cấp OAuth nằm trong /providers/
- Xử lý phiên sử dụng Redis
Kiểm soát quyền riêng tư và Bảo mật
Claude-mem cung cấp các kiểm soát quyền riêng tư chi tiết để ngăn dữ liệu nhạy cảm xâm nhập vào hệ thống bộ nhớ.
Thẻ nội dung riêng tư
Gói nội dung nhạy cảm trong các thẻ <private> để loại trừ nó khỏi bộ nhớ:
<private>
API_KEY=sk-live-abc123xyz789
DATABASE_PASSWORD=supersecret456
</private>
Quá trình xử lý biên đảm bảo nội dung riêng tư không bao giờ đến được cơ sở dữ liệu. Điều này rất quan trọng đối với các khóa API, thông tin đăng nhập và logic độc quyền.
Hệ thống quyền riêng tư thẻ kép
Claude-mem sử dụng cách tiếp cận thẻ kép:
<private>: Quyền riêng tư do người dùng kiểm soát đối với nội dung nhạy cảm<claude-mem-context>: Các thẻ cấp hệ thống ngăn chặn lưu trữ quan sát đệ quy
Giao diện người dùng trình xem web và Giám sát thời gian thực
Claude-mem chạy một trình xem web tại http://localhost:37777 để hiển thị luồng bộ nhớ theo thời gian thực. Giao diện hiển thị:
- Luồng quan sát trực tiếp với các chỉ báo biểu tượng cảm xúc về mức độ quan trọng
- Dòng thời gian phiên với các mốc thời gian
- Giao diện tìm kiếm để truy vấn bộ nhớ
- Bảng cài đặt để điều chỉnh cấu hình
- Chuyển đổi phiên bản giữa các kênh ổn định và beta
Giao diện người dùng này là tùy chọn cho việc sử dụng cơ bản nhưng vô giá để hiểu claude-mem thu thập gì và cách nó tổ chức lịch sử phát triển của bạn.
Tính năng Beta: Chế độ Vô tận (Endless Mode)
Kênh beta cung cấp Chế độ Vô tận (Endless Mode), một kiến trúc bộ nhớ mô phỏng sinh học cho các phiên kéo dài. Thay vì đạt giới hạn ngữ cảnh sau 50 lần sử dụng công cụ, Chế độ Vô tận hứa hẹn khoảng 1.000 lần sử dụng—tăng gấp 20 lần. Nó đạt được điều này bằng cách nén đầu ra công cụ trong thời gian thực, giảm token khoảng 95% và thay đổi tỷ lệ từ bậc hai O(N²) thành bậc nhất O(N).
Đánh đổi: Việc tạo quan sát thêm 60-90 giây cho mỗi lần gọi công cụ. Đối với các phiên viết mã sâu sắc, suy tư kéo dài nhiều ngày hoặc nhiều tuần, độ trễ này có thể chấp nhận được. Đối với việc sử dụng công cụ nhanh chóng, nó có thể gây cản trở.
Bật các tính năng beta từ giao diện người dùng trình xem web tại http://localhost:37777 → Cài đặt → Kênh phiên bản.
Khắc phục sự cố thường gặp
Dịch vụ Worker không khởi động
Nếu worker không khởi động được trên cổng 37777:
- Kiểm tra xem cổng đã bị chiếm chưa:
lsof -i :37777
- Cấu hình một cổng thay thế:
export CLAUDE_MEM_WORKER_PORT=8080
- Khởi động worker thủ công:
bun plugin/scripts/worker-service.cjs
Bộ nhớ không được lưu
Nếu Claude không nhớ các phiên trước:
- Xác minh worker đang chạy:
npm run worker:status
- Kiểm tra xem tệp cơ sở dữ liệu có tồn tại không:
ls -la ~/.claude-mem/claude-mem.db
- Xem lại nhật ký worker để tìm lỗi:
npm run worker:logs
Các vấn đề về chèn ngữ cảnh
Nếu quá nhiều hoặc quá ít ngữ cảnh xuất hiện khi bắt đầu phiên:
Điều chỉnh giới hạn quan sát:
export CLAUDE_MEM_CONTEXT_OBSERVATIONS=10 # Giảm
export CLAUDE_MEM_CONTEXT_OBSERVATIONS=100 # Tăng
Tệp CLAUDE.md trống
Nếu claude-mem tạo các tệp CLAUDE.md trống trong toàn bộ dự án của bạn, đây là một vấn đề đã biết trong v9.0.5. Các giải pháp khắc phục hiện tại bao gồm xóa thủ công các thư mục đã tạo, thêm các mẫu vào .gitignore hoặc chờ bản sửa lỗi trong bản phát hành tiếp theo.
Tích hợp Claude Desktop
Claude-mem hoạt động với Claude Desktop thông qua cấu hình máy chủ MCP. Thêm máy chủ mcp-search vào cấu hình Claude Desktop của bạn, trỏ đến script máy chủ MCP trong cài đặt claude-mem và khởi động lại Claude Desktop.
Sau khi cấu hình, hãy hỏi một cách tự nhiên về công việc đã qua:
- "Chúng ta đã làm gì trong phiên trước?"
- "Chúng ta đã sửa lỗi này trước đây chưa?"
- "Chúng ta đã triển khai xác thực như thế nào?"
Sử dụng trình xem web tại localhost:37777 để xác minh bộ nhớ đang được ghi lại và kiểm tra nhật ký Claude Desktop nếu kết nối thất bại.

Lệnh quản lý Worker thủ công
Từ thư mục claude-mem, bạn có thể quản lý dịch vụ worker:
npm run worker:start # Khởi động dịch vụ worker
npm run worker:stop # Dừng dịch vụ worker
npm run worker:restart # Khởi động lại dịch vụ worker
npm run worker:logs # Xem nhật ký worker
npm run worker:status # Kiểm tra trạng thái worker
Kết luận
Claude-mem biến Claude Code từ một trợ lý không trạng thái thành một đối tác phát triển bền bỉ, tích lũy kiến thức về cơ sở mã của bạn theo thời gian. Bằng cách tự động thu thập việc sử dụng công cụ, nén các quan sát thành bộ nhớ có thể tìm kiếm và truy xuất ngữ cảnh liên quan một cách thông minh, nó loại bỏ việc xây dựng ngữ cảnh lặp đi lặp lại làm chậm quá trình phát triển hỗ trợ bởi AI.
Kiến trúc tiết lộ dần dần của hệ thống—truy xuất theo lớp với các công cụ MCP, các tệp CLAUDE.md dựa trên thư mục và kiểm soát quyền riêng tư—cung cấp hiệu quả token cao gấp khoảng 10 lần so với quản lý ngữ cảnh thủ công, đồng thời duy trì hoàn toàn tính cục bộ và bảo mật dữ liệu.
Khi xây dựng API hoặc làm việc với các dịch vụ bên ngoài trong quy trình làm việc được tăng cường bởi Claude-mem của bạn, hãy tối ưu hóa việc kiểm thử với Apidog. Nó cung cấp kiểm thử API trực quan, tạo tài liệu tự động và gỡ lỗi cộng tác, bổ sung cho thiết lập bộ nhớ liên tục của bạn.
