Thế giới của các Mô hình Ngôn ngữ Lớn (LLM) cục bộ đại diện cho một biên giới về quyền riêng tư, kiểm soát và tùy chỉnh. Trong nhiều năm, các nhà phát triển và những người đam mê đã chạy các mô hình mạnh mẽ trên phần cứng của riêng họ, không bị ràng buộc bởi các hạn chế và chi phí của các dịch vụ dựa trên đám mây. Tuy nhiên, sự tự do này thường đi kèm với một hạn chế đáng kể: sự cô lập. Các mô hình cục bộ có thể suy luận, nhưng chúng không thể hành động. Với việc phát hành phiên bản 0.3.17, LM Studio đã phá vỡ rào cản này bằng cách giới thiệu hỗ trợ cho Giao thức Ngữ cảnh Mô hình (MCP), một tính năng mang tính chuyển đổi cho phép các LLM cục bộ của bạn kết nối với các công cụ và tài nguyên bên ngoài.

Hướng dẫn này cung cấp một cái nhìn tổng quan toàn diện, chuyên sâu về cách cấu hình và sử dụng tính năng mạnh mẽ này. Chúng tôi sẽ đi từ các khái niệm cơ bản đến các ví dụ thực tế nâng cao, mang đến cho bạn một bức tranh hoàn chỉnh về cách biến LLM cục bộ của bạn thành một tác nhân tương tác và hiệu quả.
Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
Máy chủ MCP là gì?
Trước khi bạn có thể cấu hình một máy chủ, điều quan trọng là phải hiểu kiến trúc mà bạn đang làm việc. Giao thức Ngữ cảnh Mô hình (MCP) là một đặc tả nguồn mở, ban đầu được Anthropic giới thiệu, được thiết kế để tạo ra một ngôn ngữ phổ quát giữa các LLM và các công cụ bên ngoài. Hãy coi nó như một "API cho các API" được chuẩn hóa, đặc biệt dành cho việc tiêu thụ AI.
Hệ thống MCP bao gồm hai thành phần chính:
- MCP Host: Đây là ứng dụng nơi LLM cư trú. Host chịu trách nhiệm quản lý việc khám phá công cụ, trình bày các công cụ có sẵn cho mô hình trong quá trình suy luận và xử lý toàn bộ vòng đời của một cuộc gọi công cụ. Trong hướng dẫn này, LM Studio là Máy chủ MCP.
- MCP Server: Đây là một chương trình phơi bày một tập hợp các công cụ (hàm) thông qua một điểm cuối HTTP. Một máy chủ có thể là một tập lệnh đơn giản chạy trên máy của bạn hoặc một dịch vụ mạnh mẽ, cấp doanh nghiệp trên web. Ví dụ, một công ty như Stripe có thể cung cấp một máy chủ MCP để xử lý thanh toán, hoặc một nhà phát triển có thể viết một máy chủ cá nhân để tương tác với các thiết bị nhà thông minh của họ.
Vẻ đẹp của giao thức này nằm ở sự đơn giản và chuẩn hóa của nó. Bất kỳ nhà phát triển nào cũng có thể xây dựng một máy chủ phơi bày các công cụ, và bất kỳ ứng dụng nào hoạt động như một máy chủ lưu trữ cũng có thể kết nối với nó, tạo ra một hệ sinh thái không phụ thuộc vào nhà cung cấp.
Hướng dẫn từng bước: Thêm Máy chủ MCP từ xa
Phương pháp chính để thêm và quản lý các máy chủ MCP trong LM Studio là chỉnh sửa một tệp cấu hình trung tâm có tên mcp.json
.
Tìm và Chỉnh sửa mcp.json
Bạn có thể truy cập tệp này trực tiếp từ giao diện LM Studio, đây là cách tiếp cận được khuyến nghị.
- Khởi chạy LM Studio và nhìn vào thanh bên phải.
- Nhấp vào tab Program, được biểu thị bằng biểu tượng dấu nhắc terminal (
>_
). - Trong phần "Install", nhấp vào nút Edit mcp.json.

Hành động này mở tệp cấu hình trực tiếp trong trình soạn thảo văn bản trong ứng dụng của LM Studio. Ứng dụng tự động theo dõi tệp này để tìm các thay đổi, vì vậy bất kỳ máy chủ nào bạn thêm hoặc sửa đổi sẽ được tải lại ngay khi bạn lưu.

Cấu hình ví dụ: Máy chủ Hugging Face
Để minh họa quá trình này, chúng ta sẽ kết nối với máy chủ MCP chính thức của Hugging Face. Công cụ này cung cấp cho LLM của bạn khả năng tìm kiếm các mô hình và tập dữ liệu trên Hugging Face Hub—một bước đầu tiên hoàn hảo để sử dụng công cụ.
Đầu tiên, bạn cần một mã truy cập từ Hugging Face.
- Điều hướng đến cài đặt Mã truy cập của tài khoản Hugging Face của bạn.
- Tạo một mã thông báo mới. Đặt cho nó một tên mô tả (ví dụ:
lm-studio-mcp
) và gán cho nó vai tròread
, đủ để tìm kiếm. - Sao chép mã thông báo đã tạo (
hf_...
).
Tiếp theo, thêm cấu trúc sau vào tệp mcp.json
của bạn.
{
"mcpServers": {
"hf-mcp-server": {
"url": "<https://huggingface.co/mcp>",
"headers": {
"Authorization": "Bearer <YOUR_HF_TOKEN>"
}
}
}
}
Bây giờ, thay thế chỗ giữ chỗ <YOUR_HF_TOKEN>
bằng mã thông báo thực tế mà bạn đã sao chép từ Hugging Face. Lưu tệp (Ctrl+S hoặc Cmd+S).
Vậy là xong. Phiên bản LM Studio của bạn hiện đã được kết nối.
Xác minh và Kiểm tra
Để xác nhận kết nối đang hoạt động, bạn phải sử dụng một mô hình thành thạo việc gọi hàm. Nhiều mô hình hiện đại, chẳng hạn như các biến thể của Llama 3, Mixtral và Qwen, có khả năng này. Tải một mô hình phù hợp và bắt đầu một cuộc trò chuyện mới.
Đưa ra một lời nhắc yêu cầu công cụ, ví dụ:
"Bạn có thể tìm một số mô hình LLM phổ biến trên Hugging Face có dưới 7 tỷ tham số không?"
Nếu mọi thứ được cấu hình đúng, mô hình sẽ nhận ra nhu cầu về một công cụ. Thay vì trả lời trực tiếp, nó sẽ kích hoạt một cuộc gọi công cụ, mà LM Studio sẽ chặn và trình bày cho bạn để xác nhận.
Xác nhận cuộc gọi công cụ trong LMStudio
Sức mạnh để kết nối LLM của bạn với các công cụ bên ngoài đi kèm với trách nhiệm đáng kể. Một máy chủ MCP có thể, theo thiết kế, truy cập các tệp cục bộ của bạn, thực hiện các yêu cầu mạng và thực thi mã. LM Studio giảm thiểu rủi ro này bằng một tính năng an toàn quan trọng: xác nhận cuộc gọi công cụ.
Khi một mô hình muốn sử dụng một công cụ, một hộp thoại sẽ xuất hiện trong giao diện trò chuyện. Hộp này cung cấp cho bạn một cái nhìn tổng quan đầy đủ, dễ đọc của con người về hành động đang chờ xử lý:
- Tên của công cụ đang được gọi.
- Các đối số cụ thể mà mô hình muốn gửi đến nó.
Bạn có toàn quyền kiểm soát. Bạn có thể kiểm tra các đối số để tìm bất kỳ điều gì đáng ngờ và sau đó chọn Cho phép cuộc gọi một lần, Từ chối nó, hoặc, đối với các công cụ bạn hoàn toàn tin tưởng, Luôn cho phép công cụ cụ thể đó.
Cảnh báo: Không bao giờ cài đặt hoặc cấp quyền cho máy chủ MCP từ một nguồn mà bạn không hoàn toàn tin tưởng. Luôn kiểm tra kỹ cuộc gọi công cụ đầu tiên từ bất kỳ máy chủ mới nào. Bạn có thể quản lý và thu hồi quyền "Luôn cho phép" của mình bất cứ lúc nào trong Cài đặt ứng dụng > Công cụ & Tích hợp.
Kết nối LMStudio với Máy chủ MCP cục bộ
Mặc dù việc kết nối với các máy chủ từ xa rất hữu ích, nhưng sức mạnh thực sự của MCP đối với nhiều người dùng là khả năng chạy các máy chủ trên máy cục bộ của họ. Điều này cấp cho LLM quyền truy cập vào các tệp, tập lệnh và chương trình cục bộ, đồng thời giữ dữ liệu hoàn toàn ngoại tuyến.
LM Studio hỗ trợ cả máy chủ MCP cục bộ và từ xa. Để cấu hình một máy chủ cục bộ, bạn sẽ thêm một mục vào tệp `mcp.json` của mình trỏ đến một URL cục bộ.
Ví dụ, nếu bạn đang chạy một máy chủ trên máy của mình trên cổng 8000, cấu hình của bạn có thể trông như thế này:
{
"mcpServers": {
"my-local-server": {
"url": "http://localhost:8000"
}
}
}
Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ Phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
Tương lai là cục bộ và được kết nối
Việc tích hợp MCP vào LM Studio không chỉ là một bản cập nhật tăng dần; đó là một sự thay đổi cơ bản. Nó thu hẹp khoảng cách giữa trí thông minh thô của các LLM và tiện ích thực tế của các ứng dụng phần mềm. Điều này tạo ra một tương lai nơi AI của bạn không chỉ là một người trò chuyện mà còn là một trợ lý cá nhân hoạt động an toàn trên phần cứng của riêng bạn.
Hãy tưởng tượng một nhà văn với một máy chủ MCP cục bộ cung cấp các công cụ tùy chỉnh để tóm tắt, kiểm tra thực tế dựa trên thư viện tài liệu riêng tư và phân tích phong cách—tất cả mà không gửi một từ nào lên đám mây. Hoặc một nhà phát triển có LLM có thể tương tác với một máy chủ cục bộ để chạy thử nghiệm, đọc đầu ra trình biên dịch và tìm kiếm các cơ sở mã nội bộ.
Để tạo điều kiện cho tầm nhìn này, nhóm LM Studio cũng đã giúp các nhà phát triển dễ dàng chia sẻ các sáng tạo của họ. Nút "Add to LM Studio", sử dụng một liên kết sâu lmstudio://
tùy chỉnh, cho phép cài đặt máy chủ MCP mới chỉ bằng một cú nhấp chuột. Điều này làm giảm rào cản gia nhập và mở đường cho một hệ sinh thái công cụ sôi động, do cộng đồng thúc đẩy.
Bằng cách áp dụng một tiêu chuẩn mở và ưu tiên kiểm soát của người dùng, LM Studio đã cung cấp một khuôn khổ mạnh mẽ cho thế hệ AI cá nhân tiếp theo.