Gemini CLI: Mã Nguồn Mở Thay Thế Claude Code Từ Google

Rebecca Kovács

Rebecca Kovács

25 tháng 6 2025

Gemini CLI: Mã Nguồn Mở Thay Thế Claude Code Từ Google

Trong nhiều thập kỷ, giao diện dòng lệnh (CLI) đã là thánh địa của nhà phát triển—một không gian của hiệu quả, kiểm soát và sức mạnh thuần túy. Nơi mã được tạo ra, hệ thống được quản lý và công việc thực sự được hoàn thành. Trong khi các giao diện đồ họa đã phát triển, terminal vẫn là một hằng số, minh chứng cho tiện ích bền bỉ của nó. Giờ đây, công cụ đáng kính này đang nhận được bản nâng cấp quan trọng nhất trong một thế hệ. Google đã giới thiệu Gemini CLI, một tác nhân AI mã nguồn mở, mạnh mẽ, mang khả năng vượt trội của các mô hình thuộc dòng Gemini trực tiếp vào môi trường làm việc tự nhiên của nhà phát triển.

Đây không chỉ là một chatbot AI khác được nhét vào cửa sổ terminal. Gemini CLI được định vị là một phản hồi trực tiếp và mạnh mẽ đối với hệ sinh thái đang phát triển của các trợ lý mã hóa AI, mang đến một lựa chọn mã nguồn mở hấp dẫn thay thế cho các công cụ sử dụng các mô hình như Claude của Anthropic. Đây là một tiện ích "ưu tiên AI" được thiết kế từ đầu cho dòng lệnh, có khả năng không chỉ trò chuyện mà còn hành động. Nó có thể hiểu cơ sở mã của bạn, tương tác với hệ thống tệp, thực thi lệnh và thậm chí tìm kiếm thông tin theo thời gian thực trên web. Với việc phát hành này, Google đang đưa ra một tuyên bố táo bạo: tương lai của phát triển là một mối quan hệ đối tác mở, có thể mở rộng và tích hợp sâu sắc giữa sự khéo léo của con người và trí tuệ nhân tạo, tất cả được điều phối từ dấu nhắc lệnh khiêm tốn.

Bài viết này sẽ đi sâu vào những gì khiến Gemini CLI trở thành một yếu tố thay đổi cuộc chơi tiềm năng, từ cấp độ miễn phí chưa từng có cho đến các khả năng sâu sắc, giống như tác nhân có thể định nghĩa lại quy trình làm việc của nhà phát triển.

💡
Bạn muốn một công cụ kiểm thử API tuyệt vời có thể tạo Tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
nút

Bức tranh lớn: Tác nhân AI dòng lệnh là gì?

Về cốt lõi, Gemini CLI là một công cụ mã nguồn mở và miễn phí, cung cấp giao diện trực tiếp, nhẹ nhàng tới mô hình Gemini 2.5 Pro của Google. Nhưng nếu chỉ gọi nó là một "giao diện" thì sẽ là một sự thiếu sót. Google cố tình gọi nó là một "tác nhân AI", một thuật ngữ ngụ ý mức độ tự chủ và khả năng cao hơn một công cụ hỏi-đáp đơn thuần.

Vậy, "tác nhân" có nghĩa là gì trong ngữ cảnh này? Nó có nghĩa là Gemini CLI được thiết kế để trở thành một đối tác chủ động. Nó có thể nhận một yêu cầu cấp cao—như "Tái cấu trúc dịch vụ Python của tôi để tuân thủ quy tắc hơn và thêm các bài kiểm tra đơn vị"—và chia nhỏ nó thành một kế hoạch nhiều bước. Nó có thể bắt đầu bằng cách phân tích mã hiện có, sau đó viết phiên bản đã được tái cấu trúc vào một tệp mới, tạo một tệp kiểm tra tương ứng và cuối cùng, thực thi các bài kiểm tra để đảm bảo mọi thứ hoạt động như mong đợi. Khả năng lập kế hoạch, thực thi và thậm chí phục hồi từ lỗi này là điều phân biệt một tác nhân với một trợ lý thụ động.

Mặc dù khả năng mã hóa là một tính năng chính, Gemini CLI được thiết kế có chủ đích để trở nên đa năng. Đây là một tiện ích đa năng được thiết kế cho nhiều tác vụ mà các nhà phát triển phải đối mặt hàng ngày:

Điều quan trọng là toàn bộ dự án được mã nguồn mở theo giấy phép Apache 2.0 cho phép. Đây là một yếu tố khác biệt lớn trong một thị trường ngày càng có nhiều hệ thống AI độc quyền, hộp đen. Điều này có nghĩa là các nhà phát triển có thể kiểm tra mã nguồn để hiểu cách hoạt động bên trong của nó, xác minh các thực tiễn bảo mật và đóng góp trực tiếp vào sự phát triển của nó. Sự minh bạch này xây dựng lòng tin và trao quyền cho cộng đồng định hình công cụ theo nhu cầu riêng của họ, một triết lý phù hợp sâu sắc với tinh thần mã nguồn mở của cộng đồng nhà phát triển.

Vâng! Gemini CLI đi kèm với cấp độ miễn phí truy cập API Google Gemini

Có lẽ khía cạnh thu hút sự chú ý nhất của Gemini CLI là khả năng tiếp cận của nó. Google không chỉ đặt mô hình mạnh mẽ nhất của mình vào tay các nhà phát triển; họ còn làm điều đó với một cấp độ miễn phí mà theo tiêu chuẩn ngành hiện tại, gần như không thể tin được.

Để bắt đầu, nhà phát triển chỉ cần đăng nhập bằng tài khoản Google cá nhân, tài khoản này sẽ tự động cấp một giấy phép miễn phí cho Gemini Code Assist. Giấy phép này mở khóa toàn bộ sức mạnh của mô hình Gemini 2.5 Pro, hoàn chỉnh với cửa sổ ngữ cảnh 1 triệu token đột phá của nó. Một cửa sổ ngữ cảnh lớn là một siêu năng lực đối với các nhà phát triển. Nó cho phép mô hình tiếp nhận và suy luận về lượng lớn thông tin cùng lúc—toàn bộ cơ sở mã, tài liệu dài, lịch sử dự án phức tạp—dẫn đến các phản hồi chính xác hơn, nhận biết ngữ cảnh và hữu ích hơn.

Điều thực sự làm nó nổi bật là các giới hạn sử dụng. Cấp độ miễn phí bao gồm:

Những con số này thật đáng kinh ngạc. Chúng loại bỏ hiệu quả khái niệm "lo lắng về giới hạn tốc độ" đối với phần lớn các nhà phát triển cá nhân, nhà nghiên cứu và sinh viên. Nó cho phép một quy trình làm việc trôi chảy, không bị gián đoạn, nơi nhà phát triển có thể thử nghiệm, lặp lại và giải quyết vấn đề mà không cần lo lắng liên tục về việc đạt đến giới hạn sử dụng. Điều này hoàn toàn trái ngược với các sản phẩm khác trên thị trường, nơi quyền truy cập miễn phí thường bị hạn chế nghiêm ngặt hoặc quyền truy cập API chỉ trả tiền theo mức sử dụng.

Chiến lược này là một bước đi rõ ràng nhằm dân chủ hóa quyền truy cập vào AI tiên tiến. Bằng cách loại bỏ rào cản chi phí, Google đang khuyến khích việc áp dụng rộng rãi và mời gọi một cộng đồng toàn cầu xây dựng, đổi mới và khám phá những cách làm việc mới với một tác nhân AI. Đối với các nhà phát triển chuyên nghiệp hoặc các nhóm có nhu cầu chuyên sâu hơn, một lộ trình nâng cấp rõ ràng tồn tại thông qua Google AI Studio hoặc Vertex AI để tính phí dựa trên mức sử dụng, hoặc thông qua giấy phép Gemini Code Assist trả phí cho các tính năng doanh nghiệp. Nhưng nền tảng là sự hào phóng triệt để, đảm bảo rằng bất kỳ nhà phát triển nào, ở bất cứ đâu, cũng có thể có một tác nhân AI đẳng cấp thế giới trong terminal của họ.

Khả năng cốt lõi: Vượt ra ngoài hội thoại đến hành động

Sức mạnh thực sự của Gemini CLI nằm ở các "công cụ tích hợp" của nó, nâng tầm nó từ một giao diện trò chuyện thành một tác nhân chức năng có thể tương tác với môi trường kỹ thuật số của bạn. Đây là nơi nó thực sự tỏa sáng như một giải pháp thay thế cho các giải pháp chủ yếu là nhập văn bản, xuất văn bản.

Hiểu, tạo và gỡ lỗi mã: Đây là nền tảng của bất kỳ AI nào tập trung vào nhà phát triển. Bạn có thể truyền trực tiếp một tệp vào CLI (cat main.go | gemini "add comments to this code") hoặc yêu cầu nó tạo mã từ đầu (gemini "write a bash script to back up all .log files in /var/log to a tarball"). Nó vượt trội trong việc gỡ lỗi, nơi nó có thể phân tích dấu vết ngăn xếp và đề xuất các bản sửa lỗi.

Tương tác với hệ thống tệp: Gemini CLI có khả năng đọc và ghi vào hệ thống tệp cục bộ của bạn. Đây là một khả năng quan trọng đối với một tác nhân. Bạn có thể yêu cầu nó thực hiện các tác vụ tái cấu trúc phức tạp, trên toàn dự án như: "Quét tất cả các tệp .ts trong thư mục src và thay thế tất cả các trường hợp của oldFunction() đã lỗi thời bằng newFunction(), đảm bảo các đối số được ánh xạ chính xác." Điều này vượt ra ngoài việc tạo mã đơn thuần để duy trì cơ sở mã một cách chủ động.

Thực thi lệnh và Tự động hóa: Đây có lẽ là tính năng mạnh mẽ nhất của nó. Gemini CLI có thể thực thi các lệnh shell thay mặt bạn. Khi bạn kết hợp điều này với khả năng suy luận của nó, các khả năng là vô tận. Hãy tưởng tượng lời nhắc này: "Ứng dụng Node.js của tôi bị lỗi khi khởi động. Hãy tìm hiểu lý do và sửa nó." Tác nhân có thể đưa ra một kế hoạch:

  1. Chạy npm install để đảm bảo các phụ thuộc là chính xác.
  2. Chạy ứng dụng (npm start) và ghi lại đầu ra lỗi.
  3. Sử dụng Google Search để tra cứu thông báo lỗi cụ thể.
  4. Dựa trên kết quả tìm kiếm, xác định nguyên nhân có thể xảy ra (ví dụ: một biến môi trường bị thiếu).
  5. Đề xuất lệnh để sửa nó: export DATABASE_URL=...

Hơn nữa, nó có thể được gọi không tương tác trong các tập lệnh, cho phép bạn nhúng các bước được hỗ trợ bởi AI vào các quy trình CI/CD hiện có hoặc tự động hóa xây dựng. Ví dụ, một tập lệnh có thể tạo một bản tóm tắt dễ đọc về các thay đổi mã gần đây bằng cách truyền git diff vào Gemini CLI.

Dựa trên Google Search: Các mô hình như Gemini được đào tạo trên các tập dữ liệu khổng lồ, nhưng dữ liệu đó có ngày cắt. Gemini CLI khắc phục hạn chế này bằng cách tích hợp trực tiếp Google Search vào bộ công cụ của nó. Nó có thể tìm nạp thông tin thời gian thực từ web để làm cơ sở cho các lời nhắc của mình. Điều này vô giá cho các tác vụ như: "Những thay đổi gây lỗi trong phiên bản Django mới nhất là gì? Tóm tắt chúng và chỉ cho tôi cách cập nhật tệp settings.py của tôi." Mô hình có thể tìm kiếm trên web các ghi chú phát hành mới nhất và sử dụng thông tin mới đó để cung cấp câu trả lời chính xác, cập nhật.

Mở và có thể mở rộng: Tạo AI cá nhân của bạn

Google hiểu rằng terminal là một không gian mang tính cá nhân sâu sắc. Các nhà phát triển dành nhiều năm để tùy chỉnh shell, trình chỉnh sửa và quy trình làm việc của họ. Một AI phù hợp với tất cả sẽ không bao giờ hiệu quả. Đó là lý do tại sao Gemini CLI được xây dựng từ đầu để mở và có thể mở rộng.

Nền tảng của điều này là giấy phép mã nguồn mở Apache 2.0 của nó. Điều này mang lại cho các nhà phát triển quyền tự do không chỉ kiểm tra mã mà còn sửa đổi, phân nhánh và điều chỉnh nó theo nhu cầu cụ thể của họ mà không bị hạn chế. Nó thúc đẩy một môi trường hợp tác nơi cộng đồng có thể đóng góp mọi thứ từ sửa lỗi đến các tính năng mới quan trọng, đảm bảo công cụ phát triển theo hướng có lợi cho người dùng.

Ngoài việc là mã nguồn mở, nó còn cung cấp một số lớp tùy chỉnh:

Sự tập trung vào tính mở và khả năng tùy chỉnh này là một thách thức trực tiếp đối với phương pháp "khu vườn có tường bao quanh" của một số đối thủ cạnh tranh. Nó trao quyền cho các nhà phát triển trở thành đồng sáng tạo các công cụ AI của họ, chứ không chỉ là người tiêu dùng thụ động.

Trải nghiệm thống nhất: Từ Terminal đến IDE

Quy trình làm việc của nhà phát triển hiện đại hiếm khi bị giới hạn trong một công cụ duy nhất. Trong khi terminal là cần thiết, IDE là nơi diễn ra phần lớn công việc phức tạp, đa tệp. Google đã hợp nhất hai môi trường này bằng cách chia sẻ công nghệ tác nhân cốt lõi giữa Gemini CLI và Gemini Code Assist, trợ lý AI của họ cho các IDE như VS Code.

Khi bạn đang ở trong VS Code, bạn có thể kích hoạt "chế độ tác nhân" trong cửa sổ trò chuyện. Điều này cung cấp cho bạn cùng một tác nhân đa bước, được hỗ trợ bởi khả năng suy luận mà bạn có trong CLI. Bạn có thể đưa cho nó cùng các lời nhắc cấp cao, và nó sẽ làm việc không ngừng nghỉ thay mặt bạn để xây dựng tính năng, sửa lỗi hoặc di chuyển mã, hiển thị cho bạn kế hoạch và tiến độ của nó trong suốt quá trình.

Công nghệ chia sẻ này có nghĩa là không có sự chuyển đổi ngữ cảnh gây khó chịu. Các khả năng của AI, sự hiểu biết của nó về các lời nhắc của bạn và hành vi chung của nó vẫn nhất quán cho dù bạn đang thực hiện một lệnh nhanh trong terminal hay tham gia vào một phiên tái cấu trúc sâu trong IDE của mình. Điều này tạo ra một trải nghiệm phát triển liền mạch, mạnh mẽ và thống nhất.

Kết luận: Chương tiếp theo của dòng lệnh

Gemini CLI không chỉ là một công cụ mới; nó là một sự thay đổi mô hình cho dòng lệnh. Bằng cách cung cấp mô hình mạnh mẽ nhất của mình thông qua một giao diện mã nguồn mở, có thể mở rộng và có tính tác nhân—với một cấp độ miễn phí hào phóng đến mức định nghĩa lại thị trường—Google đang trao quyền cho một thế hệ nhà phát triển mới. Nó cung cấp một giải pháp thay thế mạnh mẽ, mở cho các giải pháp mã hóa AI khác, được xây dựng trên nền tảng của sự minh bạch và hợp tác cộng đồng. Nó tôn trọng sự thiêng liêng của terminal đồng thời tăng cường nó với những khả năng trước đây không thể tưởng tượng được. Đối với bất kỳ nhà phát triển nào muốn tích hợp AI vào quy trình làm việc của họ một cách sâu sắc và có ý nghĩa, lời kêu gọi hành động là rõ ràng: nâng cấp trải nghiệm terminal của bạn ngay hôm nay. Tương lai của dòng lệnh đã ở đây, và nó đang chờ đợi lời nhắc đầu tiên của bạn.

💡
Bạn muốn một công cụ kiểm thử API tuyệt vời có thể tạo Tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, tất cả trong một để Đội ngũ phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
nút

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API