Cách Sử Dụng Google Gemini 2.5 Pro với Open Codex CLI (Open Codex CLI)

Minh Triết

Minh Triết

18 tháng 4 2025

Cách Sử Dụng Google Gemini 2.5 Pro với Open Codex CLI (Open Codex CLI)

Open Codex CLI là một công cụ mã nguồn mở mang sức mạnh của các mô hình ngôn ngữ lớn (LLMs) trực tiếp vào quy trình làm việc trong terminal của bạn. Hướng dẫn này tập trung cụ thể vào việc tận dụng một trong những mô hình tiên tiến nhất hiện có ngày nay – Google's Gemini 2.5 Pro – trong môi trường Open Codex CLI.

Open Codex CLI là một nhánh của OpenAI Codex CLI ban đầu, duy trì chức năng cốt lõi của nó nhưng mở rộng đáng kể khả năng của nó bằng cách thêm hỗ trợ cho nhiều nhà cung cấp AI, bao gồm Google Gemini. Điều này cho phép các nhà phát triển chọn mô hình tốt nhất cho nhiệm vụ của họ trong khi vẫn giữ giao diện terminal quen thuộc. Hãy tưởng tượng bạn có thể đặt câu hỏi lập trình phức tạp, tạo mã mẫu, tái cấu trúc các hàm hiện có, giải thích các kịch bản phức tạp, hoặc thậm chí điều phối các lệnh build, tất cả đều được điều khiển bởi trí tuệ của Gemini mà không cần rời khỏi dòng lệnh của bạn.

Bài viết này cung cấp một hướng dẫn toàn diện, từng bước để cài đặt, cấu hình và sử dụng Open Codex CLI đặc biệt với Google Gemini 2.5 Pro (tham chiếu đến phiên bản mô hình gemini-2.5-pro-preview-03-25 có sẵn tại thời điểm viết, như được chỉ định trong cấu hình Open Codex CLI) và các mô hình anh em như gemini-2.0-flash. Dù bạn là một nhà phát triển dày dạn kinh nghiệm tìm cách tối ưu hóa quy trình làm việc của mình hay mới bước chân vào trợ lý lập trình AI, bạn sẽ học cách tận dụng sự kết hợp mạnh mẽ này.

💡
Bạn muốn một công cụ kiểm tra API tuyệt vời tạo ra tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, All-in-One cho nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog cung cấp tất cả nhu cầu của bạn và thay thế Postman với giá cả phải chăng hơn rất nhiều!
button

Tại sao Open Codex CLI với Gemini?

Sự kết hợp giữa Open Codex CLI với Gemini 2.5 Pro mang lại nhiều lợi ích đáng chú ý:

Các yêu cầu trước khi bắt đầu

Trước khi bạn bắt đầu, hãy đảm bảo bạn có những điều sau:

  1. Hệ điều hành: macOS 12 trở lên, một bản phân phối Linux hiện đại (như Ubuntu 20.04+, Debian 10+), hoặc Windows 10/11 sử dụng Windows Subsystem for Linux (WSL2). Hỗ trợ Windows trực tiếp không có sẵn.
  2. Node.js: Phiên bản 22 trở lên là yêu cầu. Các phiên bản LTS (Hỗ trợ dài hạn) thường được khuyến nghị. Bạn có thể kiểm tra phiên bản của mình bằng cách chạy node -v trong terminal của bạn. Tải xuống Node.js từ nodejs.org.
  3. Tài khoản Google Cloud & Khóa API Gemini: Bạn sẽ cần một khóa API để xác thực các yêu cầu đến các mô hình Gemini. Bạn có thể nhận được một khóa thông qua Google AI Studio hoặc Google Cloud Console. Giữ khóa này an toàn, vì nó liên kết với tài khoản của bạn.
  4. Quen thuộc với Terminal: Kiến thức cơ bản về cách sử dụng giao diện dòng lệnh của hệ thống (Terminal, iTerm, Bash, Zsh, v.v.) được giả định.

Bước 1: Cài đặt Open Codex CLI

Cách cài đặt Open Codex CLI được khuyến nghị là cài đặt toàn cầu thông qua npm (Node Package Manager), cái đi kèm với Node.js. Mở terminal của bạn và chạy:

npm install -g open-codex

Hoặc, nếu bạn sử dụng Yarn làm trình quản lý gói, bạn có thể chạy:

yarn global add open-codex

Lệnh này tải xuống gói open-codex và làm cho lệnh open-codex có thể truy cập từ bất kỳ đâu trong terminal của bạn. Tránh sử dụng sudo cho các cài đặt npm toàn cầu; nếu bạn gặp vấn đề về quyền, tốt hơn hết là sửa quyền npm.

Bạn có thể xác minh việc cài đặt bằng cách chạy open-codex --version hoặc open-codex --help.

Bước 2: Cấu hình quyền truy cập Gemini

Để sử dụng các mô hình Gemini, Open Codex CLI cần khóa API của bạn và cần biết bạn muốn sử dụng nhà cung cấp gemini. Có hai phương pháp chính để cấu hình điều này:

Phương pháp 1: Biến môi trường (Khuyến nghị cho Khởi động Nhanh/Kiểm tra)

Cách đơn giản nhất để cung cấp khóa API của bạn là thông qua một biến môi trường. Open Codex CLI sẽ tìm GOOGLE_GENERATIVE_AI_API_KEY khi nhà cung cấp gemini được chọn.

Trong terminal của bạn, chạy lệnh sau, thay thế "YOUR_API_KEY_HERE" bằng khóa API Gemini thực tế của bạn:

export GOOGLE_GENERATIVE_AI_API_KEY="YOUR_API_KEY_HERE"

Quan trọng: Lệnh này thiết lập biến môi trường chỉ cho phiên làm việc terminal hiện tại. Nếu bạn đóng terminal hoặc mở một cái mới, bạn sẽ cần chạy lệnh đó một lần nữa.

Để làm cho khóa API có sẵn vĩnh viễn, bạn cần thêm dòng export vào tệp cấu hình shell của bạn. Các tệp phổ biến bao gồm:

Thêm dòng export GOOGLE_GENERATIVE_AI_API_KEY="YOUR_API_KEY_HERE" vào tệp phù hợp, lưu lại, và sau đó khởi động lại terminal của bạn hoặc chạy source ~/.zshrc (hoặc đường dẫn tệp liên quan) để áp dụng các thay đổi.

Bạn có thể chỉ định Gemini là nhà cung cấp trong mỗi lần gọi sử dụng cờ --provider:

open-codex --provider gemini "Hà Nội là thủ đô của nước nào?"

Phương pháp 2: Tệp cấu hình (Khuyến nghị cho Thiết lập Vĩnh viễn)

Để có một thiết lập vĩnh viễn hơn, đặc biệt nếu bạn dự định sử dụng Gemini một cách nhất quán, bạn có thể sử dụng tệp cấu hình Open Codex CLI. CLI sẽ tìm kiếm một tệp cấu hình tại ~/.codex/config.json.

Tạo thư mục nếu nó không tồn tại: mkdir -p ~/.codex

Tạo và mở tệp cấu hình: nano ~/.codex/config.json (hoặc sử dụng trình soạn thảo văn bản ưa thích của bạn).

Thêm nội dung JSON sau để chỉ định Gemini là nhà cung cấp mặc định:

{
  "provider": "gemini"
}

Bạn cũng có thể tùy chọn thiết lập một mô hình Gemini mặc định. Open Codex CLI xác định gemini-2.5-pro-preview-03-25 là mô hình "agentic" mặc định và gemini-2.0-flash là mô hình "đầy đủ ngữ cảnh" mặc định cho Gemini. Để thiết lập rõ ràng mô hình 2.5 Pro mạnh mẽ làm mặc định cho hầu hết các tương tác, hãy sử dụng:

{
  "provider": "gemini",
  "model": "gemini-2.5-pro-preview-03-25"
}

Lưu tệp và thoát khỏi trình soạn thảo.

Quan trọng, ngay cả khi sử dụng tệp cấu hình để thiết lập nhà cung cấp và mô hình, bạn vẫn cần thiết lập biến môi trường GOOGLE_GENERATIVE_AI_API_KEY như đã mô tả trong Phương pháp 1. Tệp cấu hình cho CLI biết nhà cung cấp nào để sử dụng, trong khi biến môi trường cung cấp thông tin xác thực cho nhà cung cấp đó.

Khi tệp cấu hình đã được thiết lập, bạn giờ đây có thể đơn giản chạy open-codex và nó sẽ mặc định sử dụng nhà cung cấp Gemini được chỉ định:

open-codex "Hà Nội là thủ đô của nước nào?"

Bước 3: Sử dụng cơ bản với Gemini

Giờ đây, Open Codex CLI đã được cài đặt và cấu hình cho Gemini, hãy khám phá cách tương tác với nó.

Chế độ tương tác (REPL)

Để có trải nghiệm giống như trò chuyện, hãy chạy CLI mà không có lời nhắc cụ thể:

open-codex
# Hoặc nếu bạn chưa thiết lập nhà cung cấp mặc định trong config.json:
# open-codex --provider gemini

Điều này khởi động một Vòng lặp Đọc-Đánh giá-In ra (REPL) nơi bạn có thể nhập lời nhắc, nhận phản hồi và có một cuộc trò chuyện liên tục với Gemini.

❯ open-codex --provider gemini
Chào mừng bạn đến với Open Codex CLI! Gõ yêu cầu của bạn, sau đó nhấn Enter hai lần để gửi.
> Hãy cho tôi biết về mô hình Gemini 2.5 Pro.

Nhấn Enter hai lần để gửi lời nhắc. Gemini sẽ phản hồi bên trong terminal. Bạn có thể tiếp tục cuộc trò chuyện bằng cách nhập các câu hỏi tiếp theo.

Gửi yêu cầu trực tiếp

Đối với các yêu cầu một lần, bạn có thể truyền lời nhắc trực tiếp như một đối số. Nếu bạn chưa thiết lập các giá trị mặc định trong config.json, bạn sẽ cần cờ nhà cung cấp. Bạn cũng có thể chỉ định chính xác mô hình bằng cách sử dụng cờ --model hoặc -m:

open-codex "Giải thích khái niệm closures trong Python."
open-codex --provider gemini --model gemini-2.5-pro-preview-03-25 "Viết một script bash để tìm tất cả các tệp lớn hơn 10MB trong thư mục hiện tại và các thư mục con."
open-codex --provider gemini --model gemini-2.0-flash "Tóm tắt các điểm chính trong tài liệu React về hooks."

CLI sẽ xử lý yêu cầu với Gemini và in phản hồi trực tiếp ra đầu ra tiêu chuẩn.

Bước 4: Tận dụng các tính năng Open Codex với Gemini

Sức mạnh thực sự của Open Codex CLI nằm ở khả năng tương tác với môi trường phát triển cục bộ của bạn, được hướng dẫn bởi Gemini.

Tương tác với Hệ thống Tệp

Gemini, thông qua Open Codex CLI, có thể đọc các tệp trong dự án hiện tại của bạn để có được bối cảnh cho các yêu cầu của bạn. Nó cũng có thể đề xuất các thay đổi (ghi hoặc vá lỗi) cho các tệp của bạn.

# Giả sử bạn có một tệp có tên 'calculate.js'
open-codex --provider gemini "Đọc 'calculate.js' và đề xuất cải thiện độ dễ đọc."
open-codex --provider gemini "Thêm một hàm mới gọi là 'subtract' vào 'calculate.js' nhận hai tham số và trả về hiệu số của chúng."

CLI sẽ xuất các thay đổi đề xuất và nhắc nhở: Áp dụng vá lỗi? [y/N]. Nhấn y để chấp nhận hoặc n để từ chối.

Thực thi Lệnh

Open Codex CLI cũng có thể thực hiện các lệnh shell được đề xuất bởi Gemini. Điều này rất mạnh mẽ nhưng yêu cầu sự thận trọng.

open-codex --provider gemini "Cài đặt thư viện 'requests' sử dụng pip."

Gemini có thể đề xuất lệnh pip install requests. CLI sẽ hiển thị lệnh và hỏi: Chạy lệnh? [y/N].

Bối cảnh Dự án (codex.md)

Bạn có thể cung cấp các hướng dẫn hoặc bối cảnh về dự án của bạn cho Gemini bằng cách tạo các tệp codex.md. CLI đọc các tệp này theo thứ tự:

  1. ~/.codex/instructions.md (Hướng dẫn toàn cầu, cá nhân)
  2. codex.md tại gốc kho của bạn (Ghi chú trên toàn dự án)
  3. codex.md trong thư mục làm việc hiện tại (Ghi chú riêng cho thư mục con)

Điều này cho phép bạn hướng dẫn hành vi của Gemini hoặc cung cấp thông tin về tiêu chuẩn dự án, các thư viện sử dụng, v.v., mà không cần lặp lại trong mỗi lời nhắc.

Khắc phục sự cố & Mẹo

Kết luận

Open Codex CLI, được tăng cường bởi Google’s Gemini 2.5 Pro, biến terminal của bạn thành một trợ lý lập trình thông minh. Bằng cách làm theo các bước được nêu trong hướng dẫn này, bạn có thể tích hợp liền mạch các khả năng AI tiên tiến vào quy trình phát triển hàng ngày của bạn, ngay từ dòng lệnh.

Từ các đoạn mã nhanh chóng và các giải thích cho đến tái cấu trúc phức tạp và thực thi kịch bản, sự kết hợp này cung cấp tiềm năng lớn để nâng cao năng suất và tinh giản các công việc. Sự tập trung của công cụ vào bảo mật thông qua sandboxing và phê duyệt của người dùng, kết hợp với sự linh hoạt của hỗ trợ đa nhà cung cấp và tính chất mã nguồn mở của nó, khiến Open Codex CLI trở thành một lựa chọn hấp dẫn cho các nhà phát triển muốn khai thác AI trong terminal của họ.

Thử nghiệm với các lời nhắc khác nhau, khám phá các chế độ phê duyệt khác nhau (một cách thận trọng!), và phát hiện cách Gemini và Open Codex CLI có thể nâng cao trải nghiệm lập trình của bạn.

💡
Bạn muốn một công cụ kiểm tra API tuyệt vời tạo ra tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, All-in-One cho nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog cung cấp tất cả nhu cầu của bạn và thay thế Postman với giá cả phải chăng hơn nhiều!
button

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API