Apidog

Nền tảng phát triển API hợp tác tất cả trong một

Thiết kế API

Tài liệu API

Gỡ lỗi API

Giả lập API

Kiểm thử API tự động

Cách Sử Dụng Google Gemini 2.5 Pro với Open Codex CLI (Open Codex CLI)

Minh Triết

Minh Triết

Updated on tháng 4 18, 2025

Open Codex CLI là một công cụ mã nguồn mở mang sức mạnh của các mô hình ngôn ngữ lớn (LLMs) trực tiếp vào quy trình làm việc trong terminal của bạn. Hướng dẫn này tập trung cụ thể vào việc tận dụng một trong những mô hình tiên tiến nhất hiện có ngày nay – Google's Gemini 2.5 Pro – trong môi trường Open Codex CLI.

Open Codex CLI là một nhánh của OpenAI Codex CLI ban đầu, duy trì chức năng cốt lõi của nó nhưng mở rộng đáng kể khả năng của nó bằng cách thêm hỗ trợ cho nhiều nhà cung cấp AI, bao gồm Google Gemini. Điều này cho phép các nhà phát triển chọn mô hình tốt nhất cho nhiệm vụ của họ trong khi vẫn giữ giao diện terminal quen thuộc. Hãy tưởng tượng bạn có thể đặt câu hỏi lập trình phức tạp, tạo mã mẫu, tái cấu trúc các hàm hiện có, giải thích các kịch bản phức tạp, hoặc thậm chí điều phối các lệnh build, tất cả đều được điều khiển bởi trí tuệ của Gemini mà không cần rời khỏi dòng lệnh của bạn.

Bài viết này cung cấp một hướng dẫn toàn diện, từng bước để cài đặt, cấu hình và sử dụng Open Codex CLI đặc biệt với Google Gemini 2.5 Pro (tham chiếu đến phiên bản mô hình gemini-2.5-pro-preview-03-25 có sẵn tại thời điểm viết, như được chỉ định trong cấu hình Open Codex CLI) và các mô hình anh em như gemini-2.0-flash. Dù bạn là một nhà phát triển dày dạn kinh nghiệm tìm cách tối ưu hóa quy trình làm việc của mình hay mới bước chân vào trợ lý lập trình AI, bạn sẽ học cách tận dụng sự kết hợp mạnh mẽ này.

💡
Bạn muốn một công cụ kiểm tra API tuyệt vời tạo ra tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, All-in-One cho nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog cung cấp tất cả nhu cầu của bạn và thay thế Postman với giá cả phải chăng hơn rất nhiều!
button

Tại sao Open Codex CLI với Gemini?

Sự kết hợp giữa Open Codex CLI với Gemini 2.5 Pro mang lại nhiều lợi ích đáng chú ý:

  • Luồng làm việc gốc terminal: Đối với các nhà phát triển thích dòng lệnh, Open Codex CLI cung cấp tích hợp liền mạch. Không cần phải chuyển đổi giữa trình soạn thảo, terminal và một cửa sổ trình duyệt riêng biệt để được trợ giúp AI. Điều này dẫn đến việc lặp lại nhanh hơn và ít gián đoạn hơn.
  • Mã nguồn mở và linh hoạt: Là một công cụ mã nguồn mở (open-codex trên npm), công cụ này mang lại tính minh bạch và tiềm năng cho các đóng góp từ cộng đồng. Hỗ trợ đa nhà cung cấp (Gemini, OpenAI, OpenRouter, Ollama) cung cấp cho bạn sự linh hoạt để thay đổi mô hình hoặc nhà cung cấp khi cần mà không làm thay đổi công cụ cốt lõi của bạn.
  • Các khả năng AI mạnh mẽ: Gemini 2.5 Pro mang đến khả năng lập luận, tạo mã và hiểu biết tiên tiến nhất. Điều này cho phép thực hiện các nhiệm vụ phức tạp hơn, gợi ý chất lượng mã tốt hơn và phân tích sâu hơn trực tiếp trong CLI.
  • Hướng tới hành động: Khác với các chatbot đơn giản, Open Codex CLI được thiết kế cho hành động. Nó có thể đọc các tệp cục bộ của bạn để có bối cảnh, đề xuất sửa đổi tệp (vá lỗi) và thực hiện lệnh shell trong một sandbox an toàn, cho phép phát triển thực sự dựa trên hội thoại.
  • Tập trung vào bảo mật: CLI kết hợp các cơ chế sandboxing (Apple Seatbelt trên macOS, Docker được khuyến nghị trên Linux) để thực hiện các thao tác có thể mạo hiểm như các lệnh shell một cách an toàn, đặc biệt khi sử dụng chế độ tự động phê duyệt. Nó chạy lệnh không có kết nối mạng và trong thư mục sandboxed theo mặc định trong các chế độ tự chủ cao hơn.
  • Tích hợp kiểm soát phiên bản: Công cụ được thiết kế để làm việc song song với Git. Theo mặc định, nó yêu cầu phê duyệt trước khi sửa đổi tệp, cho phép bạn xem lại các thay đổi trước khi chúng ảnh hưởng đến thư mục làm việc của bạn, đảm bảo bạn luôn có một mạng lưới an toàn.

Các yêu cầu trước khi bắt đầu

Trước khi bạn bắt đầu, hãy đảm bảo bạn có những điều sau:

  1. Hệ điều hành: macOS 12 trở lên, một bản phân phối Linux hiện đại (như Ubuntu 20.04+, Debian 10+), hoặc Windows 10/11 sử dụng Windows Subsystem for Linux (WSL2). Hỗ trợ Windows trực tiếp không có sẵn.
  2. Node.js: Phiên bản 22 trở lên là yêu cầu. Các phiên bản LTS (Hỗ trợ dài hạn) thường được khuyến nghị. Bạn có thể kiểm tra phiên bản của mình bằng cách chạy node -v trong terminal của bạn. Tải xuống Node.js từ nodejs.org.
  3. Tài khoản Google Cloud & Khóa API Gemini: Bạn sẽ cần một khóa API để xác thực các yêu cầu đến các mô hình Gemini. Bạn có thể nhận được một khóa thông qua Google AI Studio hoặc Google Cloud Console. Giữ khóa này an toàn, vì nó liên kết với tài khoản của bạn.
  4. Quen thuộc với Terminal: Kiến thức cơ bản về cách sử dụng giao diện dòng lệnh của hệ thống (Terminal, iTerm, Bash, Zsh, v.v.) được giả định.

Bước 1: Cài đặt Open Codex CLI

Cách cài đặt Open Codex CLI được khuyến nghị là cài đặt toàn cầu thông qua npm (Node Package Manager), cái đi kèm với Node.js. Mở terminal của bạn và chạy:

npm install -g open-codex

Hoặc, nếu bạn sử dụng Yarn làm trình quản lý gói, bạn có thể chạy:

yarn global add open-codex

Lệnh này tải xuống gói open-codex và làm cho lệnh open-codex có thể truy cập từ bất kỳ đâu trong terminal của bạn. Tránh sử dụng sudo cho các cài đặt npm toàn cầu; nếu bạn gặp vấn đề về quyền, tốt hơn hết là sửa quyền npm.

Bạn có thể xác minh việc cài đặt bằng cách chạy open-codex --version hoặc open-codex --help.

Bước 2: Cấu hình quyền truy cập Gemini

Để sử dụng các mô hình Gemini, Open Codex CLI cần khóa API của bạn và cần biết bạn muốn sử dụng nhà cung cấp gemini. Có hai phương pháp chính để cấu hình điều này:

Phương pháp 1: Biến môi trường (Khuyến nghị cho Khởi động Nhanh/Kiểm tra)

Cách đơn giản nhất để cung cấp khóa API của bạn là thông qua một biến môi trường. Open Codex CLI sẽ tìm GOOGLE_GENERATIVE_AI_API_KEY khi nhà cung cấp gemini được chọn.

Trong terminal của bạn, chạy lệnh sau, thay thế "YOUR_API_KEY_HERE" bằng khóa API Gemini thực tế của bạn:

export GOOGLE_GENERATIVE_AI_API_KEY="YOUR_API_KEY_HERE"

Quan trọng: Lệnh này thiết lập biến môi trường chỉ cho phiên làm việc terminal hiện tại. Nếu bạn đóng terminal hoặc mở một cái mới, bạn sẽ cần chạy lệnh đó một lần nữa.

Để làm cho khóa API có sẵn vĩnh viễn, bạn cần thêm dòng export vào tệp cấu hình shell của bạn. Các tệp phổ biến bao gồm:

  • ~/.zshrc (dành cho Zsh, mặc định trên macOS gần đây)
  • ~/.bashrc hoặc ~/.bash_profile (dành cho Bash)

Thêm dòng export GOOGLE_GENERATIVE_AI_API_KEY="YOUR_API_KEY_HERE" vào tệp phù hợp, lưu lại, và sau đó khởi động lại terminal của bạn hoặc chạy source ~/.zshrc (hoặc đường dẫn tệp liên quan) để áp dụng các thay đổi.

Bạn có thể chỉ định Gemini là nhà cung cấp trong mỗi lần gọi sử dụng cờ --provider:

open-codex --provider gemini "Hà Nội là thủ đô của nước nào?"

Phương pháp 2: Tệp cấu hình (Khuyến nghị cho Thiết lập Vĩnh viễn)

Để có một thiết lập vĩnh viễn hơn, đặc biệt nếu bạn dự định sử dụng Gemini một cách nhất quán, bạn có thể sử dụng tệp cấu hình Open Codex CLI. CLI sẽ tìm kiếm một tệp cấu hình tại ~/.codex/config.json.

Tạo thư mục nếu nó không tồn tại: mkdir -p ~/.codex

Tạo và mở tệp cấu hình: nano ~/.codex/config.json (hoặc sử dụng trình soạn thảo văn bản ưa thích của bạn).

Thêm nội dung JSON sau để chỉ định Gemini là nhà cung cấp mặc định:

{
  "provider": "gemini"
}

Bạn cũng có thể tùy chọn thiết lập một mô hình Gemini mặc định. Open Codex CLI xác định gemini-2.5-pro-preview-03-25 là mô hình "agentic" mặc định và gemini-2.0-flash là mô hình "đầy đủ ngữ cảnh" mặc định cho Gemini. Để thiết lập rõ ràng mô hình 2.5 Pro mạnh mẽ làm mặc định cho hầu hết các tương tác, hãy sử dụng:

{
  "provider": "gemini",
  "model": "gemini-2.5-pro-preview-03-25"
}

Lưu tệp và thoát khỏi trình soạn thảo.

Quan trọng, ngay cả khi sử dụng tệp cấu hình để thiết lập nhà cung cấp và mô hình, bạn vẫn cần thiết lập biến môi trường GOOGLE_GENERATIVE_AI_API_KEY như đã mô tả trong Phương pháp 1. Tệp cấu hình cho CLI biết nhà cung cấp nào để sử dụng, trong khi biến môi trường cung cấp thông tin xác thực cho nhà cung cấp đó.

Khi tệp cấu hình đã được thiết lập, bạn giờ đây có thể đơn giản chạy open-codex và nó sẽ mặc định sử dụng nhà cung cấp Gemini được chỉ định:

open-codex "Hà Nội là thủ đô của nước nào?"

Bước 3: Sử dụng cơ bản với Gemini

Giờ đây, Open Codex CLI đã được cài đặt và cấu hình cho Gemini, hãy khám phá cách tương tác với nó.

Chế độ tương tác (REPL)

Để có trải nghiệm giống như trò chuyện, hãy chạy CLI mà không có lời nhắc cụ thể:

open-codex
# Hoặc nếu bạn chưa thiết lập nhà cung cấp mặc định trong config.json:
# open-codex --provider gemini

Điều này khởi động một Vòng lặp Đọc-Đánh giá-In ra (REPL) nơi bạn có thể nhập lời nhắc, nhận phản hồi và có một cuộc trò chuyện liên tục với Gemini.

❯ open-codex --provider gemini
Chào mừng bạn đến với Open Codex CLI! Gõ yêu cầu của bạn, sau đó nhấn Enter hai lần để gửi.
> Hãy cho tôi biết về mô hình Gemini 2.5 Pro.

Nhấn Enter hai lần để gửi lời nhắc. Gemini sẽ phản hồi bên trong terminal. Bạn có thể tiếp tục cuộc trò chuyện bằng cách nhập các câu hỏi tiếp theo.

Gửi yêu cầu trực tiếp

Đối với các yêu cầu một lần, bạn có thể truyền lời nhắc trực tiếp như một đối số. Nếu bạn chưa thiết lập các giá trị mặc định trong config.json, bạn sẽ cần cờ nhà cung cấp. Bạn cũng có thể chỉ định chính xác mô hình bằng cách sử dụng cờ --model hoặc -m:

  • Sử dụng mô hình Gemini mặc định (nếu được thiết lập trong config):
open-codex "Giải thích khái niệm closures trong Python."
  • Chỉ định rõ ràng nhà cung cấp và mô hình:
open-codex --provider gemini --model gemini-2.5-pro-preview-03-25 "Viết một script bash để tìm tất cả các tệp lớn hơn 10MB trong thư mục hiện tại và các thư mục con."
  • Sử dụng mô hình Gemini khác (ví dụ: Flash cho các nhiệm vụ có thể nhanh chóng/tiết kiệm hơn):
open-codex --provider gemini --model gemini-2.0-flash "Tóm tắt các điểm chính trong tài liệu React về hooks."

CLI sẽ xử lý yêu cầu với Gemini và in phản hồi trực tiếp ra đầu ra tiêu chuẩn.

Bước 4: Tận dụng các tính năng Open Codex với Gemini

Sức mạnh thực sự của Open Codex CLI nằm ở khả năng tương tác với môi trường phát triển cục bộ của bạn, được hướng dẫn bởi Gemini.

Tương tác với Hệ thống Tệp

Gemini, thông qua Open Codex CLI, có thể đọc các tệp trong dự án hiện tại của bạn để có được bối cảnh cho các yêu cầu của bạn. Nó cũng có thể đề xuất các thay đổi (ghi hoặc vá lỗi) cho các tệp của bạn.

  • Đọc tệp: Khi bạn đề cập đến tên tệp trong lời nhắc của bạn, CLI thường tự động đọc chúng để cung cấp bối cảnh cho Gemini.
# Giả sử bạn có một tệp có tên 'calculate.js'
open-codex --provider gemini "Đọc 'calculate.js' và đề xuất cải thiện độ dễ đọc."
  • Ghi/Vá lỗi tệp: Nếu bạn yêu cầu Gemini sửa đổi một tệp, CLI sẽ tạo một bản khác biệt (tóm tắt các thay đổi đề xuất) và yêu cầu sự phê duyệt của bạn trước khi áp dụng bất kỳ điều gì.
open-codex --provider gemini "Thêm một hàm mới gọi là 'subtract' vào 'calculate.js' nhận hai tham số và trả về hiệu số của chúng."

CLI sẽ xuất các thay đổi đề xuất và nhắc nhở: Áp dụng vá lỗi? [y/N]. Nhấn y để chấp nhận hoặc n để từ chối.

Thực thi Lệnh

Open Codex CLI cũng có thể thực hiện các lệnh shell được đề xuất bởi Gemini. Điều này rất mạnh mẽ nhưng yêu cầu sự thận trọng.

  • Các chế độ phê duyệt: Cờ --approval-mode (hoặc -a) điều khiển mức độ tự chủ:
  • suggest (mặc định): Yêu cầu phê duyệt rõ ràng cho tất cả các thay đổi tệp và tất cả các lệnh shell. Khuyến nghị cho việc bắt đầu.
  • auto-edit: Tự động áp dụng các thay đổi tệp nhưng vẫn yêu cầu phê duyệt cho các lệnh shell.
  • full-auto: Tự động áp dụng các thay đổi tệp VÀ thực hiện các lệnh shell (trong sandbox). Sử dụng với sự thận trọng cao độ, đặc biệt trong các kho lưu trữ không đáng tin cậy.
  • Sandboxing: Trong các chế độ auto-editfull-auto, các lệnh được chạy không có kết nối mạng và bị giới hạn trong thư mục làm việc hiện tại và các tệp tạm thời để đảm bảo an toàn.
  • Ví dụ (với chế độ mặc định 'suggest'):
open-codex --provider gemini "Cài đặt thư viện 'requests' sử dụng pip."

Gemini có thể đề xuất lệnh pip install requests. CLI sẽ hiển thị lệnh và hỏi: Chạy lệnh? [y/N].

Bối cảnh Dự án (codex.md)

Bạn có thể cung cấp các hướng dẫn hoặc bối cảnh về dự án của bạn cho Gemini bằng cách tạo các tệp codex.md. CLI đọc các tệp này theo thứ tự:

  1. ~/.codex/instructions.md (Hướng dẫn toàn cầu, cá nhân)
  2. codex.md tại gốc kho của bạn (Ghi chú trên toàn dự án)
  3. codex.md trong thư mục làm việc hiện tại (Ghi chú riêng cho thư mục con)

Điều này cho phép bạn hướng dẫn hành vi của Gemini hoặc cung cấp thông tin về tiêu chuẩn dự án, các thư viện sử dụng, v.v., mà không cần lặp lại trong mỗi lời nhắc.

Khắc phục sự cố & Mẹo

  • Lỗi Khóa API: Đảm bảo GOOGLE_GENERATIVE_AI_API_KEY được thiết lập chính xác, xuất ra và có thể truy cập trong phiên terminal hiện tại của bạn. Kiểm tra lại để đảm bảo không có lỗi chính tả.
  • Mô hình Không Tìm thấy: Xác minh rằng tên mô hình (gemini-2.5-pro-preview-03-25, gemini-2.0-flash, v.v.) khớp với những mô hình được hỗ trợ hoặc đã được cấu hình. Kiểm tra ~/.codex/config.json hoặc sử dụng cờ --model chính xác.
  • Lỗi Nhà cung cấp: Đảm bảo nhà cung cấp được thiết lập là gemini thông qua config.json hoặc cờ --provider gemini.
  • Ghi chép chi tiết: Để gỡ lỗi, chạy các lệnh với biến môi trường DEBUG=true được thêm vào: DEBUG=true open-codex --provider gemini "Lời nhắc của tôi". Điều này sẽ in ra thông tin chi tiết về yêu cầu/phản hồi.
  • Bắt đầu Đơn giản: Bắt đầu với các lời nhắc đơn giản và dần dần tăng độ phức tạp khi bạn cảm thấy thoải mái với cách Gemini và CLI tương tác.
  • Xem xét phê duyệt một cách cẩn thận: Đặc biệt khi xử lý các thay đổi tệp hoặc thực hiện lệnh, luôn xem xét các thay đổi hoặc lệnh đã đề xuất trước khi phê duyệt (trả lời y).

Kết luận

Open Codex CLI, được tăng cường bởi Google’s Gemini 2.5 Pro, biến terminal của bạn thành một trợ lý lập trình thông minh. Bằng cách làm theo các bước được nêu trong hướng dẫn này, bạn có thể tích hợp liền mạch các khả năng AI tiên tiến vào quy trình phát triển hàng ngày của bạn, ngay từ dòng lệnh.

Từ các đoạn mã nhanh chóng và các giải thích cho đến tái cấu trúc phức tạp và thực thi kịch bản, sự kết hợp này cung cấp tiềm năng lớn để nâng cao năng suất và tinh giản các công việc. Sự tập trung của công cụ vào bảo mật thông qua sandboxing và phê duyệt của người dùng, kết hợp với sự linh hoạt của hỗ trợ đa nhà cung cấp và tính chất mã nguồn mở của nó, khiến Open Codex CLI trở thành một lựa chọn hấp dẫn cho các nhà phát triển muốn khai thác AI trong terminal của họ.

Thử nghiệm với các lời nhắc khác nhau, khám phá các chế độ phê duyệt khác nhau (một cách thận trọng!), và phát hiện cách Gemini và Open Codex CLI có thể nâng cao trải nghiệm lập trình của bạn.

💡
Bạn muốn một công cụ kiểm tra API tuyệt vời tạo ra tài liệu API đẹp mắt?

Bạn muốn một nền tảng tích hợp, All-in-One cho nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?

Apidog cung cấp tất cả nhu cầu của bạn và thay thế Postman với giá cả phải chăng hơn nhiều!
button