OpenAI đã tăng gấp đôi giá mỗi token trên dòng GPT-5 với việc phát hành GPT-5.5 vào ngày 23 tháng 4 năm 2026. Giá đầu vào tăng từ 2,50 đô la lên 5,00 đô la cho mỗi triệu token. Giá đầu ra tăng từ 15,00 đô la lên 30,00 đô la cho mỗi triệu. Giá Pro vẫn giữ nguyên ở mức 30 đô la / 180 đô la. Đó là tiêu đề chính; các chi tiết là nơi ẩn chứa chi phí thực tế.
Hướng dẫn này bao gồm mọi khía cạnh định giá: API tiêu chuẩn, Batch, Flex và Priority; định giá Pro; giới hạn Codex theo gói; và cách tính toán cho khối lượng công việc thực tế của bạn trước khi bạn cam kết thay đổi mô hình mặc định.
Để xem tổng quan về mô hình, hãy xem GPT-5.5 là gì. Để xem hướng dẫn dành cho nhà phát triển, hãy xem Cách sử dụng API GPT-5.5.
Tóm tắt
| Dịch vụ | Đầu vào / Triệu | Đầu ra / Triệu |
|---|---|---|
| API tiêu chuẩn GPT-5.5 | $5.00 | $30.00 |
| API GPT-5.5 Pro | $30.00 | $180.00 |
| GPT-5.5 Batch (giảm 50%) | $2.50 | $15.00 |
| GPT-5.5 Flex (giảm 50%) | $2.50 | $15.00 |
| GPT-5.5 Priority (gấp 2,5 lần) | $12.50 | $75.00 |
| API tiêu chuẩn GPT-5.4 | $2.50 | $15.00 |
| API GPT-5.4-mini | $0.25 | $2.00 |
Hiệu ứng ròng: GPT-5.5 có giá gấp 2 lần GPT-5.4 ở cấp độ token, nhưng OpenAI tuyên bố mức tăng chỉ số Thông minh (Intelligence-Index) ròng khoảng 20% khi tính đến hiệu quả token.
Các con số chính
OpenAI đã công bố giá trên trang giá API vào cùng ngày ra mắt.
- GPT-5.5: 5,00 đô la cho mỗi triệu token đầu vào, 30,00 đô la cho mỗi triệu token đầu ra.
- GPT-5.5 Pro: 30,00 đô la cho mỗi triệu token đầu vào, 180,00 đô la cho mỗi triệu token đầu ra.
- Cửa sổ ngữ cảnh (Context window): 1 triệu token trên cả hai biến thể. Token suy luận được tính vào cửa sổ ngữ cảnh và tính vào hóa đơn đầu ra.
Batch, Flex và Priority
OpenAI cung cấp ba cấp độ thay thế giúp định hình lại mức giá tiêu chuẩn.
API Batch
Xếp hàng yêu cầu thông qua điểm cuối Batch và chúng sẽ chạy với 50% giá tiêu chuẩn. Thời gian hoàn thành dưới 24 giờ. Phù hợp cho:
- Đánh giá qua đêm trên một bộ dữ liệu đầy đủ.
- Bổ sung dữ liệu và xử lý lại dữ liệu lịch sử.
- Bất kỳ quy trình làm việc nào mà ngân sách độ trễ được đo bằng giờ, chứ không phải giây.
Với giá Batch, GPT-5.5 có giá 2,50 đô la / 15,00 đô la cho mỗi triệu token; tương đương với giá tiêu chuẩn của GPT-5.4. Đối với các khối lượng công việc ngoại tuyến, việc giá tăng gấp đôi sẽ biến mất.
Xử lý Flex
Flex cũng giảm giá 50% so với mức tiêu chuẩn, nhưng thời gian chờ đợi có thể thay đổi; từ vài giây đến vài phút tùy thuộc vào tải. Sử dụng Flex khi bạn có thể chấp nhận độ trễ không thể đoán trước và muốn mức giá tương đương Batch với phản hồi gần như đồng bộ.
Xử lý ưu tiên
Priority có giá gấp 2,5 lần mức tiêu chuẩn (12,50 đô la / 75,00 đô la cho mỗi triệu token trên GPT-5.5) và mang lại thông lượng nhanh hơn mặc định, giới hạn tỷ lệ cao hơn và thời gian chờ gần như bằng không. Hãy dành nó cho các trải nghiệm trực tiếp dành cho người dùng mà độ trễ ở cuối chu kỳ xuất hiện trong các chỉ số giữ chân người dùng.
Tính toán chi phí chế độ suy nghĩ (Thinking mode)
Chế độ suy nghĩ GPT-5.5 (GPT-5.5 Thinking) sử dụng cùng ID mô hình nhưng với reasoning.effort (mức độ nỗ lực suy luận) cao hơn. Nó không thay đổi giá mỗi token; nó thay đổi số lượng token mà một yêu cầu sử dụng. Hãy kỳ vọng hệ số nhân sẽ nằm trong ba dải.
| Nỗ lực | Hệ số nhân token đầu ra | Khi nào nên sử dụng |
|---|---|---|
thấp (mặc định) |
1× | Hầu hết các cuộc gọi thông thường |
trung bình |
1.3–2× | Mã hóa nhiều bước, tạo nội dung có cấu trúc |
cao |
2–4× | Nghiên cứu chuyên sâu, đánh giá quan trọng về độ chính xác |
rất cao |
3–8× | Vòng lặp tác nhân với chuỗi công cụ, lập kế hoạch chi tiết |
Một cuộc gọi xhigh duy nhất với một câu lệnh dài có thể dễ dàng sử dụng 20 nghìn token suy luận; với giá 30 đô la mỗi triệu, riêng phần suy luận đã tốn 0,60 đô la, chưa kể chi phí token đầu ra cuối cùng.
Lập ngân sách theo khối lượng công việc, không theo từng yêu cầu.
Giá Codex
Quyền truy cập Codex được gắn với gói ChatGPT, không phải thanh toán theo từng token. Vào ngày 23 tháng 4 năm 2026, cấu trúc trông như thế này.
| Gói | Truy cập Codex | GPT-5.5 | Ghi chú |
|---|---|---|---|
| Miễn phí | Có (có giới hạn thời gian) | Có | Giới hạn hàng tuần chặt chẽ |
| Go | Có (có giới hạn thời gian) | Có | Gấp 2 lần giới hạn của gói Miễn phí |
| Plus (20 đô la / tháng) | Có | Có | Giới hạn tiêu chuẩn |
| Pro (200 đô la / tháng) | Có | Có + Thinking + Pro (trong ChatGPT) | Giới hạn cao nhất cho mỗi người dùng |
| Business | Có | Có | Tính theo ghế |
| Doanh nghiệp / Giáo dục | Có | Có | Dựa trên hợp đồng |
Đối với những người dùng dành phần lớn thời gian làm việc trong quy trình mã hóa trên terminal, Plus hoặc Pro là cách rẻ nhất để chạy GPT-5.5; phí hàng tháng cố định sẽ rẻ hơn cả giá Batch một khi bạn vượt qua vài trăm nghìn token mỗi ngày. Hướng dẫn về con đường miễn phí bao gồm điểm truy cập không tốn phí.
So sánh: GPT-5.5 so với các phiên bản còn lại
Khi nào bạn trả tiền cho GPT-5.5 và khi nào bạn nên giữ GPT-5.4 hoặc GPT-5.4-mini? Việc tính toán chi phí phụ thuộc vào mức độ tải đầu ra của khối lượng công việc của bạn.
| Mô hình | Đầu vào / Triệu | Đầu ra / Triệu | Chi phí cho 1 nghìn token đầu ra |
|---|---|---|---|
| GPT-5.4-mini | $0.25 | $2.00 | $0.0020 |
| GPT-5.4 | $2.50 | $15.00 | $0.0150 |
| GPT-5.5 | $5.00 | $30.00 | $0.0300 |
| GPT-5.5 Pro | $30.00 | $180.00 | $0.1800 |
Một luồng quyết định sơ bộ:
- Đầu ra khối lượng lớn, rủi ro thấp (phân loại, tóm tắt, trò chuyện đơn giản): GPT-5.4-mini.
- Lưu lượng sản xuất chung mà 5.4 đã đạt tiêu chuẩn chất lượng: GPT-5.4.
- Mã hóa phức tạp, công việc tác nhân nhiều bước, chuỗi nghiên cứu: GPT-5.5.
- Đầu ra yêu cầu độ chính xác cao, nơi một câu trả lời sai sẽ tốn kém để khắc phục sau này: GPT-5.5 Pro.
Ví dụ thực tế: chi phí tác nhân mã hóa trên mỗi tác vụ
Một phiên mã hóa tác nhân điển hình thông qua API trên GPT-5.5 với reasoning.effort: "medium" sẽ như sau.
- Token đầu vào cho mỗi tác vụ (ngữ cảnh kho lưu trữ + lời nhắc của người dùng): ~15.000
- Token đầu ra cho mỗi tác vụ (mã + giải thích): ~3.000
- Token suy luận cho mỗi tác vụ (nỗ lực trung bình): ~6.000
Chi phí cho mỗi tác vụ với giá tiêu chuẩn:
- Đầu vào: 15 Nghìn × 5,00 đô la / Triệu = 0,075 đô la
- Đầu ra: (3 Nghìn + 6 Nghìn) × 30,00 đô la / Triệu = 0,27 đô la
- Tổng cộng: 0,345 đô la cho mỗi tác vụ mã hóa hoàn thành.
Chạy cùng khối lượng công việc trên GPT-5.4:
- Đầu vào: 15 Nghìn × 2,50 đô la / Triệu = 0,0375 đô la
- Đầu ra: 9 Nghìn × 15,00 đô la / Triệu = 0,135 đô la
- Tổng cộng: 0,1725 đô la cho mỗi tác vụ mã hóa hoàn thành.
GPT-5.5 có chi phí chính xác gấp 2 lần cho mỗi tác vụ với cùng mức độ nỗ lực suy luận. Việc nâng cấp sẽ tự bù đắp chi phí khi khoảng cách hiệu suất SWE-bench (88,7% so với khoảng 74%) giúp hoàn thành đủ số tác vụ thành công để loại bỏ một lượt đi lại thứ hai. Nếu cứ tám tác vụ trên GPT-5.4 lại cần viết lại thủ công, thì GPT-5.5 sẽ rẻ hơn xét về tổng thể.
Các biện pháp kiểm soát chi phí đáng xây dựng ngay từ Ngày 1
Năm đòn bẩy giúp hóa đơn GPT-5.5 không gây bất ngờ.
- Giới hạn cứng
max_output_tokens. Mọi cuộc gọi, mọi lúc. Mặc định là 2.000 trừ khi bạn cần đầu ra dài rõ ràng. - Sơ đồ JSON nghiêm ngặt. Đầu ra bị lỗi có nghĩa là phải thử lại; việc thử lại là một cuộc gọi tính phí đầy đủ.
- Định tuyến theo độ khó. Phân loại yêu cầu dễ cho GPT-5.4-mini; chuyển yêu cầu khó cho GPT-5.5. Một bộ định tuyến 10 dòng tiết kiệm hơn bất kỳ tối ưu hóa cấp lời nhắc nào.
- Sử dụng Batch cho mọi thứ ngoại tuyến. Đánh giá, bổ sung dữ liệu, tạo báo cáo hàng đêm; tất cả đều giảm giá 50%.
- Theo dõi
usage.reasoning_tokens. Bất ngờ về hóa đơn trên GPT-5.5 gần như luôn là chi phí token suy luận ở mức nỗ lực cao. Hãy đặt cảnh báo về điều đó.
Ước tính chi phí hàng tháng theo gói
Nếu bạn đang chọn một cấp ChatGPT để truy cập GPT-5.5, đây là chi phí của mỗi gói.
| Gói | Giá hàng tháng | Phù hợp nhất |
|---|---|---|
| Miễn phí | $0 | Dùng thử GPT-5.5 qua Codex trước khi cam kết |
| Go | $4 / tháng | Học sinh, sinh viên và người dùng ít sử dụng muốn giới hạn gấp 2 lần gói Miễn phí |
| Plus | $20 / tháng | Nhà phát triển cá nhân sử dụng Codex + ChatGPT hàng ngày |
| Pro | $200 / tháng | Người dùng nâng cao muốn Thinking và Pro trong ChatGPT |
| Business | $25 / chỗ / tháng | Các nhóm cần không gian làm việc chung |
| Doanh nghiệp / Giáo dục | Tùy chỉnh | Dựa trên hợp đồng với SLA |
Đối với bất kỳ ai chạy hơn ~4 triệu token đầu ra mỗi tháng trên API, gói Pro trong ChatGPT cộng với Codex CLI sẽ rẻ hơn so với thanh toán API theo mức sử dụng, miễn là khối lượng công việc nằm trong cửa sổ ngữ cảnh 400 Nghìn của CLI.
Các tín hiệu thay đổi giá cần theo dõi
Hai tín hiệu đáng theo dõi nếu bạn đang lập ngân sách dài hạn.
- Phiên bản GA (General Availability) của API GPT-5.5. Giá có thể giảm xuống khi OpenAI phản ứng với áp lực cạnh tranh từ Anthropic Claude Mythos, Gemini 3.5 và các mô hình mã nguồn mở được đánh giá trên bảng xếp hạng Vellum.
- Dân chủ hóa mô hình Pro. OpenAI trong lịch sử đã giảm giá các gói Pro trong vòng 3–6 tháng kể từ mỗi lần phát hành. Đừng cho rằng mức giá 30 đô la / 180 đô la hôm nay là vĩnh viễn; cũng đừng cho rằng nó sẽ giảm.
Câu hỏi thường gặp
Việc lưu bộ nhớ đệm có giảm chi phí đầu vào không?Có. Các token đầu vào được lưu trong bộ nhớ đệm trên GPT-5.5 được tính phí bằng một phần nhỏ so với mức tiêu chuẩn; trang giá của OpenAI có hệ số nhân chính xác. Hãy lưu vào bộ nhớ đệm bất kỳ thứ gì bạn sử dụng lại trong nhiều hơn một yêu cầu (lời nhắc hệ thống, sơ đồ công cụ, ngữ cảnh kho lưu trữ).
Có chiết khấu số lượng lớn không?Không có công bố. Các hợp đồng doanh nghiệp thường bao gồm mức giá tùy chỉnh, và OpenAI điều chỉnh giá để đáp lại mức sử dụng liên tục. Hãy liên hệ với bộ phận bán hàng nếu chi tiêu hàng năm của bạn vượt quá bảy con số.
Chế độ suy nghĩ có tốn thêm chi phí ngoài giá mỗi token không?Không. Nó tốn kém hơn vì nó sử dụng nhiều token hơn, chứ không phải vì giá mỗi token thay đổi.
Việc sử dụng Codex CLI có được tính phí riêng với việc sử dụng API không?Chỉ khi bạn đăng nhập bằng khóa API. Đăng nhập ChatGPT sẽ tính phí gói; đăng nhập bằng khóa API sẽ tính phí theo tài khoản dựa trên mức sử dụng.
Cách rẻ nhất để dùng thử GPT-5.5 là gì?Gói Free hoặc Go cộng với Codex CLI. Xem hướng dẫn về con đường miễn phí của chúng tôi để biết mọi tùy chọn không tốn phí.
