TL;DR / Trả lời Nhanh
GPT-5.4 là mô hình tiên tiến nhất của OpenAI dành cho công việc chuyên nghiệp, được phát hành vào ngày 5 tháng 3 năm 2026. Nó kết hợp khả năng lập trình hàng đầu trong ngành từ GPT-5.3-Codex với khả năng suy luận, sử dụng máy tính và tích hợp công cụ được nâng cao. Mô hình này đạt tỷ lệ thắng 83% trong các tác vụ công việc tri thức, 75% trong các điểm chuẩn sử dụng máy tính và sử dụng ít token hơn đáng kể so với GPT-5.2. Có sẵn thông qua API với giá 2,50 USD/M token đầu vào và 15 USD/M token đầu ra, với phiên bản Pro (30 USD/180 USD) cho các tác vụ phức tạp.
Giới thiệu
OpenAI vừa nâng tầm tiêu chuẩn cho công việc chuyên nghiệp được hỗ trợ bởi AI. Vào ngày 5 tháng 3 năm 2026, họ đã phát hành GPT-5.4, một mô hình đạt tỷ lệ thắng 83% trước các chuyên gia trong ngành trong các tác vụ công việc tri thức thực tế, đồng thời sử dụng ít token hơn đáng kể so với phiên bản tiền nhiệm.
Nếu bạn đã từng làm việc với các mô hình AI bị "ảo giác" thông tin, gặp khó khăn với các quy trình làm việc phức tạp hoặc đốt cháy token cho các tác vụ đơn giản, GPT-5.4 giải quyết trực tiếp những vấn đề này. Nó ít có khả năng mắc lỗi thực tế hơn 33% và hoàn thành các tác vụ sử dụng máy tính nhanh hơn 3 lần so với các mô hình trước đây.
Hướng dẫn này phân tích những gì GPT-5.4 thực sự làm, cách nó so sánh với các phiên bản trước và liệu những cải tiến về hiệu suất có xứng đáng với chi phí token cao hơn hay không. Bạn sẽ nhận được dữ liệu điểm chuẩn cụ thể, so sánh hiệu suất thực tế và hướng dẫn rõ ràng về biến thể GPT-5.4 nào phù hợp với trường hợp sử dụng của bạn.
Bạn sẽ học được:
- Các cải tiến hiệu suất chính xác so với GPT-5.2 và GPT-5.3-Codex
- Điểm chuẩn về lập trình, sử dụng máy tính và công việc tri thức
- Khả năng sử dụng máy tính và thị giác mới với các ví dụ thực tế
- Phân tích giá cả và khi nào nên sử dụng phiên bản Pro so với tiêu chuẩn
- Cân nhắc tích hợp cho các nhà phát triển API
GPT-5.4 là gì?
GPT-5.4 đại diện cho mô hình đa năng đầu tiên của OpenAI với khả năng sử dụng máy tính gốc. Nó kết hợp sự xuất sắc trong lập trình của GPT-5.3-Codex với khả năng suy luận, nhận thức thị giác và tích hợp công cụ được nâng cao thành một mô hình tiên tiến duy nhất.

Mô hình này nhắm mục tiêu ba kịch bản chuyên nghiệp cốt lõi:
Công việc tri thức - Tạo bảng tính, bản trình bày, tài liệu và phân tích trên 44 ngành nghề. GPT-5.4 sánh ngang hoặc vượt trội so với các chuyên gia trong ngành trong 83% các so sánh trên GDPval, tăng từ 70,9% đối với GPT-5.2.
Sử dụng máy tính và tác nhân - Vận hành máy tính thông qua các lệnh chuột/bàn phím, tự động hóa trình duyệt và quy trình làm việc nhiều bước trên các ứng dụng. Đạt tỷ lệ thành công 75% trên OSWorld-Verified, vượt qua hiệu suất của con người ở mức 72,4%.
Lập trình và phát triển - Viết, gỡ lỗi và lặp lại mã với hiệu suất hàng đầu trên SWE-Bench Pro (57,7%) trong khi hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cho các cơ sở mã phức tạp.
GPT-5.4 có hai biến thể:
- GPT-5.4 - Mô hình tiêu chuẩn cho hầu hết các tác vụ chuyên nghiệp
- GPT-5.4 Pro - Hiệu suất tối đa cho các tác vụ suy luận phức tạp (30 USD/M đầu vào, 180 USD/M đầu ra)
Các cải tiến chính so với GPT-5.2
GPT-5.4 không phải là một bản cập nhật gia tăng. OpenAI đã đạt được những bước tiến đáng kể trên bốn lĩnh vực quan trọng.
1. Độ chính xác thực tế và Giảm thiểu "ảo giác"
Các tuyên bố sai giảm 33% ở cấp độ tuyên bố cá nhân. Các phản hồi đầy đủ chứa ít lỗi hơn 18% nói chung. Điều này rất quan trọng khi bạn tạo tài liệu pháp lý, mô hình tài chính hoặc tài liệu kỹ thuật mà một thực tế bị "ảo giác" duy nhất có thể làm hỏng toàn bộ dự án.
2. Hiệu quả Token
GPT-5.4 sử dụng ít token hơn đáng kể để giải quyết vấn đề so với GPT-5.2. Trong các quy trình làm việc nặng về công cụ với điểm chuẩn MCP Atlas, mức sử dụng token giảm 47% trong khi vẫn duy trì độ chính xác. Đối với người dùng API khối lượng lớn, việc tăng hiệu quả này bù đắp cho giá mỗi token cao hơn.
3. Khả năng sử dụng máy tính
Các mô hình trước đây yêu cầu các mô hình chuyên biệt riêng biệt để sử dụng máy tính. GPT-5.4 xử lý điều này một cách tự nhiên:
- Thực hiện các lệnh chuột và bàn phím từ ảnh chụp màn hình
- Tự động hóa trình duyệt thông qua Playwright
- Điều hướng môi trường máy tính để bàn thông qua các tương tác dựa trên tọa độ
- Hỗ trợ các chính sách an toàn tùy chỉnh và yêu cầu xác nhận
4. Tìm kiếm và Tích hợp Công cụ
Tìm kiếm công cụ loại bỏ nhu cầu tải hàng nghìn định nghĩa công cụ vào mỗi yêu cầu. Mô hình tra cứu định nghĩa công cụ theo yêu cầu, giảm chi phí token ban đầu và cho phép làm việc với các hệ sinh thái chứa hàng chục nghìn công cụ.
Trên điểm chuẩn Toolathlon, GPT-5.4 đạt độ chính xác 54,6% so với 45,7% của GPT-5.2, với ít kết quả công cụ hơn (đại diện độ trễ) được yêu cầu.
Điểm chuẩn hiệu suất GPT-5.4
Dữ liệu điểm chuẩn cho thấy GPT-5.4 vượt trội ở đâu và các mô hình trước đó vẫn cạnh tranh ở đâu.
Công việc tri thức (GDPval)
Mô hình | Tỷ lệ thắng so với Chuyên gia |
|---|---|
GPT-5.4 | 83.0% |
GPT-5.4 Pro | 82.0% |
GPT-5.2 Pro | 74.1% |
GPT-5.2 | 70.9% |
GDPval kiểm tra công việc tri thức được xác định rõ ràng trên 44 ngành nghề từ 9 ngành công nghiệp hàng đầu đóng góp vào GDP của Hoa Kỳ. Các tác vụ bao gồm bản trình bày bán hàng, bảng tính kế toán, lịch trình chăm sóc khẩn cấp, sơ đồ sản xuất và video ngắn.
Tạo bảng tính và tài liệu
Trên các tác vụ mô hình hóa ngân hàng đầu tư nội bộ:
- GPT-5.4: Điểm trung bình 87,3%
- GPT-5.2: Điểm trung bình 68,4%
Đối với đánh giá bản trình bày, những người đánh giá là con người ưa thích đầu ra của GPT-5.4 68% số lần nhờ tính thẩm mỹ mạnh mẽ hơn, sự đa dạng hình ảnh lớn hơn và việc sử dụng tạo hình ảnh hiệu quả hơn.
Hiệu suất lập trình (SWE-Bench Pro)
Mô hình | Độ chính xác | Độ trễ ước tính |
|---|---|---|
GPT-5.4 | 57.7% | ~1000s |
GPT-5.3-Codex | 56.8% | ~1200s |
GPT-5.2 | 55.6% | ~1500s |

GPT-5.4 sánh ngang hoặc vượt trội so với GPT-5.3-Codex trên SWE-Bench Pro trong khi mang lại độ trễ thấp hơn trong các nỗ lực suy luận. Chế độ /fast trong Codex mang lại tốc độ token nhanh hơn tới 1,5 lần với GPT-5.4.
Sử dụng máy tính (OSWorld-Verified)
OSWorld-Verified đo lường thành công trong việc điều hướng môi trường máy tính để bàn thông qua ảnh chụp màn hình và các hành động bàn phím/chuột:
- GPT-5.4: 75,0%
- GPT-5.3-Codex: 74,0% (với tham số API giữ nguyên độ phân giải hình ảnh gốc)
- GPT-5.2: 47,3%
- Hiệu suất của con người: 72,4%
Điểm chuẩn này kiểm tra các quy trình làm việc trên máy tính để bàn thực tế: quản lý email và lịch, nhập dữ liệu hàng loạt, thao tác tệp và các tác vụ đa ứng dụng.
Duyệt web (BrowseComp)
BrowseComp kiểm tra nghiên cứu web liên tục để tìm thông tin khó định vị:
- GPT-5.4 Pro: 89,3%
- GPT-5.4: 82,7%
- GPT-5.2 Pro: 77,9%
- GPT-5.2: 65,8%
Cải thiện tuyệt đối 17% so với GPT-5.2 phản ánh khả năng tổng hợp thông tin đa nguồn tốt hơn và chiến lược tìm kiếm bền bỉ hơn.
Hiểu biết về thị giác
MMMU Pro (không có công cụ) - Kiểm tra hiểu biết và suy luận về thị giác:
- GPT-5.4: 81,2%
- GPT-5.2: 79,5%
OmniDocBench - Độ chính xác phân tích tài liệu (lỗi thấp hơn = tốt hơn):
- GPT-5.4: Khoảng cách chỉnh sửa chuẩn hóa 0,109
- GPT-5.2: Khoảng cách chỉnh sửa chuẩn hóa 0,140
Khả năng sử dụng máy tính và thị giác
Khả năng sử dụng máy tính của GPT-5.4 cần được kiểm tra chi tiết. Đây là mô hình đa năng đầu tiên của OpenAI có thể vận hành máy tính một cách tự nhiên.
Cách hoạt động của việc sử dụng máy tính
Mô hình diễn giải ảnh chụp màn hình giao diện trình duyệt hoặc máy tính để bàn và phản hồi bằng:
- Nhấp chuột dựa trên tọa độ vào các yếu tố giao diện người dùng
- Nhập liệu bằng bàn phím để nhập văn bản
- Các lệnh Playwright để tự động hóa trình duyệt
- Di chuyển chuột và thao tác kéo
Các nhà phát triển cấu hình hành vi thông qua các thông báo hệ thống, điều chỉnh các chính sách an toàn và yêu cầu xác nhận dựa trên mức độ chấp nhận rủi ro.
Ví dụ thực tế về sử dụng máy tính
Mainstay đã kiểm thử GPT-5.4 trên khoảng 30.000 cổng thông tin HOA và thuế tài sản:
- GPT-5.4: Thành công 95% ngay lần thử đầu tiên, 100% trong ba lần thử
- Các mô hình CUA trước đây: Tỷ lệ thành công 73-79%
- Hoàn thành phiên: Nhanh hơn 3 lần với GPT-5.4
- Mức sử dụng token: Ít token hơn 70% cho mỗi phiên
Mô hình điều hướng giao diện cổng thông tin, trích xuất dữ liệu từ các bố cục giao diện người dùng đa dạng, xử lý luồng xác thực và quản lý các trường hợp đặc biệt như mã captcha hoặc biểu mẫu nhiều bước.
Nhận thức thị giác nâng cao
GPT-5.4 giới thiệu mức độ chi tiết đầu vào hình ảnh gốc hỗ trợ:
- Tổng số pixel lên đến 10,24 triệu
- Kích thước tối đa 6000 pixel
- Nhận thức trung thực hoàn toàn cho hình ảnh có độ phân giải cao, dày đặc
Mức độ chi tiết cao hỗ trợ tổng số pixel lên đến 2,56 triệu hoặc kích thước tối đa 2048 pixel. Thử nghiệm người dùng API ban đầu cho thấy những cải thiện đáng kể về khả năng bản địa hóa, hiểu hình ảnh và độ chính xác khi nhấp chuột với cài đặt gốc hoặc chi tiết cao.
Cải tiến phân tích tài liệu
Nhận thức thị giác tốt hơn chuyển thành khả năng xử lý tài liệu. GPT-5.4 phân tích:
- Các tệp PDF nhiều trang có bảng và hình ảnh
- Các tài liệu được quét với bố cục đa dạng
- Ảnh chụp màn hình chứa văn bản và các yếu tố giao diện người dùng
- Sơ đồ và biểu đồ kỹ thuật
Mức cải thiện 22% trên OmniDocBench (tỷ lệ lỗi từ 0,140 xuống 0,109) phản ánh khả năng này.
Các tính năng lập trình và phát triển
GPT-5.4 kế thừa sự xuất sắc trong lập trình của GPT-5.3-Codex trong khi bổ sung khả năng sử dụng máy tính cho các quy trình làm việc phát triển tích hợp.
Phát triển Frontend
Các đánh giá nội bộ cho thấy GPT-5.4 vượt trội trong các tác vụ frontend phức tạp với kết quả thẩm mỹ và chức năng rõ rệt hơn so với các mô hình trước đây. Kỹ năng Playwright Interactive thử nghiệm trong Codex minh họa điều này:
Ví dụ: Mô phỏng công viên giải trí Một lời nhắc duy nhất đã tạo ra mô phỏng công viên giải trí đẳng cự với:
- Đặt đường đi dựa trên ô
- Xây dựng trò chơi và cảnh quan
- Tìm đường và xếp hàng của khách
- Các chỉ số công viên (tiền, khách, hạnh phúc, sạch sẽ)
- Kiểm thử trình duyệt thông qua tự động hóa Playwright
- Tạo hình ảnh cho tài sản đẳng cự
Mô hình đã xây dựng trò chơi, sau đó sử dụng Playwright để tự động hóa các thử nghiệm, xác minh vị trí, điều hướng, phản ứng của khách và sự ổn định của giao diện người dùng qua nhiều vòng.
Chế độ nhanh cho nhà phát triển
GPT-5.4 trong Codex hỗ trợ chế độ /fast mang lại tốc độ token nhanh hơn tới 1,5 lần. Các nhà phát triển API truy cập tốc độ tương đương thông qua xử lý ưu tiên. Điều này duy trì cùng một mức độ thông minh trong khi giảm thời gian lặp lại trong quá trình gỡ lỗi và phát triển.
Hỗ trợ cửa sổ ngữ cảnh
GPT-5.4 Codex bao gồm hỗ trợ cửa sổ ngữ cảnh 1 triệu token thử nghiệm. Cấu hình thông qua:
- Tham số
model_context_window - Tham số
model_auto_compact_token_limit
Các yêu cầu vượt quá ngữ cảnh tiêu chuẩn 272K được tính vào giới hạn sử dụng với tỷ lệ gấp đôi so với bình thường. Điều này cho phép phân tích toàn bộ cơ sở mã, các bộ tài liệu lớn hoặc các dự án nhiều tệp trong một yêu cầu duy nhất.
Apidog cho Tài liệu API:tài liệu API

Tích hợp và Tìm kiếm Công cụ
Tìm kiếm công cụ đại diện cho một sự thay đổi cơ bản trong cách các mô hình tương tác với các công cụ bên ngoài và máy chủ MCP.
Cách hoạt động của Tìm kiếm công cụ
Cách tiếp cận trước đây: Tất cả các định nghĩa công cụ được tải vào mọi yêu cầu ngay từ đầu. Đối với các hệ thống có nhiều công cụ, điều này đã thêm hàng nghìn đến hàng chục nghìn token, làm tăng chi phí và làm chậm phản hồi.
Cách tiếp cận tìm kiếm công cụ: Mô hình nhận một danh sách nhẹ các công cụ có sẵn. Khi cần, nó sẽ tra cứu các định nghĩa công cụ cụ thể và nối chúng vào cuộc trò chuyện tại thời điểm đó.
Ví dụ tiết kiệm Token
Điểm chuẩn MCP Atlas của Scale đã kiểm tra 250 tác vụ với tất cả 36 máy chủ MCP được bật:

Phân tích token không có tìm kiếm công cụ:
- 65.320 token đầu vào ban đầu (định nghĩa công cụ)
- Các token bổ sung từ đầu ra công cụ
- Token đầu ra
Tìm kiếm công cụ loại bỏ chi phí ban đầu trong khi vẫn duy trì hiệu quả bộ đệm.
Hiệu suất MCP Atlas
Trên điểm chuẩn MCP Atlas (250 tác vụ, 36 máy chủ MCP):
- GPT-5.4: Độ chính xác 67,2%
- GPT-5.2: Độ chính xác 60,6%
Mô hình hoạt động với các hệ sinh thái công cụ lớn hơn mà không làm giảm độ chính xác hoặc làm quá tải cửa sổ ngữ cảnh.
Gọi công cụ theo tác nhân
Điểm chuẩn Toolathlon kiểm tra các quy trình làm việc công cụ nhiều bước (đọc email, trích xuất tệp đính kèm, tải tệp lên, chấm điểm, ghi lại kết quả):

Kết quả công cụ (chờ phản hồi của công cụ) phản ánh độ trễ tốt hơn số lượng cuộc gọi công cụ vì chúng nắm bắt được lợi ích song song. GPT-5.4 hoàn thành tác vụ trong ít vòng hơn.
GPT-5.4 so với GPT-5.3-Codex so với GPT-5.2
Việc lựa chọn giữa các mô hình phụ thuộc vào các yêu cầu cụ thể của bạn.
Khi nào nên sử dụng GPT-5.4
- Yêu cầu sử dụng máy tính - Vận hành máy tính gốc, tự động hóa trình duyệt
- Công việc tri thức - Bảng tính, bản trình bày, tài liệu
- Quy trình làm việc nặng về công cụ - Máy chủ MCP, API bên ngoài, tự động hóa nhiều bước
- Nhạy cảm về chi phí ở quy mô lớn - Hiệu quả token giảm tổng chi phí mặc dù giá mỗi token cao hơn
- Nhu cầu ngữ cảnh dài - Lên đến 1 triệu token cho các cơ sở mã phức tạp
Khi GPT-5.3-Codex vẫn cạnh tranh
- Các tác vụ lập trình thuần túy - Hiệu suất SWE-Bench Pro tương tự (56,8% so với 57,7%)
- Các quy trình làm việc Codex đã thiết lập - Các tích hợp hiện có có thể không cần sử dụng máy tính
- Tối ưu hóa chi phí - Nếu giá GPT-5.3-Codex vẫn thấp hơn
Khi GPT-5.2 là đủ
- Các truy vấn đơn giản - Hỏi đáp cơ bản, tóm tắt, tạo nội dung đơn giản
- Hạn chế ngân sách - Chi phí mỗi token thấp hơn (1,75 USD/14 USD so với 2,50 USD/15 USD)
- Các quy trình làm việc không phải tác nhân - Các yêu cầu một lượt không sử dụng công cụ
So sánh giá cả
Mô hình | Giá đầu vào | Đầu vào được lưu vào bộ nhớ cache | Giá đầu ra |
|---|---|---|---|
GPT-5.2 | 1,75 USD/M | 0,175 USD/M | 14 USD/M |
GPT-5.4 | 2,50 USD/M | 0,25 USD/M | 15 USD/M |
GPT-5.2 Pro | 21 USD/M | - | 168 USD/M |
GPT-5.4 Pro | 30 USD/M | - | 180 USD/M |
Giá hàng loạt và Linh hoạt có sẵn với 50% mức giá tiêu chuẩn. Xử lý ưu tiên ở mức 200% mức giá tiêu chuẩn.
Tùy chọn khả dụng và truy cập
GPT-5.4 đã được triển khai dần dần bắt đầu từ ngày 5 tháng 3 năm 2026 trên ChatGPT, Codex và API.
Truy cập ChatGPT
GPT-5.4 Thinking có sẵn cho:
- Người đăng ký ChatGPT Plus
- Người đăng ký ChatGPT Team
- Người đăng ký ChatGPT Pro
GPT-5.4 Pro có sẵn cho:
- Người đăng ký ChatGPT Pro
- Người đăng ký ChatGPT Enterprise
Truy cập kế thừa: GPT-5.2 Thinking vẫn có sẵn trong ba tháng trong phần Mô hình Kế thừa, sẽ ngừng hoạt động vào ngày 5 tháng 6 năm 2026.
Doanh nghiệp và Giáo dục: Quyền truy cập sớm có sẵn thông qua cài đặt quản trị viên.
Truy cập Codex
GPT-5.4 là mô hình mặc định trong Codex với:
- Hỗ trợ cửa sổ ngữ cảnh 1 triệu thử nghiệm
- Kỹ năng Playwright Interactive để kiểm thử trình duyệt
- Chế độ /fast để tăng tốc độ token 1,5 lần
Truy cập API
Tên mô hình:
gpt-5.4- Mô hình tiêu chuẩngpt-5.4-pro- Mô hình Pro cho các tác vụ phức tạp
Cửa sổ ngữ cảnh:
- Tiêu chuẩn: 272K token
- Mở rộng: Lên đến 1 triệu token (thử nghiệm, tốc độ sử dụng gấp 2 lần)
Giá cả:
- Tiêu chuẩn: 2,50 USD/M đầu vào, 0,25 USD/M đầu vào được lưu vào bộ nhớ cache, 15 USD/M đầu ra
- Pro: 30 USD/M đầu vào, 180 USD/M đầu ra
- Hàng loạt/Linh hoạt: Giảm giá 50%
- Ưu tiên: Tỷ lệ tiêu chuẩn gấp 2 lần
Lịch trình ngừng hoạt động
GPT-5.2 Thinking ngừng hoạt động vào ngày 5 tháng 6 năm 2026. Hãy di chuyển các quy trình làm việc trước ngày này để tránh gián đoạn.
Kết luận
GPT-5.4 mang lại những cải tiến đáng kể trong công việc tri thức, sử dụng máy tính và các tác vụ lập trình. Tỷ lệ thắng GDPval 83%, điểm OSWorld-Verified 75% và độ chính xác SWE-Bench Pro 57,7% khẳng định nó là công nghệ tiên tiến nhất cho các quy trình làm việc AI chuyên nghiệp.
Đối với các nhà phát triển tích hợp GPT-5.4 vào ứng dụng, việc có các công cụ kiểm thử và gỡ lỗi API mạnh mẽ trở nên cần thiết. Apidog hợp lý hóa quá trình tích hợp với khả năng thiết kế, gỡ lỗi, kiểm thử và tài liệu API hợp nhất. Cho dù bạn đang xây dựng tác nhân AI, tự động hóa quy trình làm việc hay tạo các tính năng hướng tới khách hàng được hỗ trợ bởi GPT-5.4, Apidog đều giúp đảm bảo các tích hợp API của bạn hoạt động chính xác ngay từ ngày đầu tiên.
Những điểm chính:
- Giảm 33% các tuyên bố sai và ít lỗi phản hồi hơn 18%
- Giảm 47% token trong các quy trình làm việc nặng về công cụ
- Tỷ lệ thành công sử dụng máy tính 75%, vượt qua mức cơ bản của con người
- Vận hành máy tính gốc thông qua các lệnh chuột/bàn phím
- Tìm kiếm công cụ cho phép làm việc với hàng chục nghìn công cụ
- Cửa sổ ngữ cảnh 1 triệu token cho các cơ sở mã phức tạp
- Có sẵn với giá 2,50 USD/15 USD mỗi triệu token (biến thể tiêu chuẩn)
Khi nào nên áp dụng:
- Bạn cần sử dụng máy tính hoặc tự động hóa trình duyệt
- Hiệu quả token quan trọng đối với các quy trình làm việc khối lượng lớn
- Độ chính xác thực tế rất quan trọng (pháp lý, tài chính, kỹ thuật)
- Bạn làm việc với các hệ sinh thái công cụ lớn hoặc máy chủ MCP
- Phân tích ngữ cảnh dài của cơ sở mã hoặc tài liệu
Khi nào nên chờ:
- Các quy trình làm việc hỏi đáp đơn giản không được hưởng lợi từ các khả năng mới
- Hạn chế ngân sách ưu tiên chi phí mỗi token thấp nhất
- Các quy trình làm việc GPT-5.2 hoặc GPT-5.3-Codex hiện có hoạt động đầy đủ
GPT-5.4 đại diện cho mô hình suy luận hiệu quả nhất của OpenAI cho đến nay. Sự kết hợp giữa giảm "ảo giác", cải thiện hiệu quả token và khả năng sử dụng máy tính gốc biện minh cho giá mỗi token cao hơn đối với các ứng dụng chuyên nghiệp.
FAQ
Sự khác biệt giữa GPT-5.4 và GPT-5.2 là gì?
GPT-5.4 đạt tỷ lệ thắng 83% trong công việc tri thức so với 70,9% của GPT-5.2, sử dụng ít token hơn đáng kể, có khả năng sử dụng máy tính gốc và giảm lỗi thực tế 33%. Giá cao hơn (2,50 USD/15 USD so với 1,75 USD/14 USD) nhưng tổng chi phí có thể thấp hơn do tăng hiệu quả.
API GPT-5.4 có giá bao nhiêu?
GPT-5.4 có giá 2,50 USD cho mỗi triệu token đầu vào, 0,25 USD cho mỗi triệu token đầu vào được lưu vào bộ nhớ cache và 15 USD cho mỗi triệu token đầu ra. GPT-5.4 Pro có giá 30 USD/M đầu vào và 180 USD/M đầu ra. Giá hàng loạt và Linh hoạt giảm 50%.
GPT-5.4 có giới hạn cửa sổ ngữ cảnh không?
Cửa sổ ngữ cảnh tiêu chuẩn là 272K token. Hỗ trợ cửa sổ ngữ cảnh 1 triệu token thử nghiệm có sẵn trong Codex bằng cách cấu hình các tham số model_context_window và model_auto_compact_token_limit. Các yêu cầu vượt quá 272K được tính với tỷ lệ sử dụng gấp 2 lần.
GPT-5.4 Pro được sử dụng để làm gì?
GPT-5.4 Pro nhắm mục tiêu hiệu suất tối đa cho các tác vụ suy luận phức tạp. Nó đạt điểm cao hơn trên các điểm chuẩn như BrowseComp (89,3% so với 82,7%) và GDPval (82,0% so với 83,0% tiêu chuẩn) nhưng chi phí gấp 12 lần (30 USD/180 USD so với 2,50 USD/15 USD).
GPT-5.4 được phát hành khi nào?
GPT-5.4 được phát hành vào ngày 5 tháng 3 năm 2026, được triển khai dần dần trên ChatGPT, Codex và API. GPT-5.2 Thinking vẫn có sẵn cho đến ngày 5 tháng 6 năm 2026 để di chuyển.
GPT-5.4 có thể sử dụng máy tính và trình duyệt không?
Có. GPT-5.4 là mô hình đa năng đầu tiên của OpenAI có khả năng sử dụng máy tính gốc. Nó thực hiện các lệnh chuột/bàn phím, tự động hóa trình duyệt thông qua Playwright và điều hướng môi trường máy tính để bàn thông qua việc diễn giải ảnh chụp màn hình.
Tìm kiếm công cụ trong GPT-5.4 là gì?
Tìm kiếm công cụ cho phép mô hình tra cứu định nghĩa công cụ theo yêu cầu thay vì tải tất cả các định nghĩa ngay từ đầu. Điều này giảm mức sử dụng token 47% trong các quy trình làm việc nặng về công cụ và cho phép làm việc với các hệ sinh thái chứa hàng chục nghìn công cụ.
GPT-5.4 so sánh với GPT-5.3-Codex như thế nào về lập trình?
GPT-5.4 sánh ngang hoặc vượt trội so với GPT-5.3-Codex trên SWE-Bench Pro (57,7% so với 56,8%) trong khi mang lại độ trễ thấp hơn và bổ sung khả năng sử dụng máy tính. Đây là lựa chọn được khuyến nghị cho các quy trình làm việc phát triển mới.
GPT-5.4 có sẵn trong ChatGPT không?
Có. GPT-5.4 Thinking có sẵn cho người đăng ký Plus, Team và Pro. GPT-5.4 Pro có sẵn cho các gói Pro và Enterprise. GPT-5.2 Thinking vẫn có sẵn trong phần Mô hình Kế thừa cho đến ngày 5 tháng 6 năm 2026.
Các cân nhắc về an toàn đối với GPT-5.4 là gì?
GPT-5.4 được coi là có khả năng mạng cao theo Khung chuẩn bị của OpenAI. Các biện pháp bảo vệ bao gồm ngăn xếp an toàn mạng mở rộng, hệ thống giám sát, kiểm soát truy cập đáng tin cậy và chặn không đồng bộ đối với các yêu cầu rủi ro cao hơn trên các bề mặt Không giữ dữ liệu. Một số lỗi dương tính giả có thể xảy ra khi các bộ phân loại được cải thiện.
