GPT-5.4 Là Gì? Hướng Dẫn Chi Tiết Về Mô Hình Mạnh Nhất Của OpenAI

Ashley Innocent

Ashley Innocent

6 tháng 3 2026

GPT-5.4 Là Gì? Hướng Dẫn Chi Tiết Về Mô Hình Mạnh Nhất Của OpenAI

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

TL;DR / Trả lời Nhanh

GPT-5.4 là mô hình tiên tiến nhất của OpenAI dành cho công việc chuyên nghiệp, được phát hành vào ngày 5 tháng 3 năm 2026. Nó kết hợp khả năng lập trình hàng đầu trong ngành từ GPT-5.3-Codex với khả năng suy luận, sử dụng máy tính và tích hợp công cụ được nâng cao. Mô hình này đạt tỷ lệ thắng 83% trong các tác vụ công việc tri thức, 75% trong các điểm chuẩn sử dụng máy tính và sử dụng ít token hơn đáng kể so với GPT-5.2. Có sẵn thông qua API với giá 2,50 USD/M token đầu vào và 15 USD/M token đầu ra, với phiên bản Pro (30 USD/180 USD) cho các tác vụ phức tạp.

Giới thiệu

OpenAI vừa nâng tầm tiêu chuẩn cho công việc chuyên nghiệp được hỗ trợ bởi AI. Vào ngày 5 tháng 3 năm 2026, họ đã phát hành GPT-5.4, một mô hình đạt tỷ lệ thắng 83% trước các chuyên gia trong ngành trong các tác vụ công việc tri thức thực tế, đồng thời sử dụng ít token hơn đáng kể so với phiên bản tiền nhiệm.

Nếu bạn đã từng làm việc với các mô hình AI bị "ảo giác" thông tin, gặp khó khăn với các quy trình làm việc phức tạp hoặc đốt cháy token cho các tác vụ đơn giản, GPT-5.4 giải quyết trực tiếp những vấn đề này. Nó ít có khả năng mắc lỗi thực tế hơn 33% và hoàn thành các tác vụ sử dụng máy tính nhanh hơn 3 lần so với các mô hình trước đây.

💡
Đối với các nhà phát triển đang xây dựng ứng dụng hỗ trợ AI, việc kiểm thử và xác thực tích hợp API trở nên rất quan trọng. Các công cụ như Apidog giúp bạn thiết kế, gỡ lỗi và kiểm thử các điểm cuối API cho dù bạn đang tích hợp GPT-5.4 hay xây dựng dịch vụ của riêng mình. Nền tảng hợp nhất của Apidog kết hợp thiết kế API, gỡ lỗi, kiểm thử và mô phỏng trong một giao diện duy nhất, hợp lý hóa quy trình phát triển cho các nhóm tích hợp các mô hình AI vào ứng dụng của họ.
button

Hướng dẫn này phân tích những gì GPT-5.4 thực sự làm, cách nó so sánh với các phiên bản trước và liệu những cải tiến về hiệu suất có xứng đáng với chi phí token cao hơn hay không. Bạn sẽ nhận được dữ liệu điểm chuẩn cụ thể, so sánh hiệu suất thực tế và hướng dẫn rõ ràng về biến thể GPT-5.4 nào phù hợp với trường hợp sử dụng của bạn.

Bạn sẽ học được:

GPT-5.4 là gì?

GPT-5.4 đại diện cho mô hình đa năng đầu tiên của OpenAI với khả năng sử dụng máy tính gốc. Nó kết hợp sự xuất sắc trong lập trình của GPT-5.3-Codex với khả năng suy luận, nhận thức thị giác và tích hợp công cụ được nâng cao thành một mô hình tiên tiến duy nhất.

Image showing GPT-5.4's capabilities across coding, knowledge work, and computer use.

Mô hình này nhắm mục tiêu ba kịch bản chuyên nghiệp cốt lõi:

Công việc tri thức - Tạo bảng tính, bản trình bày, tài liệu và phân tích trên 44 ngành nghề. GPT-5.4 sánh ngang hoặc vượt trội so với các chuyên gia trong ngành trong 83% các so sánh trên GDPval, tăng từ 70,9% đối với GPT-5.2.

Sử dụng máy tính và tác nhân - Vận hành máy tính thông qua các lệnh chuột/bàn phím, tự động hóa trình duyệt và quy trình làm việc nhiều bước trên các ứng dụng. Đạt tỷ lệ thành công 75% trên OSWorld-Verified, vượt qua hiệu suất của con người ở mức 72,4%.

Lập trình và phát triển - Viết, gỡ lỗi và lặp lại mã với hiệu suất hàng đầu trên SWE-Bench Pro (57,7%) trong khi hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token cho các cơ sở mã phức tạp.

GPT-5.4 có hai biến thể:

Các cải tiến chính so với GPT-5.2

GPT-5.4 không phải là một bản cập nhật gia tăng. OpenAI đã đạt được những bước tiến đáng kể trên bốn lĩnh vực quan trọng.

1. Độ chính xác thực tế và Giảm thiểu "ảo giác"

Các tuyên bố sai giảm 33% ở cấp độ tuyên bố cá nhân. Các phản hồi đầy đủ chứa ít lỗi hơn 18% nói chung. Điều này rất quan trọng khi bạn tạo tài liệu pháp lý, mô hình tài chính hoặc tài liệu kỹ thuật mà một thực tế bị "ảo giác" duy nhất có thể làm hỏng toàn bộ dự án.

2. Hiệu quả Token

GPT-5.4 sử dụng ít token hơn đáng kể để giải quyết vấn đề so với GPT-5.2. Trong các quy trình làm việc nặng về công cụ với điểm chuẩn MCP Atlas, mức sử dụng token giảm 47% trong khi vẫn duy trì độ chính xác. Đối với người dùng API khối lượng lớn, việc tăng hiệu quả này bù đắp cho giá mỗi token cao hơn.

3. Khả năng sử dụng máy tính

Các mô hình trước đây yêu cầu các mô hình chuyên biệt riêng biệt để sử dụng máy tính. GPT-5.4 xử lý điều này một cách tự nhiên:

4. Tìm kiếm và Tích hợp Công cụ

Tìm kiếm công cụ loại bỏ nhu cầu tải hàng nghìn định nghĩa công cụ vào mỗi yêu cầu. Mô hình tra cứu định nghĩa công cụ theo yêu cầu, giảm chi phí token ban đầu và cho phép làm việc với các hệ sinh thái chứa hàng chục nghìn công cụ.

Trên điểm chuẩn Toolathlon, GPT-5.4 đạt độ chính xác 54,6% so với 45,7% của GPT-5.2, với ít kết quả công cụ hơn (đại diện độ trễ) được yêu cầu.

Điểm chuẩn hiệu suất GPT-5.4

Dữ liệu điểm chuẩn cho thấy GPT-5.4 vượt trội ở đâu và các mô hình trước đó vẫn cạnh tranh ở đâu.

Công việc tri thức (GDPval)

Mô hình

Tỷ lệ thắng so với Chuyên gia

GPT-5.4

83.0%

GPT-5.4 Pro

82.0%

GPT-5.2 Pro

74.1%

GPT-5.2

70.9%

GDPval kiểm tra công việc tri thức được xác định rõ ràng trên 44 ngành nghề từ 9 ngành công nghiệp hàng đầu đóng góp vào GDP của Hoa Kỳ. Các tác vụ bao gồm bản trình bày bán hàng, bảng tính kế toán, lịch trình chăm sóc khẩn cấp, sơ đồ sản xuất và video ngắn.

Tạo bảng tính và tài liệu

Trên các tác vụ mô hình hóa ngân hàng đầu tư nội bộ:

Đối với đánh giá bản trình bày, những người đánh giá là con người ưa thích đầu ra của GPT-5.4 68% số lần nhờ tính thẩm mỹ mạnh mẽ hơn, sự đa dạng hình ảnh lớn hơn và việc sử dụng tạo hình ảnh hiệu quả hơn.

Hiệu suất lập trình (SWE-Bench Pro)

Mô hình

Độ chính xác

Độ trễ ước tính

GPT-5.4

57.7%

~1000s

GPT-5.3-Codex

56.8%

~1200s

GPT-5.2

55.6%

~1500s

A bar chart comparing GPT-5.4, GPT-5.3-Codex, and GPT-5.2 on SWE-Bench Pro accuracy and estimated latency, showing GPT-5.4 as the top performer.

GPT-5.4 sánh ngang hoặc vượt trội so với GPT-5.3-Codex trên SWE-Bench Pro trong khi mang lại độ trễ thấp hơn trong các nỗ lực suy luận. Chế độ /fast trong Codex mang lại tốc độ token nhanh hơn tới 1,5 lần với GPT-5.4.

Sử dụng máy tính (OSWorld-Verified)

OSWorld-Verified đo lường thành công trong việc điều hướng môi trường máy tính để bàn thông qua ảnh chụp màn hình và các hành động bàn phím/chuột:

Điểm chuẩn này kiểm tra các quy trình làm việc trên máy tính để bàn thực tế: quản lý email và lịch, nhập dữ liệu hàng loạt, thao tác tệp và các tác vụ đa ứng dụng.

Duyệt web (BrowseComp)

BrowseComp kiểm tra nghiên cứu web liên tục để tìm thông tin khó định vị:

Cải thiện tuyệt đối 17% so với GPT-5.2 phản ánh khả năng tổng hợp thông tin đa nguồn tốt hơn và chiến lược tìm kiếm bền bỉ hơn.

Hiểu biết về thị giác

MMMU Pro (không có công cụ) - Kiểm tra hiểu biết và suy luận về thị giác:

OmniDocBench - Độ chính xác phân tích tài liệu (lỗi thấp hơn = tốt hơn):

Khả năng sử dụng máy tính và thị giác

Khả năng sử dụng máy tính của GPT-5.4 cần được kiểm tra chi tiết. Đây là mô hình đa năng đầu tiên của OpenAI có thể vận hành máy tính một cách tự nhiên.

Cách hoạt động của việc sử dụng máy tính

Mô hình diễn giải ảnh chụp màn hình giao diện trình duyệt hoặc máy tính để bàn và phản hồi bằng:

  1. Nhấp chuột dựa trên tọa độ vào các yếu tố giao diện người dùng
  2. Nhập liệu bằng bàn phím để nhập văn bản
  3. Các lệnh Playwright để tự động hóa trình duyệt
  4. Di chuyển chuột và thao tác kéo

Các nhà phát triển cấu hình hành vi thông qua các thông báo hệ thống, điều chỉnh các chính sách an toàn và yêu cầu xác nhận dựa trên mức độ chấp nhận rủi ro.

Ví dụ thực tế về sử dụng máy tính

Mainstay đã kiểm thử GPT-5.4 trên khoảng 30.000 cổng thông tin HOA và thuế tài sản:

Mô hình điều hướng giao diện cổng thông tin, trích xuất dữ liệu từ các bố cục giao diện người dùng đa dạng, xử lý luồng xác thực và quản lý các trường hợp đặc biệt như mã captcha hoặc biểu mẫu nhiều bước.

Nhận thức thị giác nâng cao

GPT-5.4 giới thiệu mức độ chi tiết đầu vào hình ảnh gốc hỗ trợ:

Mức độ chi tiết cao hỗ trợ tổng số pixel lên đến 2,56 triệu hoặc kích thước tối đa 2048 pixel. Thử nghiệm người dùng API ban đầu cho thấy những cải thiện đáng kể về khả năng bản địa hóa, hiểu hình ảnh và độ chính xác khi nhấp chuột với cài đặt gốc hoặc chi tiết cao.

Cải tiến phân tích tài liệu

Nhận thức thị giác tốt hơn chuyển thành khả năng xử lý tài liệu. GPT-5.4 phân tích:

Mức cải thiện 22% trên OmniDocBench (tỷ lệ lỗi từ 0,140 xuống 0,109) phản ánh khả năng này.

Các tính năng lập trình và phát triển

GPT-5.4 kế thừa sự xuất sắc trong lập trình của GPT-5.3-Codex trong khi bổ sung khả năng sử dụng máy tính cho các quy trình làm việc phát triển tích hợp.

Phát triển Frontend

Các đánh giá nội bộ cho thấy GPT-5.4 vượt trội trong các tác vụ frontend phức tạp với kết quả thẩm mỹ và chức năng rõ rệt hơn so với các mô hình trước đây. Kỹ năng Playwright Interactive thử nghiệm trong Codex minh họa điều này:

Ví dụ: Mô phỏng công viên giải trí Một lời nhắc duy nhất đã tạo ra mô phỏng công viên giải trí đẳng cự với:

Mô hình đã xây dựng trò chơi, sau đó sử dụng Playwright để tự động hóa các thử nghiệm, xác minh vị trí, điều hướng, phản ứng của khách và sự ổn định của giao diện người dùng qua nhiều vòng.

Chế độ nhanh cho nhà phát triển

GPT-5.4 trong Codex hỗ trợ chế độ /fast mang lại tốc độ token nhanh hơn tới 1,5 lần. Các nhà phát triển API truy cập tốc độ tương đương thông qua xử lý ưu tiên. Điều này duy trì cùng một mức độ thông minh trong khi giảm thời gian lặp lại trong quá trình gỡ lỗi và phát triển.

Hỗ trợ cửa sổ ngữ cảnh

GPT-5.4 Codex bao gồm hỗ trợ cửa sổ ngữ cảnh 1 triệu token thử nghiệm. Cấu hình thông qua:

Các yêu cầu vượt quá ngữ cảnh tiêu chuẩn 272K được tính vào giới hạn sử dụng với tỷ lệ gấp đôi so với bình thường. Điều này cho phép phân tích toàn bộ cơ sở mã, các bộ tài liệu lớn hoặc các dự án nhiều tệp trong một yêu cầu duy nhất.

Apidog cho Tài liệu API:tài liệu API
A screenshot of Apidog's interface demonstrating API documentation and management features.

Tích hợp và Tìm kiếm Công cụ

Tìm kiếm công cụ đại diện cho một sự thay đổi cơ bản trong cách các mô hình tương tác với các công cụ bên ngoài và máy chủ MCP.

Cách hoạt động của Tìm kiếm công cụ

Cách tiếp cận trước đây: Tất cả các định nghĩa công cụ được tải vào mọi yêu cầu ngay từ đầu. Đối với các hệ thống có nhiều công cụ, điều này đã thêm hàng nghìn đến hàng chục nghìn token, làm tăng chi phí và làm chậm phản hồi.

Cách tiếp cận tìm kiếm công cụ: Mô hình nhận một danh sách nhẹ các công cụ có sẵn. Khi cần, nó sẽ tra cứu các định nghĩa công cụ cụ thể và nối chúng vào cuộc trò chuyện tại thời điểm đó.

Ví dụ tiết kiệm Token

Điểm chuẩn MCP Atlas của Scale đã kiểm tra 250 tác vụ với tất cả 36 máy chủ MCP được bật:

A chart showing token usage breakdown without tool search, highlighting high upfront token costs for tool definitions.

Phân tích token không có tìm kiếm công cụ:

Tìm kiếm công cụ loại bỏ chi phí ban đầu trong khi vẫn duy trì hiệu quả bộ đệm.

Hiệu suất MCP Atlas

Trên điểm chuẩn MCP Atlas (250 tác vụ, 36 máy chủ MCP):

Mô hình hoạt động với các hệ sinh thái công cụ lớn hơn mà không làm giảm độ chính xác hoặc làm quá tải cửa sổ ngữ cảnh.

Gọi công cụ theo tác nhân

Điểm chuẩn Toolathlon kiểm tra các quy trình làm việc công cụ nhiều bước (đọc email, trích xuất tệp đính kèm, tải tệp lên, chấm điểm, ghi lại kết quả):

A bar chart comparing GPT-5.4 and GPT-5.2 on Toolathlon benchmark, showing GPT-5.4 with fewer tool yields and better performance.

Kết quả công cụ (chờ phản hồi của công cụ) phản ánh độ trễ tốt hơn số lượng cuộc gọi công cụ vì chúng nắm bắt được lợi ích song song. GPT-5.4 hoàn thành tác vụ trong ít vòng hơn.

GPT-5.4 so với GPT-5.3-Codex so với GPT-5.2

Việc lựa chọn giữa các mô hình phụ thuộc vào các yêu cầu cụ thể của bạn.

Khi nào nên sử dụng GPT-5.4

Khi GPT-5.3-Codex vẫn cạnh tranh

Khi GPT-5.2 là đủ

So sánh giá cả

Mô hình

Giá đầu vào

Đầu vào được lưu vào bộ nhớ cache

Giá đầu ra

GPT-5.2

1,75 USD/M

0,175 USD/M

14 USD/M

GPT-5.4

2,50 USD/M

0,25 USD/M

15 USD/M

GPT-5.2 Pro

21 USD/M

-

168 USD/M

GPT-5.4 Pro

30 USD/M

-

180 USD/M

Giá hàng loạt và Linh hoạt có sẵn với 50% mức giá tiêu chuẩn. Xử lý ưu tiên ở mức 200% mức giá tiêu chuẩn.

Tùy chọn khả dụng và truy cập

GPT-5.4 đã được triển khai dần dần bắt đầu từ ngày 5 tháng 3 năm 2026 trên ChatGPT, Codex và API.

Truy cập ChatGPT

GPT-5.4 Thinking có sẵn cho:

GPT-5.4 Pro có sẵn cho:

Truy cập kế thừa: GPT-5.2 Thinking vẫn có sẵn trong ba tháng trong phần Mô hình Kế thừa, sẽ ngừng hoạt động vào ngày 5 tháng 6 năm 2026.

Doanh nghiệp và Giáo dục: Quyền truy cập sớm có sẵn thông qua cài đặt quản trị viên.

Truy cập Codex

GPT-5.4 là mô hình mặc định trong Codex với:

Truy cập API

Tên mô hình:

Cửa sổ ngữ cảnh:

Giá cả:

Lịch trình ngừng hoạt động

GPT-5.2 Thinking ngừng hoạt động vào ngày 5 tháng 6 năm 2026. Hãy di chuyển các quy trình làm việc trước ngày này để tránh gián đoạn.

Kết luận

GPT-5.4 mang lại những cải tiến đáng kể trong công việc tri thức, sử dụng máy tính và các tác vụ lập trình. Tỷ lệ thắng GDPval 83%, điểm OSWorld-Verified 75% và độ chính xác SWE-Bench Pro 57,7% khẳng định nó là công nghệ tiên tiến nhất cho các quy trình làm việc AI chuyên nghiệp.

Đối với các nhà phát triển tích hợp GPT-5.4 vào ứng dụng, việc có các công cụ kiểm thử và gỡ lỗi API mạnh mẽ trở nên cần thiết. Apidog hợp lý hóa quá trình tích hợp với khả năng thiết kế, gỡ lỗi, kiểm thử và tài liệu API hợp nhất. Cho dù bạn đang xây dựng tác nhân AI, tự động hóa quy trình làm việc hay tạo các tính năng hướng tới khách hàng được hỗ trợ bởi GPT-5.4, Apidog đều giúp đảm bảo các tích hợp API của bạn hoạt động chính xác ngay từ ngày đầu tiên.

button

Những điểm chính:

Khi nào nên áp dụng:

Khi nào nên chờ:

GPT-5.4 đại diện cho mô hình suy luận hiệu quả nhất của OpenAI cho đến nay. Sự kết hợp giữa giảm "ảo giác", cải thiện hiệu quả token và khả năng sử dụng máy tính gốc biện minh cho giá mỗi token cao hơn đối với các ứng dụng chuyên nghiệp.

FAQ

Sự khác biệt giữa GPT-5.4 và GPT-5.2 là gì?

GPT-5.4 đạt tỷ lệ thắng 83% trong công việc tri thức so với 70,9% của GPT-5.2, sử dụng ít token hơn đáng kể, có khả năng sử dụng máy tính gốc và giảm lỗi thực tế 33%. Giá cao hơn (2,50 USD/15 USD so với 1,75 USD/14 USD) nhưng tổng chi phí có thể thấp hơn do tăng hiệu quả.

API GPT-5.4 có giá bao nhiêu?

GPT-5.4 có giá 2,50 USD cho mỗi triệu token đầu vào, 0,25 USD cho mỗi triệu token đầu vào được lưu vào bộ nhớ cache và 15 USD cho mỗi triệu token đầu ra. GPT-5.4 Pro có giá 30 USD/M đầu vào và 180 USD/M đầu ra. Giá hàng loạt và Linh hoạt giảm 50%.

GPT-5.4 có giới hạn cửa sổ ngữ cảnh không?

Cửa sổ ngữ cảnh tiêu chuẩn là 272K token. Hỗ trợ cửa sổ ngữ cảnh 1 triệu token thử nghiệm có sẵn trong Codex bằng cách cấu hình các tham số model_context_windowmodel_auto_compact_token_limit. Các yêu cầu vượt quá 272K được tính với tỷ lệ sử dụng gấp 2 lần.

GPT-5.4 Pro được sử dụng để làm gì?

GPT-5.4 Pro nhắm mục tiêu hiệu suất tối đa cho các tác vụ suy luận phức tạp. Nó đạt điểm cao hơn trên các điểm chuẩn như BrowseComp (89,3% so với 82,7%) và GDPval (82,0% so với 83,0% tiêu chuẩn) nhưng chi phí gấp 12 lần (30 USD/180 USD so với 2,50 USD/15 USD).

GPT-5.4 được phát hành khi nào?

GPT-5.4 được phát hành vào ngày 5 tháng 3 năm 2026, được triển khai dần dần trên ChatGPT, Codex và API. GPT-5.2 Thinking vẫn có sẵn cho đến ngày 5 tháng 6 năm 2026 để di chuyển.

GPT-5.4 có thể sử dụng máy tính và trình duyệt không?

Có. GPT-5.4 là mô hình đa năng đầu tiên của OpenAI có khả năng sử dụng máy tính gốc. Nó thực hiện các lệnh chuột/bàn phím, tự động hóa trình duyệt thông qua Playwright và điều hướng môi trường máy tính để bàn thông qua việc diễn giải ảnh chụp màn hình.

Tìm kiếm công cụ trong GPT-5.4 là gì?

Tìm kiếm công cụ cho phép mô hình tra cứu định nghĩa công cụ theo yêu cầu thay vì tải tất cả các định nghĩa ngay từ đầu. Điều này giảm mức sử dụng token 47% trong các quy trình làm việc nặng về công cụ và cho phép làm việc với các hệ sinh thái chứa hàng chục nghìn công cụ.

GPT-5.4 so sánh với GPT-5.3-Codex như thế nào về lập trình?

GPT-5.4 sánh ngang hoặc vượt trội so với GPT-5.3-Codex trên SWE-Bench Pro (57,7% so với 56,8%) trong khi mang lại độ trễ thấp hơn và bổ sung khả năng sử dụng máy tính. Đây là lựa chọn được khuyến nghị cho các quy trình làm việc phát triển mới.

GPT-5.4 có sẵn trong ChatGPT không?

Có. GPT-5.4 Thinking có sẵn cho người đăng ký Plus, Team và Pro. GPT-5.4 Pro có sẵn cho các gói Pro và Enterprise. GPT-5.2 Thinking vẫn có sẵn trong phần Mô hình Kế thừa cho đến ngày 5 tháng 6 năm 2026.

Các cân nhắc về an toàn đối với GPT-5.4 là gì?

GPT-5.4 được coi là có khả năng mạng cao theo Khung chuẩn bị của OpenAI. Các biện pháp bảo vệ bao gồm ngăn xếp an toàn mạng mở rộng, hệ thống giám sát, kiểm soát truy cập đáng tin cậy và chặn không đồng bộ đối với các yêu cầu rủi ro cao hơn trên các bề mặt Không giữ dữ liệu. Một số lỗi dương tính giả có thể xảy ra khi các bộ phân loại được cải thiện.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API