Cách truy cập và sử dụng GPT-5.5 Instant: Hướng dẫn ChatGPT + API

Ashley Innocent

Ashley Innocent

6 tháng 5 2026

Cách truy cập và sử dụng GPT-5.5 Instant: Hướng dẫn ChatGPT + API

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

OpenAI đã thay đổi bộ não mặc định của ChatGPT vào ngày 5 tháng 5 năm 2026, và hầu hết người dùng sẽ không nhận thấy điều đó. GPT-5.5 Instant lặng lẽ tiếp quản từ GPT-5.3 Instant, giảm 52.5% các tuyên bố sai lệch trên các lời nhắc có rủi ro cao, và duy trì cảm giác độ trễ thấp đã làm cho Instant trở thành mô hình chủ lực ngay từ đầu. Nếu bạn xây dựng bằng API, cùng một bản nâng cấp đang nằm sau tên mô hình gpt-5.5, với cửa sổ ngữ cảnh 1M-token và bảng giá theo triệu bạn có thể dự trù ngân sách.

Hướng dẫn này sẽ chỉ cho bạn mọi cách để truy cập GPT-5.5 Instant, khi nào nó chuyển bạn sang GPT-5.5 Thinking một cách ngầm định, và cách để tích hợp nó vào một yêu cầu API đang hoạt động mà bạn có thể kiểm tra trước khi triển khai.

TÓM TẮT

GPT-5.5 Instant là mặc định ChatGPT mới của OpenAI và là tầng nhanh của dòng GPT-5.5. Người dùng miễn phí nhận được 10 tin nhắn mỗi 5 giờ, người dùng Plus nhận 160 tin nhắn mỗi 3 giờ, và người dùng Pro/Business được sử dụng không giới hạn. Các nhà phát triển gọi nó thông qua Responses hoặc Chat Completions API dưới tên gpt-5.5 với giá 5 đô la cho mỗi triệu token đầu vào và 30 đô la cho mỗi triệu token đầu ra, với cửa sổ ngữ cảnh 1M-token.

Giới thiệu

Nếu bạn mở ChatGPT tuần này và các câu trả lời của bạn cảm thấy sắc bén hơn một chút, đó chính là GPT-5.5 Instant đang làm việc của nó. OpenAI đã triển khai mô hình này làm mặc định mới cho các tài khoản miễn phí, Plus, Pro, Business và Enterprise vào ngày 5 tháng 5 năm 2026, thay thế GPT-5.3 Instant mà không yêu cầu người dùng phải nhấp chuột nào trong giao diện người dùng.

Điểm nổi bật không phải là trí thông minh thô. Đó là độ tin cậy. OpenAI báo cáo giảm 52.5% các tuyên bố sai lệch trên các lời nhắc có rủi ro cao trong y học, luật pháp và tài chính so với GPT-5.3 Instant, và giảm 37.3% các tuyên bố không chính xác trên các lỗi thực tế do người dùng gắn cờ. Mức độ cải thiện này rất quan trọng khi bạn đặt mô hình vào một lộ trình hướng tới khách hàng hoặc đưa nó vào một tác nhân gọi các API thực tế.

💡
Nếu bạn đang triển khai với mô hình này, bạn cũng cần kiểm tra nó như bất kỳ phụ thuộc nào khác. Các công cụ như Apidog cho phép bạn gửi yêu cầu đến OpenAI Responses API, theo dõi đầu ra streaming và so sánh GPT-5.5 với GPT-5.5 Pro cạnh nhau mà không cần chạm vào mã nguồn sản xuất. Tuy nhiên, trước đó, bạn cần biết mình đang hướng lưu lượng truy cập của mình đến đâu, và điều gì thay đổi ngay khi bạn đạt đến giới hạn tầng miễn phí của GPT-5.5 Instant.
button

Hướng dẫn này bao gồm các đường dẫn truy cập, quy tắc định tuyến, tính toán giá cả và cuộc gọi API mà bạn sẽ sao chép vào codebase của mình, với một quy trình kiểm thử đang hoạt động ở cuối.

GPT-5.5 Instant là gì

GPT-5.5 Instant là biến thể được tối ưu hóa độ trễ của GPT-5.5. Trong ChatGPT, OpenAI cung cấp ba phiên bản của mô hình: Instant, Thinking và Pro. Instant trả về câu trả lời trong khoảng thời gian tương tự như GPT-5.3 Instant, vì vậy trải nghiệm người dùng không bị chậm đi. Thinking đánh đổi độ trễ để có lý luận sâu hơn. Pro mở rộng Thinking với khả năng tính toán bổ sung và được giới hạn cho các gói trả phí.

So sánh các phiên bản GPT-5.5: Instant, Thinking, Pro

Nhãn Instant tồn tại vì hai lý do. Thứ nhất, OpenAI duy trì một bộ định tuyến có thể nâng cấp yêu cầu Instant lên GPT-5.5 Thinking khi mô hình quyết định lời nhắc đủ khó để cần lý luận sâu hơn. Thứ hai, người dùng trả phí có thể ghi đè bộ định tuyến và ghim Instant thủ công từ bộ chọn mô hình, điều này hữu ích khi bạn muốn tốc độ dự đoán trên một cuộc trò chuyện dài.

Bộ chọn mô hình trong ChatGPT với các tùy chọn GPT-5.5 Instant, Thinking và Pro

Bên dưới, GPT-5.5 Instant chia sẻ cùng kiến trúc cơ bản với GPT-5.5 Thinking. Sự khác biệt nằm ở độ sâu lý luận, không phải giới hạn kiến thức. Cả hai đều có quyền truy cập vào:

Để biết chi tiết hơn về bản phát hành rộng hơn, tổng quan về GPT-5.5 bao gồm đầy đủ bộ tính năng, bao gồm cách Thinking và Pro khác với Instant trên khối lượng công việc của agent.

Cách truy cập GPT-5.5 Instant trong ChatGPT

Cách nhanh nhất là cách mà hầu hết mọi người vô tình sử dụng. Mở chatgpt.com hoặc ứng dụng di động, gửi tin nhắn và bạn đã ở trên GPT-5.5 Instant. OpenAI đã biến nó thành mặc định trên mọi cấp độ tài khoản, vì vậy không có gì để chuyển đổi.

Điều thay đổi là tần suất bạn có thể sử dụng nó trước khi giới hạn tầng đạt đến.

Gói Giới hạn GPT-5.5 Instant Điều gì xảy ra sau khi đạt giới hạn
Miễn phí 10 tin nhắn mỗi 5 giờ Chuyển về GPT-5.5 mini
Plus 160 tin nhắn mỗi 3 giờ Chuyển về GPT-5.5 mini
Pro Không giới hạn (tuân theo các biện pháp bảo vệ chống lạm dụng) Duy trì trên GPT-5.5
Business Không giới hạn (tuân theo các biện pháp bảo vệ chống lạm dụng) Duy trì trên GPT-5.5
Enterprise Không giới hạn (tuân theo các biện pháp bảo vệ chống lạm dụng) Duy trì trên GPT-5.5

Các tài khoản Plus, Pro và Business cũng mở khóa bộ chọn mô hình ở góc trên bên trái của cửa sổ trò chuyện. Nhấp vào đó và bạn có thể ghim GPT-5.5 Instant hoặc GPT-5.5 Thinking cho tin nhắn tiếp theo. Việc ghim là theo cuộc trò chuyện, không phải theo tài khoản, vì vậy một cuộc trò chuyện mới sẽ trở về mặc định mà bộ định tuyến chọn.

Nếu bạn đang sử dụng gói Pro hoặc Business và muốn so sánh Instant với Thinking trên một tác vụ thực tế, hãy mở hai tab cạnh nhau, ghim mỗi tab vào một mô hình, sau đó cung cấp cùng một lời nhắc. Sự khác biệt sẽ xuất hiện trên các tác vụ với lý luận đa bước ngầm định, nơi Thinking khám phá các nhánh trước khi trả lời. Đối với các cuộc trò chuyện hàng ngày, Instant chiến thắng về thời gian tạo token đầu tiên.

Những gì bộ định tuyến tự động quyết định thay bạn

Khi bạn không ghim mô hình, bộ định tuyến tự động của ChatGPT sẽ đọc lời nhắc và chọn Instant hoặc Thinking. OpenAI chưa công bố đầy đủ các quy tắc định tuyến, nhưng trên thực tế, bạn sẽ thấy Thinking hoạt động khi lời nhắc:

Đối với tất cả các trường hợp khác, bộ định tuyến vẫn ở chế độ Instant. Đó là hành vi đúng cho trò chuyện. Đó là hành vi sai khi bạn muốn độ sâu lý luận được đảm bảo, đó là lý do tại sao bộ chọn mô hình tồn tại.

Cách gọi GPT-5.5 Instant thông qua API

Trong API, GPT-5.5 Instant và GPT-5.5 Thinking gộp lại thành một định danh mô hình duy nhất: gpt-5.5. Không có điểm cuối gpt-5.5-instant riêng biệt. Thay vào đó, bạn kiểm soát độ sâu lý luận bằng tham số reasoning_effort, chấp nhận các giá trị minimal, low, medium hoặc high. Đặt reasoning_effort: "minimal" là tương đương gần nhất trong API với trải nghiệm Instant trong ChatGPT.

GPT-5.5 được cung cấp qua hai điểm cuối:

Giá cả giống nhau trên cả hai:

Cấp Đầu vào ($/1M tokens) Đầu ra ($/1M tokens)
Tiêu chuẩn $5.00 $30.00
Batch $2.50 $15.00
Linh hoạt $2.50 $15.00
Ưu tiên $12.50 $75.00

Lưu ý một điểm đặc biệt: các lời nhắc có hơn 272K token đầu vào sẽ bị tính phí gấp đôi đầu vào và gấp 1.5 lần đầu ra cho phần còn lại của phiên, trên mọi cấp trừ Ưu tiên. Nếu bạn đang thực hiện RAG tài liệu dài, hãy cắt nhỏ các yêu cầu của bạn một cách cẩn thận.

Để tính toán chi phí song song với các mô hình OpenAI trước đây, phân tích giá GPT-5.5 sẽ hướng dẫn bạn qua các kinh tế đơn vị cho các khối lượng công việc phổ biến.

Yêu cầu Python tối thiểu

Bạn sẽ cần một khóa API từ nền tảng và SDK Python chính thức.

Màn hình bảng điều khiển nền tảng OpenAI với các API Keys được tô sáng.
pip install --upgrade openai
export OPENAI_API_KEY="sk-..."

Cuộc gọi Responses API:

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    reasoning={"effort": "minimal"},
    input=[
        {
            "role": "user",
            "content": "Tóm tắt mục changelog này trong 3 gạch đầu dòng: ..."
        }
    ],
    max_output_tokens=400,
)

print(response.output_text)

reasoning.effort: "minimal" cho mô hình biết phải hoạt động như Instant trong ChatGPT: ngắn gọn, nhanh chóng, độ trễ thấp. Nâng lên "medium" hoặc "high" khi bạn cần độ sâu kiểu Thinking trên cùng một định danh mô hình.

Yêu cầu Node.js tối thiểu

import OpenAI from "openai";

const client = new OpenAI();

const response = await client.responses.create({
  model: "gpt-5.5",
  reasoning: { effort: "minimal" },
  input: [
    {
      role: "user",
      content: "Dịch mô tả sản phẩm này sang tiếng Tây Ban Nha, giữ nguyên HTML: ..."
    }
  ],
  max_output_tokens: 600,
});

console.log(response.output_text);

Streaming phản hồi

Streaming là nơi trải nghiệm Instant phát huy tác dụng. Đặt stream: true trong yêu cầu và truyền iterator kết quả vào giao diện người dùng của bạn:

stream = client.responses.create(
    model="gpt-5.5",
    reasoning={"effort": "minimal"},
    input=[{"role": "user", "content": "Soạn thảo một ghi chú phát hành cho v2.7..."}],
    stream=True,
)

for event in stream:
    if event.type == "response.output_text.delta":
        print(event.delta, end="", flush=True)

Nếu bạn đang di chuyển từ Chat Completions, hình dạng tham số tương tự nhưng đối tượng phản hồi khác nhau. Trợ giúp output_text hợp nhất các khối đầu ra có cấu trúc thành một chuỗi thuần túy để bạn không phải tự mình duyệt cây JSON.

Để biết cách sử dụng API miễn phí và các thủ thuật hạn ngạch, hướng dẫn truy cập miễn phí GPT-5.5 bao gồm luồng tín dụng và cơ chế giới hạn tốc độ.

Kiểm tra yêu cầu GPT-5.5 Instant với Apidog trước khi bạn triển khai

Gọi OpenAI API từ một notebook là ổn cho việc phác thảo. Đưa nó vào sản xuất đòi hỏi kỷ luật hơn: bạn muốn kiểm tra các lời nhắc ở quy mô lớn, lưu các mẫu yêu cầu có thể tái tạo, chuyển đổi giữa gpt-5.5gpt-5.5-pro để so sánh chi phí và chất lượng, và quản lý phiên bản toàn bộ đặc tả bên cạnh codebase của bạn.

Giao diện Apidog hiển thị các bài kiểm tra API chạy song song, với các phản hồi được tô sáng

Apidog cung cấp cho bạn vòng lặp đó mà không cần viết các script dùng một lần. Đây là quy trình làm việc mà hầu hết các nhóm thường sử dụng.

Bước 1, nhập OpenAI OpenAPI spec. Apidog đọc OpenAPI 3.x một cách tự nhiên. Thả Responses API spec vào và mọi điểm cuối, tham số và hình dạng phản hồi đều hiển thị với tính năng tự động hoàn thành.

Bước 2, thêm khóa API của bạn làm bí mật không gian làm việc. Apidog lưu trữ bí mật theo môi trường, vì vậy khóa dàn dựng và khóa sản xuất của bạn không bao giờ bị rò rỉ vào một yêu cầu dùng chung. Tham chiếu bí mật trong tiêu đề Authorization với {{OPENAI_API_KEY}} và bạn có thể chuyển đổi môi trường mà không cần nhập lại giá trị.

Bước 3, lưu một mẫu yêu cầu GPT-5.5 Instant. Đặt model: "gpt-5.5", reasoning.effort: "minimal", và các tin nhắn hệ thống + người dùng bạn muốn kiểm tra. Lưu nó vào dự án của bạn. Bất kỳ ai trong nhóm cũng có thể phát lại cuộc gọi chính xác đó.

Bước 4, chạy các bài kiểm tra song song. Sao chép mẫu, thay đổi reasoning.effort thành "high" hoặc thay đổi mô hình thành gpt-5.5-pro, và chạy cả hai. Apidog hiển thị độ trễ, số lượng token và nội dung phản hồi trong một chế độ xem khác biệt để bạn có thể đánh giá chất lượng so với chi phí ngay tại chỗ.

Bước 5, tích hợp yêu cầu vào một bộ kiểm thử. Các kịch bản kiểm thử của Apidog cho phép bạn xâu chuỗi các yêu cầu, xác nhận các trường phản hồi và chạy bộ kiểm thử từ CI. Đó là cách bạn bắt được các lỗi hồi quy khi OpenAI phát hành bản cập nhật mô hình hoặc bạn điều chỉnh lời nhắc.

Bước 6, giả lập điểm cuối cho phát triển ngoại tuyến. Apidog có thể giả lập Responses API dựa trên lược đồ OpenAPI, vì vậy các kỹ sư frontend có thể xây dựng dựa trên một hình dạng ổn định trong khi bạn tiếp tục lặp lại các lời nhắc.

Nếu bạn muốn xem xét sâu hơn về thiết lập kiểm tra, kiểm tra API cho kỹ sư QA bao gồm thư viện xác nhận và tích hợp CI từ đầu đến cuối. Bạn có thể tải Apidog từ Tải xuống Apidog và thực hiện yêu cầu đầu tiên trong vòng chưa đầy năm phút.

Các kỹ thuật nâng cao và mẹo chuyên nghiệp

Khi bạn đã gọi GPT-5.5 Instant một cách trơn tru, công việc thực sự là làm cho nó rẻ, nhanh và có thể dự đoán được.

Ghim nỗ lực lý luận theo từng tuyến. Một bot hỗ trợ khách hàng không cần reasoning.effort: "high" trong mọi lượt. Ghim "minimal" trên đường dẫn nóng và dành "high" cho các trình xử lý leo thang. Hóa đơn token sẽ giảm mà không ảnh hưởng đến trải nghiệm người dùng.

Giới hạn đầu ra với max_output_tokens. GPT-5.5 có thể tạo ra tới 128K token đầu ra. Đó là một vector chi phí vượt tầm kiểm soát nếu lời nhắc vô tình khuyến khích một câu trả lời dài. Giới hạn nó ở giá trị nhỏ nhất mà UI của bạn chấp nhận; bạn luôn có thể phân trang.

Cẩn thận với ngưỡng 272K token. Một khi đầu vào của bạn vượt quá 272K token, mọi cuộc gọi tiếp theo trong phiên sẽ phải trả mức phí nhân 2x cho đầu vào và 1.5x cho đầu ra. Nếu bạn đang phân tích tài liệu dài, hãy chia nhỏ và truyền (stream) thay vì nhồi nhét toàn bộ tài liệu vào một lần gọi duy nhất.

Sử dụng Batch cho các khối lượng công việc ngoại tuyến. Tạo embeddings để điền dữ liệu, tóm tắt báo cáo hàng tuần, phân loại phiếu hỗ trợ hàng loạt; những việc này không có ngân sách độ trễ. Batch cắt giảm hóa đơn một nửa và chạy trong vòng 24 giờ.

Sử dụng Priority cho các cuộc gọi quan trọng về độ trễ, hướng người dùng. Nếu SLA của bạn chặt chẽ và bạn sẵn sàng trả giá gấp 2.5 lần, Priority cung cấp cho bạn dung lượng dành riêng. Đáng giá cho các sản phẩm kiểu trò chuyện cạnh tranh về thời gian phản hồi.

Streaming từ token đầu tiên. Instant nhanh, nhưng độ trễ cảm nhận sẽ giảm thêm khi bạn hiển thị các token ngay khi chúng đến. Responses API hỗ trợ stream: true và phát ra các sự kiện delta mà bạn có thể truyền đến một websocket hoặc kênh SSE.

Những lỗi thường gặp cần tránh:

  1. Gọi gpt-5.5-pro cho các lời nhắc có rủi ro thấp. Pro tốn gấp 6 lần cho đầu vào và gấp 6 lần cho đầu ra. Chỉ sử dụng khi sự khác biệt về độ chính xác xứng đáng với hóa đơn.
  2. Để trống lời nhắc hệ thống. Ngay cả trên Instant, một lời nhắc hệ thống chặt chẽ sẽ cắt giảm token và cải thiện tính nhất quán.
  3. Quên đặt reasoning.effort. Hành vi mặc định thay đổi giữa các điểm cuối; hãy ghim nó một cách rõ ràng để dấu vết của bạn có thể tái tạo.
  4. Lưu khóa API trong mã nguồn. Thay vào đó, hãy sử dụng trình quản lý bí mật hoặc môi trường Apidog.

Các lựa chọn thay thế và so sánh GPT-5.5 Instant

GPT-5.5 Instant không phải là mô hình biên giới nhanh duy nhất trên thị trường. Đây là cách nó so sánh với các đối thủ cạnh tranh rõ ràng.

Mô hình Đầu vào ($/1M) Đầu ra ($/1M) Ngữ cảnh Điểm mạnh đáng chú ý
GPT-5.5 (Instant) $5.00 $30.00 1M Mặc định trong ChatGPT, ít sai lệch, sử dụng công cụ rộng rãi
GPT-5.5 Pro $30.00 $180.00 1M Độ chính xác cao nhất trong dòng sản phẩm OpenAI
Gemini 3 Flash Preview thay đổi thay đổi 1M Đa phương thức nhanh, tích hợp chặt chẽ với hệ sinh thái Google
DeepSeek V4 thấp thấp 128K Mô hình biên giới mã nguồn mở rẻ nhất

Câu trả lời thẳng thắn về việc nên chọn cái nào: GPT-5.5 Instant chiến thắng khi bạn cần độ tin cậy và sử dụng công cụ cấp ChatGPT. Gemini 3 Flash chiến thắng về độ trễ đa phương thức trong các thiết lập Google Cloud. DeepSeek V4 chiến thắng về chi phí thô khi bạn kiểm soát stack suy luận.

Các trường hợp sử dụng thực tế cho GPT-5.5 Instant

Phân loại hỗ trợ khách hàng. Định tuyến các phiếu hỗ trợ đến GPT-5.5 với reasoning.effort: "minimal", phân loại theo ý định, và chỉ chuyển giao cho người thật trong các trường hợp đặc biệt. Việc giảm sai lệch trong các cuộc trò chuyện được gắn cờ rất quan trọng ở đây; các phiếu thanh toán bị phân loại sai gây tốn kém tiền bạc thật.

Hỏi đáp tài liệu. Cung cấp một trang web tài liệu làm cửa sổ ngữ cảnh tăng cường truy xuất và để GPT-5.5 Instant trả lời với độ trễ thấp. Ngữ cảnh 1M xử lý được ngay cả các hướng dẫn sản phẩm lớn mà không cần chia nhỏ quá mức.

Trợ lý đánh giá mã. GPT-5.5 phát hiện các lỗi rõ ràng và đề xuất các cách tái cấu trúc với reasoning.effort: "low". Nâng lên "medium" cho các đường dẫn nhạy cảm về bảo mật. Kết hợp nó với tiện ích mở rộng Apidog VS Code để kiểm tra API trực tiếp trên mã được đề xuất.

Kết luận

GPT-5.5 Instant là con đường ít ma sát nhất cho bất kỳ ai muốn có mô hình mới. Trong ChatGPT, bạn đã có nó rồi. Trong API, bạn chọn tham gia bằng cách đặt model: "gpt-5.5"reasoning.effort: "minimal". Phần còn lại là kỹ thuật: ngân sách giới hạn tốc độ, thiết kế lời nhắc, vệ sinh bí mật và một vòng lặp kiểm tra mà bạn tin cậy.

Những điểm chính:

Bước tiếp theo đúng đắn phụ thuộc vào vị trí của bạn. Nếu bạn là người dùng ChatGPT, hãy tiếp tục trò chuyện; bản nâng cấp là tự động. Nếu bạn là nhà phát triển, hãy lấy khóa API, cài đặt Apidog và chạy yêu cầu gpt-5.5 đầu tiên của bạn thông qua một mẫu yêu cầu đã lưu. Tài liệu tham khảo đầy đủ dành cho nhà phát triển nằm trong hướng dẫn API GPT-5.5, và hướng dẫn về tín dụng miễn phí có trong truy cập miễn phí GPT-5.5.

button

Câu hỏi thường gặp

GPT-5.5 Instant có miễn phí không?Có, trên cơ sở có giới hạn. Các tài khoản ChatGPT miễn phí có thể gửi 10 tin nhắn mỗi 5 giờ trên GPT-5.5 Instant. Sau đó, cuộc trò chuyện sẽ chuyển về GPT-5.5 mini cho đến khi bộ đếm thời gian được đặt lại. Tài khoản Plus nhận được 160 tin nhắn mỗi 3 giờ; Pro và Business được sử dụng không giới hạn.

Tên mô hình API cho GPT-5.5 Instant là gì?Không có định danh mô hình gpt-5.5-instant riêng biệt. Sử dụng gpt-5.5 và đặt reasoning.effort: "minimal" để có hành vi Instant. Các giá trị nỗ lực cao hơn tương ứng gần hơn với GPT-5.5 Thinking. Tài liệu tham khảo đầy đủ có trong hướng dẫn API GPT-5.5.

GPT-5.5 Instant khác GPT-5.5 Thinking như thế nào?Cùng một mô hình cơ bản, ngân sách lý luận khác nhau. Instant trả về câu trả lời nhanh, độ trễ thấp. Thinking khám phá nhiều nhánh hơn trước khi trả lời và xử lý tốt hơn việc sử dụng công cụ đa bước theo kiểu agent. Pro bổ sung thêm khả năng tính toán lên trên Thinking và có giá API là 30 đô la/180 đô la cho mỗi triệu token.

GPT-5.5 Instant có hỗ trợ sử dụng công cụ không?Có. Mô hình có thể gọi công cụ, duyệt web thông qua công cụ tìm kiếm, chạy trình thông dịch mã và vận hành API tệp. Responses API hiển thị điều này thông qua tham số tools trên phần thân yêu cầu.

Cửa sổ ngữ cảnh là gì?1 triệu token đầu vào, với tối đa 128.000 token đầu ra cho mỗi phản hồi. Hãy chú ý đến ngưỡng 272K token đầu vào; vượt qua ngưỡng đó, phiên của bạn sẽ phải trả mức phí nhân 2x cho đầu vào và 1.5x cho đầu ra trên các cấp tiêu chuẩn, batch và flex.

Tôi có thể ghim GPT-5.5 Instant trong ChatGPT không?Trên các gói Plus, Pro và Business, có. Mở bộ chọn mô hình trong tiêu đề trò chuyện và chọn GPT-5.5 Instant. Việc ghim kéo dài cho cuộc trò chuyện hiện tại. Các tài khoản miễn phí không thể ghim và thay vào đó dựa vào bộ định tuyến tự động.

Làm thế nào để kiểm tra yêu cầu GPT-5.5 Instant trước khi triển khai?Lưu yêu cầu dưới dạng một mẫu trong Apidog, đặt khóa API làm bí mật môi trường và phát lại nó trên các môi trường dàn dựng và sản xuất. Thêm các xác nhận phản hồi vào một kịch bản kiểm tra và tích hợp kịch bản đó vào CI để phát hiện các lỗi hồi quy.

Điều gì xảy ra khi GPT-5.5 Instant chuyển tôi sang Thinking?Bộ định tuyến tự động nâng cấp khi lời nhắc có vẻ đủ phức tạp. Bạn sẽ thấy thời gian chờ đợi token đầu tiên lâu hơn một chút. Đầu ra được tính phí theo cùng mô hình gpt-5.5, vì vậy không có thay đổi giá bất ngờ trừ khi bạn đặt rõ ràng một reasoning.effort cao hơn trong API.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API