GPT-5.5 diluncurkan pada 23 April 2026, dan berita utama pengembangnya sederhana: OpenAI membuka model tersebut di dalam ChatGPT dan Codex pada hari yang sama, serta berkomitmen untuk API Responses dan Chat Completions “segera.” Panduan ini mencakup kedua sisi tersebut; bagaimana memanggil GPT-5.5 begitu kunci API berfungsi, dan bagaimana penguji awal menjalankannya hari ini melalui jalur masuk Codex.
Anda akan mendapatkan bentuk endpoint, autentikasi, contoh Python dan Node, tabel parameter lengkap, perhitungan harga mode berpikir, penanganan kesalahan, dan alur kerja pengujian di Apidog yang menghemat kredit saat Anda berulang kali mencoba.
Untuk gambaran umum model di tingkat produk, lihat Apa itu GPT-5.5. Untuk jalur tingkat gratis murni, lihat Cara menggunakan API GPT-5.5 secara gratis.
Ringkasan
- GPT-5.5 tersedia di endpoint Responses dan Chat Completions; ID modelnya adalah
gpt-5.5. Versi Pro adalahgpt-5.5-pro. - Harga API adalah $5 / Juta input dan $30 / Juta output; Versi Pro adalah $30 / Juta input dan $180 / Juta output.
- Jendela konteks adalah 1 Juta token di API dan 400 Ribu di dalam Codex CLI.
- Hingga peluncuran API secara umum selesai, pengembang dapat menjalankan GPT-5.5 melalui Codex menggunakan login ChatGPT.
- Gunakan Apidog untuk membangun koleksi terlebih dahulu; bentuk permintaan sesuai dengan GPT-5.4 dengan ID model baru dan blok
reasoningyang diperluas.
Prasyarat
Sebelum Anda mengirim permintaan pertama, siapkan empat hal:
- Akun pengembang OpenAI dengan tingkat penagihan. Langganan ChatGPT Plus atau Pro terpisah dari penagihan API; Anda memerlukan keduanya jika ingin akses UI dan akses terprogram.
- Kunci API dengan akses ke keluarga model GPT-5. Kunci API yang terlingkup proyek sangat direkomendasikan daripada kunci pengguna untuk setiap beban kerja produksi.
- Versi SDK yang mendukung
gpt-5.5. Pada Python yaituopenai>=2.1.0; pada Node yaituopenai@5.1.0atau yang lebih baru. - Klien API yang dapat memutar ulang permintaan tanpa membanjiri terminal. curl berfungsi untuk satu panggilan; setelah itu, beralihlah ke Apidog atau yang serupa.
Ekspor kunci Anda sekali:
export OPENAI_API_KEY="sk-proj-..."
Endpoint dan autentikasi
GPT-5.5 berada di dua endpoint yang sama dengan keluarga GPT-5 lainnya.
POST https://api.openai.com/v1/responses
POST https://api.openai.com/v1/chat/completions
API Responses adalah antarmuka OpenAI yang lebih baru, sadar alat, dan tempat di mana mode berpikir, pencarian web, dan penggunaan komputer semuanya terintegrasi dengan bersih. Chat Completions masih berfungsi dan masih membawa sebagian besar integrasi lama.
Otentikasi adalah token bearer. Setiap permintaan mengambil body JSON dengan ID model, array prompt atau pesan, dan parameter apa pun yang Anda inginkan.
curl https://api.openai.com/v1/responses \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"input": "Summarize the last 10 releases of the openai/codex repo in three bullets.",
"reasoning": { "effort": "medium" }
}'
```Jika panggilan berhasil, Anda akan mendapatkan objek JSON dengan array output pesan dan blok usage yang dipecah menjadi token input, output, dan reasoning. Kegagalan mengembalikan standar respons OpenAI dengan code dan message yang mudah dibaca; tabel kesalahan di akhir panduan ini mencakup yang akan Anda temui pertama kali.
Parameter permintaan
Setiap kolom dalam body memetakan ke biaya atau perilaku. Berikut adalah peta lengkap untuk gpt-5.5.
| Parameter | Tipe | Nilai | Catatan |
|---|---|---|---|
model |
string | gpt-5.5, gpt-5.5-pro |
Wajib. Pro biayanya 6× input dan 6× output. |
input / messages |
string atau array | Prompt atau array chat | Wajib. input untuk Responses, messages untuk Chat Completions. |
reasoning.effort |
string | none, low, medium, high, xhigh |
Default adalah low. xhigh membuka kedalaman gaya Berpikir dengan biaya token. |
max_output_tokens |
integer | 1 – 128000 | Batas keras untuk output, tidak termasuk token reasoning. |
tools |
array | Function, web_search, file_search, computer_use, code_interpreter | Definisi alat; model memilih dan mengaitkannya. |
tool_choice |
string atau objek | auto, none, atau alat bernama |
Memaksa pemanggilan alat tertentu saat Anda tahu Anda membutuhkannya. |
response_format |
objek | { "type": "json_schema", "schema": {...} } |
Output terstruktur; mode ketat sekarang adalah default. |
stream |
boolean | true / false | Server-sent events. Token reasoning tiba sebagai event terpisah. |
user |
string | Bentuk bebas | Digunakan untuk deteksi penyalahgunaan; berikan ID pengguna yang di-hash. |
metadata |
objek | Hingga 16 pasangan key-value | Muncul di dashboard dan log OpenAI. |
seed |
integer | Int32 apa saja | Deterministik lunak; seed yang sama dengan prompt yang sama hasilnya mirip, tidak identik. |
temperature |
number | 0 – 2 | Diabaikan pada reasoning.effort >= medium. |
Tiga bidang yang paling memengaruhi biaya adalah reasoning.effort, max_output_tokens, dan tools. Jalankan gaya berpikir pada reasoning.effort: "high" atau `"xhigh"` dapat dengan mudah menambah 3–8× jumlah token output dari jalankan low.
Contoh Python
Bentuk SDK untuk GPT-5.5 mengikuti API Responses 5.4; satu-satunya perbedaan adalah ID model dan rentang reasoning.effort yang lebih luas.
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model="gpt-5.5",
input=[
{
"role": "system",
"content": "You are a senior Go engineer. Answer in terse, runnable code.",
},
{
"role": "user",
"content": (
"Write a worker pool with bounded concurrency and a context "
"cancellation path. No third-party deps."
),
},
],
reasoning={"effort": "medium"},
max_output_tokens=4000,
)
print(response.output_text)
print(response.usage.model_dump())
Dua hal yang perlu diperhatikan:
response.output_textmeratakan arrayoutputuntuk Anda. Jika Anda membutuhkan event terstruktur (panggilan alat, jejak reasoning, kutipan), bacaresponse.outputsecara langsung.usagesekarang mengembalikaninput_tokens,output_tokens, danreasoning_tokenssebagai penghitung terpisah. Biaya dihitung dari ketiga nilai ini.
Contoh Node
import OpenAI from "openai";
const client = new OpenAI();
const response = await client.responses.create({
model: "gpt-5.5",
input: [
{ role: "system", content: "You are a careful reviewer." },
{
role: "user",
content:
"Review this migration and flag any operation that would lock a write-heavy table for more than 200 ms.",
},
],
reasoning: { effort: "high" },
tools: [{ type: "file_search" }],
max_output_tokens: 6000,
});
console.log(response.output_text);
console.log(response.usage);
Atur reasoning.effort ke high ketika tugasnya adalah gaya peninjauan dan biaya masalah yang terlewat lebih besar daripada biaya beberapa sen ekstra untuk token reasoning.
Mode Berpikir
Mode Berpikir GPT-5.5 bukanlah ID model yang berbeda; ini adalah model gpt-5.5 standar yang dijalankan dengan reasoning.effort pada high atau xhigh, dipasangkan dengan anggaran max_output_tokens yang lebih panjang. UI ChatGPT OpenAI mengeksposnya sebagai toggle; pada API Anda mengontrolnya per-permintaan.
Dua aturan praktis:
Gunakanmediumsebagai default. Ini mencakup sebagian besar pekerjaan agen, debugging multi-file, dan pembuatan dokumen. Biaya tetap hampir sama dibandingkan dengan GPT-5.4.Cadangkanhighdanxhighuntuk penelitian, tinjauan yang sangat kritis terhadap kebenaran, dan rantai alat yang panjang. Anggarkan 3–8× jumlah token output dan hitung waktu respons daripada menganggap itu akan kembali dalam waktu kurang dari 30 detik.
Jika permintaan Anda menyentuh computer_use atau rantai pencarian web yang panjang, upaya tingkat Berpikir sepadan dengan biayanya; penurunan halusinasi yang dikutip OpenAI dalam artikel peluncuran sebagian besar muncul dalam alur kerja ini.
Output terstruktur
Output JSON yang ketat adalah default pada GPT-5.5. Berikan skema dan SDK akan menolak mengembalikan JSON yang salah format.
response = client.responses.create(
model="gpt-5.5",
input="Extract the title, speaker, and start time from this transcript chunk.",
response_format={
"type": "json_schema",
"json_schema": {
"name": "session_extract",
"strict": True,
"schema": {
"type": "object",
"required": ["title", "speaker", "start_time"],
"properties": {
"title": {"type": "string"},
"speaker": {"type": "string"},
"start_time": {"type": "string", "format": "date-time"},
},
},
},
},
)
```Untuk setiap pipeline yang mengalirkan kode downstream, selalu tetapkan skema. Ini tidak memakan biaya di tingkat token dan menghilangkan loop percobaan ulang yang seharusnya Anda tulis untuk mengatasi output yang salah format.
Penggunaan alat dan agen
Penggunaan alat dan agenAPI Responses mengekspos lima jenis alat pihak pertama:
web_search— pencarian waktu nyata, sekarang dengan kutipan per hasil.file_search— pencarian vektor pada file yang diunggah.code_interpreter— Python dalam sandbox.computer_use— mouse, keyboard, dan browser melalui tumpukan Operator.function— callback Anda sendiri.
Peningkatan GPT-5.5 atas 5.4 di sini bukanlah daftar alat; melainkan seberapa rela model mengaitkannya tanpa pengawasan. Dalam pengujian terhadap suite reproduksi The Decoder, GPT-5.5 menyelesaikan 11 % lebih banyak rantai alat multi-langkah tanpa intervensi pengguna daripada 5.4 dengan prompt yang sama.
Penanganan kesalahan dan percobaan ulang
Penanganan kesalahan dan percobaan ulangHarapkan empat kode kesalahan yang cukup sering muncul untuk menanganinya berdasarkan nama.
| Kode | Arti | Coba Lagi? |
|---|---|---|
429 rate_limit_exceeded |
Batas per menit atau per hari tercapai. | Ya, dengan backoff eksponensial + jitter. |
400 context_length_exceeded |
Input + output + reasoning > 1 Juta token. | Tidak, persingkat input. |
500 server_error |
Sementara di sisi OpenAI. | Ya, hingga 3 percobaan. |
403 policy_violation |
Penolakan keamanan. | Tidak, tulis ulang prompt. |
Token reasoning dihitung terhadap jendela konteks. Panggilan reasoning.effort: "xhigh" pada input 900 Ribu token akan mencapai 400 untuk luapan konteks meskipun pesan pengguna Anda singkat.
Alur kerja pengujian dengan Apidog
Alur kerja pengujian dengan ApidogPanggilan GPT-5.5 cukup mahal sehingga Anda tidak ingin menemukan bug skema dengan menjalankan ulang prompt 20 kali. Alur kerja yang paling sedikit membuang token:
Buat permintaan sekali di Apidog, simpan sebagai entri koleksi, dan tandai lingkungan (kunci dev, staging, prod).Gunakan mock server bawaan untuk memutar ulang respons nyata terakhir saat Anda mengulang pada kode downstream.Beralih ke kunci live hanya ketika skema stabil.
Apidog juga dilengkapi integrasi Claude Code dan Cursor sehingga koleksi yang sama dapat diakses dari agen tingkat editor mana pun yang Anda gunakan. Lihat panduan Apidog di VS Code kami dan perbandingan Apidog vs. Postman untuk pengaturan lengkap.
Memanggil GPT-5.5 sebelum API bersifat umum
Memanggil GPT-5.5 sebelum API bersifat umumHingga OpenAI menyelesaikan peluncuran API Responses, jalur praktis bagi pengembang yang ingin mencoba GPT-5.5 adalah alur login Codex. Panduan gratis Codex menjelaskan cara menginstal CLI, melakukan autentikasi dengan akun ChatGPT, dan memilih model.
FAQ
FAQApakah adagpt-5.5-mini?Tidak saat peluncuran. OpenAI mempertahankangpt-5.4-minisebagai SKU yang dioptimalkan biaya.Apa itu jendela konteks?1 Juta token di API. 400 Ribu di dalam Codex CLI. Keduanya termasuk token reasoning.Apakah saya perlu menulis ulang kode GPT-5.4 saya?Tidak. Tukar ID model, perluasmax_output_tokensjika Anda ingin output tingkat Berpikir, dan sesuaikan kembalireasoning.effortuntuk beban kerja Anda.Bagaimana cara mengurangi biaya?Tiga tuas: Batch (diskon 50%), Flex (diskon 50%, antrean lebih lambat), dan skema ketat untuk menghentikan loop percobaan ulang. Perhitungan biaya penuh ada di rincian harga GPT-5.5.Di mana saya bisa melihat pengumuman GA API?Komunitas pengembang OpenAI dan halaman harga API OpenAI adalah sinyal publik tercepat.
