Cara Menggunakan API GPT-5.5

Ashley Innocent

Ashley Innocent

24 April 2026

Cara Menggunakan API GPT-5.5

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

GPT-5.5 diluncurkan pada 23 April 2026, dan berita utama pengembangnya sederhana: OpenAI membuka model tersebut di dalam ChatGPT dan Codex pada hari yang sama, serta berkomitmen untuk API Responses dan Chat Completions “segera.” Panduan ini mencakup kedua sisi tersebut; bagaimana memanggil GPT-5.5 begitu kunci API berfungsi, dan bagaimana penguji awal menjalankannya hari ini melalui jalur masuk Codex.

Anda akan mendapatkan bentuk endpoint, autentikasi, contoh Python dan Node, tabel parameter lengkap, perhitungan harga mode berpikir, penanganan kesalahan, dan alur kerja pengujian di Apidog yang menghemat kredit saat Anda berulang kali mencoba.

button

Untuk gambaran umum model di tingkat produk, lihat Apa itu GPT-5.5. Untuk jalur tingkat gratis murni, lihat Cara menggunakan API GPT-5.5 secara gratis.

Ringkasan

Prasyarat

Sebelum Anda mengirim permintaan pertama, siapkan empat hal:

Ekspor kunci Anda sekali:

export OPENAI_API_KEY="sk-proj-..."

Endpoint dan autentikasi

GPT-5.5 berada di dua endpoint yang sama dengan keluarga GPT-5 lainnya.

POST https://api.openai.com/v1/responses
POST https://api.openai.com/v1/chat/completions

API Responses adalah antarmuka OpenAI yang lebih baru, sadar alat, dan tempat di mana mode berpikir, pencarian web, dan penggunaan komputer semuanya terintegrasi dengan bersih. Chat Completions masih berfungsi dan masih membawa sebagian besar integrasi lama.

Otentikasi adalah token bearer. Setiap permintaan mengambil body JSON dengan ID model, array prompt atau pesan, dan parameter apa pun yang Anda inginkan.

curl https://api.openai.com/v1/responses \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "input": "Summarize the last 10 releases of the openai/codex repo in three bullets.",
    "reasoning": { "effort": "medium" }
  }'
```

Jika panggilan berhasil, Anda akan mendapatkan objek JSON dengan array output pesan dan blok usage yang dipecah menjadi token input, output, dan reasoning. Kegagalan mengembalikan standar respons OpenAI dengan code dan message yang mudah dibaca; tabel kesalahan di akhir panduan ini mencakup yang akan Anda temui pertama kali.

Parameter permintaan

Setiap kolom dalam body memetakan ke biaya atau perilaku. Berikut adalah peta lengkap untuk gpt-5.5.

Parameter Tipe Nilai Catatan
model string gpt-5.5, gpt-5.5-pro Wajib. Pro biayanya 6× input dan 6× output.
input / messages string atau array Prompt atau array chat Wajib. input untuk Responses, messages untuk Chat Completions.
reasoning.effort string none, low, medium, high, xhigh Default adalah low. xhigh membuka kedalaman gaya Berpikir dengan biaya token.
max_output_tokens integer 1 – 128000 Batas keras untuk output, tidak termasuk token reasoning.
tools array Function, web_search, file_search, computer_use, code_interpreter Definisi alat; model memilih dan mengaitkannya.
tool_choice string atau objek auto, none, atau alat bernama Memaksa pemanggilan alat tertentu saat Anda tahu Anda membutuhkannya.
response_format objek { "type": "json_schema", "schema": {...} } Output terstruktur; mode ketat sekarang adalah default.
stream boolean true / false Server-sent events. Token reasoning tiba sebagai event terpisah.
user string Bentuk bebas Digunakan untuk deteksi penyalahgunaan; berikan ID pengguna yang di-hash.
metadata objek Hingga 16 pasangan key-value Muncul di dashboard dan log OpenAI.
seed integer Int32 apa saja Deterministik lunak; seed yang sama dengan prompt yang sama hasilnya mirip, tidak identik.
temperature number 0 – 2 Diabaikan pada reasoning.effort >= medium.

Tiga bidang yang paling memengaruhi biaya adalah reasoning.effort, max_output_tokens, dan tools. Jalankan gaya berpikir pada reasoning.effort: "high" atau `"xhigh"` dapat dengan mudah menambah 3–8× jumlah token output dari jalankan low.

Contoh Python

Bentuk SDK untuk GPT-5.5 mengikuti API Responses 5.4; satu-satunya perbedaan adalah ID model dan rentang reasoning.effort yang lebih luas.

from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="gpt-5.5",
    input=[
        {
            "role": "system",
            "content": "You are a senior Go engineer. Answer in terse, runnable code.",
        },
        {
            "role": "user",
            "content": (
                "Write a worker pool with bounded concurrency and a context "
                "cancellation path. No third-party deps."
            ),
        },
    ],
    reasoning={"effort": "medium"},
    max_output_tokens=4000,
)

print(response.output_text)
print(response.usage.model_dump())

Dua hal yang perlu diperhatikan:

Contoh Node

import OpenAI from "openai";

const client = new OpenAI();

const response = await client.responses.create({
  model: "gpt-5.5",
  input: [
    { role: "system", content: "You are a careful reviewer." },
    {
      role: "user",
      content:
        "Review this migration and flag any operation that would lock a write-heavy table for more than 200 ms.",
    },
  ],
  reasoning: { effort: "high" },
  tools: [{ type: "file_search" }],
  max_output_tokens: 6000,
});

console.log(response.output_text);
console.log(response.usage);

Atur reasoning.effort ke high ketika tugasnya adalah gaya peninjauan dan biaya masalah yang terlewat lebih besar daripada biaya beberapa sen ekstra untuk token reasoning.

Mode Berpikir

Mode Berpikir GPT-5.5 bukanlah ID model yang berbeda; ini adalah model gpt-5.5 standar yang dijalankan dengan reasoning.effort pada high atau xhigh, dipasangkan dengan anggaran max_output_tokens yang lebih panjang. UI ChatGPT OpenAI mengeksposnya sebagai toggle; pada API Anda mengontrolnya per-permintaan.

Dua aturan praktis:

Jika permintaan Anda menyentuh computer_use atau rantai pencarian web yang panjang, upaya tingkat Berpikir sepadan dengan biayanya; penurunan halusinasi yang dikutip OpenAI dalam artikel peluncuran sebagian besar muncul dalam alur kerja ini.

Output terstruktur

Output JSON yang ketat adalah default pada GPT-5.5. Berikan skema dan SDK akan menolak mengembalikan JSON yang salah format.

response = client.responses.create(
    model="gpt-5.5",
    input="Extract the title, speaker, and start time from this transcript chunk.",
    response_format={
        "type": "json_schema",
        "json_schema": {
            "name": "session_extract",
            "strict": True,
            "schema": {
                "type": "object",
                "required": ["title", "speaker", "start_time"],
                "properties": {
                    "title": {"type": "string"},
                    "speaker": {"type": "string"},
                    "start_time": {"type": "string", "format": "date-time"},
                },
            },
        },
    },
)
```

Untuk setiap pipeline yang mengalirkan kode downstream, selalu tetapkan skema. Ini tidak memakan biaya di tingkat token dan menghilangkan loop percobaan ulang yang seharusnya Anda tulis untuk mengatasi output yang salah format.

Penggunaan alat dan agen

API Responses mengekspos lima jenis alat pihak pertama:

Peningkatan GPT-5.5 atas 5.4 di sini bukanlah daftar alat; melainkan seberapa rela model mengaitkannya tanpa pengawasan. Dalam pengujian terhadap suite reproduksi The Decoder, GPT-5.5 menyelesaikan 11 % lebih banyak rantai alat multi-langkah tanpa intervensi pengguna daripada 5.4 dengan prompt yang sama.

Penanganan kesalahan dan percobaan ulang

Harapkan empat kode kesalahan yang cukup sering muncul untuk menanganinya berdasarkan nama.

Kode Arti Coba Lagi?
429 rate_limit_exceeded Batas per menit atau per hari tercapai. Ya, dengan backoff eksponensial + jitter.
400 context_length_exceeded Input + output + reasoning > 1 Juta token. Tidak, persingkat input.
500 server_error Sementara di sisi OpenAI. Ya, hingga 3 percobaan.
403 policy_violation Penolakan keamanan. Tidak, tulis ulang prompt.

Token reasoning dihitung terhadap jendela konteks. Panggilan reasoning.effort: "xhigh" pada input 900 Ribu token akan mencapai 400 untuk luapan konteks meskipun pesan pengguna Anda singkat.

Alur kerja pengujian dengan Apidog

Panggilan GPT-5.5 cukup mahal sehingga Anda tidak ingin menemukan bug skema dengan menjalankan ulang prompt 20 kali. Alur kerja yang paling sedikit membuang token:

  1. Buat permintaan sekali di Apidog, simpan sebagai entri koleksi, dan tandai lingkungan (kunci dev, staging, prod).
  2. Gunakan mock server bawaan untuk memutar ulang respons nyata terakhir saat Anda mengulang pada kode downstream.
  3. Beralih ke kunci live hanya ketika skema stabil.

Apidog juga dilengkapi integrasi Claude Code dan Cursor sehingga koleksi yang sama dapat diakses dari agen tingkat editor mana pun yang Anda gunakan. Lihat panduan Apidog di VS Code kami dan perbandingan Apidog vs. Postman untuk pengaturan lengkap.

Memanggil GPT-5.5 sebelum API bersifat umum

Hingga OpenAI menyelesaikan peluncuran API Responses, jalur praktis bagi pengembang yang ingin mencoba GPT-5.5 adalah alur login Codex. Panduan gratis Codex menjelaskan cara menginstal CLI, melakukan autentikasi dengan akun ChatGPT, dan memilih model.

FAQ

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.