OpenAI menggandakan harga per-token pada lini GPT-5 dengan perilisan GPT-5.5 pada 23 April 2026. Input naik dari $2.50 menjadi $5.00 per juta token. Output naik dari $15.00 menjadi $30.00 per juta. Harga Pro tetap flat di $30 / $180. Itu adalah berita utamanya; rinciannya adalah tempat biaya sebenarnya berada.
Panduan ini mencakup setiap permukaan harga: API standar, Batch, Flex, dan Prioritas; harga Pro; batas Codex per paket; dan cara menghitung beban kerja Anda yang sebenarnya sebelum Anda berkomitmen untuk perubahan model default.
Untuk tinjauan model, lihat Apa itu GPT-5.5. Untuk panduan pengembang, lihat Cara menggunakan API GPT-5.5.
TL;DR
| Permukaan | Input / Juta | Output / Juta |
|---|---|---|
| API standar GPT-5.5 | $5.00 | $30.00 |
| API Pro GPT-5.5 | $30.00 | $180.00 |
| GPT-5.5 Batch (diskon 50%) | $2.50 | $15.00 |
| GPT-5.5 Flex (diskon 50%) | $2.50 | $15.00 |
| Prioritas GPT-5.5 (2.5×) | $12.50 | $75.00 |
| API standar GPT-5.4 | $2.50 | $15.00 |
| API GPT-5.4-mini | $0.25 | $2.00 |
Efek bersih: GPT-5.5 adalah 2× GPT-5.4 pada tingkat token, tetapi OpenAI mengklaim peningkatan Indeks Kecerdasan bersih ~20% setelah efisiensi token diperhitungkan.
Angka-angka Utama
OpenAI menerbitkan harga di halaman harga API pada hari yang sama dengan peluncuran.
- GPT-5.5: $5.00 per juta token input, $30.00 per juta token output.
- GPT-5.5 Pro: $30.00 per juta token input, $180.00 per juta token output.
- Jendela Konteks: 1 juta token pada kedua varian. Token penalaran dihitung terhadap jendela dan terhadap tagihan output.
Batch, Flex, dan Prioritas
OpenAI menawarkan tiga tingkatan alternatif yang mengubah harga standar.
API Batch
Antrekan permintaan melalui titik akhir Batch dan permintaan tersebut akan berjalan dengan diskon 50% dari harga standar. Waktu penyelesaian kurang dari 24 jam. Baik untuk:
- Evaluasi semalam pada seluruh dataset.
- Pengisian ulang data (backfill) dan pemrosesan ulang historis.
- Setiap alur kerja di mana anggaran latensi diukur dalam jam, bukan detik.
Dengan harga Batch, GPT-5.5 berharga $2.50 / $15.00 per juta token; identik dengan harga standar GPT-5.4. Untuk beban kerja offline, penggandaan harga hilang.
Pemrosesan Flex
Flex juga memberi Anda diskon 50% dari tarif standar, tetapi waktu tunggu bervariasi; mulai dari detik hingga beberapa menit tergantung pada beban. Gunakan Flex ketika Anda dapat mentolerir latensi yang tidak dapat diprediksi dan menginginkan harga setara Batch dengan respons yang sinkron.
Pemrosesan Prioritas
Prioritas berharga 2.5× dari tarif standar ($12.50 / $75.00 per juta token pada GPT-5.5) dan memberi Anda throughput yang lebih cepat dari default, batas tarif yang lebih tinggi, dan waktu antrean yang mendekati nol. Cadangkan ini untuk pengalaman pengguna langsung di mana latensi ekor muncul dalam metrik retensi.
Perhitungan Biaya Mode Berpikir
GPT-5.5 Thinking adalah ID model yang sama dengan reasoning.effort yang lebih tinggi. Ini tidak mengubah harga per-token; ini mengubah berapa banyak token yang digunakan oleh satu permintaan. Harapkan pengali jatuh dalam tiga pita.
| Upaya | Pengali Token Output | Kapan Digunakan |
|---|---|---|
rendah (default) |
1× | Sebagian besar panggilan rutin |
sedang |
1.3–2× | Pengkodean multi-langkah, generasi terstruktur |
tinggi |
2–4× | Riset mendalam, tinjauan kritis kebenaran |
sangat tinggi |
3–8× | Perulangan agen dengan rantai alat, perencanaan padat |
Satu panggilan sangat tinggi pada prompt panjang dapat dengan mudah menggunakan 20 ribu token penalaran; dengan $30 per juta, itu adalah $0.60 hanya untuk penalaran, di atas biaya token output akhir.
Anggaran per beban kerja, bukan per permintaan.
Harga Codex
Akses Codex terikat pada paket ChatGPT, bukan pada tagihan per-token. Pada 23 April 2026, strukturnya terlihat seperti ini.
| Paket | Akses Codex | GPT-5.5 | Catatan |
|---|---|---|---|
| Gratis | Ya (waktu terbatas) | Ya | Batas mingguan ketat |
| Go | Ya (waktu terbatas) | Ya | 2× batas Gratis |
| Plus ($20 / bln) | Ya | Ya | Batas standar |
| Pro ($200 / bln) | Ya | Ya + Berpikir + Pro (di ChatGPT) | Batas per-pengguna tertinggi |
| Bisnis | Ya | Ya | Berbasis kursi |
| Perusahaan / Edu | Ya | Ya | Berbasis kontrak |
Bagi pengguna yang menghabiskan sebagian besar waktunya dalam alur kerja pengkodean terminal, Plus atau Pro adalah cara termurah untuk menjalankan GPT-5.5; biaya bulanan tetap mengalahkan bahkan harga Batch setelah Anda melewati beberapa ratus ribu token per hari. Panduan jalur gratis mencakup titik masuk tanpa biaya.
Perbandingan: GPT-5.5 vs Model Lainnya
Kapan Anda membayar untuk GPT-5.5 dan kapan Anda tetap menggunakan GPT-5.4 atau GPT-5.4-mini? Perhitungan biaya tergantung pada seberapa berat beban kerja output Anda.
| Model | Input / Juta | Output / Juta | Biaya per 1 Ribu token output |
|---|---|---|---|
| GPT-5.4-mini | $0.25 | $2.00 | $0.0020 |
| GPT-5.4 | $2.50 | $15.00 | $0.0150 |
| GPT-5.5 | $5.00 | $30.00 | $0.0300 |
| GPT-5.5 Pro | $30.00 | $180.00 | $0.1800 |
Alur keputusan kasar:
- Output bervolume tinggi, berisiko rendah (klasifikasi, ringkasan, obrolan sederhana): GPT-5.4-mini.
- Lalu lintas produksi umum di mana 5.4 sudah melewati standar kualitas: GPT-5.4.
- Pengkodean sulit, pekerjaan agen multi-langkah, rantai penelitian: GPT-5.5.
- Output yang sangat penting keakuratannya di mana jawaban yang salah mahal untuk ditangani di kemudian hari: GPT-5.5 Pro.
Contoh Praktis: Biaya Agen Pengkodean per Tugas
Sesi pengkodean agen yang khas melalui API pada GPT-5.5 dengan reasoning.effort: "medium" terlihat seperti ini.
- Token input per tugas (konteks repo + prompt pengguna): ~15.000
- Token output per tugas (kode + penjelasan): ~3.000
- Token penalaran per tugas (upaya sedang): ~6.000
Biaya per tugas dengan harga standar:
- Input: 15 Ribu × $5.00 / Juta = $0.075
- Output: (3 Ribu + 6 Ribu) × $30.00 / Juta = $0.27
- Total: $0.345 per tugas pengkodean yang diselesaikan.
Menjalankan beban kerja yang sama pada GPT-5.4:
- Input: 15 Ribu × $2.50 / Juta = $0.0375
- Output: 9 Ribu × $15.00 / Juta = $0.135
- Total: $0.1725 per tugas pengkodean yang diselesaikan.
GPT-5.5 persis 2× biaya per tugas dengan upaya penalaran yang sama. Peningkatan ini akan impas ketika celah SWE-bench (88.7% vs sekitar 74%) berhasil menutup cukup banyak tugas untuk menghilangkan perjalanan pulang-pergi kedua. Jika satu dari delapan tugas pada GPT-5.4 memerlukan penulisan ulang manual, GPT-5.5 lebih murah secara keseluruhan.
Kontrol Biaya yang Layak Dibangun Sejak Hari Pertama
Lima tuas yang membuat tagihan GPT-5.5 tetap stabil.
- Batas keras
max_output_tokens. Setiap panggilan, setiap saat. Default ke 2.000 kecuali Anda secara eksplisit membutuhkan output panjang. - Skema JSON yang ketat. Output yang salah format berarti percobaan ulang; percobaan ulang adalah panggilan berharga penuh.
- Rute berdasarkan kesulitan. Triage permintaan mudah ke GPT-5.4-mini; eskalasikan yang sulit ke GPT-5.5. Sebuah router 10 baris menghemat lebih banyak daripada optimasi tingkat prompt.
- Gunakan Batch untuk segala hal offline. Evaluasi, pengisian ulang data, pembuatan laporan malam; semuanya diskon 50%.
- Lacak
usage.reasoning_tokens. Kejutan tagihan pada GPT-5.5 hampir selalu berupa pengeluaran token penalaran pada upaya tinggi. Beri peringatan untuk itu.
Estimasi Biaya Bulanan Per Paket
Jika Anda memilih tingkatan ChatGPT untuk akses GPT-5.5, berikut adalah cara kerja setiap paket.
| Paket | Harga bulanan | Paling cocok untuk |
|---|---|---|
| Gratis | $0 | Mencoba GPT-5.5 melalui Codex sebelum berkomitmen |
| Go | $4 / bln | Pelajar dan pengguna ringan yang menginginkan 2× batas Gratis |
| Plus | $20 / bln | Pengembang individu yang menggunakan Codex + ChatGPT setiap hari |
| Pro | $200 / bln | Pengguna tingkat lanjut yang menginginkan Thinking dan Pro di ChatGPT |
| Bisnis | $25 / kursi / bln | Tim yang membutuhkan ruang kerja bersama |
| Perusahaan / Edu | Kustom | Berbasis kontrak dengan SLA |
Bagi siapa pun yang menjalankan lebih dari ~4 juta token output per bulan di API, Pro di ChatGPT ditambah Codex CLI pada akhirnya lebih murah daripada tagihan API pay-as-you-go, selama beban kerja sesuai dengan jendela konteks 400 ribu CLI.
Sinyal Perubahan Harga yang Perlu Diperhatikan
Dua sinyal yang layak dilacak jika Anda membuat anggaran jangka panjang.
- Ketersediaan Umum (GA) API GPT-5.5. Harga bisa turun karena OpenAI merespons tekanan kompetitif dari Anthropic Claude Mythos, Gemini 3.5, dan model open-weight yang diuji di papan peringkat Vellum.
- Demokratisasi model Pro. OpenAI secara historis telah menurunkan harga tingkat Pro dalam 3–6 bulan setelah setiap rilis. Jangan berasumsi bahwa $30 / $180 hari ini bersifat permanen; jangan pula berasumsi bahwa harganya akan turun.
FAQ
Apakah caching mengurangi biaya input?Ya. Token input yang di-cache pada GPT-5.5 ditagih sebagian kecil dari tarif standar; halaman harga OpenAI memiliki pengali yang tepat. Cache apa pun yang Anda gunakan kembali dalam lebih dari satu permintaan (prompt sistem, skema alat, konteks repo).
Apakah ada diskon volume?Tidak ada yang dipublikasikan. Kontrak perusahaan sering kali mencakup tarif khusus, dan OpenAI menyesuaikan harga sebagai respons terhadap penggunaan berkelanjutan. Bicarakan dengan bagian penjualan jika pengeluaran tahunan melebihi tujuh digit.
Apakah mode berpikir memakan biaya tambahan di luar harga per-token?Tidak. Biayanya lebih mahal karena menggunakan lebih banyak token, bukan karena tarif per-token berubah.
Apakah penggunaan Codex CLI ditagih terpisah dari penggunaan API?Hanya jika Anda masuk dengan kunci API. Masuk melalui ChatGPT menagih biaya paket; masuk dengan kunci API menagih akun berdasarkan penggunaan.
Apa cara termurah untuk mencoba GPT-5.5?Paket Gratis atau Go ditambah Codex CLI. Lihat panduan jalur gratis kami untuk setiap opsi tanpa biaya.
