Claude Sonnet 5 diluncurkan pada 30 Juni 2026, dan harganya menjadi sorotan utama. Anda mendapatkan kinerja yang mendekati Opus 4.8 dalam tugas-tugas agensi dan penggunaan alat dengan biaya yang jauh lebih murah. Panduan ini memberikan Anda angka-angka pasti: tarif perkenalan, tarif standar, tanggal perubahan tarif, dan satu detail tokenizer yang diam-diam mengubah tagihan Anda yang sebenarnya. Anda juga akan melihat bagaimana Sonnet 5 dibandingkan dengan Opus 4.8 dan Fable 5 sehingga Anda dapat memilih model yang tepat berdasarkan biaya, bukan hanya kemampuan. Ketika Anda mulai memanggil API, Apidog adalah tempat Anda mengirim permintaan tersebut, menyimpannya, dan melacak persis apa yang Anda bayar.
Inilah yang akan Anda dapatkan: tarif per token, contoh perhitungan biaya, tabel perbandingan model, dan daftar periksa singkat untuk memperkirakan dan memantau pengeluaran sebelum mengejutkan Anda.

Harga Claude Sonnet 5 Sekilas
Sonnet 5 menggunakan tarif per token yang sama dengan pendahulunya, Sonnet 4.6. Tidak ada perubahan pada harga dasar. Yang berubah adalah diskon perkenalan yang berlaku selama dua bulan pertama.
| Tarif | Input (per 1 Juta token) | Output (per 1 Juta token) | Berlaku |
|---|---|---|---|
| Perkenalan | $2 | $10 | Hingga 31 Agustus 2026 |
| Standar | $3 | $15 | Mulai 1 September 2026 |
ID model adalah claude-sonnet-5 tanpa akhiran tanggal. String tunggal ini adalah yang Anda kirimkan dalam permintaan API, dan akan ditagih dengan tarif ini.
Dua hal yang perlu diingat sekarang:
- Tarif perkenalan ($2 input / $10 output) berlaku hingga 31 Agustus 2026. Setelah itu akan beralih ke tarif standar $3 / $15.
- Tarif standar identik dengan Sonnet 4.6. Jika Anda sudah menggunakan Sonnet 4.6, harga per token Anda tidak akan naik saat Anda bermigrasi.
Poin terakhir itu terdengar seperti kemenangan mutlak. Sebagian besar memang begitu. Tetapi ada detail tokenizer yang mengubah perhitungan, dan mudah untuk terlewatkan.
Kelemahan tokenizer: tarif sama, token lebih banyak
Sonnet 5 dilengkapi dengan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token daripada di Sonnet 4.6, sekitar 1,3x. Ini bukan perubahan API. Bentuk permintaan, respons, dan streaming identik, dan Anda tidak perlu menulis kode baru. Tetapi apa pun yang Anda ukur atau anggarkan dalam token akan bergeser.
Karena Anda membayar per token, lebih banyak token untuk teks yang sama berarti biaya yang lebih tinggi untuk permintaan yang setara, meskipun tarif per token tidak pernah berubah.
Berikut adalah contoh perhitungan. Katakanlah sebuah prompt adalah 10.000 token di Sonnet 4.6.
- Pada Sonnet 4.6 dengan $3 per juta input: 10.000 token berharga sekitar $0.030.
- Pada Sonnet 5, teks yang sama kira-kira 13.000 token. Dengan tarif perkenalan $2 per juta input: sekitar $0.026.
- Pada Sonnet 5 dengan tarif standar $3 per juta input (setelah 31 Agustus): sekitar $0.039.
Jadi, selama periode perkenalan, diskon tersebut kira-kira meniadakan token tambahan, dan Anda mungkin membayar jumlah yang sama atau sedikit lebih rendah. Setelah tarif standar berlaku, teks yang sama dengan 1,3x token akan berharga lebih mahal daripada di Sonnet 4.6 dengan tarif per token yang sama. Tarifnya tetap. Tagihannya tidak.
Ini memengaruhi lebih dari sekadar biaya:
- Bidang
usagedan hasil penghitungan token akan kembali lebih tinggi untuk teks yang sama. Hitung ulang menggunakan Sonnet 5. Jangan gunakan kembali hitungan Sonnet 4.6 lama Anda. - Jendela konteks 1 juta token menampung lebih sedikit teks secara rata-rata, karena setiap token sekarang mencakup lebih sedikit teks.
- Anggaran
max_tokensyang Anda sesuaikan mendekati output yang diharapkan mungkin terpotong. Tinjau kembali.
Poin utamanya sederhana: model beban kerja Anda yang sebenarnya dengan penghitungan token di Sonnet 5 sebelum Anda mengasumsikan paritas datar. Dokumentasi penghitungan token Anthropic menunjukkan cara mengukur prompt terhadap tokenizer saat ini. Untuk panduan lengkap panggilan API pertama dan tempat membaca blok usage, lihat panduan API Claude Sonnet 5 kami.
Bagaimana Sonnet 5 Dibandingkan dengan Opus 4.8 dan Fable 5
Sonnet 5 dihargai untuk menjadi model pekerja keras bervolume tinggi. Kasus nilainya paling jelas ketika Anda membandingkannya dengan model-model di atasnya. Ketiganya memiliki jendela konteks 1 juta token dan output maksimal 128K, jadi perbedaannya di sini adalah harga dan di mana setiap model menghasilkan nilainya.
| Model | ID Model | Input (per 1 Juta) | Output (per 1 Juta) |
|---|---|---|---|
| Sonnet 5 (perkenalan) | claude-sonnet-5 |
$2 | $10 |
| Sonnet 5 (standar) | claude-sonnet-5 |
$3 | $15 |
| Sonnet 4.6 | claude-sonnet-4-6 |
$3 | $15 |
| Opus 4.8 | claude-opus-4-8 |
$5 | $25 |
| Fable 5 | claude-fable-5 |
$10 | $50 |
Baca tabel tersebut dengan mempertimbangkan tolok ukur. Dalam tugas-tugas agensi dan penggunaan alat, angka peluncuran Anthropic menempatkan Sonnet 5 dalam kisaran 1 hingga 3 poin dari Opus 4.8. Angka yang dilaporkan termasuk SWE-bench Pro sebesar 63,2% untuk Sonnet 5 berbanding 69,2% untuk Opus 4.8, Terminal-Bench 2.1 sebesar 80,4% berbanding 82,7%, dan OSWorld-Verified sebesar 81,2% berbanding 83,4%. Opus unggul sekitar 6 poin dalam penalaran murni tanpa bantuan apa pun.
Jadi, keputusan biaya bermuara pada hal ini:
- Dengan tarif standar, Sonnet 5 40% lebih murah untuk input dan 40% lebih murah untuk output dibandingkan Opus 4.8, untuk kinerja yang mendekati Opus pada pekerjaan yang banyak menggunakan alat.
- Fable 5 berada pada $10 / $50, lebih dari tiga kali lipat tarif input standar Sonnet 5. Anda menggunakannya ketika Anda membutuhkan model Anthropic yang paling mampu yang dirilis secara luas, bukan untuk loop agen bervolume tinggi.
- Dibandingkan dengan Sonnet 4.6, Anda membayar per token yang sama untuk skor coding dan agensi yang lebih baik, dengan peringatan tokenizer di atas.
Jika Anda mempertimbangkan kemampuan versus harga untuk pekerjaan tertentu, perbandingan Sonnet 5 vs Opus 4.8 kami membahas keputusan tugas demi tugas. Untuk sisi Fable 5, lihat panduan harga Fable 5.
Uji dan Lacak Permintaan yang Anda Bayar dengan Apidog
Setiap dolar pada tagihan Sonnet 5 Anda sesuai dengan permintaan HTTP: POST ke Messages API dengan body JSON, kunci API, dan respons yang Anda bayar per token. Jika Anda menebak-nebak permintaan tersebut, Anda menebak-nebak biaya Anda.

Apidog memberi Anda tempat untuk membuat permintaan tersebut nyata dan dapat diulang:
- Kirim permintaan Sonnet 5 dan lihat respons yang tepat, termasuk blok
usageyang memberitahu Anda jumlah token input dan output per panggilan. Itulah biaya Anda, per permintaan, sebelum Anda menskalakannya. - Simpan permintaan dalam koleksi sehingga tim Anda menjalankan panggilan yang sama, bukan yang sedikit berbeda yang ditagih berbeda.
- Simpan kunci API Anda sebagai variabel lingkungan dan beralih antara kunci uji dan produksi tanpa mengedit permintaan.
- Tambahkan pernyataan otomatis sehingga perubahan prompt yang menggandakan panjang output terdeteksi di CI, bukan pada tagihan.
- Buat mock endpoint sehingga Anda dapat membangun dan menguji integrasi tanpa menghabiskan token sungguhan di setiap pengembangan.
Berikut adalah permintaan pertama dalam bentuk Anthropic Messages API. Kirimkan di Apidog, baca bidang usage dalam respons, dan Anda memiliki angka biaya per panggilan yang nyata untuk dikalikan.
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "Summarize this changelog entry in two sentences."}
]
}'
Responsnya mencakup objek usage dengan input_tokens dan output_tokens. Kalikan angka-angka tersebut dengan tarif di tabel di atas dan Anda akan mendapatkan biaya panggilan yang tepat itu. Lakukan hal ini untuk prompt Anda yang sebenarnya dan perkiraan Anda tidak lagi menjadi tebakan.
Unduh Apidog untuk mengirim permintaan Sonnet 5, memeriksa penggunaan token, dan mengatur panggilan yang Anda tagih dalam satu ruang kerja.
Pertanyaan yang Sering Diajukan
Berapa biaya API Claude Sonnet 5?
Selama periode perkenalan hingga 31 Agustus 2026, biayanya adalah $2 per juta token input dan $10 per juta token output. Mulai 1 September 2026, akan beralih ke tarif standar $3 per juta input dan $15 per juta output.
Apakah Sonnet 5 lebih murah dari Sonnet 4.6?
Tarif per token sama dengan Sonnet 4.6 pada tingkat standar ($3 / $15), dan lebih rendah selama periode perkenalan. Namun tokenizer baru Sonnet 5 menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, sehingga biaya permintaan yang setara bisa lebih tinggi dengan tarif standar. Hitung token pada Sonnet 5 untuk melihat angka sebenarnya. Perbandingan Sonnet 5 vs Sonnet 4.6 kami mencakup detail migrasi.
Mengapa prompt yang sama berharga lebih mahal di Sonnet 5 daripada di Sonnet 4.6?
Tarif per token tidak berubah, tetapi tokenizer baru membagi teks yang sama menjadi kira-kira 1,3 kali lebih banyak token. Lebih banyak token dengan tarif yang sama berarti biaya yang lebih tinggi untuk teks yang setara, paling terlihat setelah diskon perkenalan berakhir.
Bagaimana perbandingan harga Sonnet 5 dengan Opus 4.8?
Opus 4.8 berharga $5 per juta input dan $25 per juta output, dibandingkan dengan tarif standar Sonnet 5 yaitu $3 / $15. Sonnet 5 berada dalam kisaran sekitar 1 hingga 3 poin dari Opus 4.8 pada tolok ukur agensi yang dilaporkan Anthropic, sehingga Anda mendapatkan kinerja yang mendekati pada tugas-tugas yang banyak menggunakan alat dengan harga yang lebih rendah.
Adakah cara yang lebih murah untuk menjalankan Sonnet 5?
Ya. Pemrosesan batch dan caching prompt menurunkan tarif efektif untuk beban kerja yang sesuai. Tarif diskon yang tepat ada di halaman harga Anthropic. Menyesuaikan max_tokens dengan benar dan menjaga prompt tetap ringkas juga memangkas biaya output, yang 5x lipat dari tarif input.
