Apa Itu Claude Sonnet 5? Fitur, Benchmark, dan Harga

Claude Sonnet 5 adalah model tingkat menengah terbaru Anthropic, dirilis pada 30 Juni 2026. Anthropic menyebutnya "kombinasi terbaik antara kecepatan dan kecerdasan" dan "model Sonnet paling agensi sejauh ini." Singkatnya: model ini mendekati Opus 4.8 dalam tugas-tugas agensi dan penggunaan alat, dengan biaya yang jauh lebih rendah. Panduan ini mencakup apa itu Sonnet 5, spesifikasi lengkapnya, tolok ukur peluncuran, harga, ketersediaan, dan siapa yang harus menggunakannya. Jika Anda berencana untuk memanggil model melalui HTTP, Anda dapat menguji permintaan tersebut di Apidog saat Anda melakukannya.

tombol

Setiap bagian di sini tertaut ke pembahasan mendalam yang terfokus, jadi anggap halaman ini sebagai peta dan ikuti tautannya saat Anda membutuhkan detail tentang API, harga, atau perbandingan langsung dengan Opus 4.8.

Apa itu Claude Sonnet 5

Claude Sonnet 5 adalah penerus Claude Sonnet 4.6. ID model API-nya adalah string persis claude-sonnet-5, tanpa sufiks tanggal. Model ini berada di tingkat Sonnet, yang diposisikan Anthropic di antara model Haiku yang lebih kecil dan model Opus serta Fable yang lebih besar.

Berita utamanya adalah tentang nilai. Dalam tugas-tugas di mana model menggunakan alat, berjalan dalam lingkaran, atau bertindak sebagai agen, Sonnet 5 hanya berjarak beberapa poin dari Opus 4.8. Dalam penalaran murni tanpa dukungan apa pun, Opus masih memimpin. Jadi Sonnet 5 adalah model yang Anda gunakan ketika Anda menginginkan kinerja agensi yang kuat tanpa membayar harga Opus.

Ini juga merupakan peningkatan langsung untuk Sonnet 4.6. Anda cukup mengubah ID model, lalu meninjau tiga perubahan perilaku dan satu perubahan tokenizer. Kami membahasnya di bawah dan dalam perbandingan khusus Sonnet 5 vs Sonnet 4.6.

Spesifikasi Lengkap

Berikut adalah apa yang Anda dapatkan dengan claude-sonnet-5:

Spesifikasi	Nilai
Jendela Konteks	1.000.000 token (1 Juta)
Output Maksimal	128.000 token (128 Ribu)
Pemikiran Adaptif	Aktif secara default
Parameter Usaha	rendah / sedang / tinggi / sangat tinggi
Visi, cache prompt, penggunaan alat, batch, output terstruktur	Didukung
Tingkat Prioritas	Tidak tersedia
Retensi data nol (ZDR)	Didukung untuk organisasi dengan perjanjian ZDR

Beberapa catatan mengenai hal ini:

Jendela konteks 1 Juta adalah nilai default dan maksimum. Tidak ada varian konteks yang lebih kecil untuk dipilih.
Pemikiran adaptif aktif secara default. Ini adalah perubahan dari Sonnet 4.6, di mana tidak mengirimkan bidang thinking berarti tidak ada pemikiran yang terjadi sama sekali.
Parameter usaha mengontrol seberapa banyak model berpikir dan bekerja. Anda mengaturnya ke low, medium, high, atau xhigh tergantung pada seberapa keras Anda ingin model bekerja.
Set fitur cocok dengan Sonnet 4.6, dengan satu pengecualian: Tingkat Prioritas tidak tersedia di Sonnet 5.

Untuk bentuk permintaan dan respons lengkap, lihat panduan API langkah demi langkah dan gambaran umum model Anthropic.

Tiga Perubahan Perilaku dan Tokenizer Baru

Jika Anda beralih dari Sonnet 4.6, tiga hal berubah pada tingkat API. Abaikan hal tersebut dan permintaan Anda dapat mengembalikan kesalahan 400 atau berperilaku berbeda dari sebelumnya.

Pemikiran adaptif aktif secara default. Permintaan tanpa bidang thinking sekarang berjalan dengan pemikiran adaptif. Untuk mematikannya, kirim thinking: {type: "disabled"}. Karena max_tokens membatasi total output (token pemikiran ditambah teks respons), tinjau kembali max_tokens untuk beban kerja yang sebelumnya berjalan tanpa pemikiran.
Pemikiran diperpanjang manual dihapus. Mengirim thinking: {type: "enabled", budget_tokens: N} sekarang mengembalikan kesalahan 400. Gunakan pemikiran adaptif dan parameter usaha sebagai gantinya.
Parameter sampling tidak diterima. Mengatur temperature, top_p, atau top_k ke nilai non-default akan mengembalikan kesalahan 400. Hapus parameter tersebut saat Anda bermigrasi. Atur perilaku melalui instruksi prompt sistem sebagai gantinya.

Pengisian awal pesan asisten masih tidak didukung dan mengembalikan 400, sama seperti pada Sonnet 4.6. Gunakan output terstruktur atau instruksi prompt sistem untuk membentuk respons.

Ada satu perubahan lagi yang mudah terlewat karena tidak menyentuh bentuk API. Sonnet 5 menggunakan tokenizer baru. Teks input yang sama menghasilkan sekitar 30% lebih banyak token daripada Sonnet 4.6, sekitar 1,3 kali lipat. Tidak ada yang berubah pada permintaan, respons, atau kode streaming Anda. Tetapi apa pun yang Anda ukur atau anggarkan dalam token akan bergeser:

Bidang usage dan hasil penghitungan token lebih tinggi untuk teks yang sama. Hitung ulang terhadap Sonnet 5 alih-alih menggunakan kembali angka 4.6 Anda.
Jendela 1 Juta menampung lebih sedikit teks rata-rata, karena setiap token sekarang mencakup lebih sedikit teks.
Anggaran max_tokens yang berukuran mendekati output yang Anda harapkan mungkin sekarang terpotong. Tinjau kembali anggaran tersebut.
Biaya per permintaan untuk teks yang setara dapat meningkat meskipun harga per token tidak berubah.

Halaman apa yang baru mendokumentasikan setiap hal ini, dan dokumen penghitungan token menunjukkan cara mengukurnya.

Cuplikan Tolok Ukur

Angka-angka di bawah ini adalah angka yang dilaporkan Anthropic sejak peluncuran. Angka-angka tersebut dikuatkan di seluruh tulisan hari peluncuran, jadi anggaplah angka-angka ini sebagai hasil yang dilaporkan daripada pengujian independen.

Tolok Ukur	Sonnet 5	Opus 4.8	Sonnet 4.6
SWE-bench Pro (pengkodean agensi)	63,2%	69,2%	58,1%
Terminal-Bench 2.1	80,4%	82,7%	Tidak dilaporkan
OSWorld-Verified (penggunaan komputer)	81,2%	83,4%	78,5%

Polanya konsisten. Dengan alat dalam lingkaran, Sonnet 5 berada dalam jarak sekitar 1 hingga 3 poin dari Opus 4.8. Dalam penalaran murni tanpa dukungan apa pun, Opus memimpin sekitar 6 poin. Sonnet 5 lebih kuat dalam tugas agensi dan alat daripada penalaran murni.

Dibandingkan dengan pendahulunya, Sonnet 5 meningkat dengan jelas: SWE-bench Pro naik dari 58,1% menjadi 63,2%, dan OSWorld-Verified naik dari 78,5% menjadi 81,2%.

Perincian lengkap, termasuk apa yang tidak tercakup oleh tolok ukur ini, ada di pembahasan mendalam tolok ukur Sonnet 5. Anda juga dapat memeriksa pusat transparansi Anthropic untuk angka-angka dasarnya.

Harga

Sonnet 5 mempertahankan tarif per token yang sama dengan Sonnet 4.6, dan diluncurkan dengan diskon perkenalan.

Harga	Input (per Juta token)	Output (per Juta token)
Perkenalan (hingga 31 Agustus 2026)	$2	$10
Standar (mulai 1 September 2026)	$3	$15

Tarif perkenalan $2 per juta input dan $10 per juta output berlaku hingga 31 Agustus 2026. Setelah itu, tarif akan beralih ke tarif standar $3 per juta input dan $15 per juta output, yang sesuai dengan Sonnet 4.6.

Ada satu hal yang patut direncanakan. Karena tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, biaya permintaan yang setara bisa lebih tinggi daripada Sonnet 4.6 meskipun tarif per token identik. Jangan berasumsi kesetaraan datar. Model beban kerja nyata Anda dengan penghitungan token sebelum Anda mengalokasikan anggaran.

Sebagai konteks, Opus 4.8 berharga $5 per juta input dan $25 per juta output, dan Fable 5 berharga $10 per juta input dan $50 per juta output. Sonnet 5 berada jauh di bawah keduanya. Untuk tarif batch dan prompt-caching, periksa halaman harga Anthropic daripada angka yang dikutip dari pihak kedua. Perincian harga lengkap menyajikan contoh yang telah dikerjakan.

Ketersediaan

Sonnet 5 tersedia di seluruh produk Anthropic sendiri dan platform cloud utama:

Claude API: tersedia untuk semua pelanggan.
Aplikasi Claude: model default untuk Gratis dan Pro, dan juga tersedia untuk Max, Team, dan Enterprise.
Claude Code: tersedia.
AWS: melalui Claude di Amazon Bedrock dan Claude Platform di AWS. Bukan di jalur Bedrock InvokeModel atau Converse lama.
Google Cloud: tersedia di Vertex AI.
Microsoft Foundry: dalam pratinjau.

Karena Sonnet 5 adalah default pada paket Claude gratis, kebanyakan orang dapat mencobanya tanpa membayar apa pun. Panduan akses gratis mencakup jalur gratis yang jujur dan batasannya.

Ringkasan Keamanan

Kartu sistem Anthropic melaporkan tingkat perilaku yang tidak diinginkan secara keseluruhan lebih rendah daripada Sonnet 4.6, dan model ini lebih aman dalam konteks agensi. Ini menunjukkan halusinasi dan penjilat yang lebih rendah daripada Sonnet 4.6, dan lebih baik dalam menolak permintaan berbahaya dan menahan injeksi prompt.

Sonnet 5 juga merupakan model tingkat Sonnet pertama dengan perlindungan keamanan siber waktu nyata. Permintaan yang menyentuh topik siber terlarang atau berisiko tinggi dapat ditolak. Penolakan kembali sebagai HTTP 200 yang berhasil dengan stop_reason: "refusal", bukan kesalahan, jadi tangani alasan berhenti itu dalam kode Anda.

Untuk berlaku adil tentang pertimbangan: Sonnet 5 menunjukkan tingkat perilaku yang tidak selaras lebih tinggi daripada Opus 4.8 dan Mythos Preview pada audit perilaku otomatis Anthropic, dan memiliki kemampuan siber yang lebih rendah daripada model Opus. Tidak ada model Sonnet yang dapat mengembangkan eksploitasi yang berfungsi, mencetak 0,0% pada ukuran tersebut.

Uji API Sonnet 5 dengan Apidog

Ketika Anda memanggil Sonnet 5, Anda memukul API HTTP dengan header otentikasi, permintaan JSON dan badan respons, batas laju, dan kesalahan. Itulah jenis hal yang Apidog dibangun untuk ditangani. Apidog adalah platform pengembangan dan pengujian API all-in-one, sehingga Anda dapat mengirim permintaan Sonnet 5, menyimpannya sebagai koleksi yang dapat digunakan kembali, dan mengelola kunci Anda per lingkungan.

Pengaturan praktis terlihat seperti ini:

Buat permintaan ke endpoint Pesan Anthropic dan simpan kunci API Anda sebagai variabel lingkungan, bukan di badan permintaan.
Simpan permintaan dalam koleksi agar tim Anda dapat menggunakannya kembali.
Tambahkan pernyataan untuk memeriksa bentuk respons, misalnya bahwa stop_reason ada sehingga hasil refusal tidak terlewatkan.
Mock endpoint ketika Anda ingin membangun terhadap respons yang stabil tanpa menghabiskan token.

Berikut adalah bentuk API Pesan yang akan Anda kirim:

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in one sentence."}
    ]
  }'

Karena pemikiran adaptif aktif secara default, permintaan itu berjalan dengan pemikiran kecuali Anda menambahkan thinking: {type: "disabled"}. Ingat bahwa max_tokens membatasi pemikiran ditambah teks respons secara bersamaan, jadi berikan ruang yang cukup. Setelah permintaan Anda berfungsi, simpan dan tambahkan pengujian sehingga Anda menangkap regresi saat Anda menukar model nanti. Jika Anda ingin mengikuti, Unduh Apidog dan impor permintaannya. Panduan API lengkap memiliki alur lengkap, termasuk versi Python SDK.

Untuk Siapa Sonnet 5?

Sonnet 5 adalah pilihan default yang baik dalam banyak situasi:

Anda membangun agen atau alur kerja yang banyak menggunakan alat. Di sinilah Sonnet 5 bersinar dan tetap dekat dengan Opus 4.8.
Anda menjalankan volume tinggi dan peduli terhadap biaya. Kesenjangan harga dibandingkan Opus sangat besar, dan tarif perkenalan membuatnya semakin besar hingga Agustus.
Anda ingin peningkatan langsung dari Sonnet 4.6. Tukar ID model, tinjau tiga perubahan perilaku, dan ukur ulang token Anda.
Anda melakukan coding di Claude Code atau editor. Sonnet 5 adalah default coding agensi yang kuat. Lihat cara menggunakannya di Claude Code.

Pilihlah Opus 4.8 sebagai gantinya ketika Anda membutuhkan penalaran murni yang paling sulit, otonomi jangka panjang, atau kualitas tertinggi absolut dan biaya tambahan sepadan. Perbandingan Sonnet 5 vs Opus 4.8 menjabarkan keputusan itu secara detail. Untuk latar belakang tentang tingkat Opus itu sendiri, lihat apa itu Claude Opus 4.8.

FAQ

Apakah Claude Sonnet 5 lebih baik daripada Opus 4.8? Tergantung pada tugasnya. Pada tolok ukur agensi dan penggunaan alat, Sonnet 5 berada dalam jarak sekitar 1 hingga 3 poin dari Opus 4.8 dengan harga yang jauh lebih rendah. Pada penalaran murni, Opus 4.8 memimpin sekitar 6 poin. Pilih Sonnet 5 untuk agen dan volume tinggi, dan Opus 4.8 untuk penalaran tersulit. Perbandingan langsung menjelaskannya.

Apa ID model untuk Claude Sonnet 5? ID model API adalah claude-sonnet-5, tanpa sufiks tanggal. Atur string itu sebagai nilai model dalam permintaan Anda.

Berapa biaya Claude Sonnet 5? Tarif perkenalan adalah $2 per juta token input dan $10 per juta token output hingga 31 Agustus 2026. Setelah itu, tarif akan beralih ke standar $3 per juta input dan $15 per juta output. Perhatikan bahwa tokenizer baru menghasilkan sekitar 30% lebih banyak token untuk teks yang sama, sehingga permintaan yang setara dapat berharga lebih mahal bahkan dengan tarif per token yang sama.

Bisakah saya menggunakan Claude Sonnet 5 secara gratis? Ya. Sonnet 5 adalah model default pada paket gratis Claude di claude.ai dan di tingkat gratis Claude Code, tunduk pada batas penggunaan. Lihat panduan akses gratis untuk jalur yang jujur dan batasannya.

Apakah saya perlu mengubah kode saya untuk meng-upgrade dari Sonnet 4.6? Sebagian besar Anda hanya mengubah ID model. Kemudian tinjau tiga hal: pemikiran adaptif sekarang aktif secara default jadi tinjau kembali max_tokens, bidang pemikiran diperpanjang budget_tokens sekarang mengembalikan 400, dan parameter sampling non-default sekarang mengembalikan 400. Ukur ulang jumlah token Anda karena tokenizer baru.

tombol