TL;DR
Claude Sonnet 4.6, milyon girdi tokenı başına 3 dolar ve milyon çıktı tokenı başına 15 dolar maliyetle Sonnet 4.5 ile aynı fiyata sahipken, Opus'a yakın performans sunar. Anında önbellekleme ile önbellek okumaları 0,30$/MTok'a düşer (%90 tasarruf). Toplu API, maliyetleri yarıya indirerek MTok başına 1,50$/7,50$ yapar. 1M token bağlam penceresi (beta), 200K token üzerindeki istekler için MTok başına 6$/22,50$ uzun bağlam fiyatlandırmasını tetikler.
Claude Sonnet 4.6 Temel Fiyatlandırması
Claude Sonnet 4.6, önceki sürümüyle aynı fiyat noktasını korurken, anlamlı derecede daha iyi sonuçlar sunar. İşte temel fiyatlandırmaya hızlı bir bakış:
| Fiyatlandırma Katmanı | Girdi Tokenları | Çıktı Tokenları |
|---|---|---|
| Standart | 3,00$ / MTok | 15,00$ / MTok |
| Toplu API | 1,50$ / MTok | 7,50$ / MTok |
| Önbellek yazmaları (5 dakika) | 3,75$ / MTok | — |
| Önbellek yazmaları (1 saat) | 6,00$ / MTok | — |
| Önbellek okumaları | 0,30$ / MTok | — |
| Uzun bağlam >200K (standart) | 6,00$ / MTok | 22,50$ / MTok |
| Uzun bağlam >200K (toplu) | 3,00$ / MTok | 11,25$ / MTok |
MTok = milyon token. Tüm fiyatlar USD cinsindendir.
Buradaki değer hikayesini görmezden gelmek zor. İlk test edenler, başa baş karşılaştırmaların %59'unda Sonnet 4.6'yı önceki premium model Opus 4.5'e tercih etti; maliyetin %60'ı karşılığında.

Çoğu kodlama, analiz ve ajans görevleri için, Opus seviyesinde sonuçlar almak amacıyla artık Opus fiyatlarını ödemenize gerek yok.
Özelliğe Göre Tam Fiyatlandırma Detayı
Standart API Fiyatlandırması
Anthropic API aracılığıyla yapılan tüm senkron API çağrıları için standart oranlar geçerlidir:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Bu belgeyi özetle."}]
)
# Tam token kullanımını kontrol edin
print(f"Girdi tokenları: {response.usage.input_tokens}")
print(f"Çıktı tokenları: {response.usage.output_tokens}")
# Maliyeti hesaplayın
input_cost = response.usage.input_tokens / 1_000_000 * 3.00
output_cost = response.usage.output_tokens / 1_000_000 * 15.00
print(f"İstek maliyeti: ${input_cost + output_cost:.6f}")
500-token girdi ve 300-token çıktı ile tipik bir API çağrısı için maliyet yaklaşık 0,0060$'dır. Bu, standart oranlarda istek başına bir sentten daha azdır.
Anında Önbellekleme Fiyatlandırması
Anında önbellekleme, Sonnet 4.6'nın en etkili maliyet kaldıraçlarından biridir. İsteğinizin bazı kısımlarını sunucu tarafında depolar ve önbellek isabetlerinde önemli ölçüde daha az ücret alır.
Önbellek yazma oranları:- 5 dakikalık önbellek: 3,75$/MTok (1,25× temel girdi fiyatı) - 1 saatlik önbellek: 6,00$/MTok (2× temel girdi fiyatı)
Önbellek okuma oranı:- 0,30$/MTok — standart girdi fiyatının onda biri
Sistem isteğiniz 10.000 token ise ve günde 1.000 istek işliyorsanız: - Önbellekleme olmadan: 10.000 × 1.000 × 3$/MTok = 30$/gün- Önbellekleme ile (bir kez yaz, 999 kez oku): 3,75$ + (999 × 0,30) × 10.000/MTok ≈ 3,04$/gün
Bu, yalnızca statik bir sistem isteği için %90 azalma demektir.
import anthropic
client = anthropic.Anthropic()
# Önbelleğe alınacak pahalı statik içeriği işaretleyin
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "Siz Python, FastAPI ve dağıtılmış sistemlerde uzmanlaşmış kıdemli bir kod inceleyicisiniz. İşte kodlama standartlarımız ve inceleme yönergelerimiz: [büyük blok standart metni]...",
"cache_control": {"type": "ephemeral"} # Bu bloğu önbelleğe al
}
],
messages=[{"role": "user", "content": "Bu çekme isteğini inceleyin: [PR içeriği]"}]
)
# Önbellekten ne geldiğini ve yeni tokenları kontrol edin
usage = response.usage
print(f"Önbellek yazma tokenları: {usage.cache_creation_input_tokens}")
print(f"Önbellek okuma tokenları: {usage.cache_read_input_tokens}")
print(f"Önbelleğe alınmamış tokenlar: {usage.input_tokens}")
Hangi önbellek süresini ne zaman kullanmalı:- 5 dakikalık önbellek: Yüksek frekanslı çağrılar, ani trafik artışları, kısa konuşma pencereleri - 1 saatlik önbellek: Arka plan işleme boru hatları, daha uzun boşluklara sahip toplu işler, ajan döngüleri
Toplu API Fiyatlandırması
Toplu API, asenkron işleme karşılığında (sonuçlar 24 saat içinde, genellikle çok daha erken) hem girdi hem de çıktı tokenlarında %50 indirim sunar.
| Standart | Toplu API | |
|---|---|---|
| Girdi | 3,00$/MTok | 1,50$/MTok |
| Çıktı | 15,00$/MTok | 7,50$/MTok |
Toplu API için en iyi kullanım durumları:- İçerik denetimi boru hatları - Ölçekli belge sınıflandırması - Gecelik veri zenginleştirme - Büyük veri kümeleri için gömme veya özet oluşturma - Gecikmenin önemli olmadığı etkileşimsiz her türlü işleme
1,50$/7,50$/MTok ile, her biri 500 girdi tokenı ve 100 çıktı tokenı olan bir milyon belgeyi işlemek şunları maliyetlendirir: - Girdi: 500M token × 1,50$/MTok = 750$- Çıktı: 100M token × 7,50$/MTok = 750$- Toplam: 1 milyon belge için 1.500$ (belge başına ~0,0015$)
Toplu API: Gerçek Zamanlı Olmayan İş Yükleri İçin %50 İndirim
Toplu işleme basittir: istekleri gönderin, sonuçları yarı fiyatına asenkron olarak alın. Değiş tokuş gecikmedir - sonuçlar 24 saat içinde gelir, ancak genellikle çok daha hızlıdır.
import anthropic, time
client = anthropic.Anthropic()
def batch_classify(texts: list[str]) -> list[str]:
"""Metin listesini Toplu API oranlarında sınıflandırın."""
# Toplu işi gönder
requests = [
{
"custom_id": f"item-{i}",
"params": {
"model": "claude-sonnet-4-6",
"max_tokens": 20,
"messages": [{
"role": "user",
"content": f"POZİTİF, NEGATİF veya NÖTR olarak sınıflandırın. Sadece tek kelimeyle yanıtlayın.\n\n{text}"
}]
}
}
for i, text in enumerate(texts)
]
batch = client.messages.batches.create(requests=requests)
# Tamamlanana kadar yokla
while True:
status = client.messages.batches.retrieve(batch.id)
if status.processing_status == "ended":
break
time.sleep(60)
# Sonuçları sırayla topla
results = {}
for result in client.messages.batches.results(batch.id):
if result.result.type == "succeeded":
results[result.custom_id] = result.result.message.content[0].text.strip()
return [results.get(f"item-{i}", "HATA") for i in range(len(texts))]
Uzun Bağlam (1M Token) Fiyatlandırması
context-1m-2025-08-07 beta başlığı aracılığıyla 1M token bağlam penceresini etkinleştirdiğinizde, 200K girdi tokenını aşan istekler daha yüksek bir oranda ücretlendirilir.
Uzun Bağlam Oran Tablosu
| Girdi Tokenları | Girdi Fiyatı | Çıktı Fiyatı |
|---|---|---|
| ≤ 200K | 3,00$/MTok | 15,00$/MTok |
| > 200K | 6,00$/MTok | 22,50$/MTok |
200K eşiği, toplam girdi tokenlarına dayanır ve şunları içerir: - input_tokens (standart girdi) - cache_creation_input_tokens (anında önbellekleme kullanılıyorsa) - cache_read_input_tokens (anında önbellekleme kullanılıyorsa)
Toplam 200K'yı aşarsa, o istekteki tüm tokenlar daha yüksek oranda ücretlendirilir.
Uzun Bağlam + Toplu API
Toplu API'nin %50 indirimi, uzun bağlam fiyatlandırmasıyla birleşir:
| Senaryo | Girdi Oranı | Çıktı Oranı |
|---|---|---|
| Standart | 3,00$/MTok | 15,00$/MTok |
| Uzun bağlam (>200K) | 6,00$/MTok | 22,50$/MTok |
| Toplu API | 1,50$/MTok | 7,50$/MTok |
| Uzun bağlam + Toplu | 3,00$/MTok | 11,25$/MTok |
Toplu API aracılığıyla büyük belgeleri toplu olarak işlemek, uzun bağlam maliyetlerini yönetilebilir tutar.
Araç ve Özellik Fiyatlandırması
Bazı araçlar, token maliyetlerinin ötesinde ayrı ücretler taşır.
Web Arama Aracı
1.000 arama başına 10,00$
+ arama tarafından oluşturulan içerik için standart token maliyetleri
Her web arama çağrısı, kaç sonuç döndürüldüğüne bakılmaksızın bir kullanım olarak sayılır. Arama hata verirse ücret alınmaz.
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
betas=["code-execution-web-tools-2026-02-09"],
tools=[{"type": "web_search_20260209", "name": "web_search"}],
messages=[{"role": "user", "content": "Bu haftanın en son LLM kıyaslama haberleri nelerdir?"}]
)
usage = response.usage
search_count = getattr(usage, 'server_tool_use', {})
print(f"Kullanılan web aramaları: {search_count.get('web_search_requests', 0)}")
# Her arama: 0,01$
Kod Yürütme Aracı
Web araması veya web getirme ile birlikte kullanıldığında ücretsizdir (web_search_20260209 veya web_fetch_20260209 araç sürümleri kullanılarak).
Bağımsız kullanıldığında: - Ayda kuruluş başına 1.550 ücretsiz saat - Ücretsiz katmanın ötesinde konteyner başına saatte 0,05$ - Minimum faturalandırma birimi: 5 dakika
Çoğu geliştirme ve test iş yükü için ücretsiz katman fazlasıyla yeterlidir.
Web Getirme Aracı
Ek ücret yok. Sadece konuşmaya giren içerik için standart token maliyetlerini ödersiniz.
| Araç | Ek Maliyet | Notlar |
|---|---|---|
| Web araması | 10$/1K arama | Arama başına ücret |
| Web getirme | Ücretsiz | Yalnızca token maliyetleri |
| Kod yürütme (web araçlarıyla) | Ücretsiz | Birlikte sunulur |
| Kod yürütme (bağımsız) | 1.550 ücretsiz saat/ay sonrası saatte 0,05$ | Konteyner başına |
| Bilgisayar kullanımı ek yükü | ~735 ekstra girdi tokenı | Araç tanımı başına |
| Metin düzenleyici ek yükü | ~700 ekstra girdi tokenı | Araç tanımı başına |
Bilgisayar Kullanımı Ek Yükü
Bilgisayar kullanımı sabit token ek yükü ekler: - Sistem istemi eklemesi: 466–499 token - Araç tanımı tokenları: Araç başına 735 token (Claude 4.x modelleri)
Ekran görüntüleri ile birlikte, dönüş başına 200 token ve 100 dönüş içeren bir bilgisayar kullanım oturumu için: - Araç ek yükü: 735 token × 3$/MTok = 0,0022$ (ihmal edilebilir) - Ekran görüntüsü tokenları çözünürlüğe bağlıdır; ekran görüntüsü başına ~2.000–5.000 token planlayın
Claude Sonnet 4.6 Tüm Modellere Karşı: Tam Karşılaştırma
Güncel Model Fiyatlandırması
| Model | Girdi | Çıktı | Önbellek Oku | Toplu Girdi | Toplu Çıktı |
|---|---|---|---|---|---|
| Claude Sonnet 4.6 | 3,00$ | 15,00$ | 0,30$ | 1,50$ | 7,50$ |
| Claude Haiku 4.5 | 1,00$ | 5,00$ | 0,10$ | 0,50$ | 2,50$ |
| Claude Opus 4.6 | 5,00$ | 25,00$ | 0,50$ | 2,50$ | 12,50$ |
| Claude Opus 4.5 | 5,00$ | 25,00$ | 0,50$ | 2,50$ | 12,50$ |
| Claude Opus 4.1 | 15,00$ | 75,00$ | 1,50$ | 7,50$ | 37,50$ |
Tüm fiyatlar milyon token başına USD cinsindendir.
Sonnet 4.6 vs Opus 4.6: Değer Sorusu
| Claude Sonnet 4.6 | Claude Opus 4.6 | |
|---|---|---|
| Girdi fiyatı | 3$/MTok | 5$/MTok |
| Çıktı fiyatı | 15$/MTok | 25$/MTok |
| Göreceli maliyet | 1× | 1,67× |
| SWE-bench Onaylı | %79,6 | ~%80,8 |
| OSWorld (bilgisayar kullanımı) | %72,5 | %72,7 |
| Kullanıcı tercihi vs Sonnet 4.5 | %70 | U/D |
| Kullanıcı tercihi vs Opus 4.5 | %59 | U/D |
| 1M bağlam penceresi | Evet (beta) | Evet (beta) |
| Adaptif düşünme | Evet | Evet |
| Maksimum çıktı | 64K token | 128K token |
Görevlerin büyük çoğunluğu için - kodlama, analiz, belge işleme, ajans iş akışları - Sonnet 4.6, Opus performansını %60 daha ucuz fiyata sunar. Opus 4.6, 128K çıktı tokenına veya yeni akıl yürütme görevlerinde mutlak maksimuma ihtiyacınız olduğunda premium'a değerdir.
Sonnet 4.6 vs Haiku 4.5: Hangisini Ne Zaman Kullanmalı
| Kullanım Durumu | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|
| Karmaşık kod üretimi | ✅ | ⚠️ |
| Basit sınıflandırma | ⚠️ Fazla | ✅ |
| Belge özetleme | ✅ | ✅ |
| Çok adımlı ajans görevleri | ✅ | ❌ |
| Yüksek hacimli düşük karmaşıklık | ❌ Pahalı | ✅ |
| Araç çağırma / fonksiyon kullanımı | ✅ | ✅ |
| Uzun akıl yürütme zincirleri | ✅ | ❌ |
| Gecikmeye duyarlı uygulamalar | ✅ Hızlı | ✅ En Hızlı |
Akıllı desen: yönlendirme, sınıflandırma ve basit çıkarma için Haiku 4.5 kullanın; karmaşık görevleri Sonnet 4.6'ya yönlendirin. Bu hibrit yaklaşım, genellikle her şey için Sonnet 4.6'dan %60-80 daha az maliyetlidir.
Yayına Başlamadan Önce Apidog ile Maliyetleri Test Etme
Üretim ortamına dağıtmadan önce, her isteğin ne kadara mal olduğunu tam olarak bilmek istersiniz. Apidog'un görsel API istemcisi, Claude Sonnet 4.6 çağrılarını test etmenizi, usage nesnesi dahil tam yanıtı incelemenizi ve istek başına token sayılarını takip etmenizi sağlar.

Apidog'da Maliyet Görünürlüğünü Ayarlayın
https://api.anthropic.com/v1/messagesadresine yeni bir POST isteği oluşturun- Başlıkları ekleyin:
x-api-key,anthropic-version: 2023-06-01,Content-Type: application/json - Gövdeyi modeliniz ve mesajlarınızla ayarlayın
- İsteği çalıştırın — yanıtın
usagenesnesi tam token sayılarını gösterir
{
"usage": {
"input_tokens": 523,
"cache_creation_input_tokens": 5000,
"cache_read_input_tokens": 0,
"output_tokens": 312
}
}
Bu sayılardan gerçek maliyeti hesaplayın: - Girdi: 523 token × 3$/MTok = 0,00157$ - Önbellek yazma: 5.000 token × 3,75$/MTok = 0,01875$ - Çıktı: 312 token × 15$/MTok = 0,00468$ - Toplam ilk çağrı: 0,025$ (önbellek isabeti olan sonraki çağrılar: ~0,006$)
Bu istekleri Apidog'da bir koleksiyon olarak kaydedebilir, ekibinizle paylaşabilir ve üretim tasarımınızı sonlandırmadan önce farklı istem varyasyonları için maliyet tahminleri çalıştırabilirsiniz.
Geliştirmeye başlamaya hazır mısınız? Claude Sonnet 4.6 API çağrılarını görsel olarak test etmek, istek başına token kullanımını incelemek ve dağıtım yapmadan önce maliyetlerinizi doğru bir şekilde boyutlandırmak için Apidog'u ücretsiz indirin.
