Claude Sonnet 4.6 Fiyatı Ne Kadar?

TL;DR

Claude Sonnet 4.6, milyon girdi tokenı başına 3 dolar ve milyon çıktı tokenı başına 15 dolar maliyetle Sonnet 4.5 ile aynı fiyata sahipken, Opus'a yakın performans sunar. Anında önbellekleme ile önbellek okumaları 0,30$/MTok'a düşer (%90 tasarruf). Toplu API, maliyetleri yarıya indirerek MTok başına 1,50$/7,50$ yapar. 1M token bağlam penceresi (beta), 200K token üzerindeki istekler için MTok başına 6$/22,50$ uzun bağlam fiyatlandırmasını tetikler.

Claude Sonnet 4.6 Temel Fiyatlandırması

Claude Sonnet 4.6, önceki sürümüyle aynı fiyat noktasını korurken, anlamlı derecede daha iyi sonuçlar sunar. İşte temel fiyatlandırmaya hızlı bir bakış:

Fiyatlandırma Katmanı	Girdi Tokenları	Çıktı Tokenları
Standart	3,00$ / MTok	15,00$ / MTok
Toplu API	1,50$ / MTok	7,50$ / MTok
Önbellek yazmaları (5 dakika)	3,75$ / MTok	—
Önbellek yazmaları (1 saat)	6,00$ / MTok	—
Önbellek okumaları	0,30$ / MTok	—
Uzun bağlam >200K (standart)	6,00$ / MTok	22,50$ / MTok
Uzun bağlam >200K (toplu)	3,00$ / MTok	11,25$ / MTok

MTok = milyon token. Tüm fiyatlar USD cinsindendir.

Buradaki değer hikayesini görmezden gelmek zor. İlk test edenler, başa baş karşılaştırmaların %59'unda Sonnet 4.6'yı önceki premium model Opus 4.5'e tercih etti; maliyetin %60'ı karşılığında.

Çoğu kodlama, analiz ve ajans görevleri için, Opus seviyesinde sonuçlar almak amacıyla artık Opus fiyatlarını ödemenize gerek yok.

💡

Üretim kodu yazmadan önce bu istekleri test etmek, büyük ölçekte para tasarrufu sağlar. Claude Sonnet 4.6'ya deneme API çağrıları yapmak, istek başına gerçek token kullanımını incelemek ve taahhütte bulunmadan önce bütçenizi doğru bir şekilde boyutlandırmak için Apidog'u indirin.

Düğme

Özelliğe Göre Tam Fiyatlandırma Detayı

Standart API Fiyatlandırması

Anthropic API aracılığıyla yapılan tüm senkron API çağrıları için standart oranlar geçerlidir:

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Bu belgeyi özetle."}]
)

# Tam token kullanımını kontrol edin
print(f"Girdi tokenları: {response.usage.input_tokens}")
print(f"Çıktı tokenları: {response.usage.output_tokens}")

# Maliyeti hesaplayın
input_cost  = response.usage.input_tokens  / 1_000_000 * 3.00
output_cost = response.usage.output_tokens / 1_000_000 * 15.00
print(f"İstek maliyeti: ${input_cost + output_cost:.6f}")

500-token girdi ve 300-token çıktı ile tipik bir API çağrısı için maliyet yaklaşık 0,0060$'dır. Bu, standart oranlarda istek başına bir sentten daha azdır.

Anında Önbellekleme Fiyatlandırması

Anında önbellekleme, Sonnet 4.6'nın en etkili maliyet kaldıraçlarından biridir. İsteğinizin bazı kısımlarını sunucu tarafında depolar ve önbellek isabetlerinde önemli ölçüde daha az ücret alır.

Önbellek yazma oranları:- 5 dakikalık önbellek: 3,75$/MTok (1,25× temel girdi fiyatı) - 1 saatlik önbellek: 6,00$/MTok (2× temel girdi fiyatı)

Önbellek okuma oranı:- 0,30$/MTok — standart girdi fiyatının onda biri

Sistem isteğiniz 10.000 token ise ve günde 1.000 istek işliyorsanız: - Önbellekleme olmadan: 10.000 × 1.000 × 3$/MTok = 30$/gün- Önbellekleme ile (bir kez yaz, 999 kez oku): 3,75$ + (999 × 0,30) × 10.000/MTok ≈ 3,04$/gün

Bu, yalnızca statik bir sistem isteği için %90 azalma demektir.

import anthropic

client = anthropic.Anthropic()

# Önbelleğe alınacak pahalı statik içeriği işaretleyin
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Siz Python, FastAPI ve dağıtılmış sistemlerde uzmanlaşmış kıdemli bir kod inceleyicisiniz. İşte kodlama standartlarımız ve inceleme yönergelerimiz: [büyük blok standart metni]...",
            "cache_control": {"type": "ephemeral"}  # Bu bloğu önbelleğe al
        }
    ],
    messages=[{"role": "user", "content": "Bu çekme isteğini inceleyin: [PR içeriği]"}]
)

# Önbellekten ne geldiğini ve yeni tokenları kontrol edin
usage = response.usage
print(f"Önbellek yazma tokenları: {usage.cache_creation_input_tokens}")
print(f"Önbellek okuma tokenları:  {usage.cache_read_input_tokens}")
print(f"Önbelleğe alınmamış tokenlar:    {usage.input_tokens}")

Hangi önbellek süresini ne zaman kullanmalı:- 5 dakikalık önbellek: Yüksek frekanslı çağrılar, ani trafik artışları, kısa konuşma pencereleri - 1 saatlik önbellek: Arka plan işleme boru hatları, daha uzun boşluklara sahip toplu işler, ajan döngüleri

Toplu API Fiyatlandırması

Toplu API, asenkron işleme karşılığında (sonuçlar 24 saat içinde, genellikle çok daha erken) hem girdi hem de çıktı tokenlarında %50 indirim sunar.

	Standart	Toplu API
Girdi	3,00$/MTok	1,50$/MTok
Çıktı	15,00$/MTok	7,50$/MTok

Toplu API için en iyi kullanım durumları:- İçerik denetimi boru hatları - Ölçekli belge sınıflandırması - Gecelik veri zenginleştirme - Büyük veri kümeleri için gömme veya özet oluşturma - Gecikmenin önemli olmadığı etkileşimsiz her türlü işleme

1,50$/7,50$/MTok ile, her biri 500 girdi tokenı ve 100 çıktı tokenı olan bir milyon belgeyi işlemek şunları maliyetlendirir: - Girdi: 500M token × 1,50$/MTok = 750$- Çıktı: 100M token × 7,50$/MTok = 750$- Toplam: 1 milyon belge için 1.500$ (belge başına ~0,0015$)

Toplu API: Gerçek Zamanlı Olmayan İş Yükleri İçin %50 İndirim

Toplu işleme basittir: istekleri gönderin, sonuçları yarı fiyatına asenkron olarak alın. Değiş tokuş gecikmedir - sonuçlar 24 saat içinde gelir, ancak genellikle çok daha hızlıdır.

import anthropic, time

client = anthropic.Anthropic()

def batch_classify(texts: list[str]) -> list[str]:
    """Metin listesini Toplu API oranlarında sınıflandırın."""

    # Toplu işi gönder
    requests = [
        {
            "custom_id": f"item-{i}",
            "params": {
                "model": "claude-sonnet-4-6",
                "max_tokens": 20,
                "messages": [{
                    "role": "user",
                    "content": f"POZİTİF, NEGATİF veya NÖTR olarak sınıflandırın. Sadece tek kelimeyle yanıtlayın.\n\n{text}"
                }]
            }
        }
        for i, text in enumerate(texts)
    ]

    batch = client.messages.batches.create(requests=requests)

    # Tamamlanana kadar yokla
    while True:
        status = client.messages.batches.retrieve(batch.id)
        if status.processing_status == "ended":
            break
        time.sleep(60)

    # Sonuçları sırayla topla
    results = {}
    for result in client.messages.batches.results(batch.id):
        if result.result.type == "succeeded":
            results[result.custom_id] = result.result.message.content[0].text.strip()

    return [results.get(f"item-{i}", "HATA") for i in range(len(texts))]

Uzun Bağlam (1M Token) Fiyatlandırması

context-1m-2025-08-07 beta başlığı aracılığıyla 1M token bağlam penceresini etkinleştirdiğinizde, 200K girdi tokenını aşan istekler daha yüksek bir oranda ücretlendirilir.

Uzun Bağlam Oran Tablosu

Girdi Tokenları	Girdi Fiyatı	Çıktı Fiyatı
≤ 200K	3,00$/MTok	15,00$/MTok
> 200K	6,00$/MTok	22,50$/MTok

200K eşiği, toplam girdi tokenlarına dayanır ve şunları içerir: - input_tokens (standart girdi) - cache_creation_input_tokens (anında önbellekleme kullanılıyorsa) - cache_read_input_tokens (anında önbellekleme kullanılıyorsa)

Toplam 200K'yı aşarsa, o istekteki tüm tokenlar daha yüksek oranda ücretlendirilir.

Uzun Bağlam + Toplu API

Toplu API'nin %50 indirimi, uzun bağlam fiyatlandırmasıyla birleşir:

Senaryo	Girdi Oranı	Çıktı Oranı
Standart	3,00$/MTok	15,00$/MTok
Uzun bağlam (>200K)	6,00$/MTok	22,50$/MTok
Toplu API	1,50$/MTok	7,50$/MTok
Uzun bağlam + Toplu	3,00$/MTok	11,25$/MTok

Toplu API aracılığıyla büyük belgeleri toplu olarak işlemek, uzun bağlam maliyetlerini yönetilebilir tutar.

Araç ve Özellik Fiyatlandırması

Bazı araçlar, token maliyetlerinin ötesinde ayrı ücretler taşır.

Web Arama Aracı

1.000 arama başına 10,00$
+ arama tarafından oluşturulan içerik için standart token maliyetleri

Her web arama çağrısı, kaç sonuç döndürüldüğüne bakılmaksızın bir kullanım olarak sayılır. Arama hata verirse ücret alınmaz.

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    betas=["code-execution-web-tools-2026-02-09"],
    tools=[{"type": "web_search_20260209", "name": "web_search"}],
    messages=[{"role": "user", "content": "Bu haftanın en son LLM kıyaslama haberleri nelerdir?"}]
)

usage = response.usage
search_count = getattr(usage, 'server_tool_use', {})
print(f"Kullanılan web aramaları: {search_count.get('web_search_requests', 0)}")
# Her arama: 0,01$

Kod Yürütme Aracı

Web araması veya web getirme ile birlikte kullanıldığında ücretsizdir (web_search_20260209 veya web_fetch_20260209 araç sürümleri kullanılarak).

Bağımsız kullanıldığında: - Ayda kuruluş başına 1.550 ücretsiz saat - Ücretsiz katmanın ötesinde konteyner başına saatte 0,05$ - Minimum faturalandırma birimi: 5 dakika

Çoğu geliştirme ve test iş yükü için ücretsiz katman fazlasıyla yeterlidir.

Web Getirme Aracı

Ek ücret yok. Sadece konuşmaya giren içerik için standart token maliyetlerini ödersiniz.

Araç	Ek Maliyet	Notlar
Web araması	10$/1K arama	Arama başına ücret
Web getirme	Ücretsiz	Yalnızca token maliyetleri
Kod yürütme (web araçlarıyla)	Ücretsiz	Birlikte sunulur
Kod yürütme (bağımsız)	1.550 ücretsiz saat/ay sonrası saatte 0,05$	Konteyner başına
Bilgisayar kullanımı ek yükü	~735 ekstra girdi tokenı	Araç tanımı başına
Metin düzenleyici ek yükü	~700 ekstra girdi tokenı	Araç tanımı başına

Bilgisayar Kullanımı Ek Yükü

Bilgisayar kullanımı sabit token ek yükü ekler: - Sistem istemi eklemesi: 466–499 token - Araç tanımı tokenları: Araç başına 735 token (Claude 4.x modelleri)

Ekran görüntüleri ile birlikte, dönüş başına 200 token ve 100 dönüş içeren bir bilgisayar kullanım oturumu için: - Araç ek yükü: 735 token × 3$/MTok = 0,0022$ (ihmal edilebilir) - Ekran görüntüsü tokenları çözünürlüğe bağlıdır; ekran görüntüsü başına ~2.000–5.000 token planlayın

Claude Sonnet 4.6 Tüm Modellere Karşı: Tam Karşılaştırma

Güncel Model Fiyatlandırması

Model	Girdi	Çıktı	Önbellek Oku	Toplu Girdi	Toplu Çıktı
Claude Sonnet 4.6	3,00$	15,00$	0,30$	1,50$	7,50$
Claude Haiku 4.5	1,00$	5,00$	0,10$	0,50$	2,50$
Claude Opus 4.6	5,00$	25,00$	0,50$	2,50$	12,50$
Claude Opus 4.5	5,00$	25,00$	0,50$	2,50$	12,50$
Claude Opus 4.1	15,00$	75,00$	1,50$	7,50$	37,50$

Tüm fiyatlar milyon token başına USD cinsindendir.

Sonnet 4.6 vs Opus 4.6: Değer Sorusu

	Claude Sonnet 4.6	Claude Opus 4.6
Girdi fiyatı	3$/MTok	5$/MTok
Çıktı fiyatı	15$/MTok	25$/MTok
Göreceli maliyet	1×	1,67×
SWE-bench Onaylı	%79,6	~%80,8
OSWorld (bilgisayar kullanımı)	%72,5	%72,7
Kullanıcı tercihi vs Sonnet 4.5	%70	U/D
Kullanıcı tercihi vs Opus 4.5	%59	U/D
1M bağlam penceresi	Evet (beta)	Evet (beta)
Adaptif düşünme	Evet	Evet
Maksimum çıktı	64K token	128K token

Görevlerin büyük çoğunluğu için - kodlama, analiz, belge işleme, ajans iş akışları - Sonnet 4.6, Opus performansını %60 daha ucuz fiyata sunar. Opus 4.6, 128K çıktı tokenına veya yeni akıl yürütme görevlerinde mutlak maksimuma ihtiyacınız olduğunda premium'a değerdir.

Sonnet 4.6 vs Haiku 4.5: Hangisini Ne Zaman Kullanmalı

Kullanım Durumu	Sonnet 4.6	Haiku 4.5
Karmaşık kod üretimi	✅	⚠️
Basit sınıflandırma	⚠️ Fazla	✅
Belge özetleme	✅	✅
Çok adımlı ajans görevleri	✅	❌
Yüksek hacimli düşük karmaşıklık	❌ Pahalı	✅
Araç çağırma / fonksiyon kullanımı	✅	✅
Uzun akıl yürütme zincirleri	✅	❌
Gecikmeye duyarlı uygulamalar	✅ Hızlı	✅ En Hızlı

Akıllı desen: yönlendirme, sınıflandırma ve basit çıkarma için Haiku 4.5 kullanın; karmaşık görevleri Sonnet 4.6'ya yönlendirin. Bu hibrit yaklaşım, genellikle her şey için Sonnet 4.6'dan %60-80 daha az maliyetlidir.

Yayına Başlamadan Önce Apidog ile Maliyetleri Test Etme

Üretim ortamına dağıtmadan önce, her isteğin ne kadara mal olduğunu tam olarak bilmek istersiniz. Apidog'un görsel API istemcisi, Claude Sonnet 4.6 çağrılarını test etmenizi, usage nesnesi dahil tam yanıtı incelemenizi ve istek başına token sayılarını takip etmenizi sağlar.

Apidog'da Maliyet Görünürlüğünü Ayarlayın

https://api.anthropic.com/v1/messages adresine yeni bir POST isteği oluşturun
Başlıkları ekleyin: x-api-key, anthropic-version: 2023-06-01, Content-Type: application/json
Gövdeyi modeliniz ve mesajlarınızla ayarlayın
İsteği çalıştırın — yanıtın usage nesnesi tam token sayılarını gösterir

{
  "usage": {
    "input_tokens": 523,
    "cache_creation_input_tokens": 5000,
    "cache_read_input_tokens": 0,
    "output_tokens": 312
  }
}

Bu sayılardan gerçek maliyeti hesaplayın: - Girdi: 523 token × 3$/MTok = 0,00157$ - Önbellek yazma: 5.000 token × 3,75$/MTok = 0,01875$ - Çıktı: 312 token × 15$/MTok = 0,00468$ - Toplam ilk çağrı: 0,025$ (önbellek isabeti olan sonraki çağrılar: ~0,006$)

Bu istekleri Apidog'da bir koleksiyon olarak kaydedebilir, ekibinizle paylaşabilir ve üretim tasarımınızı sonlandırmadan önce farklı istem varyasyonları için maliyet tahminleri çalıştırabilirsiniz.

Geliştirmeye başlamaya hazır mısınız? Claude Sonnet 4.6 API çağrılarını görsel olarak test etmek, istek başına token kullanımını incelemek ve dağıtım yapmadan önce maliyetlerinizi doğru bir şekilde boyutlandırmak için Apidog'u ücretsiz indirin.

Düğme