Claude Sonnet 4.6 Fiyatı Ne Kadar?

Ashley Innocent

Ashley Innocent

18 February 2026

Claude Sonnet 4.6 Fiyatı Ne Kadar?

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

TL;DR

Claude Sonnet 4.6, milyon girdi tokenı başına 3 dolar ve milyon çıktı tokenı başına 15 dolar maliyetle Sonnet 4.5 ile aynı fiyata sahipken, Opus'a yakın performans sunar. Anında önbellekleme ile önbellek okumaları 0,30$/MTok'a düşer (%90 tasarruf). Toplu API, maliyetleri yarıya indirerek MTok başına 1,50$/7,50$ yapar. 1M token bağlam penceresi (beta), 200K token üzerindeki istekler için MTok başına 6$/22,50$ uzun bağlam fiyatlandırmasını tetikler.

Claude Sonnet 4.6 Temel Fiyatlandırması

Claude Sonnet 4.6, önceki sürümüyle aynı fiyat noktasını korurken, anlamlı derecede daha iyi sonuçlar sunar. İşte temel fiyatlandırmaya hızlı bir bakış:

Fiyatlandırma Katmanı Girdi Tokenları Çıktı Tokenları
Standart 3,00$ / MTok 15,00$ / MTok
Toplu API 1,50$ / MTok 7,50$ / MTok
Önbellek yazmaları (5 dakika) 3,75$ / MTok
Önbellek yazmaları (1 saat) 6,00$ / MTok
Önbellek okumaları 0,30$ / MTok
Uzun bağlam >200K (standart) 6,00$ / MTok 22,50$ / MTok
Uzun bağlam >200K (toplu) 3,00$ / MTok 11,25$ / MTok

MTok = milyon token. Tüm fiyatlar USD cinsindendir.

Buradaki değer hikayesini görmezden gelmek zor. İlk test edenler, başa baş karşılaştırmaların %59'unda Sonnet 4.6'yı önceki premium model Opus 4.5'e tercih etti; maliyetin %60'ı karşılığında.

Sonnet 4.6 kıyaslaması

Çoğu kodlama, analiz ve ajans görevleri için, Opus seviyesinde sonuçlar almak amacıyla artık Opus fiyatlarını ödemenize gerek yok.

💡
Üretim kodu yazmadan önce bu istekleri test etmek, büyük ölçekte para tasarrufu sağlar. Claude Sonnet 4.6'ya deneme API çağrıları yapmak, istek başına gerçek token kullanımını incelemek ve taahhütte bulunmadan önce bütçenizi doğru bir şekilde boyutlandırmak için Apidog'u indirin.
Düğme

Özelliğe Göre Tam Fiyatlandırma Detayı

Standart API Fiyatlandırması

Anthropic API aracılığıyla yapılan tüm senkron API çağrıları için standart oranlar geçerlidir:

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    messages=[{"role": "user", "content": "Bu belgeyi özetle."}]
)

# Tam token kullanımını kontrol edin
print(f"Girdi tokenları: {response.usage.input_tokens}")
print(f"Çıktı tokenları: {response.usage.output_tokens}")

# Maliyeti hesaplayın
input_cost  = response.usage.input_tokens  / 1_000_000 * 3.00
output_cost = response.usage.output_tokens / 1_000_000 * 15.00
print(f"İstek maliyeti: ${input_cost + output_cost:.6f}")

500-token girdi ve 300-token çıktı ile tipik bir API çağrısı için maliyet yaklaşık 0,0060$'dır. Bu, standart oranlarda istek başına bir sentten daha azdır.

Anında Önbellekleme Fiyatlandırması

Anında önbellekleme, Sonnet 4.6'nın en etkili maliyet kaldıraçlarından biridir. İsteğinizin bazı kısımlarını sunucu tarafında depolar ve önbellek isabetlerinde önemli ölçüde daha az ücret alır.

Önbellek yazma oranları:- 5 dakikalık önbellek: 3,75$/MTok (1,25× temel girdi fiyatı) - 1 saatlik önbellek: 6,00$/MTok (2× temel girdi fiyatı)

Önbellek okuma oranı:- 0,30$/MTok — standart girdi fiyatının onda biri

Sistem isteğiniz 10.000 token ise ve günde 1.000 istek işliyorsanız: - Önbellekleme olmadan: 10.000 × 1.000 × 3$/MTok = 30$/gün- Önbellekleme ile (bir kez yaz, 999 kez oku): 3,75$ + (999 × 0,30) × 10.000/MTok ≈ 3,04$/gün

Bu, yalnızca statik bir sistem isteği için %90 azalma demektir.

import anthropic

client = anthropic.Anthropic()

# Önbelleğe alınacak pahalı statik içeriği işaretleyin
response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system=[
        {
            "type": "text",
            "text": "Siz Python, FastAPI ve dağıtılmış sistemlerde uzmanlaşmış kıdemli bir kod inceleyicisiniz. İşte kodlama standartlarımız ve inceleme yönergelerimiz: [büyük blok standart metni]...",
            "cache_control": {"type": "ephemeral"}  # Bu bloğu önbelleğe al
        }
    ],
    messages=[{"role": "user", "content": "Bu çekme isteğini inceleyin: [PR içeriği]"}]
)

# Önbellekten ne geldiğini ve yeni tokenları kontrol edin
usage = response.usage
print(f"Önbellek yazma tokenları: {usage.cache_creation_input_tokens}")
print(f"Önbellek okuma tokenları:  {usage.cache_read_input_tokens}")
print(f"Önbelleğe alınmamış tokenlar:    {usage.input_tokens}")

Hangi önbellek süresini ne zaman kullanmalı:- 5 dakikalık önbellek: Yüksek frekanslı çağrılar, ani trafik artışları, kısa konuşma pencereleri - 1 saatlik önbellek: Arka plan işleme boru hatları, daha uzun boşluklara sahip toplu işler, ajan döngüleri

Toplu API Fiyatlandırması

Toplu API, asenkron işleme karşılığında (sonuçlar 24 saat içinde, genellikle çok daha erken) hem girdi hem de çıktı tokenlarında %50 indirim sunar.

Standart Toplu API
Girdi 3,00$/MTok 1,50$/MTok
Çıktı 15,00$/MTok 7,50$/MTok

Toplu API için en iyi kullanım durumları:- İçerik denetimi boru hatları - Ölçekli belge sınıflandırması - Gecelik veri zenginleştirme - Büyük veri kümeleri için gömme veya özet oluşturma - Gecikmenin önemli olmadığı etkileşimsiz her türlü işleme

1,50$/7,50$/MTok ile, her biri 500 girdi tokenı ve 100 çıktı tokenı olan bir milyon belgeyi işlemek şunları maliyetlendirir: - Girdi: 500M token × 1,50$/MTok = 750$- Çıktı: 100M token × 7,50$/MTok = 750$- Toplam: 1 milyon belge için 1.500$ (belge başına ~0,0015$)

Toplu API: Gerçek Zamanlı Olmayan İş Yükleri İçin %50 İndirim

Toplu işleme basittir: istekleri gönderin, sonuçları yarı fiyatına asenkron olarak alın. Değiş tokuş gecikmedir - sonuçlar 24 saat içinde gelir, ancak genellikle çok daha hızlıdır.

import anthropic, time

client = anthropic.Anthropic()

def batch_classify(texts: list[str]) -> list[str]:
    """Metin listesini Toplu API oranlarında sınıflandırın."""

    # Toplu işi gönder
    requests = [
        {
            "custom_id": f"item-{i}",
            "params": {
                "model": "claude-sonnet-4-6",
                "max_tokens": 20,
                "messages": [{
                    "role": "user",
                    "content": f"POZİTİF, NEGATİF veya NÖTR olarak sınıflandırın. Sadece tek kelimeyle yanıtlayın.\n\n{text}"
                }]
            }
        }
        for i, text in enumerate(texts)
    ]

    batch = client.messages.batches.create(requests=requests)

    # Tamamlanana kadar yokla
    while True:
        status = client.messages.batches.retrieve(batch.id)
        if status.processing_status == "ended":
            break
        time.sleep(60)

    # Sonuçları sırayla topla
    results = {}
    for result in client.messages.batches.results(batch.id):
        if result.result.type == "succeeded":
            results[result.custom_id] = result.result.message.content[0].text.strip()

    return [results.get(f"item-{i}", "HATA") for i in range(len(texts))]

Uzun Bağlam (1M Token) Fiyatlandırması

context-1m-2025-08-07 beta başlığı aracılığıyla 1M token bağlam penceresini etkinleştirdiğinizde, 200K girdi tokenını aşan istekler daha yüksek bir oranda ücretlendirilir.

Uzun Bağlam Oran Tablosu

Girdi Tokenları Girdi Fiyatı Çıktı Fiyatı
≤ 200K 3,00$/MTok 15,00$/MTok
> 200K 6,00$/MTok 22,50$/MTok

200K eşiği, toplam girdi tokenlarına dayanır ve şunları içerir: - input_tokens (standart girdi) - cache_creation_input_tokens (anında önbellekleme kullanılıyorsa) - cache_read_input_tokens (anında önbellekleme kullanılıyorsa)

Toplam 200K'yı aşarsa, o istekteki tüm tokenlar daha yüksek oranda ücretlendirilir.

Uzun Bağlam + Toplu API

Toplu API'nin %50 indirimi, uzun bağlam fiyatlandırmasıyla birleşir:

Senaryo Girdi Oranı Çıktı Oranı
Standart 3,00$/MTok 15,00$/MTok
Uzun bağlam (>200K) 6,00$/MTok 22,50$/MTok
Toplu API 1,50$/MTok 7,50$/MTok
Uzun bağlam + Toplu 3,00$/MTok 11,25$/MTok

Toplu API aracılığıyla büyük belgeleri toplu olarak işlemek, uzun bağlam maliyetlerini yönetilebilir tutar.

Araç ve Özellik Fiyatlandırması

Bazı araçlar, token maliyetlerinin ötesinde ayrı ücretler taşır.

Web Arama Aracı

1.000 arama başına 10,00$
+ arama tarafından oluşturulan içerik için standart token maliyetleri

Her web arama çağrısı, kaç sonuç döndürüldüğüne bakılmaksızın bir kullanım olarak sayılır. Arama hata verirse ücret alınmaz.

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    betas=["code-execution-web-tools-2026-02-09"],
    tools=[{"type": "web_search_20260209", "name": "web_search"}],
    messages=[{"role": "user", "content": "Bu haftanın en son LLM kıyaslama haberleri nelerdir?"}]
)

usage = response.usage
search_count = getattr(usage, 'server_tool_use', {})
print(f"Kullanılan web aramaları: {search_count.get('web_search_requests', 0)}")
# Her arama: 0,01$

Kod Yürütme Aracı

Web araması veya web getirme ile birlikte kullanıldığında ücretsizdir (web_search_20260209 veya web_fetch_20260209 araç sürümleri kullanılarak).

Bağımsız kullanıldığında: - Ayda kuruluş başına 1.550 ücretsiz saat - Ücretsiz katmanın ötesinde konteyner başına saatte 0,05$ - Minimum faturalandırma birimi: 5 dakika

Çoğu geliştirme ve test iş yükü için ücretsiz katman fazlasıyla yeterlidir.

Web Getirme Aracı

Ek ücret yok. Sadece konuşmaya giren içerik için standart token maliyetlerini ödersiniz.

Araç Ek Maliyet Notlar
Web araması 10$/1K arama Arama başına ücret
Web getirme Ücretsiz Yalnızca token maliyetleri
Kod yürütme (web araçlarıyla) Ücretsiz Birlikte sunulur
Kod yürütme (bağımsız) 1.550 ücretsiz saat/ay sonrası saatte 0,05$ Konteyner başına
Bilgisayar kullanımı ek yükü ~735 ekstra girdi tokenı Araç tanımı başına
Metin düzenleyici ek yükü ~700 ekstra girdi tokenı Araç tanımı başına

Bilgisayar Kullanımı Ek Yükü

Bilgisayar kullanımı sabit token ek yükü ekler: - Sistem istemi eklemesi: 466–499 token - Araç tanımı tokenları: Araç başına 735 token (Claude 4.x modelleri)

Ekran görüntüleri ile birlikte, dönüş başına 200 token ve 100 dönüş içeren bir bilgisayar kullanım oturumu için: - Araç ek yükü: 735 token × 3$/MTok = 0,0022$ (ihmal edilebilir) - Ekran görüntüsü tokenları çözünürlüğe bağlıdır; ekran görüntüsü başına ~2.000–5.000 token planlayın

Claude Sonnet 4.6 Tüm Modellere Karşı: Tam Karşılaştırma

Güncel Model Fiyatlandırması

Model Girdi Çıktı Önbellek Oku Toplu Girdi Toplu Çıktı
Claude Sonnet 4.6 3,00$ 15,00$ 0,30$ 1,50$ 7,50$
Claude Haiku 4.5 1,00$ 5,00$ 0,10$ 0,50$ 2,50$
Claude Opus 4.6 5,00$ 25,00$ 0,50$ 2,50$ 12,50$
Claude Opus 4.5 5,00$ 25,00$ 0,50$ 2,50$ 12,50$
Claude Opus 4.1 15,00$ 75,00$ 1,50$ 7,50$ 37,50$

Tüm fiyatlar milyon token başına USD cinsindendir.

Sonnet 4.6 vs Opus 4.6: Değer Sorusu

Claude Sonnet 4.6 Claude Opus 4.6
Girdi fiyatı 3$/MTok 5$/MTok
Çıktı fiyatı 15$/MTok 25$/MTok
Göreceli maliyet 1,67×
SWE-bench Onaylı %79,6 ~%80,8
OSWorld (bilgisayar kullanımı) %72,5 %72,7
Kullanıcı tercihi vs Sonnet 4.5 %70 U/D
Kullanıcı tercihi vs Opus 4.5 %59 U/D
1M bağlam penceresi Evet (beta) Evet (beta)
Adaptif düşünme Evet Evet
Maksimum çıktı 64K token 128K token

Görevlerin büyük çoğunluğu için - kodlama, analiz, belge işleme, ajans iş akışları - Sonnet 4.6, Opus performansını %60 daha ucuz fiyata sunar. Opus 4.6, 128K çıktı tokenına veya yeni akıl yürütme görevlerinde mutlak maksimuma ihtiyacınız olduğunda premium'a değerdir.

Sonnet 4.6 vs Haiku 4.5: Hangisini Ne Zaman Kullanmalı

Kullanım Durumu Sonnet 4.6 Haiku 4.5
Karmaşık kod üretimi ⚠️
Basit sınıflandırma ⚠️ Fazla
Belge özetleme
Çok adımlı ajans görevleri
Yüksek hacimli düşük karmaşıklık ❌ Pahalı
Araç çağırma / fonksiyon kullanımı
Uzun akıl yürütme zincirleri
Gecikmeye duyarlı uygulamalar ✅ Hızlı ✅ En Hızlı

Akıllı desen: yönlendirme, sınıflandırma ve basit çıkarma için Haiku 4.5 kullanın; karmaşık görevleri Sonnet 4.6'ya yönlendirin. Bu hibrit yaklaşım, genellikle her şey için Sonnet 4.6'dan %60-80 daha az maliyetlidir.

Yayına Başlamadan Önce Apidog ile Maliyetleri Test Etme

Üretim ortamına dağıtmadan önce, her isteğin ne kadara mal olduğunu tam olarak bilmek istersiniz. Apidog'un görsel API istemcisi, Claude Sonnet 4.6 çağrılarını test etmenizi, usage nesnesi dahil tam yanıtı incelemenizi ve istek başına token sayılarını takip etmenizi sağlar.

Apidog arayüzü

Apidog'da Maliyet Görünürlüğünü Ayarlayın

  1. https://api.anthropic.com/v1/messages adresine yeni bir POST isteği oluşturun
  2. Başlıkları ekleyin: x-api-key, anthropic-version: 2023-06-01, Content-Type: application/json
  3. Gövdeyi modeliniz ve mesajlarınızla ayarlayın
  4. İsteği çalıştırın — yanıtın usage nesnesi tam token sayılarını gösterir
{
  "usage": {
    "input_tokens": 523,
    "cache_creation_input_tokens": 5000,
    "cache_read_input_tokens": 0,
    "output_tokens": 312
  }
}

Bu sayılardan gerçek maliyeti hesaplayın: - Girdi: 523 token × 3$/MTok = 0,00157$ - Önbellek yazma: 5.000 token × 3,75$/MTok = 0,01875$ - Çıktı: 312 token × 15$/MTok = 0,00468$ - Toplam ilk çağrı: 0,025$ (önbellek isabeti olan sonraki çağrılar: ~0,006$)

Bu istekleri Apidog'da bir koleksiyon olarak kaydedebilir, ekibinizle paylaşabilir ve üretim tasarımınızı sonlandırmadan önce farklı istem varyasyonları için maliyet tahminleri çalıştırabilirsiniz.

Geliştirmeye başlamaya hazır mısınız? Claude Sonnet 4.6 API çağrılarını görsel olarak test etmek, istek başına token kullanımını incelemek ve dağıtım yapmadan önce maliyetlerinizi doğru bir şekilde boyutlandırmak için Apidog'u ücretsiz indirin.

Düğme

API Tasarım-Öncelikli Yaklaşımı Apidog'da Uygulayın

API'leri oluşturmanın ve kullanmanın daha kolay yolunu keşfedin

Claude Sonnet 4.6 Fiyatı Ne Kadar?