Gemini 3.5 Flash Fiyatı: Gerçek Maliyeti Ne Kadar?

Ashley Innocent

Ashley Innocent

20 May 2026

Gemini 3.5 Flash Fiyatı: Gerçek Maliyeti Ne Kadar?

Kurumsal Apidog

Şirket İçi Dağıtım

SSO & RBAC

SOC 2 Uyumlu

Apidog Enterprise'ı Keşfet

Google, Gemini 3.5 Flash'ı 19 Mayıs 2026'da piyasaya sürdü ve ana fiyatlandırma iddiası iddialı: aracı görevler için "diğer öncü modellerin yarı fiyatından daha az". Bu, pazarlama sloganı. Bu rehber gerçek matematiği yapıyor.

Jeton başına oranları, ücretsiz katman limitlerini, toplu mod indirimini, yaygın iş yükleri için gerçek dünya maliyet senaryolarını ve GPT-5.5 ve Claude Opus 4.7'ye karşı yan yana maliyet karşılaştırmasını bulacaksınız. Sonunda, Flash'ı çalıştırmanın tam olarak ne kadara mal olduğunu ve çok fazla ödün vermeden %50 veya daha fazla tasarruf edebileceğiniz yerleri bileceksiniz.

Hızlı özet

Maliyet türü Oran
Standart giriş ~1,50 $ / 1M jeton
Standart çıkış ~9,00 $ / 1M jeton
Toplu mod girişi ~0,75 $ / 1M jeton (~%50 indirim)
Toplu mod çıkışı ~4,50 $ / 1M jeton (~%50 indirim)
Önbelleğe alınmış giriş indirimli oran (değişir)
Ücretsiz katman (AI Studio) ~1.500 istek/gün, 1M jeton/dk, 15 RPM
Vertex AI yeni hesap 90 gün içinde 300 $ kredi

Oranlar Google'ın lansman duyurusu ve toplayıcı listelerine göre Mayıs 2026 itibarıyla geçerlidir. Bütçeyi taahhüt etmeden önce daima resmi fiyatlandırma sayfasını kontrol edin.

Gemini 3.5 Flash jeton başına oranları

Flash, her Gemini varyantının 2.5'ten beri kullandığı aynı kullandığın kadar öde modelini kullanır: her milyon giriş jetonu ve her milyon çıkış jetonu için ayrı ayrı ödeme yaparsınız.

Katman Giriş ($/1M) Çıkış ($/1M)
Standart ~1,50 $ ~9,00 $
Önbelleğe alınmış giriş indirimli yok
Toplu (eşzamansız) ~0,75 $ ~4,50 $

İki pratik not:

Gemini'nin toplu modunun nasıl çalıştığı hakkında bilgi için Gemini API toplu modu burada ve %50 daha ucuz makalesine bakın.

Ücretsiz katman: ödeme yapmadan ne elde edersiniz

AI Studio ücretsiz katmanı, ilk günden itibaren Flash ile birlikte gelir. Lansmandaki sınırlar:

Bu, çoğu yan proje, dahili prototip ve küçük ölçekli otomasyon için yeterlidir. İş yükünüz günde 1.500 çağrının içine sığıyorsa, 0 $ ödersiniz.

Ücretsiz katman özellikleri:

Tam kurulum kılavuzu için Gemini 3.5'i ücretsiz olarak nasıl kullanabilirsiniz ve Ücretsiz Google Gemini API anahtarı nasıl alınır makalelerine bakın.

Toplu mod: çoğu ekibin kaçırdığı %50 indirim

İş yükünüz gerçek zamanlı yanıtlara ihtiyaç duymuyorsa, toplu mod Flash maliyetlerini kabaca yarıya indirir.

Nasıl çalışır:

  1. Tek seferde 50.000 adede kadar istem içeren bir toplu iş gönderin
  2. Google bunları 24 saat içinde işler
  3. Hem giriş hem de çıkış için jeton başına ~%50 daha az ödersiniz

Toplu modun ne zaman anlamlı olduğu:

Ne zaman anlamlı olmadığı:

Çoğu üretim yığını, gecikmeye tolerans gösterebilecek herhangi bir iş yükü için toplu modu çalıştırmalıdır. Tasarruflar ölçekte hızla birleşir. Kurulum detayları toplu mod rehberimizde.

Önbelleğe alınmış giriş: başka bir kaldıraç

İstemleriniz uzun bir statik önek (sistem istemi, büyük referans belge, uzun talimatlar) paylaşıyorsa, bağlam önbellekleme size önbelleğe alınmış kısımda indirim sağlar.

Desen:

Somut tasarruflar önbellek isabet oranına bağlıdır, ancak aynı alınan parçaların sorgular arasında geri geldiği RAG tarzı uygulamalar için %30-60 giriş maliyeti azaltması bekleyin.

Gerçek dünya maliyet senaryoları

Jeton matematiği hızla soyutlaşır. İşte Flash'ın standart oranlarında beş somut senaryo.

Senaryo 1: Müşteri destek sohbet botu

Günlük maliyet:

Aynı iş yükünü toplu mod üzerinden çalıştırın (toplu yanıtlara tolerans gösterebiliyorsanız): ~585 $/ay. Sistem istemi için bağlam önbellekleme ekleyin: başka bir %20-30 indirim.

Senaryo 2: Belge Soru-Cevap SaaS

Günlük maliyet:

Flash'ın 1M bağlamının parladığı yer burasıdır: parçalama altyapısı yok, sadece tüm belgeyi gönderin. Bir amiral gemisi modelle parçalı RAG'ye kıyasla, API artı altyapıda kat kat daha fazla ödersiniz.

Senaryo 3: Uzun süreli otonom ajan

Çalıştırma başına maliyet:

Günlük toplam: 200 × 0,83 $ = ~165 $/gün, ~4.950 $/ay

Karşılaştırma için, Opus 4.7'deki aynı iş yükü (1M başına ~15 $/75 $) kabaca 25 $/çalıştırma veya 5.000 $/gün maliyeti vardır. Google'ın iddiasının işaret ettiği ajans maliyet farkı budur.

Senaryo 4: Grafik çıkarma hattı

Günlük maliyet:

Toplu modu ekleyin ve aynı iş yükü ~375 $/ay'a düşer. CharXiv'in %84,2'lik mantığı, kalitenin korunduğu anlamına gelir.

Senaryo 5: Yüksek hacimli içerik üretimi

Günlük maliyet:

Bunu toplu moda taşıyın ve aylık fatura ~28K $'a düşer. Bu ölçekte, rutin parçaları 3.1 Flash-Lite gibi daha ucuz modellere yönlendirmeyi ve Flash'ı daha zor üretimler için saklamayı da test etmek isteyebilirsiniz.

GPT-5.5 ve Opus 4.7'ye karşı maliyet

Ana fiyat karşılaştırması:

Model Giriş ($/1M) Çıkış ($/1M) Flash'a karşı katı
Gemini 3.5 Flash ~1,50 $ ~9,00 $ 1 kat (temel)
GPT-5.5 ~10 $ ~30 $ 6,7 kat giriş, 3,3 kat çıkış
Claude Opus 4.7 ~15 $ ~75 $ 10 kat giriş, 8,3 kat çıkış

Senaryo 1'i (müşteri destek sohbeti) her biri üzerinden çalıştırın:

Google'ın pazarlama çizgisini yönlendiren ajans maliyet farkı budur. Amiral gemileri en zor görevlerde marjinal olarak daha iyi kalite sağlar; günlük iş yükleri için Flash, maliyetin çok küçük bir kısmıyla yeterlidir.

Daha derin ayrıştırmalar için GPT-5.5 fiyatlandırması ve üçlü karşılaştırmamıza bakın.

Diğer Gemini varyantlarına karşı maliyet

Model Giriş ($/1M) Çıkış ($/1M) Ne zaman kullanılmalı
Gemini 3.1 Flash-Lite ~0,40 $ ~2,00 $ Yüksek hacimli rutin işler
Gemini 3 Flash ~0,50 $ ~3,00 $ Eski nesil, hala sağlam
Gemini 3.1 Pro ~2,00 $ ~12,00 $ 3.5 Pro öncesi muhakeme ağırlıklı işler
Gemini 3.5 Flash ~1,50 $ ~9,00 $ Çoğu iş yükü için yeni varsayılan
Gemini 3.5 Pro (Haziran 2026) Belirlenecek Belirlenecek En zor muhakeme görevleri

Flash, 3.x Flash seleflerinden daha pahalı ancak önceki Pro katmanından inandırıcı bir şekilde daha ucuzdur. Çoğu ekip için bu doğru takastır: Flash 3.x'ten daha iyi, Pro 3.x'ten daha az maliyetli.

Eski Gemini serisi için 3.1 Flash-Lite, 3.0 API fiyatlandırması ve 3 Flash makalelerine bakın.

Vertex AI fiyatlandırması (üretim)

Flash'ı AI Studio yerine Vertex AI üzerinden çağırırsanız, jeton başına fiyatlandırma aynıdır. Farklılıklar faturalandırma ve hesap özellikleridir:

Çoğu üretim ekibi için yol şöyledir: AI Studio'nun ücretsiz katmanında prototip oluşturun, ölçek için AI Studio ücretli sürümüne geçin, ardından kurumsal kontrollere ihtiyaç duyduğunuzda Vertex AI'ye geçin. Model davranışı üçünde de aynıdır.

Maliyet optimizasyon ipuçları

Flash faturalarını en çok düşüren altı somut alışkanlık:

  1. Gerçek zamanlı yanıt gerektirmeyen her şey için toplu modu çalıştırın. %50 indirim, kalite kaybı yok.
  2. Uzun statik önekleri önbelleğe alın. Sistem istemleri, referans belgeler, talimatlar, hepsi iyi adaylardır.
  3. Yapılandırılmış JSON çıktısı kullanın. Modelin daha az yazmasını sağlar, serbest biçimli metne göre hem daha hızlı hem de daha ucuzdur.
  4. Görevin karmaşıklığına göre yönlendirin. Kolay görevler Flash-Lite'a; zor olanlar Flash'a; nadir öldürücü görev 3.5 Pro çıktığında ona.
  5. Girdileri önceden doğrulayın. Hatalı istekler için jeton harcamayın. Apidog bunları API'ye ulaşmadan yakalar.
  6. İstem başına maliyeti izleyin. İstek başına giriş/çıkış jetonlarını kaydeden bir günlük orta katmanı ekleyin. Maliyet aşımları neredeyse her zaman birkaç aykırı istemden kaynaklanır.

İstem doğrulama akışı için Apidog'u indirin, Gemini uç noktanız için bir test senaryosu oluşturun ve yanıt-şekil iddiaları ekleyin. Aynı bozuk isteği bir hata ayıklama oturumunda 200 kez yakmak, ekiplerin ücretsiz katman kotalarını tek bir öğleden sonra nasıl boşa harcadığıdır.

Ücretsiz katman yeterli olmadığında

Ücretsizden ücretli Flash'a yükseltmek için üç sinyal:

  1. Üst üste birden fazla gün günde 1.500 isteğe ulaşıyorsunuz. Kullandığın kadar öde, kota atlatmak için harcanan geliştirme süresinin yükseltmeden daha pahalıya mal olduğu kadar ucuzdur.
  2. Daha yüksek RPM verimine ihtiyacınız var. Ücretsiz katman dakikada 15 istekle sınırlıdır; ücretli katmanlar çok daha yükseğe çıkar.
  3. Veri yerleşimi veya denetim günlüklerine ihtiyacınız var. Faturalandırılan bir hesapta Vertex AI'ye geçin.

Çoğu ekip, ayda 50-200 $ ücretli Flash kullanımının birçok ücretsiz katman hokkabazlığını değiştirdiğini fark eder.

Fiyatlandırma riskleri ve dikkat edilmesi gerekenler

Hesabı değiştirebilecek üç şey:

İlk günden itibaren maliyet uyarıları kurun. Hem AI Studio (projenin kotalar sayfasında) hem de Vertex AI (Cloud Billing'de) günlük bütçe üst sınırlarını destekler. Bunları kullanın.

Sonuç

Gemini 3.5 Flash, 2026'daki çoğu üretim yapay zeka iş yükünün buradan başlaması için yeterince ucuzdur. Standart oranlar (1M jeton başına 1,50 $ / 9 $) diğer tüm öncü sınıf seçenekleri geride bırakır. Toplu mod ve bağlam önbellekleme, etkin maliyeti daha da düşürür.

Flash'ın yeterli olmadığı iş yükleri için doğru hareket, katmanları karıştırmaktır: toplu işler için Flash, en zor görevler için GPT-5.5 veya Opus 4.7 gibi bir amiral gemisi. Görev karmaşıklığına göre yönlendirme, yapabileceğiniz en yüksek kaldıraçlı maliyet optimizasyonudur.

Bunu pratiğe dökmek için:

Bu, genellikle tek bir fatura döngüsünde karşılığını veren iki günlük bir iştir.

Düğme

API Tasarım-Öncelikli Yaklaşımı Apidog'da Uygulayın

API'leri oluşturmanın ve kullanmanın daha kolay yolunu keşfedin