Google'ın Gemini 3.1 Flash Lite, 3 Mart 2026'da piyasaya sürüldü ve Gemini serisindeki en hızlı, en uygun fiyatlı modeldir. Milyon giriş jetonu başına 0,25 dolar ve milyon çıkış jetonu başına 1,50 dolar fiyatıyla, bütçeyi tüketmeden büyük ölçekte yapay zekaya ihtiyaç duyan geliştiriciler için tasarlanmıştır.
Bu kılavuz, erişim sağlamayı, API anahtarınızı kurmayı ve istek yapmaya başlamayı tam olarak nasıl yapacağınızı gösterir. 10 dakikadan kısa sürede çalışan bir kodunuz olacak.
Özet
Hızlı Kurulum:
- Google AI Studio'ya gidin
- Bir proje oluşturun ve bir API anahtarı oluşturun
- SDK'yı yükleyin:
pip install google-generativeai gemini-3.1-flash-litemodeliyle ilk isteğinizi yapın- Daha kolay hata ayıklama ve ekip işbirliği için Apidog'da test edin
Fiyatlandırma: 1 milyon giriş jetonu başına 0,25 dolar, 1 milyon çıkış jetonu başına 1,50 dolar
Hız: Gemini 2.5 Flash'tan 2,5 kat daha hızlı
Ücretsiz Katman: Önizleme süresince 1 milyon ücretsiz giriş jetonu
Gemini 3.1 Flash Lite Nedir?
Gemini 3.1 Flash Lite, Google'ın yüksek hacimli uygulamalar için tasarlanmış en yeni yapay zeka modelidir. Gemini 2.5 Flash'tan 2,5 kat daha hızlı ve %45 daha hızlı çıkış hızına sahipken, GPQA Diamond'da %86,9 ve MMMU Pro kriterlerinde %76,8 puan almıştır.

Model, istek başına ayarlayabileceğiniz düşünme seviyeleri içerir. Basit görevler için azaltabilir, karmaşık akıl yürütme için artırabilirsiniz. Bu esneklik, farklı iş yüklerini yönetirken maliyetleri optimize etmenizi sağlar.
Bireysel geliştiriciler için Google AI Studio ve kurumsal firmalar için Vertex AI aracılığıyla kullanılabilir.
Önkoşullar
Başlamadan önce şunlara sahip olduğunuzdan emin olun:
- Bir Google hesabı
- Python 3.7+ veya Node.js 14+ yüklü
- REST API'leri hakkında temel bilgi
- (İsteğe bağlı) API testi için Apidog yüklü
Adım 1: Bir Google AI Studio Hesabı Oluşturun
Google AI Studio, geliştirme için Gemini modellerine erişmenin en hızlı yoludur.
- aistudio.google.com adresine gidin
- Google hesabınızla oturum açın
- Hizmet şartlarını kabul edin
- AI Studio kontrol paneline yönlendirileceksiniz
Arayüz, mevcut modelleri, API kullanımınızı ve hızlı başlangıç şablonlarını gösterir. Flash Lite, model açılır menüsünde gemini-3.1-flash-lite olarak görünür.

Adım 2: API Anahtarınızı Oluşturun
API anahtarları, Gemini API'ye yapılan isteklerin kimliğini doğrulamanızı sağlar.
- Sağ üst köşedeki API Anahtarını Al'a tıklayın
- Yeni projede API anahtarı oluştur'u seçin (veya mevcut bir projeyi seçin)
- Google yeni bir Cloud projesi oluşturur ve anahtarınızı üretir
- API anahtarını kopyalayın -
AIzaSyXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXgibi görünür - Güvenli bir şekilde saklayın - bir daha göremeyeceksiniz

Güvenlik ipucu: API anahtarlarını asla sürüm kontrolüne kaydetmeyin. Ortam değişkenleri veya sır yönetimi araçlarını kullanın.
Adım 3: SDK'yı Yükleyin
Google, Python ve Node.js için resmi SDK'lar sağlar.
Python
pip install google-generativeai
Node.js
npm install @google/generative-ai
SDK, kimlik doğrulama, istek biçimlendirme ve yanıt ayrıştırma işlemlerini yönetir. İsterseniz doğrudan REST API'yi de kullanabilirsiniz.
Adım 4: İlk İsteğinizi Yapın
Flash Lite'a basit bir komut gönderelim.
Python Örneği
import google.generativeai as genai
import os
# Configure API key
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
# Initialize the model
model = genai.GenerativeModel('gemini-3.1-flash-lite')
# Generate content
response = model.generate_content('Explain REST APIs in one sentence.')
print(response.text)
Node.js Örneği
const { GoogleGenerativeAI } = require("@google/generative-ai");
// Initialize with API key
const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);
async function run() {
// Get the model
const model = genAI.getGenerativeModel({ model: "gemini-3.1-flash-lite" });
// Generate content
const result = await model.generateContent("Explain REST APIs in one sentence.");
const response = await result.response;
const text = response.text();
console.log(text);
}
run();
cURL Örneği (REST API)
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-lite:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"contents": [{
"parts": [{
"text": "Explain REST APIs in one sentence."
}]
}]
}'
Bu örneklerden herhangi birini çalıştırdığınızda saniyeler içinde bir yanıt alacaksınız. Model, komutunuza yanıt veren net ve özlü metin döndürür.
Adım 5: Apidog ile Test Edin
Apidog, görsel arayüzü, ekip işbirliği ve otomatik dokümantasyon ile API testini kolaylaştırır.

Gemini API için Neden Apidog Kullanmalısınız?
- Görsel istek oluşturucu - cURL komutları yazmaya gerek yok
- Ortam değişkenleri - Geliştirme/üretim API anahtarları arasında kolayca geçiş yapın
- Yanıt doğrulama - Hataları üretime geçmeden yakalayın
- Ekip paylaşımı - API koleksiyonlarını ekibinizle paylaşın
- Otomatik dokümantasyon - İsteklerinizden belgeler oluşturun
Yanıtı sağ panelde sözdizimi vurgulama, yanıt süresi ve durum koduyla göreceksiniz.
Ortam Değişkeni Olarak Kaydetme
- Apidog'da Ortamlar'a gidin
- Yeni bir ortam oluşturun (örn. "Gemini Dev")
- Değişken ekleyin:
GOOGLE_API_KEY= gerçek API anahtarınız - İsteklerinizde
{{GOOGLE_API_KEY}}kullanın
Artık isteklerinizi değiştirmeden ortamlar arasında geçiş yapabilirsiniz. Geliştirme, hazırlık ve üretim anahtarlarını yönetmek için mükemmel.
İstek Biçimini Anlama
Gemini API belirli bir JSON yapısı kullanır.
Temel İstek Yapısı
{
"contents": [{
"parts": [{
"text": "Your prompt here"
}]
}]
}
Düşünme Seviyeleri ile
{
"contents": [{
"parts": [{
"text": "Generate API documentation for a user authentication endpoint"
}]
}],
"generationConfig": {
"thinkingLevel": "high"
}
}
Düşünme seviyeleri: low (düşük), medium (orta), high (yüksek)
- Düşük: Hızlı, basit yanıtlar
- Orta: Dengeli akıl yürütme
- Yüksek: Derinlemesine analiz, karmaşık görevler
Sistem Talimatları ile
{
"systemInstruction": {
"parts": [{
"text": "You are an API documentation expert. Write clear, concise docs."
}]
},
"contents": [{
"parts": [{
"text": "Document this endpoint: POST /api/users"
}]
}]
}
Sistem talimatları, bir konuşmadaki tüm isteklerde modelin davranışını yönlendirir.
Yanıt Biçimi
API, bu yapıda bir JSON döndürür:
{
"candidates": [{
"content": {
"parts": [{
"text": "REST APIs are interfaces that let applications communicate over HTTP using standard methods like GET, POST, PUT, and DELETE."
}],
"role": "model"
},
"finishReason": "STOP",
"index": 0,
"safetyRatings": [...]
}],
"usageMetadata": {
"promptTokenCount": 8,
"candidatesTokenCount": 25,
"totalTokenCount": 33
}
}
Anahtar alanlar:
candidates[0].content.parts[0].text- Oluşturulan yanıtusageMetadata- Faturalandırma için jeton sayılarıfinishReason- Oluşturmanın neden durduğu (DUR, MAKS_JETONLAR, GÜVENLİK)
Yaygın Kullanım Durumları
1. API Dokümantasyonu Oluşturma
import google.generativeai as genai
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')
endpoint_spec = """
POST /api/v1/users
Creates a new user account
Body: { "email": string, "password": string, "name": string }
"""
response = model.generate_content(
f"Generate comprehensive API documentation for this endpoint:\n{endpoint_spec}",
generation_config={"thinkingLevel": "medium"}
)
print(response.text)
2. İstek Doğrulama
def validate_api_request(request_body):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Validate this API request body and list any issues:
{request_body}
Check for:
- Missing required fields
- Invalid data types
- Security concerns
"""
response = model.generate_content(prompt)
return response.text
# Example usage
request = '{"email": "test@example.com", "password": "123"}'
validation_result = validate_api_request(request)
print(validation_result)
3. Hata Mesajı Oluşturma
def generate_user_friendly_error(error_code, technical_message):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Convert this technical error into a user-friendly message:
Error Code: {error_code}
Technical: {technical_message}
Make it clear, actionable, and non-technical.
"""
response = model.generate_content(
prompt,
generation_config={"thinkingLevel": "low"}
)
return response.text
# Example
friendly_error = generate_user_friendly_error(
"AUTH_TOKEN_EXPIRED",
"JWT token validation failed: exp claim is in the past"
)
print(friendly_error)
Hız Sınırları ve Kotalar
Flash Lite, önizleme süresince cömert sınırlara sahiptir:
Ücretsiz Katman:
- 1 milyon ücretsiz giriş jetonu
- Dakikada 15 istek
- Günde 1.500 istek
Ücretli Katman:
- 1 milyon giriş jetonu başına 0,25 dolar
- 1 milyon çıkış jetonu başına 1,50 dolar
- Dakikada 60 istek
- Günlük limit yok
Kullanımınızı Google AI Studio'da Kullanım ve Faturalandırma altında izleyin.
Hata Yönetimi
Yaygın hataları sorunsuz bir şekilde ele alın:
import google.generativeai as genai
from google.api_core import exceptions
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')
def safe_generate(prompt):
try:
response = model.generate_content(prompt)
return response.text
except exceptions.ResourceExhausted:
return "Hız sınırı aşıldı. Bir dakika içinde tekrar deneyin."
except exceptions.InvalidArgument as e:
return f"Geçersiz istek: {str(e)}"
except exceptions.PermissionDenied:
return "API anahtarı geçersiz veya süresi dolmuş."
except Exception as e:
return f"Beklenmeyen hata: {str(e)}"
result = safe_generate("Explain APIs")
print(result)
Yaygın hatalar:
400 Bad Request- Geçersiz JSON veya eksik zorunlu alanlar401 Unauthorized- Geçersiz API anahtarı429 Too Many Requests- Hız sınırı aşıldı500 Internal Server Error- Google'ın sunucularında bir sorun oluştu
Sorun Giderme
"API anahtarı geçerli değil"
Şunları kontrol edin:
- API anahtarı doğru kopyalandı mı (fazladan boşluk yok)
- API anahtarı Google Cloud Console'da etkinleştirildi mi
- Projenizde faturalandırma etkin mi
- Doğru ortam değişkeni adı kullanılıyor mu
"Model bulunamadı"
Tam model adını kullandığınızdan emin olun:
# Correct
model = genai.GenerativeModel('gemini-3.1-flash-lite')
# Wrong
model = genai.GenerativeModel('gemini-flash-lite')
model = genai.GenerativeModel('gemini-3.1-flash')
"Hız sınırı aşıldı"
Dakikadaki istek sınırına ulaştınız. Çözümler:
- Üstel geri çekilme deneme mantığı ekleyin
- Birden fazla istemi tek isteğe gruplandırın
- Daha yüksek limitler için ücretli katmana yükseltin
- İstek kuyruklandırma uygulayın
Yavaş yanıtlar
Flash Lite hızlıdır, ancak gecikmeler yaşıyorsanız:
- Ağ bağlantınızı kontrol edin
- Basit görevler için daha düşük düşünme seviyeleri kullanın
- Komut uzunluğunu azaltın
- Uzun çıktılar için akışlı yanıtları düşünün
Gelişmiş: Akışlı Yanıtlar
Uzun çıktılar için, jetonları oluşturuldukça akış olarak alın:
import google.generativeai as genai
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = "Write a detailed explanation of REST API authentication methods"
response = model.generate_content(prompt, stream=True)
for chunk in response:
print(chunk.text, end='', flush=True)
Akış, algılanan performansı artırır. Kullanıcılar, yanıtın tamamını beklemek yerine çıktıyı hemen görürler.
Maliyet Optimizasyonu İpuçları
1. Benzer İstekleri Gruplandırma
# Expensive: 3 separate requests
response1 = model.generate_content("Explain GET")
response2 = model.generate_content("Explain POST")
response3 = model.generate_content("Explain PUT")
# Cheaper: 1 combined request
combined_prompt = """
Explain these HTTP methods:
1. GET
2. POST
3. PUT
"""
response = model.generate_content(combined_prompt)
2. Daha Düşük Düşünme Seviyeleri Kullanma
# For simple classification
response = model.generate_content(
"Is this email spam? 'Buy now!'",
generation_config={"thinkingLevel": "low"}
)
# For complex analysis
response = model.generate_content(
"Analyze this API design and suggest improvements...",
generation_config={"thinkingLevel": "high"}
)
3. Önbellekleme Uygulama
Tekrarlanan sorgular için yanıtları önbelleğe alın. Basit bir bellek içi önbellek, yaygın istekler için maliyetleri %50'den fazla azaltabilir.
4. İstekleri Kısaltma
Gereksiz bağlamı kaldırın:
# Verbose (more tokens)
prompt = "I would like you to please explain to me what REST APIs are and how they work in detail"
# Concise (fewer tokens)
prompt = "Explain REST APIs"
Güvenlik Hususları
1. API Anahtarınızı Koruyun
- Ortam değişkenlerinde veya sır yöneticilerinde saklayın
- Anahtarları düzenli olarak değiştirin
- Geliştirme/hazırlık/üretim için ayrı anahtarlar kullanın
- API anahtarlarını asla kaydetmeyin
2. Kullanıcı Girişini Doğrulama
def safe_prompt(user_input):
# Remove potential injection attempts
cleaned = user_input.replace("Ignore previous instructions", "")
cleaned = cleaned[:1000] # Limit length
return f"User question: {cleaned}"
3. Hassas Verileri Filtreleme
API'ye hassas bilgi göndermeyin:
import re
def sanitize_for_ai(text):
# Remove email addresses
text = re.sub(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', '[EMAIL]', text)
# Remove phone numbers
text = re.sub(r'\b\d{3}[-.]?\d{3}[-.]?\d{4}\b', '[PHONE]', text)
# Remove credit cards
text = re.sub(r'\b\d{4}[-\s]?\d{4}[-\s]?\d{4}[-\s]?\d{4}\b', '[CARD]', text)
return text
4. Hız Sınırlaması Uygulama
API anahtarınızı kötüye kullanımdan koruyun:
from collections import defaultdict
import time
class RateLimiter:
def __init__(self, max_requests=10, window=60):
self.max_requests = max_requests
self.window = window
self.requests = defaultdict(list)
def allow_request(self, user_id):
now = time.time()
# Remove old requests
self.requests[user_id] = [
req_time for req_time in self.requests[user_id]
if now - req_time < self.window
]
if len(self.requests[user_id]) < self.max_requests:
self.requests[user_id].append(now)
return True
return False
limiter = RateLimiter(max_requests=10, window=60)
def generate_with_limit(user_id, prompt):
if not limiter.allow_request(user_id):
return "Hız sınırı aşıldı. Lütfen daha sonra tekrar deneyin."
model = genai.GenerativeModel('gemini-3.1-flash-lite')
response = model.generate_content(prompt)
return response.text
Flash Lite'ı Diğer Gemini Modelleriyle Karşılaştırma
| Özellik | Flash Lite | Flash | Pro |
|---|---|---|---|
| Giriş Fiyatı | $0.25/1M | $0.50/1M | $1.25/1M |
| Çıkış Fiyatı | $1.50/1M | $3.00/1M | $7.50/1M |
| Hız | 2,5 Kat Daha Hızlı | Hızlı | Standart |
| Bağlam Penceresi | 32K jeton | 1M jeton | 2M jeton |
| En İyi Kullanım | Yüksek hacimli, maliyet hassas | Dengeli | Karmaşık akıl yürütme |
Flash Lite'ı şu durumlarda seçin:
- Hızlı yanıtlara ihtiyacınız varsa
- Maliyet önemliyse
- İstekler 32 bin jetonun altındaysa
- Kalite gereksinimleri orta düzeydeyse
Flash'ı şu durumlarda seçin:
- Büyük bağlam pencerelerine ihtiyacınız varsa
- Kalite maliyetten daha önemliyse
Pro'yu şu durumlarda seçin:
- Maksimum akıl yürütme yeteneğine ihtiyacınız varsa
- Maliyet bir endişe kaynağı değilse
- Çok büyük belgelerle çalışıyorsanız
Apidog İş Akışlarıyla Entegrasyon
Apidog kullanıcıları, Flash Lite'ı API geliştirme iş akışlarına entegre edebilir:
1. Otomatik Test Senaryoları Oluşturma
Flash Lite'ı API spesifikasyonlarınızdan test senaryoları oluşturmak için kullanın:
def generate_test_cases(endpoint_spec):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Generate comprehensive test cases for this API endpoint:
{json.dumps(endpoint_spec, indent=2)}
Include:
- Happy path tests
- Edge cases
- Error scenarios
- Boundary conditions
Format as JSON array of test cases.
"""
response = model.generate_content(prompt)
return json.loads(response.text)
2. API Yanıtlarını Doğrulama
Yanıtların beklenen şemalarla eşleşip eşleşmediğini kontrol edin:
def validate_response(response_data, expected_schema):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Validate this API response against the schema:
Response: {json.dumps(response_data, indent=2)}
Schema: {json.dumps(expected_schema, indent=2)}
List any mismatches or issues.
"""
response = model.generate_content(
prompt,
generation_config={"thinkingLevel": "low"}
)
return response.text
3. Sahte Veri Oluşturma
Gerçekçi test verileri oluşturun:
def generate_mock_data(schema, count=10):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Generate {count} realistic mock data entries matching this schema:
{json.dumps(schema, indent=2)}
Return as JSON array.
"""
response = model.generate_content(prompt)
return json.loads(response.text)
Sıkça Sorulan Sorular
Gemini 3.1 Flash Lite ücretsiz mi?
İlk 1 milyon giriş jetonu önizleme süresince ücretsizdir. Bundan sonra, milyon giriş jetonu başına 0,25 dolar ve milyon çıkış jetonu başına 1,50 dolar ödersiniz.
Flash Lite diğer modellere göre ne kadar hızlı?
Flash Lite, ilk jetona kadar geçen süre için Gemini 2.5 Flash'tan 2,5 kat daha hızlı ve çıkış hızı için %45 daha hızlıdır. Mevcut en hızlı modellerden biridir.
Flash Lite'ı üretimde kullanabilir miyim?
Evet. "Önizleme" olarak etiketlense de, model üretim kullanımı için yeterince kararlıdır. Latitude, Cartwheel ve Whering gibi erken benimseyenler zaten büyük ölçekte kullanmaktadır.
Bağlam penceresi boyutu nedir?
Flash Lite, 32.000 jetona kadar bağlamı destekler. Bu, çoğu API kullanım durumu için yeterlidir ancak Flash (1 milyon jeton) veya Pro (2 milyon jeton) modellerinden daha küçüktür.
Düşünme seviyeleri nasıl çalışır?
Düşünme seviyeleri, modelin ne kadar işlem uygulayacağını kontrol eder. Düşük hızlı ve basittir. Yüksek daha yavaş ama daha kapsamlıdır. Sınıflandırma için düşük, karmaşık akıl yürütme için yüksek kullanın.
Flash Lite'ı Apidog ile kullanabilir miyim?
Evet. Apidog, Gemini dahil herhangi bir REST API ile çalışır. Daha kolay test, ekip işbirliği ve dokümantasyon için isteklerinizi Apidog'da kurun.
Hız sınırlarını aşarsam ne olur?
429 hatası alırsınız. Üstel geri çekilme deneme mantığı uygulayın veya daha yüksek limitler (dakikada 15 yerine 60 istek) için ücretli katmana yükseltin.
Verilerim modeli eğitmek için kullanılıyor mu?
Google'ın politikasına göre, API istekleri modelleri eğitmek için kullanılmaz. Verileriniz gizli kalır.
Flash Lite'ı ince ayar yapabilir miyim?
Henüz değil. İnce ayar bazı Gemini modelleri için mevcuttur ancak Flash Lite piyasaya sürülürken değildir. Bunun yerine davranışı yönlendirmek için sistem talimatlarını kullanın.
Flash Lite, GPT-4 Turbo ile nasıl karşılaştırılır?
Flash Lite daha hızlı ve daha ucuzdur, ancak GPT-4 Turbo karmaşık görevler için daha güçlü akıl yürütmeye sahiptir. Yüksek hacimli API iş yükleri için Flash Lite maliyet ve hız açısından öne çıkar.
Sonraki Adımlar
Artık Gemini 3.1 Flash Lite'ı kullanmaya başlamak için ihtiyacınız olan her şeye sahipsiniz:
- Google AI Studio'dan API anahtarınızı alın
- SDK'yı yükleyin ve ilk isteğinizi çalıştırın
- Daha kolay geliştirme için Apidog'da test edin
- Hata yönetimini ve tekrar deneme mantığını uygulayın
- Maliyetleri optimize etmek için kullanımı izleyin
Model üretim için hazır. Fiyatlandırma, yapay zekayı büyük ölçekte erişilebilir kılıyor. Hız, kullanıcılarınızı mutlu ediyor.
Geliştirmeye başlayın.
