Gemini 3.1 Flash Lite API'ye Nasıl Erişilir

Google'ın Gemini 3.1 Flash Lite, 3 Mart 2026'da piyasaya sürüldü ve Gemini serisindeki en hızlı, en uygun fiyatlı modeldir. Milyon giriş jetonu başına 0,25 dolar ve milyon çıkış jetonu başına 1,50 dolar fiyatıyla, bütçeyi tüketmeden büyük ölçekte yapay zekaya ihtiyaç duyan geliştiriciler için tasarlanmıştır.

Bu kılavuz, erişim sağlamayı, API anahtarınızı kurmayı ve istek yapmaya başlamayı tam olarak nasıl yapacağınızı gösterir. 10 dakikadan kısa sürede çalışan bir kodunuz olacak.

Özet

Hızlı Kurulum:

Google AI Studio'ya gidin
Bir proje oluşturun ve bir API anahtarı oluşturun
SDK'yı yükleyin: pip install google-generativeai
gemini-3.1-flash-lite modeliyle ilk isteğinizi yapın
Daha kolay hata ayıklama ve ekip işbirliği için Apidog'da test edin

Fiyatlandırma: 1 milyon giriş jetonu başına 0,25 dolar, 1 milyon çıkış jetonu başına 1,50 dolar
Hız: Gemini 2.5 Flash'tan 2,5 kat daha hızlı
Ücretsiz Katman: Önizleme süresince 1 milyon ücretsiz giriş jetonu

Gemini 3.1 Flash Lite Nedir?

Gemini 3.1 Flash Lite, Google'ın yüksek hacimli uygulamalar için tasarlanmış en yeni yapay zeka modelidir. Gemini 2.5 Flash'tan 2,5 kat daha hızlı ve %45 daha hızlı çıkış hızına sahipken, GPQA Diamond'da %86,9 ve MMMU Pro kriterlerinde %76,8 puan almıştır.

Model, istek başına ayarlayabileceğiniz düşünme seviyeleri içerir. Basit görevler için azaltabilir, karmaşık akıl yürütme için artırabilirsiniz. Bu esneklik, farklı iş yüklerini yönetirken maliyetleri optimize etmenizi sağlar.

Bireysel geliştiriciler için Google AI Studio ve kurumsal firmalar için Vertex AI aracılığıyla kullanılabilir.

Önkoşullar

Başlamadan önce şunlara sahip olduğunuzdan emin olun:

Bir Google hesabı
Python 3.7+ veya Node.js 14+ yüklü
REST API'leri hakkında temel bilgi
(İsteğe bağlı) API testi için Apidog yüklü

Adım 1: Bir Google AI Studio Hesabı Oluşturun

Google AI Studio, geliştirme için Gemini modellerine erişmenin en hızlı yoludur.

aistudio.google.com adresine gidin
Google hesabınızla oturum açın
Hizmet şartlarını kabul edin
AI Studio kontrol paneline yönlendirileceksiniz

Arayüz, mevcut modelleri, API kullanımınızı ve hızlı başlangıç şablonlarını gösterir. Flash Lite, model açılır menüsünde gemini-3.1-flash-lite olarak görünür.

Adım 2: API Anahtarınızı Oluşturun

API anahtarları, Gemini API'ye yapılan isteklerin kimliğini doğrulamanızı sağlar.

Sağ üst köşedeki API Anahtarını Al'a tıklayın
Yeni projede API anahtarı oluştur'u seçin (veya mevcut bir projeyi seçin)
Google yeni bir Cloud projesi oluşturur ve anahtarınızı üretir
API anahtarını kopyalayın - AIzaSyXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX gibi görünür
Güvenli bir şekilde saklayın - bir daha göremeyeceksiniz

Güvenlik ipucu: API anahtarlarını asla sürüm kontrolüne kaydetmeyin. Ortam değişkenleri veya sır yönetimi araçlarını kullanın.

Adım 3: SDK'yı Yükleyin

Google, Python ve Node.js için resmi SDK'lar sağlar.

Python

pip install google-generativeai

Node.js

npm install @google/generative-ai

SDK, kimlik doğrulama, istek biçimlendirme ve yanıt ayrıştırma işlemlerini yönetir. İsterseniz doğrudan REST API'yi de kullanabilirsiniz.

Adım 4: İlk İsteğinizi Yapın

Flash Lite'a basit bir komut gönderelim.

Python Örneği

import google.generativeai as genai
import os

# Configure API key
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))

# Initialize the model
model = genai.GenerativeModel('gemini-3.1-flash-lite')

# Generate content
response = model.generate_content('Explain REST APIs in one sentence.')

print(response.text)

Node.js Örneği

const { GoogleGenerativeAI } = require("@google/generative-ai");

// Initialize with API key
const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);

async function run() {
  // Get the model
  const model = genAI.getGenerativeModel({ model: "gemini-3.1-flash-lite" });

  // Generate content
  const result = await model.generateContent("Explain REST APIs in one sentence.");
  const response = await result.response;
  const text = response.text();

  console.log(text);
}

run();

cURL Örneği (REST API)

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-lite:generateContent?key=YOUR_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "contents": [{
      "parts": [{
        "text": "Explain REST APIs in one sentence."
      }]
    }]
  }'

Bu örneklerden herhangi birini çalıştırdığınızda saniyeler içinde bir yanıt alacaksınız. Model, komutunuza yanıt veren net ve özlü metin döndürür.

Adım 5: Apidog ile Test Edin

Apidog, görsel arayüzü, ekip işbirliği ve otomatik dokümantasyon ile API testini kolaylaştırır.

Gemini API için Neden Apidog Kullanmalısınız?

Görsel istek oluşturucu - cURL komutları yazmaya gerek yok
Ortam değişkenleri - Geliştirme/üretim API anahtarları arasında kolayca geçiş yapın
Yanıt doğrulama - Hataları üretime geçmeden yakalayın
Ekip paylaşımı - API koleksiyonlarını ekibinizle paylaşın
Otomatik dokümantasyon - İsteklerinizden belgeler oluşturun

Yanıtı sağ panelde sözdizimi vurgulama, yanıt süresi ve durum koduyla göreceksiniz.

Ortam Değişkeni Olarak Kaydetme

Apidog'da Ortamlar'a gidin
Yeni bir ortam oluşturun (örn. "Gemini Dev")
Değişken ekleyin: GOOGLE_API_KEY = gerçek API anahtarınız
İsteklerinizde {{GOOGLE_API_KEY}} kullanın

Artık isteklerinizi değiştirmeden ortamlar arasında geçiş yapabilirsiniz. Geliştirme, hazırlık ve üretim anahtarlarını yönetmek için mükemmel.

İstek Biçimini Anlama

Gemini API belirli bir JSON yapısı kullanır.

Temel İstek Yapısı

{
  "contents": [{
    "parts": [{
      "text": "Your prompt here"
    }]
  }]
}

Düşünme Seviyeleri ile

{
  "contents": [{
    "parts": [{
      "text": "Generate API documentation for a user authentication endpoint"
    }]
  }],
  "generationConfig": {
    "thinkingLevel": "high"
  }
}

Düşünme seviyeleri: low (düşük), medium (orta), high (yüksek)

Düşük: Hızlı, basit yanıtlar
Orta: Dengeli akıl yürütme
Yüksek: Derinlemesine analiz, karmaşık görevler

Sistem Talimatları ile

{
  "systemInstruction": {
    "parts": [{
      "text": "You are an API documentation expert. Write clear, concise docs."
    }]
  },
  "contents": [{
    "parts": [{
      "text": "Document this endpoint: POST /api/users"
    }]
  }]
}

Sistem talimatları, bir konuşmadaki tüm isteklerde modelin davranışını yönlendirir.

Yanıt Biçimi

API, bu yapıda bir JSON döndürür:

{
  "candidates": [{
    "content": {
      "parts": [{
        "text": "REST APIs are interfaces that let applications communicate over HTTP using standard methods like GET, POST, PUT, and DELETE."
      }],
      "role": "model"
    },
    "finishReason": "STOP",
    "index": 0,
    "safetyRatings": [...]
  }],
  "usageMetadata": {
    "promptTokenCount": 8,
    "candidatesTokenCount": 25,
    "totalTokenCount": 33
  }
}

Anahtar alanlar:

candidates[0].content.parts[0].text - Oluşturulan yanıt
usageMetadata - Faturalandırma için jeton sayıları
finishReason - Oluşturmanın neden durduğu (DUR, MAKS_JETONLAR, GÜVENLİK)

Yaygın Kullanım Durumları

1. API Dokümantasyonu Oluşturma

import google.generativeai as genai

genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')

endpoint_spec = """
POST /api/v1/users
Creates a new user account
Body: { "email": string, "password": string, "name": string }
"""

response = model.generate_content(
    f"Generate comprehensive API documentation for this endpoint:\n{endpoint_spec}",
    generation_config={"thinkingLevel": "medium"}
)

print(response.text)

2. İstek Doğrulama

def validate_api_request(request_body):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Validate this API request body and list any issues:
    {request_body}

    Check for:
    - Missing required fields
    - Invalid data types
    - Security concerns
    """

    response = model.generate_content(prompt)
    return response.text

# Example usage
request = '{"email": "test@example.com", "password": "123"}'
validation_result = validate_api_request(request)
print(validation_result)

3. Hata Mesajı Oluşturma

def generate_user_friendly_error(error_code, technical_message):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Convert this technical error into a user-friendly message:
    Error Code: {error_code}
    Technical: {technical_message}

    Make it clear, actionable, and non-technical.
    """

    response = model.generate_content(
        prompt,
        generation_config={"thinkingLevel": "low"}
    )
    return response.text

# Example
friendly_error = generate_user_friendly_error(
    "AUTH_TOKEN_EXPIRED",
    "JWT token validation failed: exp claim is in the past"
)
print(friendly_error)

Hız Sınırları ve Kotalar

Flash Lite, önizleme süresince cömert sınırlara sahiptir:

Ücretsiz Katman:

1 milyon ücretsiz giriş jetonu
Dakikada 15 istek
Günde 1.500 istek

Ücretli Katman:

1 milyon giriş jetonu başına 0,25 dolar
1 milyon çıkış jetonu başına 1,50 dolar
Dakikada 60 istek
Günlük limit yok

Kullanımınızı Google AI Studio'da Kullanım ve Faturalandırma altında izleyin.

Hata Yönetimi

Yaygın hataları sorunsuz bir şekilde ele alın:

import google.generativeai as genai
from google.api_core import exceptions

genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')

def safe_generate(prompt):
    try:
        response = model.generate_content(prompt)
        return response.text
    except exceptions.ResourceExhausted:
        return "Hız sınırı aşıldı. Bir dakika içinde tekrar deneyin."
    except exceptions.InvalidArgument as e:
        return f"Geçersiz istek: {str(e)}"
    except exceptions.PermissionDenied:
        return "API anahtarı geçersiz veya süresi dolmuş."
    except Exception as e:
        return f"Beklenmeyen hata: {str(e)}"

result = safe_generate("Explain APIs")
print(result)

Yaygın hatalar:

400 Bad Request - Geçersiz JSON veya eksik zorunlu alanlar
401 Unauthorized - Geçersiz API anahtarı
429 Too Many Requests - Hız sınırı aşıldı
500 Internal Server Error - Google'ın sunucularında bir sorun oluştu

Sorun Giderme

"API anahtarı geçerli değil"

Şunları kontrol edin:

API anahtarı doğru kopyalandı mı (fazladan boşluk yok)
API anahtarı Google Cloud Console'da etkinleştirildi mi
Projenizde faturalandırma etkin mi
Doğru ortam değişkeni adı kullanılıyor mu

"Model bulunamadı"

Tam model adını kullandığınızdan emin olun:

# Correct
model = genai.GenerativeModel('gemini-3.1-flash-lite')

# Wrong
model = genai.GenerativeModel('gemini-flash-lite')
model = genai.GenerativeModel('gemini-3.1-flash')

"Hız sınırı aşıldı"

Dakikadaki istek sınırına ulaştınız. Çözümler:

Üstel geri çekilme deneme mantığı ekleyin
Birden fazla istemi tek isteğe gruplandırın
Daha yüksek limitler için ücretli katmana yükseltin
İstek kuyruklandırma uygulayın

Yavaş yanıtlar

Flash Lite hızlıdır, ancak gecikmeler yaşıyorsanız:

Ağ bağlantınızı kontrol edin
Basit görevler için daha düşük düşünme seviyeleri kullanın
Komut uzunluğunu azaltın
Uzun çıktılar için akışlı yanıtları düşünün

Gelişmiş: Akışlı Yanıtlar

Uzun çıktılar için, jetonları oluşturuldukça akış olarak alın:

import google.generativeai as genai

genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')

prompt = "Write a detailed explanation of REST API authentication methods"

response = model.generate_content(prompt, stream=True)

for chunk in response:
    print(chunk.text, end='', flush=True)

Akış, algılanan performansı artırır. Kullanıcılar, yanıtın tamamını beklemek yerine çıktıyı hemen görürler.

Maliyet Optimizasyonu İpuçları

1. Benzer İstekleri Gruplandırma

# Expensive: 3 separate requests
response1 = model.generate_content("Explain GET")
response2 = model.generate_content("Explain POST")
response3 = model.generate_content("Explain PUT")

# Cheaper: 1 combined request
combined_prompt = """
Explain these HTTP methods:
1. GET
2. POST
3. PUT
"""
response = model.generate_content(combined_prompt)

2. Daha Düşük Düşünme Seviyeleri Kullanma

# For simple classification
response = model.generate_content(
    "Is this email spam? 'Buy now!'",
    generation_config={"thinkingLevel": "low"}
)

# For complex analysis
response = model.generate_content(
    "Analyze this API design and suggest improvements...",
    generation_config={"thinkingLevel": "high"}
)

3. Önbellekleme Uygulama

Tekrarlanan sorgular için yanıtları önbelleğe alın. Basit bir bellek içi önbellek, yaygın istekler için maliyetleri %50'den fazla azaltabilir.

4. İstekleri Kısaltma

Gereksiz bağlamı kaldırın:

# Verbose (more tokens)
prompt = "I would like you to please explain to me what REST APIs are and how they work in detail"

# Concise (fewer tokens)
prompt = "Explain REST APIs"

Güvenlik Hususları

1. API Anahtarınızı Koruyun

Ortam değişkenlerinde veya sır yöneticilerinde saklayın
Anahtarları düzenli olarak değiştirin
Geliştirme/hazırlık/üretim için ayrı anahtarlar kullanın
API anahtarlarını asla kaydetmeyin

2. Kullanıcı Girişini Doğrulama

def safe_prompt(user_input):
    # Remove potential injection attempts
    cleaned = user_input.replace("Ignore previous instructions", "")
    cleaned = cleaned[:1000]  # Limit length

    return f"User question: {cleaned}"

3. Hassas Verileri Filtreleme

API'ye hassas bilgi göndermeyin:

import re

def sanitize_for_ai(text):
    # Remove email addresses
    text = re.sub(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', '[EMAIL]', text)
    # Remove phone numbers
    text = re.sub(r'\b\d{3}[-.]?\d{3}[-.]?\d{4}\b', '[PHONE]', text)
    # Remove credit cards
    text = re.sub(r'\b\d{4}[-\s]?\d{4}[-\s]?\d{4}[-\s]?\d{4}\b', '[CARD]', text)
    return text

4. Hız Sınırlaması Uygulama

API anahtarınızı kötüye kullanımdan koruyun:

from collections import defaultdict
import time

class RateLimiter:
    def __init__(self, max_requests=10, window=60):
        self.max_requests = max_requests
        self.window = window
        self.requests = defaultdict(list)

    def allow_request(self, user_id):
        now = time.time()
        # Remove old requests
        self.requests[user_id] = [
            req_time for req_time in self.requests[user_id]
            if now - req_time < self.window
        ]

        if len(self.requests[user_id]) < self.max_requests:
            self.requests[user_id].append(now)
            return True
        return False

limiter = RateLimiter(max_requests=10, window=60)

def generate_with_limit(user_id, prompt):
    if not limiter.allow_request(user_id):
        return "Hız sınırı aşıldı. Lütfen daha sonra tekrar deneyin."

    model = genai.GenerativeModel('gemini-3.1-flash-lite')
    response = model.generate_content(prompt)
    return response.text

Flash Lite'ı Diğer Gemini Modelleriyle Karşılaştırma

Özellik	Flash Lite	Flash	Pro
Giriş Fiyatı	$0.25/1M	$0.50/1M	$1.25/1M
Çıkış Fiyatı	$1.50/1M	$3.00/1M	$7.50/1M
Hız	2,5 Kat Daha Hızlı	Hızlı	Standart
Bağlam Penceresi	32K jeton	1M jeton	2M jeton
En İyi Kullanım	Yüksek hacimli, maliyet hassas	Dengeli	Karmaşık akıl yürütme

Flash Lite'ı şu durumlarda seçin:

Hızlı yanıtlara ihtiyacınız varsa
Maliyet önemliyse
İstekler 32 bin jetonun altındaysa
Kalite gereksinimleri orta düzeydeyse

Flash'ı şu durumlarda seçin:

Büyük bağlam pencerelerine ihtiyacınız varsa
Kalite maliyetten daha önemliyse

Pro'yu şu durumlarda seçin:

Maksimum akıl yürütme yeteneğine ihtiyacınız varsa
Maliyet bir endişe kaynağı değilse
Çok büyük belgelerle çalışıyorsanız

Apidog İş Akışlarıyla Entegrasyon

Apidog kullanıcıları, Flash Lite'ı API geliştirme iş akışlarına entegre edebilir:

1. Otomatik Test Senaryoları Oluşturma

Flash Lite'ı API spesifikasyonlarınızdan test senaryoları oluşturmak için kullanın:

def generate_test_cases(endpoint_spec):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Generate comprehensive test cases for this API endpoint:
    {json.dumps(endpoint_spec, indent=2)}

    Include:
    - Happy path tests
    - Edge cases
    - Error scenarios
    - Boundary conditions

    Format as JSON array of test cases.
    """

    response = model.generate_content(prompt)
    return json.loads(response.text)

2. API Yanıtlarını Doğrulama

Yanıtların beklenen şemalarla eşleşip eşleşmediğini kontrol edin:

def validate_response(response_data, expected_schema):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Validate this API response against the schema:

    Response: {json.dumps(response_data, indent=2)}
    Schema: {json.dumps(expected_schema, indent=2)}

    List any mismatches or issues.
    """

    response = model.generate_content(
        prompt,
        generation_config={"thinkingLevel": "low"}
    )
    return response.text

3. Sahte Veri Oluşturma

Gerçekçi test verileri oluşturun:

def generate_mock_data(schema, count=10):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Generate {count} realistic mock data entries matching this schema:
    {json.dumps(schema, indent=2)}

    Return as JSON array.
    """

    response = model.generate_content(prompt)
    return json.loads(response.text)

Sıkça Sorulan Sorular

Gemini 3.1 Flash Lite ücretsiz mi?

İlk 1 milyon giriş jetonu önizleme süresince ücretsizdir. Bundan sonra, milyon giriş jetonu başına 0,25 dolar ve milyon çıkış jetonu başına 1,50 dolar ödersiniz.

Flash Lite diğer modellere göre ne kadar hızlı?

Flash Lite, ilk jetona kadar geçen süre için Gemini 2.5 Flash'tan 2,5 kat daha hızlı ve çıkış hızı için %45 daha hızlıdır. Mevcut en hızlı modellerden biridir.

Flash Lite'ı üretimde kullanabilir miyim?

Evet. "Önizleme" olarak etiketlense de, model üretim kullanımı için yeterince kararlıdır. Latitude, Cartwheel ve Whering gibi erken benimseyenler zaten büyük ölçekte kullanmaktadır.

Bağlam penceresi boyutu nedir?

Flash Lite, 32.000 jetona kadar bağlamı destekler. Bu, çoğu API kullanım durumu için yeterlidir ancak Flash (1 milyon jeton) veya Pro (2 milyon jeton) modellerinden daha küçüktür.

Düşünme seviyeleri nasıl çalışır?

Düşünme seviyeleri, modelin ne kadar işlem uygulayacağını kontrol eder. Düşük hızlı ve basittir. Yüksek daha yavaş ama daha kapsamlıdır. Sınıflandırma için düşük, karmaşık akıl yürütme için yüksek kullanın.

Flash Lite'ı Apidog ile kullanabilir miyim?

Evet. Apidog, Gemini dahil herhangi bir REST API ile çalışır. Daha kolay test, ekip işbirliği ve dokümantasyon için isteklerinizi Apidog'da kurun.

Hız sınırlarını aşarsam ne olur?

429 hatası alırsınız. Üstel geri çekilme deneme mantığı uygulayın veya daha yüksek limitler (dakikada 15 yerine 60 istek) için ücretli katmana yükseltin.

Verilerim modeli eğitmek için kullanılıyor mu?

Google'ın politikasına göre, API istekleri modelleri eğitmek için kullanılmaz. Verileriniz gizli kalır.

Flash Lite'ı ince ayar yapabilir miyim?

Henüz değil. İnce ayar bazı Gemini modelleri için mevcuttur ancak Flash Lite piyasaya sürülürken değildir. Bunun yerine davranışı yönlendirmek için sistem talimatlarını kullanın.

Flash Lite, GPT-4 Turbo ile nasıl karşılaştırılır?

Flash Lite daha hızlı ve daha ucuzdur, ancak GPT-4 Turbo karmaşık görevler için daha güçlü akıl yürütmeye sahiptir. Yüksek hacimli API iş yükleri için Flash Lite maliyet ve hız açısından öne çıkar.

Sonraki Adımlar

Artık Gemini 3.1 Flash Lite'ı kullanmaya başlamak için ihtiyacınız olan her şeye sahipsiniz:

Google AI Studio'dan API anahtarınızı alın
SDK'yı yükleyin ve ilk isteğinizi çalıştırın
Daha kolay geliştirme için Apidog'da test edin
Hata yönetimini ve tekrar deneme mantığını uygulayın
Maliyetleri optimize etmek için kullanımı izleyin

Model üretim için hazır. Fiyatlandırma, yapay zekayı büyük ölçekte erişilebilir kılıyor. Hız, kullanıcılarınızı mutlu ediyor.

Geliştirmeye başlayın.

Uygulamayı İndir