Gemini 3.1 Flash Lite API'ye Nasıl Erişilir

Ashley Innocent

Ashley Innocent

4 March 2026

Gemini 3.1 Flash Lite API'ye Nasıl Erişilir

Kurumsal İçin Apidog

Şirket İçi (On-Premises) Dağıtım

SSO ve RBAC

SOC 2 Uyumlu

Apidog Enterprise'ı Keşfedin

Google'ın Gemini 3.1 Flash Lite, 3 Mart 2026'da piyasaya sürüldü ve Gemini serisindeki en hızlı, en uygun fiyatlı modeldir. Milyon giriş jetonu başına 0,25 dolar ve milyon çıkış jetonu başına 1,50 dolar fiyatıyla, bütçeyi tüketmeden büyük ölçekte yapay zekaya ihtiyaç duyan geliştiriciler için tasarlanmıştır.

Bu kılavuz, erişim sağlamayı, API anahtarınızı kurmayı ve istek yapmaya başlamayı tam olarak nasıl yapacağınızı gösterir. 10 dakikadan kısa sürede çalışan bir kodunuz olacak.

Özet

Hızlı Kurulum:

  1. Google AI Studio'ya gidin
  2. Bir proje oluşturun ve bir API anahtarı oluşturun
  3. SDK'yı yükleyin: pip install google-generativeai
  4. gemini-3.1-flash-lite modeliyle ilk isteğinizi yapın
  5. Daha kolay hata ayıklama ve ekip işbirliği için Apidog'da test edin

Fiyatlandırma: 1 milyon giriş jetonu başına 0,25 dolar, 1 milyon çıkış jetonu başına 1,50 dolar
Hız: Gemini 2.5 Flash'tan 2,5 kat daha hızlı
Ücretsiz Katman: Önizleme süresince 1 milyon ücretsiz giriş jetonu

Gemini 3.1 Flash Lite Nedir?

Gemini 3.1 Flash Lite, Google'ın yüksek hacimli uygulamalar için tasarlanmış en yeni yapay zeka modelidir. Gemini 2.5 Flash'tan 2,5 kat daha hızlı ve %45 daha hızlı çıkış hızına sahipken, GPQA Diamond'da %86,9 ve MMMU Pro kriterlerinde %76,8 puan almıştır.

Model, istek başına ayarlayabileceğiniz düşünme seviyeleri içerir. Basit görevler için azaltabilir, karmaşık akıl yürütme için artırabilirsiniz. Bu esneklik, farklı iş yüklerini yönetirken maliyetleri optimize etmenizi sağlar.

Bireysel geliştiriciler için Google AI Studio ve kurumsal firmalar için Vertex AI aracılığıyla kullanılabilir.

Önkoşullar

Başlamadan önce şunlara sahip olduğunuzdan emin olun:

Adım 1: Bir Google AI Studio Hesabı Oluşturun

Google AI Studio, geliştirme için Gemini modellerine erişmenin en hızlı yoludur.

  1. aistudio.google.com adresine gidin
  2. Google hesabınızla oturum açın
  3. Hizmet şartlarını kabul edin
  4. AI Studio kontrol paneline yönlendirileceksiniz

Arayüz, mevcut modelleri, API kullanımınızı ve hızlı başlangıç şablonlarını gösterir. Flash Lite, model açılır menüsünde gemini-3.1-flash-lite olarak görünür.

Adım 2: API Anahtarınızı Oluşturun

API anahtarları, Gemini API'ye yapılan isteklerin kimliğini doğrulamanızı sağlar.

  1. Sağ üst köşedeki API Anahtarını Al'a tıklayın
  2. Yeni projede API anahtarı oluştur'u seçin (veya mevcut bir projeyi seçin)
  3. Google yeni bir Cloud projesi oluşturur ve anahtarınızı üretir
  4. API anahtarını kopyalayın - AIzaSyXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX gibi görünür
  5. Güvenli bir şekilde saklayın - bir daha göremeyeceksiniz

Güvenlik ipucu: API anahtarlarını asla sürüm kontrolüne kaydetmeyin. Ortam değişkenleri veya sır yönetimi araçlarını kullanın.

Adım 3: SDK'yı Yükleyin

Google, Python ve Node.js için resmi SDK'lar sağlar.

Python

pip install google-generativeai

Node.js

npm install @google/generative-ai

SDK, kimlik doğrulama, istek biçimlendirme ve yanıt ayrıştırma işlemlerini yönetir. İsterseniz doğrudan REST API'yi de kullanabilirsiniz.

Adım 4: İlk İsteğinizi Yapın

Flash Lite'a basit bir komut gönderelim.

Python Örneği

import google.generativeai as genai
import os

# Configure API key
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))

# Initialize the model
model = genai.GenerativeModel('gemini-3.1-flash-lite')

# Generate content
response = model.generate_content('Explain REST APIs in one sentence.')

print(response.text)

Node.js Örneği

const { GoogleGenerativeAI } = require("@google/generative-ai");

// Initialize with API key
const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);

async function run() {
  // Get the model
  const model = genAI.getGenerativeModel({ model: "gemini-3.1-flash-lite" });

  // Generate content
  const result = await model.generateContent("Explain REST APIs in one sentence.");
  const response = await result.response;
  const text = response.text();

  console.log(text);
}

run();

cURL Örneği (REST API)

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-lite:generateContent?key=YOUR_API_KEY" \
  -H 'Content-Type: application/json' \
  -d '{
    "contents": [{
      "parts": [{
        "text": "Explain REST APIs in one sentence."
      }]
    }]
  }'

Bu örneklerden herhangi birini çalıştırdığınızda saniyeler içinde bir yanıt alacaksınız. Model, komutunuza yanıt veren net ve özlü metin döndürür.

Adım 5: Apidog ile Test Edin

Apidog, görsel arayüzü, ekip işbirliği ve otomatik dokümantasyon ile API testini kolaylaştırır.

Gemini API için Neden Apidog Kullanmalısınız?

Yanıtı sağ panelde sözdizimi vurgulama, yanıt süresi ve durum koduyla göreceksiniz.

Ortam Değişkeni Olarak Kaydetme

  1. Apidog'da Ortamlar'a gidin
  2. Yeni bir ortam oluşturun (örn. "Gemini Dev")
  3. Değişken ekleyin: GOOGLE_API_KEY = gerçek API anahtarınız
  4. İsteklerinizde {{GOOGLE_API_KEY}} kullanın

Artık isteklerinizi değiştirmeden ortamlar arasında geçiş yapabilirsiniz. Geliştirme, hazırlık ve üretim anahtarlarını yönetmek için mükemmel.

İstek Biçimini Anlama

Gemini API belirli bir JSON yapısı kullanır.

Temel İstek Yapısı

{
  "contents": [{
    "parts": [{
      "text": "Your prompt here"
    }]
  }]
}

Düşünme Seviyeleri ile

{
  "contents": [{
    "parts": [{
      "text": "Generate API documentation for a user authentication endpoint"
    }]
  }],
  "generationConfig": {
    "thinkingLevel": "high"
  }
}

Düşünme seviyeleri: low (düşük), medium (orta), high (yüksek)

Sistem Talimatları ile

{
  "systemInstruction": {
    "parts": [{
      "text": "You are an API documentation expert. Write clear, concise docs."
    }]
  },
  "contents": [{
    "parts": [{
      "text": "Document this endpoint: POST /api/users"
    }]
  }]
}

Sistem talimatları, bir konuşmadaki tüm isteklerde modelin davranışını yönlendirir.

Yanıt Biçimi

API, bu yapıda bir JSON döndürür:

{
  "candidates": [{
    "content": {
      "parts": [{
        "text": "REST APIs are interfaces that let applications communicate over HTTP using standard methods like GET, POST, PUT, and DELETE."
      }],
      "role": "model"
    },
    "finishReason": "STOP",
    "index": 0,
    "safetyRatings": [...]
  }],
  "usageMetadata": {
    "promptTokenCount": 8,
    "candidatesTokenCount": 25,
    "totalTokenCount": 33
  }
}

Anahtar alanlar:

Yaygın Kullanım Durumları

1. API Dokümantasyonu Oluşturma

import google.generativeai as genai

genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')

endpoint_spec = """
POST /api/v1/users
Creates a new user account
Body: { "email": string, "password": string, "name": string }
"""

response = model.generate_content(
    f"Generate comprehensive API documentation for this endpoint:\n{endpoint_spec}",
    generation_config={"thinkingLevel": "medium"}
)

print(response.text)

2. İstek Doğrulama

def validate_api_request(request_body):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Validate this API request body and list any issues:
    {request_body}

    Check for:
    - Missing required fields
    - Invalid data types
    - Security concerns
    """

    response = model.generate_content(prompt)
    return response.text

# Example usage
request = '{"email": "test@example.com", "password": "123"}'
validation_result = validate_api_request(request)
print(validation_result)

3. Hata Mesajı Oluşturma

def generate_user_friendly_error(error_code, technical_message):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Convert this technical error into a user-friendly message:
    Error Code: {error_code}
    Technical: {technical_message}

    Make it clear, actionable, and non-technical.
    """

    response = model.generate_content(
        prompt,
        generation_config={"thinkingLevel": "low"}
    )
    return response.text

# Example
friendly_error = generate_user_friendly_error(
    "AUTH_TOKEN_EXPIRED",
    "JWT token validation failed: exp claim is in the past"
)
print(friendly_error)

Hız Sınırları ve Kotalar

Flash Lite, önizleme süresince cömert sınırlara sahiptir:

Ücretsiz Katman:

Ücretli Katman:

Kullanımınızı Google AI Studio'da Kullanım ve Faturalandırma altında izleyin.

Hata Yönetimi

Yaygın hataları sorunsuz bir şekilde ele alın:

import google.generativeai as genai
from google.api_core import exceptions

genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')

def safe_generate(prompt):
    try:
        response = model.generate_content(prompt)
        return response.text
    except exceptions.ResourceExhausted:
        return "Hız sınırı aşıldı. Bir dakika içinde tekrar deneyin."
    except exceptions.InvalidArgument as e:
        return f"Geçersiz istek: {str(e)}"
    except exceptions.PermissionDenied:
        return "API anahtarı geçersiz veya süresi dolmuş."
    except Exception as e:
        return f"Beklenmeyen hata: {str(e)}"

result = safe_generate("Explain APIs")
print(result)

Yaygın hatalar:

Sorun Giderme

"API anahtarı geçerli değil"

Şunları kontrol edin:

  1. API anahtarı doğru kopyalandı mı (fazladan boşluk yok)
  2. API anahtarı Google Cloud Console'da etkinleştirildi mi
  3. Projenizde faturalandırma etkin mi
  4. Doğru ortam değişkeni adı kullanılıyor mu

"Model bulunamadı"

Tam model adını kullandığınızdan emin olun:

# Correct
model = genai.GenerativeModel('gemini-3.1-flash-lite')

# Wrong
model = genai.GenerativeModel('gemini-flash-lite')
model = genai.GenerativeModel('gemini-3.1-flash')

"Hız sınırı aşıldı"

Dakikadaki istek sınırına ulaştınız. Çözümler:

  1. Üstel geri çekilme deneme mantığı ekleyin
  2. Birden fazla istemi tek isteğe gruplandırın
  3. Daha yüksek limitler için ücretli katmana yükseltin
  4. İstek kuyruklandırma uygulayın

Yavaş yanıtlar

Flash Lite hızlıdır, ancak gecikmeler yaşıyorsanız:

  1. Ağ bağlantınızı kontrol edin
  2. Basit görevler için daha düşük düşünme seviyeleri kullanın
  3. Komut uzunluğunu azaltın
  4. Uzun çıktılar için akışlı yanıtları düşünün

Gelişmiş: Akışlı Yanıtlar

Uzun çıktılar için, jetonları oluşturuldukça akış olarak alın:

import google.generativeai as genai

genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')

prompt = "Write a detailed explanation of REST API authentication methods"

response = model.generate_content(prompt, stream=True)

for chunk in response:
    print(chunk.text, end='', flush=True)

Akış, algılanan performansı artırır. Kullanıcılar, yanıtın tamamını beklemek yerine çıktıyı hemen görürler.

Maliyet Optimizasyonu İpuçları

1. Benzer İstekleri Gruplandırma

# Expensive: 3 separate requests
response1 = model.generate_content("Explain GET")
response2 = model.generate_content("Explain POST")
response3 = model.generate_content("Explain PUT")

# Cheaper: 1 combined request
combined_prompt = """
Explain these HTTP methods:
1. GET
2. POST
3. PUT
"""
response = model.generate_content(combined_prompt)

2. Daha Düşük Düşünme Seviyeleri Kullanma

# For simple classification
response = model.generate_content(
    "Is this email spam? 'Buy now!'",
    generation_config={"thinkingLevel": "low"}
)

# For complex analysis
response = model.generate_content(
    "Analyze this API design and suggest improvements...",
    generation_config={"thinkingLevel": "high"}
)

3. Önbellekleme Uygulama

Tekrarlanan sorgular için yanıtları önbelleğe alın. Basit bir bellek içi önbellek, yaygın istekler için maliyetleri %50'den fazla azaltabilir.

4. İstekleri Kısaltma

Gereksiz bağlamı kaldırın:

# Verbose (more tokens)
prompt = "I would like you to please explain to me what REST APIs are and how they work in detail"

# Concise (fewer tokens)
prompt = "Explain REST APIs"

Güvenlik Hususları

1. API Anahtarınızı Koruyun

2. Kullanıcı Girişini Doğrulama

def safe_prompt(user_input):
    # Remove potential injection attempts
    cleaned = user_input.replace("Ignore previous instructions", "")
    cleaned = cleaned[:1000]  # Limit length

    return f"User question: {cleaned}"

3. Hassas Verileri Filtreleme

API'ye hassas bilgi göndermeyin:

import re

def sanitize_for_ai(text):
    # Remove email addresses
    text = re.sub(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', '[EMAIL]', text)
    # Remove phone numbers
    text = re.sub(r'\b\d{3}[-.]?\d{3}[-.]?\d{4}\b', '[PHONE]', text)
    # Remove credit cards
    text = re.sub(r'\b\d{4}[-\s]?\d{4}[-\s]?\d{4}[-\s]?\d{4}\b', '[CARD]', text)
    return text

4. Hız Sınırlaması Uygulama

API anahtarınızı kötüye kullanımdan koruyun:

from collections import defaultdict
import time

class RateLimiter:
    def __init__(self, max_requests=10, window=60):
        self.max_requests = max_requests
        self.window = window
        self.requests = defaultdict(list)

    def allow_request(self, user_id):
        now = time.time()
        # Remove old requests
        self.requests[user_id] = [
            req_time for req_time in self.requests[user_id]
            if now - req_time < self.window
        ]

        if len(self.requests[user_id]) < self.max_requests:
            self.requests[user_id].append(now)
            return True
        return False

limiter = RateLimiter(max_requests=10, window=60)

def generate_with_limit(user_id, prompt):
    if not limiter.allow_request(user_id):
        return "Hız sınırı aşıldı. Lütfen daha sonra tekrar deneyin."

    model = genai.GenerativeModel('gemini-3.1-flash-lite')
    response = model.generate_content(prompt)
    return response.text

Flash Lite'ı Diğer Gemini Modelleriyle Karşılaştırma

Özellik Flash Lite Flash Pro
Giriş Fiyatı $0.25/1M $0.50/1M $1.25/1M
Çıkış Fiyatı $1.50/1M $3.00/1M $7.50/1M
Hız 2,5 Kat Daha Hızlı Hızlı Standart
Bağlam Penceresi 32K jeton 1M jeton 2M jeton
En İyi Kullanım Yüksek hacimli, maliyet hassas Dengeli Karmaşık akıl yürütme

Flash Lite'ı şu durumlarda seçin:

Flash'ı şu durumlarda seçin:

Pro'yu şu durumlarda seçin:

Apidog İş Akışlarıyla Entegrasyon

Apidog kullanıcıları, Flash Lite'ı API geliştirme iş akışlarına entegre edebilir:

1. Otomatik Test Senaryoları Oluşturma

Flash Lite'ı API spesifikasyonlarınızdan test senaryoları oluşturmak için kullanın:

def generate_test_cases(endpoint_spec):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Generate comprehensive test cases for this API endpoint:
    {json.dumps(endpoint_spec, indent=2)}

    Include:
    - Happy path tests
    - Edge cases
    - Error scenarios
    - Boundary conditions

    Format as JSON array of test cases.
    """

    response = model.generate_content(prompt)
    return json.loads(response.text)

2. API Yanıtlarını Doğrulama

Yanıtların beklenen şemalarla eşleşip eşleşmediğini kontrol edin:

def validate_response(response_data, expected_schema):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Validate this API response against the schema:

    Response: {json.dumps(response_data, indent=2)}
    Schema: {json.dumps(expected_schema, indent=2)}

    List any mismatches or issues.
    """

    response = model.generate_content(
        prompt,
        generation_config={"thinkingLevel": "low"}
    )
    return response.text

3. Sahte Veri Oluşturma

Gerçekçi test verileri oluşturun:

def generate_mock_data(schema, count=10):
    model = genai.GenerativeModel('gemini-3.1-flash-lite')

    prompt = f"""
    Generate {count} realistic mock data entries matching this schema:
    {json.dumps(schema, indent=2)}

    Return as JSON array.
    """

    response = model.generate_content(prompt)
    return json.loads(response.text)

Sıkça Sorulan Sorular

Gemini 3.1 Flash Lite ücretsiz mi?

İlk 1 milyon giriş jetonu önizleme süresince ücretsizdir. Bundan sonra, milyon giriş jetonu başına 0,25 dolar ve milyon çıkış jetonu başına 1,50 dolar ödersiniz.

Flash Lite diğer modellere göre ne kadar hızlı?

Flash Lite, ilk jetona kadar geçen süre için Gemini 2.5 Flash'tan 2,5 kat daha hızlı ve çıkış hızı için %45 daha hızlıdır. Mevcut en hızlı modellerden biridir.

Flash Lite'ı üretimde kullanabilir miyim?

Evet. "Önizleme" olarak etiketlense de, model üretim kullanımı için yeterince kararlıdır. Latitude, Cartwheel ve Whering gibi erken benimseyenler zaten büyük ölçekte kullanmaktadır.

Bağlam penceresi boyutu nedir?

Flash Lite, 32.000 jetona kadar bağlamı destekler. Bu, çoğu API kullanım durumu için yeterlidir ancak Flash (1 milyon jeton) veya Pro (2 milyon jeton) modellerinden daha küçüktür.

Düşünme seviyeleri nasıl çalışır?

Düşünme seviyeleri, modelin ne kadar işlem uygulayacağını kontrol eder. Düşük hızlı ve basittir. Yüksek daha yavaş ama daha kapsamlıdır. Sınıflandırma için düşük, karmaşık akıl yürütme için yüksek kullanın.

Flash Lite'ı Apidog ile kullanabilir miyim?

Evet. Apidog, Gemini dahil herhangi bir REST API ile çalışır. Daha kolay test, ekip işbirliği ve dokümantasyon için isteklerinizi Apidog'da kurun.

Hız sınırlarını aşarsam ne olur?

429 hatası alırsınız. Üstel geri çekilme deneme mantığı uygulayın veya daha yüksek limitler (dakikada 15 yerine 60 istek) için ücretli katmana yükseltin.

Verilerim modeli eğitmek için kullanılıyor mu?

Google'ın politikasına göre, API istekleri modelleri eğitmek için kullanılmaz. Verileriniz gizli kalır.

Flash Lite'ı ince ayar yapabilir miyim?

Henüz değil. İnce ayar bazı Gemini modelleri için mevcuttur ancak Flash Lite piyasaya sürülürken değildir. Bunun yerine davranışı yönlendirmek için sistem talimatlarını kullanın.

Flash Lite, GPT-4 Turbo ile nasıl karşılaştırılır?

Flash Lite daha hızlı ve daha ucuzdur, ancak GPT-4 Turbo karmaşık görevler için daha güçlü akıl yürütmeye sahiptir. Yüksek hacimli API iş yükleri için Flash Lite maliyet ve hız açısından öne çıkar.

Sonraki Adımlar

Artık Gemini 3.1 Flash Lite'ı kullanmaya başlamak için ihtiyacınız olan her şeye sahipsiniz:

  1. Google AI Studio'dan API anahtarınızı alın
  2. SDK'yı yükleyin ve ilk isteğinizi çalıştırın
  3. Daha kolay geliştirme için Apidog'da test edin
  4. Hata yönetimini ve tekrar deneme mantığını uygulayın
  5. Maliyetleri optimize etmek için kullanımı izleyin

Model üretim için hazır. Fiyatlandırma, yapay zekayı büyük ölçekte erişilebilir kılıyor. Hız, kullanıcılarınızı mutlu ediyor.

Geliştirmeye başlayın.

Uygulamayı İndir

API Tasarım-Öncelikli Yaklaşımı Apidog'da Uygulayın

API'leri oluşturmanın ve kullanmanın daha kolay yolunu keşfedin