Son teknolojiye sahip dil ve çok modlu modellere erişim genellikle önemli hesaplama ve finansal kaynaklar gerektirir. Ancak, kullanıcıları yüzlerce yapay zeka modeline bağlayan birleşik bir API ağ geçidi olan OpenRouter, ücretsiz, yüksek kaliteli modellerden oluşan etkileyici bir seçki sunarak, güçlü yetenekleri maliyet engelleri olmadan sunar. Bu makale, OpenRouter'da bulunan en iyi 13 ücretsiz yapay zeka modelinin mimarilerini, parametre dağılımlarını, bağlam yönetimini ve performans özelliklerini analiz ederek teknik bir incelemesini sunmaktadır.
OpenRouter Nedir?
OpenRouter, büyük dil modelleri (LLM'ler) için birleşik bir çıkarım API'si olarak işlev görerek, birden fazla sağlayıcıdan tek bir uç nokta aracılığıyla modellere standartlaştırılmış erişim sağlar. Birkaç teknik avantaj sunar:
- API Normalizasyonu: Çeşitli sağlayıcıya özel API formatlarını standartlaştırılmış bir OpenAI uyumlu arayüzüne dönüştürür
- Akıllı Yönlendirme: Model kullanılabilirliğine ve istek parametrelerine göre istekleri dinamik olarak uygun arka uçlara yönlendirir
- Hata Toleransı: Hizmet sürekliliğini korumak için otomatik yedekleme mekanizmaları uygular
- Çok Modlu Destek: Desteklenen modellerde hem metin hem de görüntü girdilerini işler
- Bağlam Uzunluğu Optimizasyonu: Etkili bağlam kullanımını en üst düzeye çıkarmak için token pencerelerini verimli bir şekilde yönetir
Şimdi, platformda bulunan her bir ücretsiz modelin teknik özelliklerini ve yeteneklerini inceleyelim.
1. meta-llama/llama-4-maverick:free
Mimari: Seyrek aktivasyonlu Uzmanlar Karışımı (MoE) Parametreler: Toplam 400B, ileri geçiş başına 17B aktif (128 uzman) Bağlam Uzunluğu: 256.000 token (1 milyon token teorik maksimum) Yayınlanma Tarihi: 5 Nisan 2025 Modlar: Metin + Görüntü → Metin
Llama 4 Maverick, Meta'nın seyrek uzmanlar karışımı mimarisinin gelişmiş bir uygulamasını temsil eder ve çıkarım sırasında toplam parametrelerinin yalnızca %4,25'ini etkinleştirir. Bu seyrek aktivasyon deseni, model kapasitesini korurken hesaplama verimliliği sağlar.
Teknik Özellikler:
- Çok modlu işleme için birleşik metin-görüntü temsili ile erken füzyon uygular
- 128 mevcut uzmandan token başına 2 uzman seçmek için top-k geçitleme ile bir yönlendirme ağı kullanır
- Verimli dönüştürücü uygulaması için gruplandırılmış sorgu dikkat mekanizmaları kullanır
- Eğitim külliyatı: ~22 trilyon token, hassasiyet ağırlıklı örnekleme ile
- Verimli kelime dağarcığı kodlaması ile 12 dilde yerel çok dilli destek
- Görüş kodlayıcı: Yama boyutu optimizasyonu ile 2,5B parametreli özel ViT
Karşılaştırma Performansı:
- MMLU: %86,3
- GSM8K: %92,1
- HumanEval: %88,5
- MMMU: %73,2
Teknik Kullanım Alanları: Çok modlu akıl yürütme, görsel talimat takibi, çapraz modlu çıkarım görevleri, karmaşık sembolik akıl yürütme ve yüksek verimli API dağıtımları.
2. https://openrouter.ai/meta-llama/llama-4-scout:free
Mimari: Optimize edilmiş yönlendirmeli Uzmanlar Karışımı (MoE) Parametreler: Toplam 109B, ileri geçiş başına 17B aktif (16 uzman) Bağlam Uzunluğu: 512.000 token (10 milyon teorik maksimum) Yayınlanma Tarihi: 5 Nisan 2025 Modlar: Metin + Görüntü → Metin
Scout, Maverick ile aynı aktif parametre sayısını korurken daha az uzman kullanan, Llama 4 mimarisinin daha dağıtım için optimize edilmiş bir varyantını temsil eder.
Teknik Özellikler:
- Optimize edilmiş uzman kullanımı ile azaltılmış uzman sayısı (16 vs. 128)
- Uzman başına artırılmış parametrelerle geliştirilmiş uzman kapasitesi
- Maverick'ten özel bilgi damıtma teknikleri kullanır
- Eğitim külliyatı: Alan uyarlamalı ön eğitim ile ~40 trilyon token
- Bellek verimli çıkarım için flash attention-2 uygular
- Genişletilmiş bağlam yönetimi için döndürme tabanlı konum gömme
- Talimat takibi için düşük sıralı uyarlama ince ayarı
Karşılaştırma Performansı:
- MMLU: %82,7
- GSM8K: %89,4
- HumanEval: %84,9
- MMMU: %68,1
Teknik Kullanım Alanları: Tüketici donanımlarında verimli dağıtımlar, kenar bilişim senaryoları, bellek kısıtlamaları ile yüksek bağlam uzunluğu işleme ve çok örnekli paralelleştirme.
3. https://openrouter.ai/moonshotai/kimi-vl-a3b-thinking:free
Mimari: Özel görsel akıl yürütmeli hafif MoE Parametreler: Toplam 16B, adım başına 2,8B aktif Bağlam Uzunluğu: 131.072 token Yayınlanma Tarihi: 10 Nisan 2025 Modlar: Metin + Görüntü → Metin
Kimi-VL-A3B-Thinking, minimum parametre aktivasyonu ile güçlü performans sunan, verimlilik için optimize edilmiş çok modlu modellemede teknik bir başarıyı temsil eder.
Teknik Özellikler:
- Yüksek seçici uzman aktivasyonlu ultra seyrek MoE mimarisi
- Ön eğitim hedeflerine entegre edilmiş düşünce zinciri istemi
- Akıl yürütme adımları için tercih modellemesi ile RLHF optimizasyonu
- MoonViT kodlayıcı: Aşamalı örnekleme ile verimli görsel kodlayıcı
- Matematiksel akıl yürütme için tekniğe özel istem ayarlama uygular
- %60'a kadar azaltılmış bellek ayak izi için ileri geçiş optimizasyonu
- Çıkarım optimizasyonu için 8 bit nicemleme desteği
Karşılaştırma Performansı:
- MathVision: %76,2 (7B yoğun modellerin performansıyla eşleşir)
- MMMU: %64,8
- MathVista: %72,3
- VQAv2: %79,1
Teknik Kullanım Alanları: Kaynak kısıtlı görsel akıl yürütme, görsel girdilerle matematiksel problem çözme, verimli çok modlu dağıtım ve görsel anlayış gerektiren kenar yapay zeka uygulamaları.
4. https://openrouter.ai/nvidia/llama-3.1-nemotron-nano-8b-v1:free
Mimari: NVIDIA optimizasyonlu değiştirilmiş dönüştürücü Parametreler: 8B Bağlam Uzunluğu: 8.192 token Modlar: Metin → Metin
NVIDIA'nın katkısı, Nemotron çerçevelerinden özel optimizasyonlarla Llama 3.1 mimarisinden yararlanır.
Teknik Özellikler:
- Tensör paralelliği için NeMo çerçeve optimizasyonu
- Geliştirilmiş verim için özel dikkat uygulaması
- FlashAttention entegre hesaplama yolları
- Özel veri filtreleme ve yinelenenleri kaldırma ile eğitim
- NVIDIA'ya özel çok düğümlü dağıtılmış eğitim optimizasyonları
- Dağıtım verimliliği için 4 bit AWQ nicemleme desteği
- Çoklu GPU çıkarımı için tensör paralelliği desteği
Karşılaştırma Performansı:
- MMLU: %68,7
- GSM8K: %72,9
- HumanEval: %65,3
- BBH: %59,8
Teknik Kullanım Alanları: NVIDIA için optimize edilmiş çıkarım ortamları, verimli tensör paralelliği gerektiren uygulamalar, nicemlemeye uygun dağıtımlar ve boyut ile performans arasında denge gerektiren senaryolar.
5. https://openrouter.ai/google/gemini-2.5-pro-exp-03-25:free
Mimari: Tekrarlayan bellek mekanizmalarına sahip dönüştürücü tabanlı mimari Parametreler: Açıklanmadı (yaklaşık 300B-500B) Bağlam Uzunluğu: 1.000.000 token Yayınlanma Tarihi: 25 Mart 2025 Modlar: Metin + Görüntü → Metin
Gemini 2.5 Pro Experimental, Google'ın gelişmiş akıl yürütme yetenekleriyle büyük ölçekli dil modellemesindeki en son gelişmelerini uygular.
Teknik Özellikler:
- Ara düşünce adımı üretimi ile yinelemeli akıl yürütme uygular
- Uzun menzilli bağımlılık modellemesi için yapılandırılmış tekrarlama kullanır
- Milyon token bağlamları için bellek verimli dikkat mekanizmaları
- Hiyerarşik algı modellemesi ile çok modlu füzyon
- Verimli model paralelliği için Google'ın Pathways sistemi kullanılarak eğitilmiştir
- Hizalama için Anayasal Yapay Zeka yaklaşımlarını içerir
- Verimli sıra modellemesi için durum uzayı modeli bileşenleri
Karşılaştırma Performansı:
- LMArena: #1 pozisyon (yayın tarihi itibarıyla)
- MMLU: %92,1
- GSM8K: %97,3
- HumanEval: %94,2
- MATH: %88,7
Teknik Kullanım Alanları: Ultra uzun bağlam işleme, karmaşık akıl yürütme zincirleri, bilimsel ve matematiksel görev çözme, karmaşık bağımlılıklarla kod üretimi ve kapsamlı bağlamsal referanslarla çok modlu anlama.
6. https://openrouter.ai/mistralai/mistral-small-3.1-24b-instruct:free
Mimari: Kayan pencere dikkatli gelişmiş dönüştürücü Parametreler: 24B Bağlam Uzunluğu: 96.000 token (128K teorik maksimum) Yayınlanma Tarihi: 17 Mart 2025 Modlar: Metin + Görüntü → Metin
Mistral Small 3.1, Mistral AI'nin 24B parametre ölçeğinin mühendislik optimizasyonunu temsil ederek, çok modlu yeteneklerle verimli performans sunar.
Teknik Özellikler:
- Verimli uzun bağlam işleme için kayan pencere dikkat mekanizmaları
- Bellek optimizasyonu için gruplandırılmış sorgu dikkat uygulaması
- Çapraz dikkat hizalaması ile entegre edilmiş görüş kodlayıcı
- Çok dilli verimlilik için 128K kelime dağarcığına sahip bayt çifti kodlaması
- Geliştirilmiş gradyan akışı için SwiGLU aktivasyon fonksiyonları
- Geliştirilmiş göreli konum modellemesi için döner konumsal gömme
- JSON şema doğrulama desteği ile fonksiyon çağırma
Karşılaştırma Performansı:
- MMLU: %81,2
- GSM8K: %88,7
- HumanEval: %79,3
- MT-Bench: 8,6/10
Teknik Kullanım Alanları: Fonksiyon çağırma API'leri, JSON yapılı çıktılar, araç kullanımı uygulamaları ve performans ile dağıtım verimliliği arasında denge gerektiren uygulamalar.
7. https://openrouter.ai/openrouter/optimus-alpha
Mimari: Özel dikkat mekanizmalarına sahip dönüştürücü Parametreler: Açıklanmadı Modlar: Metin → Metin
OpenRouter'ın şirket içi Optimus Alpha modeli, yaygın API kullanım kalıpları için optimizasyonlarla genel amaçlı asistan yeteneklerine odaklanmaktadır.
Teknik Özellikler:
- API odaklı etkileşimler için talimat ayarlı
- Verimli yanıt üretimi için özel token ekonomisi
- API ortamlarında düşük gecikmeli çıkarım için optimize edilmiştir
- OpenRouter'ın tescilli eğitim metodolojisini kullanır
- Tutarlı çıktı uzunluğu için kontrollü yanıt ölçeklendirmesi uygular
Teknik Kullanım Alanları: Düşük gecikmeli API uygulamaları, tutarlı yanıt özelliklerini gerektiren sohbet robotu uygulamaları ve talimat takibine vurgu yapan genel amaçlı metin üretimi.
8. https://openrouter.ai/openrouter/quasar-alpha
Mimari: Bilgi geliştirmeli dikkatli dönüştürücü Parametreler: Açıklanmadı Modlar: Metin → Metin
Quasar Alpha, OpenRouter'ın akıl yürütme ve bilgi temsili üzerine odaklanan özel varyantını temsil eder.
Teknik Özellikler:
- Bilgi geliştirmeli dikkat mekanizmaları
- Yapılandırılmış akıl yürütme veri kümeleri üzerinde özel eğitim
- Tutarlı çok adımlı akıl yürütme zincirleri için optimize edilmiştir
- Doğrulama ve kendi kendini düzeltme mekanizmaları uygular
- Gerçek tutarlılık ve mantıksal akıl yürütmeye vurgu yapılarak eğitilmiştir
Teknik Kullanım Alanları: Yapılandırılmış akıl yürütme görevleri, bilgi yoğun uygulamalar, gerçek doğrulama sistemleri ve mantıksal tutarlılık takibi gerektiren uygulamalar.
9. https://openrouter.ai/deepseek/deepseek-v3-base:free
Mimari: Teknik alan optimizasyonlu gelişmiş dönüştürücü Parametreler: Açıklanmadı Modlar: Metin → Metin
DeepSeek V3 Base, DeepSeek'in en son neslinin temel modelini temsil eder ve teknik alanlarda özel güçlü yönlere sahiptir.
Teknik Özellikler:
- Teknik külliyatlara vurgu yapılarak özel ön eğitim
- Teknik terminoloji temsili için optimize edilmiş kelime dağarcığı
- Gelişmiş bağlam sıkıştırma teknikleri uygular
- Alana uyarlanabilir ön eğitim metodolojisi
- Yapılandırılmış temsil ile teknik bilgi gömme
Teknik Kullanım Alanları: Teknik içerik üretimi, alana özgü bilgi gerektiren programlama yardımı, dokümantasyon üretimi ve teknik bilgi alma uygulamaları.
10. https://openrouter.ai/qwen/qwen2.5-vl-3b-instruct:free
Mimari: Çok modlu yeteneklere sahip verimli dönüştürücü Parametreler: 3B Modlar: Metin + Görüntü → Metin
Qwen2.5-VL-3B-Instruct, verimlilik için optimize edilmiş kompakt bir mimaride çok modlu yetenekler sunar.
Teknik Özellikler:
- Aşamalı özellik çıkarma ile hafif görsel kodlayıcı
- Parametre verimli görsel-dil eşlemesi
- Dağıtım optimizasyonu için nicemlemeye duyarlı eğitim
- Çok modlu füzyon için bellek verimli dikkat uygulaması
- Görsel token entegrasyonlu özel kelime dağarcığı
- Hızlı yanıt üretimi için gecikme optimizasyonlu çıkarım yolları
Teknik Kullanım Alanları: Bellek kısıtlı çok modlu uygulamalar, görsel anlayış için kenar cihaz dağıtımı ve minimum kaynaklarla hızlı görsel işleme gerektiren uygulamalar.
11. https://openrouter.ai/deepseek/deepseek-chat-v3-0324:free
Mimari: Diyalog için optimize edilmiş dönüştürücü Parametreler: Açıklanmadı Modlar: Metin → Metin
DeepSeek'in temel modelinin, geliştirilmiş diyalog yönetimi ile konuşma etkileşimlerine odaklanan özel bir varyantı.
Teknik Özellikler:
- Diyalog durumu takibi yetenekleri
- Konuşma geçmişi için geliştirilmiş bellek mekanizmaları
- Doğal konuşma akışı için sıra alma optimizasyonu
- Diyalog gömme teknikleri aracılığıyla persona tutarlılığı
- Diyalog eylemi modellemesi ile bağlam farkındalıklı yanıt üretimi
Teknik Kullanım Alanları: Çok turlu konuşma sistemleri, durum takibi gerektiren diyalog sistemleri, persona tutarlı sohbet robotları ve karmaşık konuşma yönetimi gereksinimleri olan uygulamalar.
12. https://openrouter.ai/deepseek/deepseek-r1-zero:free
Mimari: Akıl yürütme konusunda uzmanlaşmış dönüştürücü Parametreler: Açıklanmadı Modlar: Metin → Metin
DeepSeek R1 Zero, özel mimari değişikliklerle araştırma odaklı görevlere ve bilimsel akıl yürütmeye odaklanmaktadır.
Teknik Özellikler:
- Ara doğrulama ile geliştirilmiş çok adımlı akıl yürütme
- Bilimsel alan bilgisi entegrasyonu
- Araştırma makalesi külliyatları üzerinde özel eğitim
- LaTeX üretimi ile matematiksel formülasyon yetenekleri
- Özel kayıp fonksiyonları aracılığıyla teknik hassasiyet optimizasyonu
Teknik Kullanım Alanları: Bilimsel literatür analizi, araştırma yardımı, teknik problem çözme ve kesin teknik akıl yürütme veya matematiksel formülasyonlar gerektiren uygulamalar.
13. https://openrouter.ai/nousresearch/deephermes-3-llama-3-8b-preview:free
Mimari: Özel ayarlamalı değiştirilmiş Llama 3 Parametreler: 8B Modlar: Metin → Metin
DeepHermes-3, Nous Research'ün kompakt bir uygulamada dengeli performans için Llama 3 mimarisinin optimizasyonunu temsil eder.
Teknik Özellikler:
- Özel ince ayar ile Llama 3 8B temel üzerine kurulmuştur
- Çeşitli görev temsili ile talimat ayarlama metodolojisi
- Hizalama için anayasal yapay zeka ilkelerini uygular
- DPO (Doğrudan Tercih Optimizasyonu) ince ayarı
- Sentetik veri artırımı yoluyla geliştirilmiş akıl yürütme yetenekleri
- Birden fazla alanda çok yönlülük için optimize edilmiştir
Karşılaştırma Performansı:
- MMLU: %64,3
- GSM8K: %67,8
- HumanEval: %55,9
- MT-Bench: 7,2/10
Teknik Kullanım Alanları: Kısıtlı hesaplama ortamlarında dengeli performans gerektiren uygulamalar, kaynak sınırlamaları ile genel amaçlı talimat takibi ve verimli parametre kullanımı gerektiren sistemler.
Python ile Openrouter API'si Nasıl Kullanılır
Bu modellere OpenRouter aracılığıyla erişmek, OpenAI uyumlu kalıpları izleyen basit bir API uygulaması içerir. İşte teknik bir uygulama örneği:
import requests
import json
API_KEY = "your_openrouter_api_key"
MODEL_ID = "meta-llama/llama-4-maverick:free" # Örnek model
headers = {
"Authorization": f"Bearer {API_KEY}",
"HTTP-Referer": "<https://your-app-domain.com>", # Analiz için isteğe bağlı
"X-Title": "Your App Name", # Analiz için isteğe bağlı
"Content-Type": "application/json"
}
payload = {
"model": MODEL_ID,
"messages": [
{"role": "system", "content": "Yardımsever bir yapay zeka asistanısınız."},
{"role": "user", "content": "Kuantum hesaplamayı teknik terimlerle açıklayın."}
],
"temperature": 0.7,
"max_tokens": 1024,
"stream": False,
"top_p": 0.95
}
response = requests.post(
"<https://openrouter.ai/api/v1/chat/completions>",
headers=headers,
data=json.dumps(payload)
)
print(response.json())
Çok modlu modeller için, görüntü girdileri base64 kodlaması kullanılarak dahil edilebilir:
import base64
# Görüntüyü yükle ve kodla
with open("image.jpg", "rb") as image_file:
encoded_image = base64.b64encode(image_file.read()).decode('utf-8')
# Çok modlu yük
multimodal_payload = {
"model": "moonshotai/kimi-vl-a3b-thinking:free",
"messages": [
{"role": "system", "content": "Yardımsever bir vizyon asistanısınız."},
{"role": "user", "content": [
{"type": "text", "text": "Bu görüntüyü ayrıntılı olarak açıklayın:"},
{"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{encoded_image}"}}
]}
],
"temperature": 0.3,
"max_tokens": 1024
}

Sonuç
OpenRouter'ın ücretsiz yapay zeka modelleri koleksiyonu, yapay zeka yeteneklerinin demokratikleşmesinde önemli bir ilerlemeyi temsil etmektedir. Llama 4 Maverick gibi sofistike MoE mimarilerinden, Kimi-VL-A3B-Thinking gibi verimli uygulamalara kadar, bu modeller daha önce yalnızca önemli finansal yatırımlarla erişilebilen teknik yetenekler sunmaktadır.
Bu modeller arasındaki teknik çeşitlilik (farklı parametre sayılarını, mimari yaklaşımları, çok modlu yetenekleri ve özel optimizasyonları kapsayan), geliştiricilerin belirli teknik gereksinimleri ve dağıtım kısıtlamaları için en uygun modeli seçmelerini sağlar.
Yapay zeka ortamı hızlı evrimine devam ederken, OpenRouter gibi platformlar, gelişmiş teknik yetenekleri daha geniş bir geliştirici topluluğuna erişilebilir hale getirmede, son teknoloji yapay zeka dağıtımıyla tipik olarak ilişkili olan engelleyici maliyetler olmadan yeniliği mümkün kılmada çok önemli bir rol oynamaktadır.