Kimi VL Düşünme API'sini Ücretsiz Nasıl Kullanılır

Görsel dil modelleri (GDM'ler), yapay zekanın görsel içeriği anlama ve bu konuda akıl yürütme yeteneğinde devrim yarattı. Bu yenilikler arasında, Moonshot AI'ın Kimi VL Düşünme modeli, gelişmiş akıl yürütme yeteneklerini olağanüstü verimlilikle birleştirmesiyle özellikle dikkat çekiyor. Bu eğitim, Kimi VL Düşünme'nin yeteneklerini anlamanız ve OpenRouter'ın platformu aracılığıyla ücretsiz olarak nasıl kullanacağınız konusunda size rehberlik edecektir.

Kimi VL Düşünme Kıyaslamaları

Kimi VL Düşünme (resmi olarak Kimi-VL-A3B-Thinking olarak adlandırılır), Moonshot AI tarafından geliştirilen gelişmiş bir görsel dil modelidir. Bu modeli özel kılan şey, toplamda yaklaşık 16 milyar parametre içerirken, çıkarım başına yalnızca 2,8 milyar parametreyi etkinleştiren Mixture-of-Experts (MoE) mimarisidir. Bu, nispeten verimli hesaplama ile sofistike akıl yürütme sağlamasına olanak tanır.

Kimi VL Düşünme, özellikle adım adım düşünme ve görsel girdilerin matematiksel analizi gerektiren gelişmiş akıl yürütme görevleri için özel olarak tasarlanmıştır. Kimi VL temel modelinin zincirleme düşünme (CoT) denetimli öğrenme ve pekiştirmeli öğrenme teknikleriyle ince ayarlanmasıyla oluşturulmuştur.

Kimi VL Düşünme Modelinin Önemli Vurguları

Uzun Bağlam Penceresi: 128K tokene kadar destekler, kapsamlı çok turlu konuşmalara ve uzun belgelerin işlenmesine olanak tanır.
Yerel Çözünürlüklü Görüş: Mükemmel ayrıntı tanıma ile yüksek çözünürlüklü görsel girdileri işlemek için MoonViT kodlayıcısını kullanır.
Gelişmiş Akıl Yürütme: Özellikle matematiksel görsel akıl yürütme ve adım adım problem çözmede güçlüdür.
Verimli Hesaplama: Güçlü yeteneklerine rağmen, model yalnızca 2,8B parametreyi etkinleştirir ve bu da onu daha büyük alternatiflere göre daha erişilebilir hale getirir.
Açık Kaynak: MIT lisansı altında mevcuttur ve geniş akademik ve ticari uygulamalara izin verir.

Kimi VL Düşünme Kıyaslama Performansı

Kimi VL Düşünme, çeşitli zorlu kıyaslamalarda etkileyici bir performans sergileyerek, genellikle çok daha büyük modellerle rekabet eder veya onları aşar:

MathVision: Gemma-3-27B (35.5) gibi modellerle karşılaştırılabilir ve Qwen2.5-VL-72B'ye (38.1) yaklaşan 36.8 (Pass@1) puanı elde eder.
MathVista: Mini kıyaslamada 71.3 puan alarak, GPT-4o-mini (56.7) ve Gemma-3-12B (56.4) gibi modellerden daha iyi performans gösterir.
MMMU (Multimodal Massive Multitask Understanding): Doğrulama setinde 61.7'ye ulaşarak, karmaşık çok modlu görevlerde güçlü yetenekler sergiler.

Bu sonuçları perspektife oturtmak gerekirse, Kimi VL Düşünme'nin performansı, yalnızca 2,8B parametreyi etkinleştirmesi ve 7B, 12B, hatta 70B+ parametre kullanan modellerle rekabet etmesi göz önüne alındığında dikkate değerdir. Bu, onu mevcut en verimli akıl yürütme yetenekli GDM'lerden biri olarak konumlandırır.

Kimi VL Düşünme'yi OpenRouter Aracılığıyla Ücretsiz Olarak Nasıl Kullanılır

OpenRouter, modeli kendiniz dağıtmanıza gerek kalmadan Kimi VL Düşünme'ye erişmenin uygun bir yolunu sunar. Ücretsiz katmanları, modelle herhangi bir maliyet olmadan denemeler yapmanıza olanak tanır. İşte nasıl başlayacağınız:

Adım 1: Bir OpenRouter Hesabı Oluşturun

Henüz bir hesabınız yoksa, OpenRouter'ın web sitesini ziyaret edin ve bir hesap için kaydolun.
Kaydolduktan sonra, bir API anahtarı oluşturmak için hesap ayarlarınıza gidin.
Bu API anahtarını güvenli bir şekilde saklayın, çünkü tüm API çağrıları için buna ihtiyacınız olacak.

Adım 2: OpenRouter API Yapısını Anlama

OpenRouter'ın API'si, OpenAI API formatıyla uyumlu olacak şekilde tasarlanmıştır ve OpenAI'nin hizmetlerine zaten aşinaysanız entegrasyonu kolaylaştırır. Temel farklılıklar şunlardır:

Temel URL: https://openrouter.ai/api/v1
Model adı: moonshotai/kimi-vl-a3b-thinking:free
Analizler için ek isteğe bağlı başlıklar

Adım 3: İlk API Çağrınızı Yapma

Python kullanıcıları için, ortamınızı bu bağımlılıklarla ayarlayın:

pip install openai requests pillow

En basit yaklaşım olan OpenAI SDK'sını kullanarak temel bir örnekle başlayalım:

from openai import OpenAI
from base64 import b64encode
from PIL import Image
import io

# OpenRouter'ın temel URL'si ile istemciyi başlatın
client = OpenAI(
    base_url="<https://openrouter.ai/api/v1>",
    api_key="your_openrouter_api_key_here",
)

# Görüntüleri kodlamak için işlev
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return b64encode(image_file.read()).decode('utf-8')

# Görüntünüzü yükleyin ve kodlayın
image_path = "path_to_your_image.jpg"
base64_image = encode_image(image_path)

# API isteğini oluşturun
completion = client.chat.completions.create(
    extra_headers={
        "HTTP-Referer": "your_site_url",  # Analizler için isteğe bağlı
        "X-Title": "your_app_name",       # Analizler için isteğe bağlı
    },
    model="moonshotai/kimi-vl-a3b-thinking:free",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}"
                    }
                },
                {
                    "type": "text",
                    "text": "Lütfen bu matematiksel problemi inceleyin ve adım adım çözün."
                }
            ]
        }
    ],
    max_tokens=1024
)

print(completion.choices[0].message.content)

SDK'sız doğrudan API çağrılarını kullanmayı tercih ederseniz:

import requests
import json
from base64 import b64encode

# Görüntüleri kodlamak için işlev
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return b64encode(image_file.read()).decode('utf-8')

# Görüntünüzü yükleyin ve kodlayın
image_path = "path_to_your_image.jpg"
base64_image = encode_image(image_path)

# API isteğini oluşturun
response = requests.post(
    url="<https://openrouter.ai/api/v1/chat/completions>",
    headers={
        "Authorization": "Bearer your_openrouter_api_key_here",
        "Content-Type": "application/json",
        "HTTP-Referer": "your_site_url",  # Analizler için isteğe bağlı
        "X-Title": "your_app_name",       # Analizler için isteğe bağlı
    },
    data=json.dumps({
        "model": "moonshotai/kimi-vl-a3b-thinking:free",
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "type": "image",
                        "image_url": {
                            "url": f"data:image/jpeg;base64,{base64_image}"
                        }
                    },
                    {
                        "type": "text",
                        "text": "Lütfen bu matematiksel problemi inceleyin ve adım adım çözün."
                    }
                ]
            }
        ],
        "max_tokens": 1024
    })
)

print(response.json()["choices"][0]["message"]["content"])

Uzun yanıtlar veya daha iyi kullanıcı deneyimi için, modelin çıktısını yayınlamak isteyebilirsiniz:

from openai import OpenAI
from base64 import b64encode

client = OpenAI(
    base_url="<https://openrouter.ai/api/v1>",
    api_key="your_openrouter_api_key_here",
)

# Görüntüleri kodlamak için işlev
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return b64encode(image_file.read()).decode('utf-8')

# Görüntünüzü yükleyin ve kodlayın
image_path = "path_to_your_image.jpg"
base64_image = encode_image(image_path)

# Bir yayın isteği oluşturun
stream = client.chat.completions.create(
    model="moonshotai/kimi-vl-a3b-thinking:free",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{base64_image}"
                    }
                },
                {
                    "type": "text",
                    "text": "Lütfen bu matematiksel problemi inceleyin ve adım adım çözün."
                }
            ]
        }
    ],
    stream=True,
    max_tokens=1024
)

# Yayın yanıtını işleyin
for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

Kimi VL Düşünme API'sini Apidog ile Test Etme

Apidog, Kimi VL Düşünme gibi API'lerle etkileşim sürecini basitleştiren kapsamlı bir API test aracıdır. Ortam yönetimi ve senaryo simülasyonu gibi özellikleri, onu geliştiriciler için ideal hale getirir. Kimi VL Düşünme API'sini test etmek için Apidog'u nasıl kullanacağımıza bakalım.

button

Apidog'u Kurun

İlk olarak, Apidog'u apidog.com adresinden indirin ve kurun. Kurulduktan sonra, yeni bir proje oluşturun ve Kimi VL Düşünme API uç noktasını ekleyin: https://openrouter.ai/api/v1/chat/completions.

Ortamınızı Yapılandırın

Ardından, Apidog'da farklı ortamlar (örneğin, geliştirme ve üretim) ayarlayın. API anahtarınız ve temel URL'niz gibi değişkenleri tanımlayın, böylece kurulumlar arasında kolayca geçiş yapabilirsiniz. Apidog'da, "Ortamlar" sekmesine gidin ve şunları ekleyin:

api_key: OpenRouter API anahtarınız
base_url: https://openrouter.ai/api/v1

Bir Test İsteği Oluşturun

Şimdi, Apidog'da yeni bir POST isteği oluşturun.

URL'yi {{base_url}}/chat/completions olarak ayarlayın, başlıklarınızı ekleyin ve JSON gövdesini girin:

{
    "model": "quasar-alpha",
    "messages": [
        {"role": "user", "content": "JavaScript'te let ve const arasındaki farkı açıklayın."}
    ],
    "max_tokens": 300
}

Başlıklar bölümünde, şunları ekleyin:

Authorization: Bearer {{api_key}}
Content-Type: application/json

Testi Çalıştırın ve Analiz Edin

Son olarak, isteği gönderin ve yanıtı Apidog'un görsel arayüzünde analiz edin. Apidog, yanıt süresi, durum kodu ve belirteç kullanımı dahil olmak üzere ayrıntılı raporlar sağlar. Bu isteği, gelecekteki testler için yeniden kullanılabilir bir senaryo olarak da kaydedebilirsiniz.

Apidog'un gerçek dünya senaryolarını simüle etme ve dışa aktarılabilir raporlar oluşturma yeteneği, Kimi VL Düşünme API'si ile etkileşimlerinizi hata ayıklamak ve optimize etmek için güçlü bir araç haline getirir. Bazı en iyi uygulamalarla toparlayalım.

button

Kimi VL Düşünme için İstekleri Optimize Etme

Kimi VL Düşünme, adım adım akıl yürütmede mükemmeldir, bu nedenle isteklerinizi bu yetenekten yararlanacak şekilde yapılandırın:

Akıl Yürütme Konusunda Açık Olun: Modelden "adım adım düşünmesini" veya "bu problemi dikkatlice düşünmesini" isteyin.
Aynı Anda Bir Görev: Karmaşık problemler için, her şeyi aynı anda istemek yerine bunları yönetilebilir adımlara ayırın.
Bağlam Sağlayın: İlgili olduğunda, modelin problemi daha iyi anlamasına yardımcı olabilecek arka plan bilgileri verin.
Açık Talimatlar Kullanın: Modelin görüntüde tam olarak neyi analiz etmesini istediğinizi belirtin.

Sonuç

Kimi VL Düşünme, verimli ancak güçlü görsel dil modellerinde etkileyici bir başarıyı temsil eder. Yalnızca 2,8B parametreyi etkinleştirirken gelişmiş akıl yürütme gerçekleştirme yeteneği, onu geleneksel büyük modellere göre daha geniş bir kullanıcı yelpazesine erişilebilir hale getirir.

OpenRouter'ın ücretsiz katmanından yararlanarak, bu son teknolojiyle maliyet engelleri olmadan denemeler yapabilirsiniz. İster eğitim uygulamaları, ister veri analizi veya teknik dokümantasyon üzerinde çalışıyor olun, Kimi VL Düşünme, görsel içeriği anlama ve bu konuda akıl yürütme için güçlü bir araç sunar.

Modelde daha rahat hale geldikçe, daha karmaşık kullanım durumlarını keşfedebilir ve potansiyel olarak üretim uygulamalarına entegre edebilirsiniz. Ücretsiz katmanın denemeler için mükemmel olduğunu, ancak yüksek hacimli üretim kullanım durumları için daha iyi güvenilirlik ve performans garantileri için ücretli bir katmana yükseltmeyi düşünebileceğinizi unutmayın.

Kimi VL Düşünme'yi bugün keşfetmeye başlayın ve gelişmiş görsel akıl yürütme yeteneklerinin projelerinizi nasıl geliştirebileceğini keşfedin!