ChatGPT Görseller 2.0 Yenilikleri

OpenAI, 21 Nisan 2026'da **gpt-image-2** adlı yeni bir modelle desteklenen ChatGPT Resimleri 2.0'ı piyasaya sürdü. İsteminizi okur, düzeni planlar, keskin çok dilli metinler oluşturur ve tek seferde on adede kadar görsel üretebilir; hepsi 2.000 piksele kadar genişlikte ve eski görsel modelinin asla desteklemediği en-boy oranlarında.

Geliştiriciler için asıl haber ChatGPT arayüzü yenilemesi değil. Asıl haber, gpt-image-2 modelinin OpenAI API aracılığıyla muhakeme yeteneğine sahip bir "düşünme" modu, belirteç başına fiyatlandırma ve üretimde zaten kullandığınız aynı uç nokta düzeniyle sunulmasıdır.

Bu kılavuz, nelerin değiştiğini, API maliyetlerini, baştan sona nasıl çağrılacağını ve tek kullanımlık komut dosyaları yazmadan Apidog ile nasıl test edileceğini anlatmaktadır. Daha önceki görsel API'lerini değerlendirip metnin bozuk çıkması veya çözünürlüğün 1024 ile sınırlı olması nedeniyle vazgeçtiyseniz, buradan başlayın.

düğme

gpt-image-2 nedir?

gpt-image-2, 21 Nisan 2026'da ChatGPT Resimleri 2.0 ürünüyle birlikte piyasaya sürülen OpenAI'ın ikinci nesil görsel oluşturucusunun model kimliğidir. API tarafında önceki gpt-image-1 ailesinin yerini alır ve web ile mobil platformlarda ChatGPT içinde görsel oluşturmayı destekler.

OpenAI görsel oluşturmayı en son 2024 veya 2025'te test ettiyseniz, üç şey yeni bir göz atmaya değer:

Betiklerde okunabilir metin. Küçük kullanıcı arayüzü etiketleri, logolar, altyazılar ve Latin olmayan betikler (Japonca, Korece, Çince, Hintçe, Bengalce) artık manuel yeniden çizim gerektirmeden gönderilebilecek kadar net bir şekilde oluşturuluyor.
Piksellerden önce akıl yürütme. Bir thinking modu, oluşturmadan önce kompozisyonu planlamak, öğeleri saymak ve kısıtlamaları kontrol etmek için ek hesaplama gücü harcar. OpenAI bunu modelin özeti "düşünmesi" olarak tanımlar; pratikte yanlış nesne sayıları veya yanlış etiketlenmiş diyagramlar üzerinde harcadığınız yeniden deneme istemlerinin sayısını azaltır.
Daha yüksek çözünürlük, daha geniş tuval. Uzun kenarda 2.000 piksele kadar ve 3:1 veya 1:3 gibi uç en-boy oranları, afişler, slayt kapakları ve dikey kısa videoları yükseltme adımı olmadan oluşturmanıza olanak tanır.

OpenAI'ın kendi yazısı, bunu "yaratıcı oyuncaktan" "görsel iş akışı aracına" bir sıçrama olarak konumlandırıyor; dergi sayfaları, infografikler, slayt şablonları, hatta manga panelleri. .

gpt-image-1'e kıyasla ne değişti?

Önceki OpenAI görsel uç noktasına göre geliştirme yaptıysanız, kod seviyesinde önemli olan farklar şunlardır.

Özellik	gpt-image-1	gpt-image-2
Maksimum çözünürlük	1024 piksel	Uzun kenarda 2.000 piksel
En boy oranları	1:1, 3:2, 2:3	1:1, 3:2, 2:3, 16:9, 9:16, 3:1, 1:3
İstek başına görsel	1	Stil tutarlılığı ile 10 adede kadar
Metin oluşturma	Yalnızca İngilizce, genellikle bozuk	CJK ve Hint betikleri dahil çok dilli
Akıl yürütme modu	Hayır	Evet (`thinking` bayrağı)
Oluşturma sırasında web araması	Hayır	Evet, düşünme modunda

Toplu mod, en sessiz ama en kullanışlı değişikliktir. Tek bir istem, kompozisyonu ve paleti paylaşan on varyasyon döndürebilir; bu, bir tasarımcının nasıl yinelediği ve bir ürün ekibinin bir sayfa setinde tutarlı kahraman görsellerini nasıl oluşturduğudur.

Erişim ve fiyatlandırma

Piyasaya sürüm aşamalıdır.

ChatGPT Ücretsiz kullanıcıları standart gpt-image-2 modelini kullanır.
ChatGPT Plus, Pro ve Business aboneleri düşünme moduna, daha uzun akıl yürütme süreçlerine ve oluşturma sırasında web aramasına sahip olur.
API geliştiricileri her iki modu da gpt-image-2 model kimliği aracılığıyla kullanabilir. Kullanıma sunulması ChatGPT lansmanından sonra aşamalı olarak yapıldı.

OpenAI API fiyatlandırma sayfasına göre fiyatlandırma belirteç bazlıdır: milyon giriş metni belirteci başına 5 dolar, milyon çıkış metni belirteci başına 10 dolar, milyon giriş görseli belirteci başına 8 dolar ve milyon çıkış görseli belirteci başına 30 dolar. Standart 1024 × 1024 yüksek kaliteli bir oluşturma işleminde, bu görsel başına yaklaşık 0,21 dolara denk gelir; önceki nesilden yaklaşık yüzde 60 daha fazla, bu da daha büyük tuvalin ve akıl yürütme adımının maliyetidir.

Dikkat etmek gerekir: düşünme modu, ek akıl yürütme belirteçleri üzerinden faturalandırılır, bu nedenle katı bir düzen özeti olan bir diyagram, serbest bir illüstrasyon isteminden daha pahalıya mal olur. Düz bir görsel başına ücret yerine buna bütçe ayırın.

API'yi çağırma

Uç nokta, önceki modelle aynı images/generations kalıbını izler. Minimal bir istek şöyle görünür:

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A clean product hero for an API testing platform, dark background, soft cyan lighting, a laptop showing a JSON response, sharp small-text UI labels readable",
    "size": "1536x1024",
    "n": 4,
    "quality": "high"
  }'

Akıl yürütme yolunu etkinleştirmek için thinking parametresini geçirin:

curl https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A four-panel infographic explaining OAuth 2.1 authorization code flow with PKCE. Label every arrow in English and Japanese.",
    "size": "2000x1000",
    "n": 1,
    "quality": "high",
    "thinking": "medium"
  }'

Yanıt, response_format'ınıza bağlı olarak base64 görsel verisi veya URL'ler döndürür; şema gpt-image-1'den bu yana değişmedi, bu nedenle mevcut SDK sarmalayıcıları bir model kimliği değişiminden sonra çalışmaya devam eder.

Resmi SDK kullanan bir Python sürümü:

from openai import OpenAI

client = OpenAI()

result = client.images.generate(
    model="gpt-image-2",
    prompt="Minimalist dashboard UI mockup for a REST client, sentence-case labels, a latency chart in the corner.",
    size="1536x1024",
    n=4,
    quality="high",
)

for i, image in enumerate(result.data):
    with open(f"out_{i}.png", "wb") as f:
        f.write(image.b64_json.encode())  # decode() in practice

Testlerden iki pratik not:

Düşünme modunun, düzen doğruluğu karşılığında gecikmeyi değiştiren üç kademesi (low, medium, high) vardır. Grafikler, tablolar ve bir sayıyı doğru bulması gereken herhangi bir görsel için medium kullanışlı bir varsayılandır.
Toplu çıktı (n > 1), tek bir çağrı içinde stil tutarlılığını korur, ancak ayrı çağrılarda tutarlılığı kaybeder. Eşleşen onlu bir sete ihtiyacınız varsa, tek bir istekte on tanesini isteyin.

Apidog ile gpt-image-2'yi Test Etme

Bir görsel modeli üzerinde komut satırından yineleme yapmak zordur; sonuçları önizleyemez, istemleri değiştiremez veya sürümlendiremezsiniz. Özel bir API istemcisi doğru araçtır ve zaten Postman veya bir terminal REST aracı kullanıyorsanız, görsel yanıtlarını yerel olarak işleyen amaca yönelik bir alternatifi düşünebilirsiniz.

Apidog, OpenAI görsel uç noktasını birinci sınıf bir istek gibi ele alır. OpenAI OpenAPI spesifikasyonunu içe aktarırsınız, OPENAI_API_KEY'i bir ortam değişkeni olarak ayarlarsınız, isteminizi gövdeye yapıştırırsınız ve Gönder'e basarsınız. Görsel yanıtlar satır içi, base64 veya URL olarak oluşturulur ve istekleri en-boy oranlarını, kalite seviyelerini ve düşünme modlarını yan yana karşılaştırmak için varyantlara ayırabilirsiniz.

Faydalı bir iş akışı:

Apidog koleksiyonunda bir gpt-image-2 isteği oluşturun.
İki ortam kaydedin: biri thinking: "off" ile, diğeri thinking: "medium" ile.
Aynı istemi her ikisiyle de çalıştırın, çıktıları karşılaştırın ve kazananı istem kitaplığınızda saklayın.
Her bir varlık türü (afiş, slayt kapağı, infografik) için koleksiyonu çatallayın, böylece her birinin kendi ayarlanmış parametre seti olsun.

Ayrıca çağrıyı zincirleyebilirsiniz: görseli oluşturun, ardından URL'yi aynı Apidog test çalıştırması içinde CDN yükleme uç noktanıza gönderin. Bu, curl betiklerinin iyi yapamadığı kısımdır.

Görsel oluşturma deneylerini genel bir HTTP istemcisinde çalıştırıyorsanız, gerçek bir API platformunun kendini gösterdiği yer burasıdır. Apidog'u indirin ve OpenAI anahtarınıza yönlendirin; kurulum beş dakikadan az sürer.

gpt-image-2'nin hala zorlandığı alanlar

Duyuru güçlü, ancak dürüst sınırlamalar mevcut.

Yakın çekimde fotogerçekçi yüzler hala kararsız, özellikle adı geçen kamu figürleri için. OpenAI'ın kimlik koruma önlemleri bu istemlerin çoğunu doğrudan reddeder.
Kesin marka varlıkları (tam logo geometrisi, tescilli karakterler) güvenilir değildir; son marka işaretlerini göndermek için değil, ruh hali için kullanın.
Çok uzun metin blokları (bir görsel içinde tam paragraflar) birkaç yüz karakterden sonra hala bozulur. Bir makaleyi görsel olarak oluşturmak için değil, altyazılar, başlıklar ve etiketler için tasarlanmıştır.
Oturumlar arası tutarlılık garanti edilmez. Toplu iş özelliği, tek bir çağrı içinde stili korur; ertesi gün yapılan ayrı bir çağrı, aynı tohum benzeri istemle bile sapma gösterecektir.

Decoder ve PetaPixel, pratik incelemelerinde benzer sınırlamaları işaret ettiler. Daha uzun bir döküm için The Decoder'ın incelemesine bakın.

2026 görsel oluşturma alanının geri kalanıyla nasıl karşılaştırılır?

OpenAI, akıl yürütme ve görsel alanında yalnız değil. Google'ın Nano Banana 2'si haftalar önce piyasaya sürüldü ve birkaç açık ağırlıklı çok modlu model metin oluşturma konusundaki boşluğu daralttı.

API tarafında alternatifleri değerlendiriyorsanız, birkaç ilgili derinlemesine inceleme zamanınıza değer:

Qwen 3.5 Omni duyurusu, görsel girişi ve oluşturmayı içeren Alibaba'nın çok modlu atılımını kapsıyor.
GLM 5V Turbo API kılavuzu, daha ucuz olan ancak metin doğruluğundan ödün veren Zhipu'nun görsel-dil API'sini anlatıyor.
Qwen 3.5 Omni nasıl kullanılır, duyuru gönderisinin uygulayıcı rehberidir.
Cursor Composer 2 analizi, akıl yürütme odaklı yapay zeka ürünlerinin araç kullanıcı deneyimini nasıl yeniden şekillendirdiğini anlatıyor; ChatGPT Images 2.0'ı yönlendiren aynı model.
Diğer bir yakın zamanda OpenAI ile ilgili lansman için Microsoft VibeVoice kılavuzumuza bakın.

Metin doğruluğu, kompozisyon üzerindeki akıl yürütme ve OpenAI yığınının geri kalanıyla entegrasyon maliyetten daha önemli olduğunda gpt-image-2'yi seçin. Kendi kendine barındırma, daha düşük görsel başına maliyet veya ticari çıktı için izin veren bir lisans gerektiğinde açık ağırlıklı çok modlu bir model seçin.

Sıkça Sorulan Sorular

gpt-image-2, ücretsiz ChatGPT katmanında mevcut mu?Evet. Standart mod tüm ChatGPT kullanıcıları için mevcuttur. Düşünme modu, genişletilmiş akıl yürütme ve oluşturma sırasında web araması Plus, Pro ve Business abonelerine özeldir. API erişimi ayrıdır ve OpenAI geliştirici hesabınıza bağlıdır; halihazırda kullandığınız aynı hız sınırı katmanları geçerlidir.

gpt-image-2 görsel düzenleme ve inpainting'i destekliyor mu?Lansman, toplu ve düşünme modlarıyla metinden görsele odaklanıyor. Düzenleme tarzı uç noktaların (görsel + maske) önceki nesille aynı deseni takip etmesi, ancak yeni model kimliği altında olması bekleniyor. Inpainting etrafında geliştirme yapmadan önce gpt-image-2 model sayfasını kontrol edin.

Hangi çözünürlükleri ve en boy oranlarını destekler?Uzun kenarda 2.000 piksele kadar, 1:1, 3:2, 2:3, 16:9, 9:16, 3:1 ve 1:3 oranlarıyla. Bu, kahraman afişleri, dikey kısa videolar, kare sosyal görseller ve LinkedIn tarzı geniş kırpılmış görselleri yükseltme adımı olmadan kapsar.

gpt-image-2 isteklerini hızlıca nasıl test ederim?Özel bir API istemcisi kullanın. Apidog, görsel yanıtlarını satır içi olarak oluşturur, istemleri koleksiyon değişkenleri olarak saklar ve düşünme modlarını yan yana karşılaştırmanıza olanak tanır. Komut satırı iş akışlarından gelen ekipler, genellikle bunu Postman olmadan API testi kılavuzumuzla eşleştirir.

API aracılığıyla bir görselin maliyeti nedir?Standart modda 1024 × 1024 yüksek kalitede yaklaşık 0,21 dolar. Düşünme modu, üzerine akıl yürütme belirteçleri ekler, bu nedenle düzen ağırlıklı istemlerde görsel başına değişken maliyet için plan yapın. Kesin belirteç oranları için OpenAI fiyatlandırma sayfasına bakın.

Model, oluştururken web'de arama yapabilir mi?Evet, düşünme modunda. Model, oluşturma sırasında referans görselleri ve gerçekleri çekebilir, bu da diyagram doğruluğuna (gerçek sayılarla grafikler, doğru etiketlerle haritalar) yardımcı olur. Standart mod arama yapmaz.