Claude Mythos: Anthropic'in Yayınlamadığı Tehlikeli Model

Özet

Claude Mythos Önizlemesi, herkese açık bir lansman yerine siber güvenliğe odaklanmış bir önizleme programı olan Project Glasswing aracılığıyla test edilen, kısıtlı bir Anthropic modeli gibi görünüyor. Bildirilen kıyaslama sayıları, yazılım mühendisliği görevlerinde Claude Opus 4.6'dan çok daha güçlü olabileceğini düşündürüyor, ancak Anthropic bunu geniş çapta piyasaya sürmedi. Olası neden, çifte kullanım riskidir: savunuculara yardımcı olan bir model, saldırganlara da yardımcı olabilir.

Giriş

Her büyük yapay zeka laboratuvarı güvenliği ciddiye aldığını söyler. Çok az laboratuvar, güçlü bir modeli mümkün olduğunca hızlı bir şekilde piyasaya sürmek yerine, onu geri tutarak bunu kanıtlar.

İşte Claude Mythos Önizlemesi'ni ilginç kılan da bu. Anthropic, bunu normal bir Claude sürümü gibi duyurmadı. Geniş çaplı bir genel API dağıtımı, standart bir sohbet ürünü lansmanı ve herkese yönelik neşeli bir "şimdi dene" sayfası yok. Bunun yerine, model, savunma amaçlı siber güvenlik çalışmalarına odaklanmış kısıtlı bir program olan Project Glasswing ile bağlantılı raporlar aracılığıyla ortaya çıktı.

Bu bile insanların dikkatini çekmeye yeterdi. Ancak Claude Mythos Önizlemesi'ne eklenen kıyaslama sayıları hikayeyi çok daha büyütüyor. Bildirilen sonuçlar, SWE-Bench tarzı kodlama görevlerinde Claude Opus 4.6'ya göre büyük bir sıçrama olduğunu gösteriyor. Bu sayılar doğruysa, Anthropic, saldırı ve savunma siber yetenekleri arasındaki dengeyi önemli ölçüde değiştiren bir modele zaten sahip olabilir.

💡

Yapay zeka model sürümleri etrafında araçlar geliştiriyorsanız, API öncelikli testin önemli olduğu durum tam da budur. Laboratuvarlar, genel bir dağıtım gerçekleşmeden çok önce bir modeli sınırlı bir ortak grubuna sunabilir. Apidog, ekiplerin bu gelecekteki API akışlarını modellemesine, kısıtlı erişimli uç noktaları taklit etmesine ve daha geniş erişim açılmadan önce entegrasyon mantığını test etmesine yardımcı olur. Tam genel sürümü beklemeden yapay zeka modeli entegrasyonlarını prototiplemek istiyorsanız Apidog'u ücretsiz indirin.

Düğme

Claude Mythos Önizlemesi Nedir?

Mevcut raporlamalara göre, Claude Mythos Önizlemesi, yalnızca seçilmiş savunma amaçlı siber güvenlik ortaklarına ve araştırmacılara sunulan, henüz piyasaya sürülmemiş bir Anthropic modelidir.

Bu ifade önemlidir.

Bu, Sonnet veya Opus gibi standart bir Claude ailesi lansmanına benzemiyor. Daha çok, dar bir kullanım durumuna bağlı erişim kısıtlamaları olan, kontrollü bir önizleme modeli gibi görünüyor. Reuters, Anthropic'in Project Glasswing kapsamında Amazon, Microsoft, Apple, Google, Nvidia, CrowdStrike ve Palo Alto Networks gibi büyük ortaklarla çalıştığını bildirdi. Amaç, kitlesel tüketici erişimi değil, savunma amaçlı siber güvenlik araştırmasıdır.

Dolayısıyla şu anda en net tanım şudur: Claude Mythos Önizlemesi, genel bir Claude katmanı değil, savunma amaçlı güvenlik çalışmaları için kısıtlı erişimli bir Anthropic modeli gibi görünmektedir.

Model neden bu kadar çok dikkat çekiyor?

Cevap basit: bildirilen kıyaslama sayıları alışılmadık derecede yüksek.

Bugünkü yapay zeka haber döngüsünde ortaya çıkan haberlere göre, Claude Mythos Önizlemesi'nin şunları başardığı bildirildi:

Kıyaslama	Claude Mythos Önizlemesi	Claude Opus 4.6
SWE-Bench Doğrulanmış	93.9%	80.8%
SWE-Bench Pro	77.8%	53.4%

Bu sayılar doğruysa, bu küçük bir yükseltme değil. Büyük bir sıçramadır.

SWE-Bench kıyaslamaları önemlidir, çünkü gerçek yazılım mühendisliği yeteneği için sahip olduğumuz en açık genel göstergelerden biridir. Bir modelin bir depoyu okuyup okuyamadığını, bir hatayı veya sorunu anlayıp anlayamadığını, doğru kod değişikliklerini yapıp yapamadığını ve görevi gerçekçi kısıtlamalar altında çözüp çözemediğini test ederler. Bu büyüklükte bir sıçrama, Anthropic'in kodlama yoğun ve ajans görevlerinde önceki genel sınırlarının çok ötesine geçtiğini düşündürür.

İnsanların bu kadar güçlü tepki vermesinin nedeni de bu. Hikaye sadece Anthropic'in daha güçlü bir modele sahip olabileceği değil. Hikaye, Anthropic'in bu modele zaten sahip olabileceği ve yine de onu halka açık bir şekilde piyasaya sürmemeyi tercih etmesidir.

Anthropic neden Claude Mythos'u gizli tutuyor olabilir?

En olası açıklama, çifte kullanım riskidir.

Savunucuların güvenlik açıklarını bulmasına, saldırı yollarını analiz etmesine, güvenli olmayan kodları incelemesine ve düzeltmeyi otomatikleştirmesine yardımcı olacak kadar güçlü bir model, saldırı iş akışlarını da kolaylaştırabilir. Mavi bir ekibin sistemleri daha hızlı yamalamasına yardımcı olan aynı yetenek, kırmızı bir ekibin veya kötü niyetli bir aktörün de daha hızlı hareket etmesine yardımcı olabilir.

Bu denge, bir model şunlarda daha iyi hale geldiğinde daha keskinleşir: - depo ölçeğinde kod anlama - otonom araç kullanımı - güvenlik açığı çoğaltma - uzun vadeli problem çözme - bağlamı kaybetmeden birçok eylemi bir araya getirme

Bunlar tam olarak modern yapay zeka laboratuvarlarının kodlama aracıları için istediği yeteneklerdir. Siber güvenlikte endişe yaratan yetenekler de bunlardır.

Anthropic, bir süredir öncü model sürümlerinin daha hedefe yönelik dağıtım stratejilerine ihtiyaç duyabileceğini işaret ediyordu. Claude Mythos Önizlemesi, bu stratejinin şimdiye kadarki en açık örneği gibi görünüyor. "Geniş çapta yayınla ve sonra yamala" yerine, buradaki hareket "önce kısıtla, onaylanmış kullanıcılardan öğren, sonra ne olacağına karar ver" gibi görünüyor.

Project Glasswing ne anlama geliyor gibi görünüyor?

Project Glasswing, Mythos hikayesinin anlam kazanmasını sağlayan çerçevedir.

Bildirilen fikir sadece "işte daha iyi bir model" değil. "İşte daha iyi bir model, ancak şu anda sadece güvenilir savunma ortakları kullanabilir." Bu, ürün hikayesini tamamen değiştiriyor.

Bir tüketici lansmanı yerine, bu daha çok bir güvenlik önizleme programına benziyor. Büyümenin ana KPI olması yerine, ana KPI kontrollü değerlendirme olabilir: modelin savunucular için neler yapabileceğini, pratikte hangi kötüye kullanım risklerinin ortaya çıktığını ve yayınlama önlemlerinin yeterli olup olmadığını anlamak.

Bu, sektör için anlamlı bir değişikliktir.

Laboratuvarlar son iki yılı, güvenlikten bahsederken halka açık erişimi en üst düzeye çıkarmaya çalışarak geçirdi. Project Glasswing farklı bir model öneriyor: en yetenekli sistemler, güvenlik araştırmacılarının ve kurumsal ortakların gerçek kısıtlamalar altında test ettiği sınırlı, sektöre özel dağıtımlarda ortaya çıkabilir.

Bu, güçlü siber yeteneklere sahip modeller için norm haline gelebilir.

Claude Mythos, Opus 4.6'dan daha mı güçlü?

Bildirilen kıyaslama sayılarına göre, öyle olabilir.

Ancak hassasiyetin önemli olduğu yer burasıdır.

Söyleyebileceklerimiz: - bildirilen sayılar, Claude Mythos Önizlemesi'nin SWE-Bench tarzı yazılım mühendisliği görevlerinde Opus 4.6'dan önemli ölçüde önde olduğunu gösteriyor - Anthropic'in onu daha yüksek riskli bir model olarak değerlendirdiği bildiriliyor - model, normal bir halka açık Claude sürümü gibi piyasaya sürülmüyor

Henüz tam kesinlikle söyleyemeyeceklerimiz: - her kategoride Opus 4.6'dan daha güçlü olduğu - yayınlanan karşılaştırma koşullarının her ayrıntıda tamamen aynı olduğu - genel kullanıcıların tüm iş akışlarında aynı kazanımları göreceği

Dolayısıyla dikkatli versiyon şudur: Claude Mythos Önizlemesi, en azından bazı önemli kodlama kıyaslamalarında Claude Opus 4.6'dan önemli ölçüde daha güçlü görünüyor ve riskler nedeniyle Anthropic'in erişimi kısıtlıyor olabileceği kadar güçlü.

Bu hala çok büyük bir hikaye.

Bu, geliştiriciler için ne anlama gelebilir?

Çoğu geliştirici için Claude Mythos, bugün kullanabileceğiniz bir şey değil. Ancak yine de önemli, çünkü bir sonraki kodlama modelleri dalgasının nereye gittiğine dair ipuçları veriyor.

Üç çıkarım öne çıkıyor.

1. Genel Claude modelleri Anthropic'in öncü tavanını yansıtmayabilir

Birçok kişi, en iyi genel Claude modelinin laboratuvarın en iyi dahili yeteneğine yakın olduğunu varsayar. Claude Mythos Önizlemesi, bu farkın varsayılandan daha büyük olabileceğini düşündürüyor.

2. Siber yetenek, ana sürüm darboğazı haline gelebilir

Bir sürümdeki en büyük kısıtlama artık model kalitesi olmayabilir. Modelin, saldırı amaçlı kötüye kullanım riskinin çok yüksek hale geldiği bir eşiği aşıp aşmadığı olabilir.

3. En iyi modeller önce kısıtlı kurumsal programlar aracılığıyla gelebilir

En güçlü sistemleri önce genel sohbet uygulamalarında görmek yerine, bunları dar ortak ağlarında, endüstri pilotlarında ve kontrollü kurumsal önizlemelerde görebiliriz.

Bu, geliştiricilerin yol haritalarını nasıl planladıklarını, sağlayıcıları nasıl değerlendirdiklerini ve erişim riskini nasıl düşündüklerini etkileyecektir.

Bu, yapay zeka endüstrisi için ne anlama gelebilir?

Claude Mythos Önizlemesi, bir ürün olarak daha az önemli ve bir sinyal olarak daha önemli olabilir.

Anthropic, siber risk nedeniyle bir modeli geri tutmaya istekliyse, diğer laboratuvarlar da aynı şeyi yapabilir. Bu, iki yollu bir yapay zeka pazarı yaratacaktır: - geniş erişime ve daha ağır kısıtlamalara sahip genel modeller - daha güçlü yeteneklere ve daha sıkı erişim kontrollerine sahip kısıtlı modeller

Bu ayrım, kıyaslamayı da etkileyecektir. Bir laboratuvar, halkın gördüğünden çok daha güçlü bir sisteme sahip olabilirken, yine de daha güvenli, daha zayıf bir sürümle halka açık olarak rekabet edebilir. Bu durum, dışarıdan gelenlerin gerçek sınırı sadece genel API'lerden yargılamasını da zorlaştıracaktır.

Politika açısından bakıldığında, yasa koyucuların ve güvenlik araştırmacılarının beklediği durum tam da budur. İlginç olan soru, güçlü modellerin var olup olmayacağı değil. Laboratuvarların, saldırı amaçlı kötüye kullanımı önemli ölçüde kolaylaştırmadan savunma değerini koruyan yayınlama mekanizmaları oluşturup oluşturamayacağıdır.

Claude Mythos Önizlemesi, bir laboratuvarın bu sorunu gerçek zamanlı olarak çözmeye çalıştığının ilk yüksek profilli örneği olabilir.

Geliştiriciler şu anda önemsemeli mi?

Evet, ama yarın araç değiştirmek zorunda olduğunuz için değil.

Önemsemelisiniz, çünkü bu, model duyurularını nasıl okuduğunuzu değiştiriyor.

Bir laboratuvar genel bir modelin "mevcut en iyi" modeli olduğunu söylediğinde, bu artık laboratuvarın sahip olduğu en güçlü model olduğu anlamına gelmeyebilir. Bu sadece, laboratuvarın geniş çapta yayınlamaya istekli olduğu en güçlü model olduğu anlamına gelebilir. Bu farklı bir ifadedir.

Ayrıca önemsemelisiniz, çünkü bu, sağlayıcılar arasındaki rekabetçi konumu etkiliyor. Anthropic daha güçlü bir kodlama modelini geri tutuyorsa, o zaman genel Claude, GPT, Gemini, GLM ve açık ağırlıklı kodlama modelleri arasındaki karşılaştırmalar, özel öncü sistemlerin zaten yapabileceği şeyleri hafife alabilir.

Sonuç

Claude Mythos Önizlemesi normal bir ürün lansmanı değil. Yazılım mühendisliği görevlerinde Claude Opus 4.6'dan önemli ölçüde daha güçlü olabilecek ve Anthropic'in geniş çapta yayınlamaya isteksiz göründüğü kadar kısıtlı bir Anthropic modeli gibi görünüyor.

Bu tek başına, onu anın en önemli yapay zeka hikayelerinden biri yapıyor.

Bildirilen kıyaslamalar doğruysa, manşet sadece Anthropic'in daha iyi bir model inşa ettiği değil. Gerçek manşet, Anthropic'in bazı öncü modellerin anında halka açık olarak yayınlanamayacak kadar yetenekli, ya da en azından çok riskli olduğu bir dünyada zaten faaliyet gösteriyor olabileceğidir.

Bu, gelişmiş yapay zeka sistemlerinin pazara ulaşma biçiminde büyük bir değişime işaret edecektir.

SSS

Claude Mythos Önizlemesi nedir?
Mevcut raporlamalara göre, halka açık olarak yayınlanmak yerine seçilmiş savunma amaçlı siber güvenlik ortaklarıyla test edilen kısıtlı bir Anthropic önizleme modelidir.

Claude Mythos halka açık mı?
Halka açık geniş çaplı bir sürüm duyurulmadı. Mevcut raporlar, erişimin Project Glasswing aracılığıyla kısıtlı olduğunu gösteriyor.

Claude Mythos, Claude Opus 4.6'dan daha mı güçlü?
Bildirilen kıyaslama sayıları, SWE-Bench tarzı kodlama görevlerinde önemli ölçüde daha güçlü olabileceğini düşündürüyor, ancak bu, her kategoride daha güçlü olduğunu kanıtlamaz.

Project Glasswing nedir?
Project Glasswing, Anthropic'in Claude Mythos Önizlemesi'ni savunma amaçlı siber güvenlik ortamlarında değerlendirmek için kullandığı kısıtlı erişimli programı gibi görünüyor.

Anthropic neden daha güçlü bir modeli yayınlamayı reddeder?
Olası neden, çifte kullanım riskidir. Savunucuların kod ve güvenlik çalışmalarını otomatikleştirmesine yardımcı olan bir model, saldırı amaçlı kötüye kullanımı da kolaylaştırabilir.

Geliştiriciler bugün Claude Mythos'u kullanabilir mi?
Geniş çapta kullanılamaz. Şu anda halka açık API kullanıcılarından ziyade seçilmiş ortaklar ve araştırmacılarla sınırlı olduğu görülüyor.