Claude Mythos: Model Terlalu Berbahaya untuk Dirilis Menurut Anthropic

TL;DR

Claude Mythos Preview tampaknya merupakan model Anthropic yang dibatasi dan sedang diuji melalui Project Glasswing, sebuah program pratinjau yang berfokus pada keamanan siber daripada peluncuran publik. Angka benchmark yang dilaporkan menunjukkan bahwa model ini bisa jauh lebih kuat daripada Claude Opus 4.6 dalam tugas rekayasa perangkat lunak, tetapi Anthropic belum merilisnya secara luas. Alasan yang mungkin adalah risiko penggunaan ganda (dual-use risk): sebuah model yang membantu pihak bertahan (defender) juga dapat membantu pihak penyerang (attacker).

Pendahuluan

Setiap lab AI besar mengatakan bahwa mereka menganggap serius masalah keamanan. Sangat sedikit lab yang membuktikannya dengan menahan model yang kuat alih-alih mendorongnya ke pasar secepat mungkin.

Itulah yang membuat Claude Mythos Preview menarik. Anthropic belum mengumumkannya seperti rilis Claude pada umumnya. Tidak ada peluncuran API publik secara luas, tidak ada peluncuran produk obrolan standar, dan tidak ada halaman "coba sekarang" yang ceria yang ditujukan untuk semua orang. Sebaliknya, model ini muncul melalui laporan yang terkait dengan Project Glasswing, sebuah program terbatas yang berfokus pada pekerjaan keamanan siber defensif.

Hal itu saja sudah cukup untuk menarik perhatian orang. Tetapi angka-angka benchmark yang melekat pada Claude Mythos Preview membuat ceritanya jauh lebih besar. Hasil yang dilaporkan menunjukkan lompatan besar dibandingkan Claude Opus 4.6 pada tugas coding bergaya SWE-Bench. Jika angka-angka tersebut bertahan, Anthropic mungkin sudah memiliki model yang secara material mengubah keseimbangan antara kemampuan siber ofensif dan defensif.

💡

Jika Anda membangun perangkat di sekitar rilis model AI, inilah persisnya jenis situasi di mana pengujian API-first menjadi penting. Laboratorium dapat mengekspos model ke sejumlah kecil mitra jauh sebelum peluncuran publik terjadi. Apidog membantu tim memodelkan alur API masa depan tersebut, menguji endpoint akses terbatas, dan menguji logika integrasi sebelum akses yang lebih luas dibuka. Unduh Apidog secara gratis jika Anda ingin membuat prototipe integrasi model AI tanpa menunggu rilis publik penuh.

Unduh Aplikasi

Apa itu Claude Mythos Preview?

Berdasarkan laporan saat ini, Claude Mythos Preview adalah model Anthropic yang belum dirilis dan hanya tersedia untuk mitra dan peneliti keamanan siber defensif terpilih.

Formulasi kata-kata itu penting.

Ini tidak terlihat seperti peluncuran keluarga Claude standar seperti Sonnet atau Opus. Ini lebih mirip model pratinjau terkontrol dengan batasan akses yang terikat pada kasus penggunaan yang sempit. Reuters melaporkan bahwa Anthropic bekerja dengan mitra utama termasuk Amazon, Microsoft, Apple, Google, Nvidia, CrowdStrike, dan Palo Alto Networks di bawah Project Glasswing. Tujuannya adalah penelitian keamanan siber defensif, bukan akses konsumen massal.

Perbandingan skor SWE-Bench Claude Mythos Preview vs Claude Opus 4.6

Analisis lebih lanjut tentang kemampuan Mythos dalam mengatasi kerentanan keamanan siber.

Jadi deskripsi paling jelas saat ini adalah ini: Claude Mythos Preview tampaknya merupakan model Anthropic dengan akses terbatas untuk pekerjaan keamanan defensif, bukan tingkat Claude publik.

Mengapa model ini menarik begitu banyak perhatian

Jawabannya sederhana: angka benchmark yang dilaporkan sangat tinggi.

Menurut liputan yang muncul selama siklus berita AI hari ini, Claude Mythos Preview dilaporkan mencapai:

Benchmark	Claude Mythos Preview	Claude Opus 4.6
SWE-Bench Terverifikasi	93.9%	80.8%
SWE-Bench Pro	77.8%	53.4%

Jika angka-angka tersebut akurat, ini bukanlah peningkatan kecil. Ini adalah lompatan besar.

Benchmark SWE-Bench penting karena mereka adalah salah satu proksi publik paling jelas yang kita miliki untuk kemampuan rekayasa perangkat lunak nyata. Mereka menguji apakah sebuah model dapat membaca repositori, memahami bug atau masalah, membuat perubahan kode yang benar, dan menyelesaikan tugas dalam batasan realistis. Lompatan sebesar ini akan menunjukkan bahwa Anthropic telah melampaui batas publik sebelumnya dalam tugas-tugas yang banyak melibatkan coding dan agen.

Itulah mengapa orang-orang bereaksi begitu kuat. Kisahnya bukan hanya tentang Anthropic yang mungkin memiliki model yang lebih kuat. Kisahnya adalah bahwa Anthropic mungkin sudah memiliki model itu dan masih memilih untuk tidak merilisnya secara publik.

Mengapa Anthropic mungkin merahasiakan Claude Mythos

Penjelasan yang paling mungkin adalah risiko penggunaan ganda (dual-use risk).

Model yang cukup kuat untuk membantu pihak bertahan (defender) menemukan kerentanan, menganalisis jalur serangan, meninjau kode yang tidak aman, dan mengotomatiskan remediasi juga dapat mempermudah alur kerja ofensif. Kemampuan yang sama yang membantu tim biru (blue team) menambal sistem lebih cepat dapat membantu tim merah (red team) atau aktor jahat bergerak lebih cepat juga.

Pertukaran itu menjadi lebih tajam ketika sebuah model menjadi lebih baik dalam: - pemahaman kode skala repo - penggunaan alat otonom - reproduksi kerentanan - pemecahan masalah berjangka panjang - merangkai banyak tindakan bersama tanpa kehilangan konteks

Itu persis kemampuan yang diinginkan lab AI modern untuk agen coding. Itu juga persis kemampuan yang menimbulkan kekhawatiran dalam keamanan siber.

Anthropic telah memberi sinyal selama beberapa waktu bahwa rilis model frontier mungkin memerlukan strategi peluncuran yang lebih bertarget. Claude Mythos Preview terlihat seperti contoh paling jelas dari strategi itu sejauh ini. Alih-alih "luncurkan secara luas dan perbaiki nanti," langkah di sini tampaknya adalah "batasi terlebih dahulu, pelajari dari pengguna yang terverifikasi, lalu putuskan apa yang terjadi selanjutnya."

Apa Arti Project Glasswing

Project Glasswing adalah kerangka yang membuat kisah Mythos menjadi masuk akal.

Ide yang dilaporkan bukan hanya "ini model yang lebih baik." Ini adalah "ini model yang lebih baik, tetapi hanya mitra defensif tepercaya yang dapat menggunakannya saat ini." Itu mengubah cerita produk sepenuhnya.

Alih-alih peluncuran konsumen, ini lebih mirip program pratinjau keamanan. Alih-alih pertumbuhan menjadi KPI utama, KPI utama mungkin adalah evaluasi terkontrol: memahami apa yang dapat dilakukan model untuk pihak bertahan, risiko penyalahgunaan apa yang muncul dalam praktik, dan apakah perlindungan rilis sudah cukup.

Itu adalah pergeseran yang berarti bagi industri.

Laboratorium telah menghabiskan dua tahun terakhir mencoba memaksimalkan akses publik sambil berbicara tentang keamanan. Project Glasswing menyarankan model yang berbeda: sistem yang paling mampu mungkin pertama kali muncul dalam penerapan terbatas dan spesifik sektor di mana peneliti keamanan dan mitra perusahaan mengujinya di bawah batasan nyata.

Itu mungkin menjadi norma untuk model dengan kemampuan siber yang kuat.

Apakah Claude Mythos lebih kuat dari Opus 4.6?

Berdasarkan angka benchmark yang dilaporkan, mungkin saja.

Namun di sinilah presisi menjadi penting.

Apa yang bisa kita katakan: - angka yang dilaporkan menunjukkan Claude Mythos Preview secara signifikan lebih unggul dari Opus 4.6 pada tugas rekayasa perangkat lunak bergaya SWE-Bench - Anthropic dilaporkan memperlakukannya sebagai model berisiko tinggi - model ini tidak diluncurkan seperti rilis Claude publik normal

Apa yang belum bisa kita katakan dengan kepastian penuh: - bahwa model ini lebih kuat dari Opus 4.6 di setiap kategori - bahwa kondisi perbandingan yang dipublikasikan sama persis dalam setiap detail - bahwa pengguna publik akan melihat keuntungan yang sama di semua alur kerja

Jadi versi hati-hati adalah ini: Claude Mythos Preview tampaknya secara material lebih kuat daripada Claude Opus 4.6 pada setidaknya beberapa benchmark coding penting, dan cukup kuat sehingga Anthropic mungkin membatasi akses karena risikonya.

Itu masih merupakan cerita yang sangat besar.

Apa arti ini bagi pengembang

Bagi sebagian besar pengembang, Claude Mythos bukanlah sesuatu yang dapat Anda gunakan hari ini. Namun ini tetap penting karena mengisyaratkan ke mana arah gelombang model coding berikutnya.

Tiga implikasi menonjol.

1. Model Claude publik mungkin tidak mencerminkan batas kemampuan Anthropic

Banyak orang berasumsi bahwa model Claude publik terbaik mendekati kemampuan internal terbaik lab. Claude Mythos Preview menunjukkan bahwa kesenjangan itu mungkin lebih besar dari yang diasumsikan banyak orang.

2. Kemampuan siber mungkin menjadi hambatan utama rilis

Batasan terbesar pada sebuah rilis mungkin bukan lagi kualitas model. Ini mungkin apakah model melewati ambang batas di mana risiko penyalahgunaan ofensif menjadi terlalu tinggi.

3. Model terbaik mungkin tiba melalui program perusahaan terbatas terlebih dahulu

Alih-alih melihat sistem terkuat pertama kali di aplikasi obrolan publik, kita mungkin melihatnya di dalam jaringan mitra terbatas, pilot industri, dan pratinjau perusahaan terkontrol.

Itu akan memengaruhi bagaimana pengembang merencanakan peta jalan, mengevaluasi penyedia, dan memikirkan risiko akses.

Apa arti ini bagi industri AI

Claude Mythos Preview mungkin kurang penting sebagai produk dan lebih penting sebagai sinyal.

Jika Anthropic bersedia menahan model karena risiko siber, lab lain mungkin akan melakukan hal yang sama. Itu akan menciptakan pasar AI dua jalur: - model publik dengan akses luas dan batasan yang lebih ketat - model terbatas dengan kemampuan yang lebih kuat dan kontrol akses yang lebih ketat

Pembagian itu juga akan memengaruhi benchmarking. Sebuah lab dapat memiliki sistem yang jauh lebih kuat dari yang pernah dilihat publik, sambil tetap bersaing secara publik dengan rilis yang lebih aman dan lebih lemah. Ini juga akan mempersulit pihak luar untuk menilai batas kemampuan sejati hanya dari API publik.

Dari sudut pandang kebijakan, ini persis jenis kasus yang telah diantisipasi oleh pembuat undang-undang dan peneliti keamanan. Pertanyaan menariknya bukan apakah model yang kuat akan ada. Ini adalah apakah lab dapat membuat mekanisme rilis yang mempertahankan nilai defensif tanpa membuat penyalahgunaan ofensif secara dramatis lebih mudah.

Claude Mythos Preview mungkin merupakan contoh profil tinggi pertama dari sebuah lab yang mencoba memecahkan masalah itu secara real time.

Haruskah pengembang peduli sekarang?

Ya, tetapi bukan karena Anda perlu mengganti alat besok.

Anda harus peduli karena ini mengubah cara Anda membaca pengumuman model.

Ketika sebuah lab mengatakan bahwa model publik adalah model "terbaik yang tersedia", itu mungkin tidak lagi berarti itu adalah model terkuat yang dimiliki lab. Itu mungkin hanya berarti itu adalah model terkuat yang bersedia dirilis secara luas oleh lab. Itu adalah pernyataan yang berbeda.

Anda juga harus peduli karena ini memengaruhi posisi kompetitif di antara penyedia. Jika Anthropic menahan model coding yang lebih kuat, maka perbandingan antara Claude publik, GPT, Gemini, GLM, dan model coding open-weight mungkin meremehkan apa yang sudah dapat dilakukan oleh sistem frontier pribadi.

Kesimpulan

Claude Mythos Preview bukanlah peluncuran produk normal. Ini terlihat seperti model Anthropic terbatas yang mungkin secara signifikan lebih kuat daripada Claude Opus 4.6 pada tugas rekayasa perangkat lunak, dan cukup terbatas sehingga Anthropic tampaknya tidak bersedia merilisnya secara luas.

Hal itu saja menjadikannya salah satu kisah AI paling penting saat ini.

Jika benchmark yang dilaporkan akurat, berita utamanya bukan hanya bahwa Anthropic membangun model yang lebih baik. Berita utama sebenarnya adalah bahwa Anthropic mungkin sudah beroperasi di dunia di mana beberapa model frontier terlalu mampu, atau setidaknya terlalu berisiko, untuk rilis publik segera.

Itu akan menandai pergeseran besar dalam cara sistem AI canggih mencapai pasar.

FAQ

Apa itu Claude Mythos Preview?Berdasarkan laporan saat ini, ini adalah model pratinjau Anthropic terbatas yang sedang diuji dengan mitra keamanan siber defensif terpilih daripada dirilis secara publik.

Apakah Claude Mythos tersedia untuk umum?Belum ada rilis umum publik yang diumumkan. Laporan saat ini menunjukkan akses dibatasi melalui Project Glasswing.

Apakah Claude Mythos lebih kuat dari Claude Opus 4.6?Angka benchmark yang dilaporkan menunjukkan bahwa model ini mungkin secara signifikan lebih kuat pada tugas coding bergaya SWE-Bench, tetapi itu tidak membuktikan bahwa model ini lebih kuat di setiap kategori.

Apa itu Project Glasswing?Project Glasswing tampaknya merupakan program akses terbatas Anthropic untuk mengevaluasi Claude Mythos Preview dalam pengaturan keamanan siber defensif.

Mengapa Anthropic menolak untuk merilis model yang lebih kuat?Alasan yang mungkin adalah risiko penggunaan ganda (dual-use risk). Model yang membantu pihak bertahan mengotomatisasi kode dan pekerjaan keamanan juga dapat membuat penyalahgunaan ofensif lebih mudah.

Bisakah pengembang menggunakan Claude Mythos hari ini?Tidak secara luas. Saat ini tampaknya terbatas pada mitra dan peneliti terpilih daripada pengguna API publik.