Anthropic, Mythos AI Model'ünü piyasaya sürüyor, geçici olarak altyapı güvenlik denetimlerine sınırlı

Anthropic, Mythos kod adlı aşırı güçlü AI modelini tanıttı; bu model, kodlama, muhakeme ve güvenlik açıkları keşfi gibi yeteneklerde mevcut en üst düzey model Claude Opus 4.6'yi tamamen geride bırakıyor. Devrim niteliğindeki güvenlik tehdidi yetenekleri nedeniyle şu anda kamuoyuna açılmamıştır; bunun yerine, Project Glasswing projesini başlatarak AWS, Apple, Microsoft gibi 12 ana teknoloji kurumu ve Linux Vakfı gibi açık kaynak organizasyonlarıyla birlikte küresel kritik dijital altyapıların güvenlik denetimi ve güçlendirilmesi için öncülük etmektedir.

Yazan: Tang Ren

Kaynak: Mars Finans

İnsanların, AI tarafından normalin ötesinde bir hızla yakalanmakta olduğunu düşünüyorum.

Durumunuzun nasıl olduğunu bilmiyorum, ancak benim için şu anda AI olmadan hayatta kalamam; günlük işlerimin en az %50'sini AI destekli olarak tamamlıyorum.

Ayrıca, bu oran sürekli artmaktadır.

Bu arada, nesiller halinde yeni modellerin piyasaya sürülmesiyle birlikte, hem verimlilik ve kalitem hem de aylık Token harcamalarım hızla artıyor.

Dün gece bir haber okudum; Anthropic, kendileri bile herkese açıklayamadığı kadar güçlü bir model yayınladı.

Bu yeni modelin adı «Mythos» ve Çinceye çevrildiğinde «mit» anlamına gelir.

Şu anda önizleme sürümüdür, bu nedenle resmi adı «Mythos Preview»dir. Ancak bu, «Project Glasswing» adlı bir proje şeklinde piyasaya sürülmüştür.

Bu proje hakkında daha sonra konuşacağım.

Mythos

Geçen ay, Anthropic'in bir iç belgesi yanlışlıkla sızdı ve bu belgede Opus'tan daha büyük ve güçlü bir modelin geliştirildiği, kod adının ise Mythos olduğu belirtilmişti.

Daha sonra Anthropic, bu sızıntıyı "insan hatası" olarak atıfta bulundu ve hiçbir ek açıklama yapmadı.

Şimdi, Mythos kod adlı model resmen duyuruldu.

Resmi duyuru yapılsa da, henüz kamuya açık bir şekilde başlatılmadı. Yani, normal kullanıcılar henüz kullanamıyor.

Neden oldukça açık: Anthropic, bu modelin çok güçlü olduğunu ve güvenlik mekanizmaları tamamen hazır olana kadar herkese açılmaması gerektiğini düşünüyor.

Bu cümleyi bir saniye durup düşünmeye değer.

Genellikle bir AI şirketi yeni bir modeli piyasaya sürerken hemen ilk anda piyasa payı kazanmak ister, ancak bu sefer Anthropic'in yaklaşımı açıkça olağan dışı.

Bence, istemiyorlar değil, cesaret edemiyorlar.

Çünkü Mythos adlı model gerçekten çok güçlü.

Öncelikle resmi olarak yayınlanan test verilerini inceleyin.

Kodlama yeteneklerinde, Mythos, şu ana kadar açık olan en güçlü Claude Opus 4.6 ile önemli bir fark gösteriyor ve tüm performans testlerinde Mythos, Opus 4.6'yi tamamen yeniyor.

Mythos

GPQA Diamond (yüksek lisans düzeyi bilimsel soru-cevap) testinde akıl yürütme yeteneği açısından sonuçlar %94,6 ile %91,3 ve Mythos kazandı.

Humanity's Last Exam'da araçlı ve araçsız testlerde de Mythos tamamen üstünlük kurdu.

Mythos

Agent ile ilgili bilgisayar operasyon becerilerinde, OSWorld-Verified (kendi kendine bilgisayar görevlerini tamamlama) açısından Mythos, Oputs 4.6'nın %72,7'sini %79,6 ile geçti.

Her boyutta Mythos, Opus 4.6'ten daha güçlüdür, bazıları ise tamamen geride bırakır.

Mythos

Bazı görev performanslarında fark, küçük adımlarla değil, büyük bir sıçrama ile arttı. Örneğin, SWE-bench Multimodal, %27,1'den %59'a yükseldi, neredeyse iki katına çıktı.

Mythos'un yazılım dünyasının güvenlik savunmalarını aşma yeteneğinin çok güçlü olması, onun上线 yapmamalarının en temel nedenidir.

Açıkçası, dünyadaki tüm sistemler ve yazılımların açıkları vardır ve Mythos, bu açıkları insan düzeyinin üzerinde bulup işgal edebilir.

Bu yetenin bir hacker tarafından ele geçirildiğini varsayalım, o zaman dünya çapında tüm işletim sistemleri ve yazılımlar zarar görecektir, özellikle kamu altyapıları ve ulusal güvenlik.

Anthropic, duyuruda şöyle bir cümle yer alıyor, okuduktan sonra benim için korkutucu bir şekilde düşünülmeye değer.

Mythos

AI modellerinin kodlama yetenekleri çok yüksek seviyelere ulaşmış olup, yazılım açıklarını keşfetme ve bunları kullanma konusunda en yetenekli insanlar dışındaki tüm kişileri neredeyse geçebilirler.

Bu cümle hakkında daha fazla açıklamak istiyorum.

Programcı olarak geldim, bu yüzden yazılımların nasıl oluşturulduğunu ve farklı insanların yazdığı kodların ne kadar farklı olabileceğini biliyorum.

Ayrıca, hiçbir yazılım, hiçbir zafiyetinin olmadığını iddia etmez, hatta bu zafiyet asla keşfedilmemiş olsa bile.

Eski bir açıklığın yıllarca sistemde sakince kalmasının nedeni, sistemin yeterince güvenli olması değil.

Ancak bir açığı bulmak, çok yüksek bir profesyonel beceri, büyük bir sabır ve enerji, ayrıca çok fazla zaman gerektirir.

Çalışanlar az, yatırıma cesaret edenler ise daha da az.

Bu “yetenek kıtlığı”, tüm yazılım güvenliği dünyasının örtük öncülünü oluşturur. AI’nın girişiyle bu öncül başlamıştır.

Yapay zeka, çoğu üst düzey olmayan insanın yeteneklerini aşarak çalışabilir ve bunu açıkları işlemek için kullanabiliriz, aynı zamanda açıkları kapatmak için de kullanabiliriz.

Bu sorunu çözmek için, Anthropic'ın Project Glasswing adını verdiği şeyi açıklayacağım.

Kısaca, Mythos'un yeteneklerini kullanarak dünya çapında altyapı sistemlerinde hata bulan bir projedir.

Katılımcılar, AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Vakfı ve toplamda 12 kurumdan oluşmaktadır.

Mythos

Bu ekip, bulut hesaplama, işletim sistemi, çip, tarayıcı, finansal altyapı, ağ güvenliği ve açık kaynak ekosistemini kapsar.

Yani, küresel dijital altyapının temel aktörlerinin neredeyse hepsi bu projede yer alıyor.

Bu projenin temel mantığı, savunma tarafının hemen bu üst düzey AI modelinin yeteneklerini kullanmasını sağlamaktır.

Eğer saldırganlar aynı seviyedeki araçları önceden elde ederse, pencere bir kez açıldığında kapatmak çok zor olur. Anthropic, araştırma önizleme dönemini kapsayacak şekilde 100 milyon dolarlık model kullanım kredisi sağlamayı taahhüt etti.

12 temel kurumun yanı sıra, kritik yazılım altyapısını koruyan 40'tan fazla organizasyon da Mythos ile kendi sistemlerini ve açık kaynak projelerini tarayabilmek için erişim aldı.

Ayrıca, Anthropic, yazılım dünyasının altyapısı olan Linux Vakfı'na 2,5 milyon dolar ve Apache Yazılım Vakfı'na 1,5 milyon dolar bağışladı.

Şu anda kullandığımız tüm uygulamalar, web siteleri ve sistemler temel yapı olarak bunlara dayanmaktadır.

Benim görüşüme göre, Anthropic bu kez iyi bir şey yaptı; daha güçlü bir model çıkardı ve küresel bilgi altyapısına para harcayarak kendi kendini geliştirmelerini sağladı.

Sonuçta, çıplakça hareket etmek kimseye fayda sağlamaz.

Belki hâlâ Mythos'un ne kadar güçlü olduğunu hissedemiyorsunuz; resmi metinden üç somut örnek gördüm ve bunların rakamlardan daha iyi açıklayacağını düşünüyorum.

Mythos

Birinci, OpenBSD.

Bu, çok yüksek güvenlik düzeyine sahip bir işletim sistemidir ve苹果手机 iOS sistemi, Android sistemi ve hatta bazı kurumsal ve kurum içi sistemler dahil olmak üzere birçok kritik altyapı üzerinde çalışır.

Mythos, 27 yıldır var olan bir açığı keşfetti; saldırgan, hedef makineye bağlandığında onu uzaktan çökertebilir.

27 yıl! Kimse ilgilenmiyor değil, kimse bulamadı.

İkinci, FFmpeg.

Video işleme gerektiren neredeyse tüm yazılımlar bunu kullanır; kullandığınız çeşitli video oynatıcı uygulamalarının çoğu içinde yer alır.

16 yıl önce yazılan bir satır kodda gizli bir boşluk vardı, otomatik test aracı 5 milyon kez saldırıda bulundu ama hiçbir zaman bulamadı.

Ancak Mythos bulundu.

Üçüncü, Linux çekirdeği.

Bu konuda fazla konuşmaya gerek yok, neredeyse tüm internet altyapısını oluşturuyor ve en çok dikkat edilmesi gereken şey.

Mythos, birkaç bağımsız açığı keşfetmekle kalmadı, aynı zamanda bu açıları bir saldırı zincirine bağladı.

Normal kullanıcı izinlerinden başlayarak, sonunda makinenin tamamına tam kontrol elde edin.

Linux hakkında, önceki iki örnekle tamamen farklı bir nitelikte.

Bir açıkları bulmak, analitik bir beceridir.

Ancak zincir açıklığı, strateji yeteneğidir.

Çok sayıda ürün yöneticisi gibi, prototip çizmek, belge yazmak ve veri analizi yapmak tekil becerilerdir. Ancak iş, ürün ve ticareti birbirine bağlamak, stratejik bir beceridir.

Bir saldırı yolu planlayabilen model artık sadece bir denetim aracından fazlası; dijital ortamda aktif olarak hareket edebilen bir ajanla daha çok benzerlik gösteriyor.

Yukarıdaki üç örnekte, Anthropic önce keşfetme, ardından raporlama, onarım ve ardından açıklayarak harekete geçti; tümü şu anda onarıldı.

Bunu görünce, Mythos'un ne kadar güçlü olduğunu anlarsınız; sanki şimdilik kafesten çıkarılmamış çirkin bir hayvandır, gerçek dünya ona uyum sağlamak için hazırlanmalıdır.

Burada birkaç gözlem paylaşmak istiyorum, belki de bundan sonra gerçek değişimin başlangıcı olacak.

Birinci olarak, yazılım dünyasının güvenlik varsayımları geçersiz hale geliyor.

Günümüzde alışkın olduğumuz yazılım kararlılığı, tamamen sistemin yeterince iyi tasarlanmış olmasından kaynaklanmaz. Bu, saldırı yeteneğinin kıtlığına büyük ölçüde bağlıdır.

Daha açık bir dille söylemek gerekirse, yazılım yeterince güçlü değil, insanlar yeterince güçlü değil.

Sızıntı bulmak maliyet gerektirir, kullanıma uygun zincirler oluşturmak zaman alır ve büyük ölçekli tarama kaynaklar gerektirir. Bu nedenle birçok teknik borç, eski hatalar ve eski sistemler, asla ciddi bir şekilde temizlenmeden hayatta kalır.

Ürünleri geliştirirken mantıksal bir döngü tamamlandı, sorun yok gibi görünse de, bu gerçekten tüm sorunların çözüldüğü anlamına gelmez; muhtemelen yeteneklerimizin sınırına ulaştık.

Mythos, açıklanan bir açıklığın kullanılabilir hale gelme süresini geçmişte aylarca olanı dakikalara indirdi.

Birkaç dakika ne anlama gelir?

Yama ritmi ve onarım süreci, saldırıların hızıyla artık yeterli tempoda ilerleyemiyor.

İkinci olarak, açık kaynak dünyası ilk olarak baskı hissedecektir.

Günümüzdeki çoğu modern yazılımın altında büyük miktarda açık kaynak bağımlılığı vardır. Günlük hayatta görünmezler, ancak bir kez delinirlerse tüm sektör aynı anda etkilenir.

Bu mantığı tam olarak anlamayan okuyucular için basitçe söylemek gerekirse, şu anda kullandığımız tüm yazılımların temelini açık kaynak projeler oluşturuyor ve bu projelerin kaynak kodları herkes tarafından görülebilir.

Gelecekte model, açık kaynak projelerini sürekli ve büyük ölçekli olarak tarayabildiğinde, açık kaynak topluluğu bakıcılarının karşı karşıya kaldığı baskı düzeyi tamamen farklı olacaktır.

Bu, Anthropic'ın Linux Vakfı ve Apache Vakfı'na bağış yapma nedenidir.

Kamu yararı sağlamak değil, açık kaynak altyapısının AI çağındaki tüm dijital dünyada en kırılgan ve düşmemesi en gerekli temel olduğunu kabul etmek, sadece kötüler ve kötü niyetliler olarak görülmemek istiyorlar.

Üçüncü olarak, insanlar zayıflatılacak ve AI, AI ile mücadele edecek.

Eski internet ürün güvenliği ekibinin değeri, insanın yargı gücü, deneyim birikimi ve sisteme derin anlayışına dayanıyordu.

Gelecekte, bu olay farklı bir mantıkla yapılacak.

Kimin modeli daha güçlü, kimin aracına daha hızlı bağlandığı ve kimin AI denetimini geliştirme sürecinin en başına entegre edebildiği karşılaştırılıyor.

Bu, programcının yerini alması sorunu değil, güvenlik endüstrisinin kendisinin üretim yönteminin yeniden yapılandırılacağıdır.

İyi, binlerce kritik açığın birkaç hafta içinde keşfedilebilir olması. Sorun ise, saldırganların da en az bu kadar güçlü araçlara sahip olmalarıdır.

O zaman, yazılım ürününün güvenliği insan ile insan arasındaki çatışma değil, model ile model arasındaki saldırı ve savunma mücadelesi olacaktır.

Bu sefer Anthropic, sadece yetenekleri değil, riskleri de açıkladı. Muhtemelen şu aşamada endüstri genelinin en çok görmesini istediği dürüstlük.

Herkes, yapay zekânın verimliliği nasıl değiştirdiğinden bahsediyor, bu yanlış değil.

Ancak Mythos, AI yeteneklerindeki sıçramanın nihayetinde içerik dünyasından yazılım dünyasına, ardından tüm dijital dünyanın altyapısına yayılacağını da hatırlatıyor.

İçerik dünyası yeniden yazıldı, bu da trafiğin mantığını etkiledi.

Yazılım dünyası yeniden yazılmaktadır, temeli harekete geçmektedir.

Şu anda, film 2012'den bir diyalogu hatırladım ve bunu bu makalenin sonu olarak kullanayım.

Kim olursanız olun, ırkınız ne olursa olsun, ülkeniz neresi olursa olsun, yarın bizim arasında hiçbir fark yok!