Anthropic, Fable 5'i Lansman Yapıyor, Mitler Modeli AGI'ye Yaklaşıyor

Herkesin Nisan ayında Anthropic'in Mythos adlı modeli yayınladığını hatırlaması gerekir.

İsimden ne kadar etkileyici olduğu belli, efsane.

O dönemde, 50 kurumsal müşteriye ait on binlerce kritik güvenlik açığı tespit edildi ve tüm sektörü sarstı.

Bu haber, bir zamanlar ağ güvenliği hisselerinin tamamında düşüşe neden olmuştu, bunu hâlâ hatırlıyor olmalısınız.

Çok güçlü olduğu için kötüye kullanımından korkulduğu ve "açıkça verilmesi çok tehlikeli" olduğu için genel publice açılmamaktadır.

Dün geceye kadar Anthropic, Mythos modeline bir güvenlik sınıflandırıcısı ekleyerek Fable 5'i resmen piyasaya sürdü.

Kesintisiz Mythos 5, şu anda beyaz ev, siber güvenlik savunucuları ve şeffaf kelebek projesi gibi yaklaşık 200 adet sıkı bir incelemeden geçen kuruma açık bulunmaktadır.

Bu kadar dikkatli olmak, son zamanlarda popüler olan AI animasyonu "Angel Engine" ile bağlantılı olmamayı zorlaştırıyor.

Kafeste kilitli olan, o “melek” mi?

Şu anda değil olsa da, yakında olacak.

01

Anthropic'ın resmi olarak yayınladığı test verilerine ve ilk kurumsal ortakların gerçek dünya raporlarına göre, Fable 5'in gücü hayranlık uyandırıcıdır.

Öncelikle performansı gözden geçirin.

Otomatik programlama değerlendirme listesi SWE-Bench Pro'da Claude Fable 5'in geçme oranı %80,3, "annesi" Opus 4.8 ise %69,2; GPT-5.5 %58,6; Gemini 3.1 Pro ise sadece %54,2.

Ön uç kod değerlendirmesi, Fable 5 %29,3'e ulaştı, Opus 4.8 %13,4; GPT-5.5 sadece %5,7.

……

Bu fark, soğuk silahlar çağında birdenbire bir makineli tüfek çıkarılmak gibi.

Diğerleri, yazılım mühendisliği, bağımsız bilimsel hipotezler, ilac molekülü tasarımı, model buharlaştırılması ve uç düzey sıkıştırma, uzun bağlam anlama vb. tüm testlerde Fable 5 birincidir.

Detaylar için lütfen videoyu izleyin.

Pratikte tekrar göz atın.

Ödeme devi Stripe, Fable 5 ile erken bir test gerçekleştirdi. 50 milyon satırın üzerindeki eski kod tabanını tamamen taşımayı planlıyorlar. Değerlendirmelere göre, bu ölçekli bir yeniden yapılandırma, profesyonel bir ekip tarafından bile en az iki ay sürebilir.

Sonuç olarak, görevi Fable 5'e verdiğinizde, tamamen kendi kendine plan yaptı, ilerlemeyi kendisi kontrol etti ve hatalarla karşılaştığında kendisi düzeltti. Sadece bir gün içinde 50 milyon satır kodun taşıması tamamlandı.

Bu performans, sadece "güçlü" iki kelimeyle anlatılamaz.

Dar anlamda, Fable 5 zaten dijital ekonomi düzeyindeki AGI'yi gerçekleştirmiştir.

Çünkü gerçek bir "uzun menzilli ajanlık yeteneği" gösteriyor.

GPT-5.5 veya Gemin 3.5 olsun, daha da aşağısındaki diğer büyük modeller olsun, hepsi temelde “yanıt veriyor”.

Bir topuk at, bir adım ilerler.

Tıkanışa ulaşıldığında, yalnızca bir istisna atar ve "Üzgünüm, sadece bir dil modeliyim" der.

Araç denir ama kullanıcı hâlâ derinlemesine düşünmeli, AI'yi adım adım kendi istediklerine yönlendirmeli, bu kolay değil.

İçselleştirilmiş hedef odaklı mantığa sahip Fable 5 farklıdır.

Strip'in testi gibi, kullanıcıya üç adımdan oluşan zorlu uzun vadeli bir görev verildiğinde:

Alt görev ağacı oluşturun;

Farklı araçları (web arama, veritabanı çekme, Python kumanya ortamı) zamanlamak;

Kendini gözden geçir, yolun kapalı olduğunu anla, hemen başka bir yol dene.

İnsanlar, görevleri önerip sonuçları almanın dışında artık yanından müdahale etmeye gerek yok.

Bir verimlilik aracı olarak bu çok mükemmel.

Ancak gerçek AGI ile hâlâ iki farklı şey.

Fable 5'in gücü, bulunduğu kod tabanında, bilimsel literatürde ve benzeri alanlarda hâlâ bir alt yapı matematiksel mantık ve yapı tanımı bulunduğunda oluşur.

Uzun dönem görevlerde kaybolmamasının nedeni, milyonlarca token uzunluğundaki karmaşık görevlerde bile temel hedeflerin hizalanmasını koruyabilen "uzun metin dikkat azalması" sorununu aşmasıdır.

Ancak bunu tamamen kaotik, dijital kurallardan yoksun ve insanlar dahi tam olarak anlayamadığı bir fiziksel toplumsal çamur havuzuna attığınızda, yine de "temel eksikliği" nedeniyle mantıksal kopmalar yaşar.

Eğer OpenAI tarafından önerilen “Yapay Zeka Beş Seviyeli Standartı” (1. seviye: Sohbet botu; 2. seviye: Akıl yürüten; 3. seviye: Ajan; 4. seviye: Yaratıcı; 5. seviye: Örgüt) ile ölçülürse.

Opus 4.8, 2. seviyeden 3. seviyeye doğru ilerliyor; Fable 5, 3. seviyeyi sağlamlaştırarak 4. seviyeye doğru keşifler yapıyor.

Opus 4.7'den 4.8'e 43 gün, 4.8'den Fable 5'e ise sadece 11 gün sürdü.

4. seviyeye ulaşmak ne kadar sürer? Anthropic'ın güncellemelerini giderek hızla yaptığı göz önüne alındığında, bu yıl içinde bunu gerçekleştirmek muhtemel.

Hatta en son 5. seviye için bile, iyimser tahminlere göre yalnızca 18-24 ay gerekecek ve gerçek anlamda sadece bir adım uzakta.

Bu hız çok yüksek, bu yüzden bunu güvenlik sınırlamalarıyla korumak gerekir.

02

Anthropic'ın modelle birlikte yayımladığı Sistem Kartı ve RSP değerlendirme raporlarında, Mythos 5 iki yetenekte çok tehlikeli sinyaller gösterdi.

Birincisi, Fable/Mythos temel modeli kimya ve biyoloji değerlendirmelerinde CB-1 seviyesine ulaşmıştır.

Yani bu model, yeni olmayan biyolojik/kimyasal silahların sentezlenmesini ve üretimini yönlendirebilen端到端 yeteneğe sahiptir ve hatta bazı yüksek riskli virüslerin bulaşma verimliliğini optimize etmek için genetik dizi değişiklikleri önerir.

Üniversite düzeyinde biyoloji bilgisine sahip bir terörist, Mitoş 5'in kilitlerini çözdüğünde, modeli sürekli olarak yönlendirerek ham madde denetimlerini nasıl atlayacağını, katında basit bir P3 laboratuvarı nasıl kuracağını ve yüksek ölümcüllükteki patojenleri nasıl sentezleyeceğini tamamen öğrenebilir.

İkincisi, ağ saldırıları ve güvenlik açıklarından yararlanma.

Çok erken test aşamasında, Mythos 5, kritik altyapıları (örneğin elektrik santralleri, finansal çaprazlama sistemleri, hastane ağ sistemleri) üzerindeki kritik açıkları kendi kendine bulma ve ele geçirme yeteneğini gösterdi ve saniyeler içinde hedefe yönelik sıfır gün açığı saldırı betikleri üretti.

Mythos, bu yıl Nisan ayında geliştirildiğinde, 50 başlangıç ortağı için on binlerce yüksek tehlike seviyesinde açığa rastlandığı iddia edildi.

……

Bu iki durumda, Mythos 5’i doğrudan halka sunmak çok büyük bir risk taşır.

Bu canavarı kafese kapatmak zorundasınız.

İki ay sonra, Anthropic tarafından geliştirilen kafes iki katlı.

Birinci, sessiz düşüş rotalama mekanizması.

Anthropic, Fable 5'in ön ucunda tamamen bağımsız ve son derece hassas bir sınıflandırıcı AI kurdu.

Kullanıcı karmaşık bir giriş yaparsa, bu giriş ağ saldırıları ve savunmalarını, biyokimya bilgilerini veya model ağırlıklarını çıkarmayı amaçlayan gizli ipuçlarını içerebilir; sınıflandırıcı hemen bir alarm çalar ve arka planda otomatik olarak oturumu eski Opus 4.8'e yönlendirir.

İkinci, veri koruma.

Anthropic ve Amazon, dün gece birlikte açıkladı: Birinci taraf veya üçüncü taraf platformlarında Mythos modeline yapılan tüm çağrılar için 30 günlük veri saklama zorunlu olacaktır.

Neden?

Çünkü gerçek bir hacker veya teröristin çoğu zaman yüksek zekâya sahiptir ve bir diyalogda doğrudan “bombayı nasıl yaparım?” diye sormaz, soruyu 100 adet görünürde zararsız temel soruya böler.

30 günlük tam veri izleme, tek bir diyalogla fark edilemeyen “salam kesme” tarzı kötüye kullanımları tanımlamak için desen tanıma yapmak içindir.

Dario Amodei'nin daha önce açıkça uyardığı gibi: "AI'nin insanlık için katastrofik bir risk oluşturma olasılığı tam olarak %25."

Anthropic, şirket içi belirlenen Sorumlu Ölçeklendirme Politikası'na (RSP) ve Öncü Uyumluluk Çerçevesi'ne (FCF) uygun hareket etmek için bu devasa yaratığa kendi eliyle zincir takmak zorundadır.

Bu yüzden Fable 5 ortaya çıktı.

03

Fiyatları tekrar konuşalım.

Anthropic, resmi fiyatlandırmayı: her milyon girdi tokeni için 10 dolar, her milyon çıktı tokeni için 50 dolar olarak açıkladı.

Çok pahalı.

Şu anki kurumsal Agent görevleri, yüksek doğruluk oranını hedefleyerek genellikle “çoklu düşünme, tekrar düşünme, tekrar düşünme” zincir mantığını kullanır; bir döngüde 20 milyon girdi tokeni tüketip, 5 milyon değiştirilmiş kodu üretir.

Hesaplandığına göre, tek bir görev 450 dolar tutuyor.

Ayrıca, Anthropic, mevcut bireysel aboneliklerde (Claude Pro) yer alan Mythos modeli deneyim penceresinin 22 Haziran 2026 tarihinde tamamen kapatılacağını duyurdu.

Gelecekte, bireysel kullanıcılar bunu gerçekten iş olarak kullanırsa, onlarca dolar göz kırpmadan tükenir.

Teknoloji güncellendikçe fiyatı nihayet düşecektir, ancak o zaman zaten en güçlü olmayacaktır.

Durum artık açıkça ortada: en önde gelen büyük modeller lüks hale geldi, sıradan insanlar bunları kullanamıyor.

B2B pazarına odaklanan Anthropic için bu tamamen anlaşılabilir.

Sorun şu ki, yakın zamanda Google hâlâ fiyat savaşı açıklamıştı.

Rekabetçiler genellikle piyasa payı kazanmak için fiyatları düşürürken, Anthropic neden tersine fiyatları artırıyor?

Token fiyatı sanal olduğundan, getiri oranı temelidir.

Kurumsal müşteriler, bir kilovat saatlik elektrik veya bir Token'in ne kadar olduğundan tamamen bağımsızdır; AI, tüm mühendislik akışını mükemmel ve hata olmadan tamamlayabiliyorsa, bu ek maliyeti hemen ödemeye hazırdırlar.

Daha da önemlisi, günümüzdeki siber güvenlik savaşları tamamen AI ile AI arasındaki bir çatışmaya dönüşmüştür.

Fable/Mythos seviyesindeki modeller, sistem açıklarını anında bulabildiği için, kurumlar ve devlet kurumları saldırıdan korunmak için tek seçeneği Anthropic'ten Mythos 5'in özel ağ içi koruma hizmetini yüksek fiyata satın almak zorundadır.

Kısaca koruma ücreti toplamak: En korkutucu kılıcı (Mythos 5) yarattım, kimseyi yaralamamak için kılıç kılıfına alıp halka sattım (Fable 5), ancak aynı zamanda sınırsız kılıcı savunma kurumlarına satarak, diğerlerinin geliştiriyor olduğu kılıçları engellemelerini sağladım.

AI tehditlerinden korunmak, her büyük şirket için zorunlu bir harcama haline gelecektir.

Bu, B tarafı pazarındaki üst bütçelerin Anthropic'e daha da odaklanmasına ve sadece resmi belgeler yazmak ve e-posta göndermek için kullanılabilen ucuz modellerin, çok düşük kar marjlarıyla C tarafı pazarında birbirleriyle çatışmasına neden olacaktır.

Ön görülebilir ki, bundan sonra küresel siber güvenlik sektörü, AI tarafından yönlendirilen bir değer yeniden değerlendirmesi yaşayacaktır.

Aynı zamanda, "tek kişi işletmesi" de yakında giderek daha yaygın bir olgu haline gelecektir.

04

Kendi görev bütçe dağıtım fonksiyonuna sahiptir, çalışma belleği ve bağlam yönetimi destekler, insan gibi hatırlar, reddeder ve yeniden başlar; ihtiyaç belgesinden kod teslimine kadar tüm yaşam döngüsünü bağımsızca üstlenir…

Fable 5 ve Mythos 5'in ortaya çıkışı, büyük model teknolojisinin bir güncellemesi değil, AI endüstrisinin tam olarak olgunlaştığına işaret eden bir yetişkinlik törenidir.

AI pazarı, "herkes için ücretsiz deneme" dönemiyle ilk kez veda etti.

En üst düzey hesaplama gücü ve en derin akıl, ticari değer en çok üreten altyapı, araştırmalar ve B türü uygulama savaş alanlarına yönelik olarak bir üretim faktörü stratejik malzemesi olarak öncelikli olarak sağlanacaktır.

Bu, üretkenlik patlamasının bir kutlamasıdır, aynı zamanda işgücü piyasasının bir kışıdır.

Bu yazı WeChat hesabından "Gelon" tarafından yazılmıştır, yazar: Wan Lianshan