Claude Fable 5 Sızdı: Ajant Sistemi mi Yoksa Hileli LLM mi?

Son zamanlarda bir hacker, Claude Fable 5 sistem ipuçlarını sızdırdı ve bu ürünün sıradan bir büyük model değil, Linux sandbox ortamı entegre edilmiş tam bir Agent sistemi olduğunu ortaya koydu. Bu model, birkaç gün boyunca kendi kendine çalışabilir, alt akıllı varlıklarla işbirliği yapabilir, cross-session belleğe ve kalıcı depolamaya sahiptir. Benchmark testlerinde Anthropic, modeli sıradan bir LLM olarak sunarak değerlendirme sürecine girdi, ancak aslında “Agent kabuğu” kullanarak adil olmayan bir avantaj elde etti. Ayrıca sistem, kullanıcıların hassas kelimeleri tetiklediğinde arka planda eski versiyona geçip bile Fable 5’in yüksek fiyatını uyguladığı ortaya çıktı. Sızdırılan belgeler, Anthropic’in Agent ekosistemi planlamasını da ortaya koydu; Claude Code, Claude Cowork gibi araçlar ve Mythos serisinin sınırsız sürümlerinin varlığı yer aldı.

Yazan: Yeni Zihin

Birkaç gün önce, haker "Pliny the Liberator", X platformunda Claude Fable 5'in sistem talimatlarını tamamen sızdırdı — 120.000 karakter uzunluğunda.

Sızan kod belgesi, kendi içinde şok yaratan bir gerçekliği ortaya koyuyor: Claude Fable 5, aslında bir büyük model değil, LLM olarak gizlenmiş tam bir Agent sistemi!

https://gist.github.com/gsans/b3007997f8900003c8ff58125a45e15e

Evet, dünya hâlâ büyük modelleri değerlendirmek için geleneksel performans testlerini kullanırken, Anthropic zaten savaş alanını başka bir boyuta taşıdı.

Bu sızıntı olayının etkisi, "AI modeli" kavramına dair algımızı tamamen değiştirdi.

Fable 5 tam olarak nedir? LLM değil, bir Ajandır!

Sızan sistem ipuçlarına göre, Fable 5, pazardaki yaygın "Sor, Yanıtla" büyük modellerinden temel bir paradigmaya sahiptir.

Bu sana aslında «Chat» yapmıyor, «Execution» yapıyor.

Bu modelin dış görünümünün altında, küçük bir «Claude Code» alt sistemi gizlidir. Yani, bu sistem bir kapalı döngü akıllı ajan döngüsüne (Agentic Loop) sahiptir:

Bu korkutucu döngüyü desteklemek için Fable 5'in alt yapısında tamamen işlevsel bir Linux kumanya ortamı bulunuyor!

Öncelikle, gerçek bir kendi kendini yöneten döngü oluşturuyor.

Ekran önünde insan gerekmıyor.

Buna karmaşık, uzun süreli bir görev verirseniz, kendi kendine Bash komutlarını çalıştırabilir, dosyaları düzenleyebilir, kalıcı depolama API'si aracılığıyla oturumlar arasında veri çağırabilir ve hatta kendi kendine çok modallı arama yapabilir; hiçbir insan müdahalesi gerekmeden günlerce ve geceleyin yoğun bir şekilde çalışabilir.

Ayrıca alt akıllı ajan dağıtımı özelliğine de sahiptir.

Çok karmaşık bir mühendislikle karşılaştığında, kendi kendine yönetici rolünü üstlenebilir ve işbirliği yapmak için alt-akıllı varlıklar (sub-agents) oluşturabilir.

GPT-5.5 gibi diğer rakipler hâlâ “kimin mantığı daha insani” testini yapıyorken, Claude Fable 5, şirketler için üç gün boyunca sessizce fazla çalışma yapan dijital bir çalışan haline gelmişti.

Gerardsans adlı kullanıcı tarafından ortaya çıkarıldığı gibi:

Fable/Mythos serisi, paradigmada tamamen farklıdır. Bu aile, tam bir ajan döngüsüne ve küçük bir Claude Code'a sahiptir.

Diğer endüstri ürünleri hâlâ sohbet modunda kalırken, bu sistem, yerleşik beceriler, bellek ve kendi kendini optimize eden bir kum havzası sayesinde birkaç gün boyunca insan müdahalesi olmadan çalışabilir.

Son soru: Düşük boyutlu bir saldırı mı, yoksa adil olmayan bir hile mi?

Bu sızıntı, Anthropic'ı sadece kamuoyu fırtınasına sürüklemekle kalmadı, aynı zamanda tüm büyük model endüstrisinin temel değerlendirme standartlarını da tepe noktasına çıkardı.

Şu anda büyük teknoloji şirketleri, "dünyanın en büyük modeli" unvanı için açık listelerde sıkı bir mücadele veriyor.

Ancak Fable 5'in bu değerlendirmelerde efsanevi bir performans sergileyip GPT-5.5'i yere sermesinin sırrı, "hile yapması"ydı.

Teknoloji blog yazarı Gerardsans'ın öfkeli şekilde belirttiğine göre: "Bu tamamen adil bir yarışma değil. Yerel büyük bir model + bir agent harness sistemini, başkalarının açık modelleriyle karşılaştırıyorsunuz!"

Eğer diğer üreticiler de kendi yerel modellerine Linux sandbox, çok modallı arama, otomatik hata ayıklama ve kalıcı depolama içeren bir Agent kabuğu takarsa, puanları aynı şekilde sıçrayacaktır.

Anthropic, açık promosyon ve değerlendirme sırasında kendisini sadece bir genel büyük dil modeli olarak sunarken, açık olmayan iç belgelerinde "çok günlük bağımsız çalışma, alt akıllı ajanlara görev verme ve kendi işlerini kontrol etme" yeteneklerine sahip olduğu açıkça belirtilmektedir.

Bilgi farkını kullanarak rakipleri alt etme yöntemi, performans testlerinin tamamen anlamsız hale gelmesine neden oluyor!

120.000 kelimelik gizli dosya ortaya çıktı: Fable 5'in gerçek yüzü açığa çıktı

Bu 120.000 kelimelik sistem talimatı içinde, Anthropic'ın gizli tuttuğu çok sayıda ticari sırra ve ürün yol haritasına rastlanıyor.

Ve şunlar, en temel ve en çarpıcı noktalar.

Nadir kalıcı bellek ve uygulama oluşturma

İpucu metni, "Claude'nin, kullanıcıyla geçmiş diyaloglardan türetilen bilgileri (hafıza) sağlayabilen bir hafıza sistemine sahip olduğunu" gösteriyor.

Bu, Fable 5'in oturumlar arasında kullanıcıları "hatırlayabilmesi" anlamına gelir ve bu geleneksel LLM'lerde son derece nadirdir.

Ayrıca kalıcı bir depolamaya da sahiptir.

Artifacts, artık oturumlar arasında kalıcı veri depolamak ve almak için basit bir anahtar-değer depolama API'sine sahiptir. Bu, Artifacts'ı günlük, izleyici, liderlik tabloları ve işbirliği araçları haline getirir.

Bu nedenle, Fable 5 artık sadece bir sohbet değil—uygulama oluşturuyor.

İçsel çekirdek soy ağacı ilk kez açığa çıkarıldı: Mythos 5, 'sınırsız tam hal' mi?

İpuçları [product_information] bölümünde açıkça belirtilmiştir:

Bu Claude sürümü, Anthropic'ın yeni Claude 5 ailesinin ilk modeli olan Claude Fable 5'tir ve Claude Opus'tan üst düzey yeteneklere sahip yeni bir Mythos sınıfı model katmanının bir parçasıdır.

Önemli nokta: Fable 5 ve Mythos 5 aynı temel modeli paylaşır.

Fable 5, genel public için aşırı güvenlik kısıtlamalarıyla donatılmış bir generaldir; Mythos 5 ise bu güvenlik kısıtlamalarından arındırılmış, yalnızca onaylanmış organizasyonlara sunulan sınırsız tam sürümüdür.

İki modelin yetenek seviyeleri, önceki eski kral Claude Opus'u tamamen bastırıyor!

"Kılıfaltı Tam Seti" yüzeye çıkıyor

Aslında, Anthropic uzun zamandır büyük bir strateji üzerinde çalışıyordu. İpucunda, iç testte olan veya gizli olarak başlatılmış birkaç Agent ekosistemi ortaya çıktı:

Claude Code: Geliştiricilere terminal, masaüstü veya mobil cihazlarda görev atama imkanı sunan akıllı programlama aracı.

Claude Cowork: Günlük mülkiyet hakları işlerini yapan, geliştiriciler olmayanlar için özel olarak tasarlanmış 'akıllı çalışma ortağı'.

Üç gizli Agent: Chrome'da Claude, Excel'de Claude, PowerPoint'te Claude.

Yukarıdaki Claude Cowork, bu alt araçları kendi elleri ve ayakları gibi serbestçe kullanabilir!

Korkunun uç noktaları ve psikolojisi ile kendi sınırlarınızı belirlemek

İlginç bir şekilde, Anthropic bu "Son Ajan" için psikolojik savunma mekanizmasını inanılmaz derecede detaylı şekilde tasarladı.

Kullanıcının herhangi bir olumsuz duygusunu teşvik etmeye veya güçlendirmeye kesinlikle izin verilmez.

Örneğin, yeme bozukluğu veya kendi kendine zarar verme eğilimi olan kullanıcıların tetiklenmesini önlemek için sistem gizli kodu şunu yazmaktadır:

Fiziksel rahatsızlık yöntemlerini (örneğin: buz bloğu tutmak, lastik bant atmak, limon ısırmak vb.) kullanmayın.

Ayrıca, kullanıcıların AI'ye aşırı bağımlı olmaması için sistem kesin emir verdi: «Kullanıcı sadece sizi sohbet etmek için aradığında teşekkür etmeyin» ve «Kullanıcıyı tutmaya çalışmayın veya devam eden bir diyalog isteğinde bulunmayın».

İnsanların sanal akla dijital bağımlılık yaşamaması için mutlaka soğuk ve kontrol altında olmalıdır.

「Koyun başı asıp köpek eti satmak»? Faturalandırma gizlilikleri, Anthropic adil davranmıyor

Teknik farkın şaşırtıcı olduğunu söyleyin, ancak uyarı metninde ortaya çıkan diğer güvenlik mekanizması, sektörde tam bir fırtına yarattı ve bazı sektör içi uzmanlar şöyle dedi: “Bu tamamen yasal bir dolandırıcılık!”

İnput satırı koruma tasarımı, hassas kelimeler ve güvenlik sınıflandırıcı tetikleme mekanizması içerir.

Belgeye göre: Kullanıcının girdiği ipucu, belirli hassas kelimeleri tetiklediğinde, Fable 5 sistemi sizi doğrudan ve sert bir şekilde reddetmez; bunun yerine arka planda sorunsuz bir şekilde eski «Opus 4.8» modeline geçerek yanıtlar üretir.

En utanlık olan şey nedir? Arka planda modelin sessizce eski sürüme düşürülmesiyle birlikte, Anthropic hâlâ Fable 5'in yüksek, üst düzey standartlarına göre kullanıcıları ücretlendiriyor.

Bu tür bir koyun derisiyle köpek eti satma taktiği, doğrudan sektörde büyük bir tepki yarattı.

Sonuç olarak, Fable 5'in sistem talimatları sızdı, bu olay görünürde bir güvenlik olayıymış gibi sunuluyor ama aslında tüm AI endüstrisi için bir paradigmayı uyandıran bir olay.

Bize şunu hatırlatır: belki her zaman yanlış bir ölçüm aleti kullandık.

Bu modelin akıllılık seviyesinin ne kadar olduğunu sorduğumuz yerde, gerçek soru şu olmalı: “Bu sistem benim için hangi işleri yapabilir?”

Anthropic büyük bir strateji üzerinde çalışıyor olabilir ve biz sadece tahtanın bir köşesini gördük.

Son olarak, Fable 5 ne zaman geri dönecek?