Amerika Birleşik Devletleri hükümeti, Anthropic'ın iki ileri düzey modeli olan Fable ve Mythos'un ihracatını sınırlamayı talep ettikten sonra, bir grup siber güvenlik uzmanı, bu kısıtlamaların, ileri AI'yi kullanarak güvenlik tarafının açıkları keşfetme, hataları düzeltme ve yazılımı güçlendirme yeteneğini zayıflattığını savunarak bu kararı kamuoyuna karşı çıkarak protesto etti.
Şu ana kadar 76 güvenlik uzmanı tarafından imzalanmış olan açık mektup, eski Facebook güvenlik sorumlusu Alex Stamos, Bugcrowd kurucusu Casey Ellis, kriptografi uzmanı Jon Callas, bilgisayar bilimcisi Paul Vixie ve Luta Security kurucusu Katie Moussouris gibi imza sahiplerini içermektedir. Ortak mektup, rakip teknolojilerin hızla ilerlemesi durumunda, en güçlü yetenekleri savunma taraflarından almanın tehlikeli bir yaklaşım olduğunu belirtmektedir.
Hükümet emriyle küresel erişim durduruldu
Anthropic, ABD hükümetinin geçen hafta ulusal güvenlik gerekçesiyle ihracat kısıtlamaları uyguladığını, ancak daha spesifik bir temel belirtmediğini açıkladı. Şirket, ardından Fable ve Mythos'a küresel kullanıcıların erişimini durdurdu.
Mythos, bu yıl Nisan ayında önizleme olarak tanıtıldı. Anthropic, modelin güvenlik açıklarını tespit etme konusunda güçlü yeteneklere sahip olduğunu belirterek, kötü niyetli hackerlar veya yabancı rakipler tarafından kötüye kullanılmaması için erişimin sıkı şekilde sınırlanması gerektiğini ifade etti. Başlangıçta yaklaşık 50 şirket erişim hakkı kazandı, ardından bu sayı 15 ülkede yaklaşık 150 kuruma çıkarıldı.
Tartışmalar, öngörülen atlatma yöntemlerine odaklanıyor.
Anthropic, Beyaz Saray'ın bu kısıtlama emrinin, Fable kısıtlamalarını atlayarak Mythos seviyesine yakın yetenekler serbest bırakabilecek bir yöntem olduğuna dair bir raporla ilgili olabileceğini de belirtti.
Katie Moussouris, bu henüz yayınlanmamış çalışmanın Amazon araştırmacıları tarafından tamamlandığını ve kendi içeriğini gördüğünü belirtti. Ona göre, makale gerçek bir “kaçış” yöntemi göstermiyor. Söz konusu araştırmacıların, modelin orijinal korumalarını aşmak yerine, açıkça belirtilmiş açıklar ve yapay olarak yerleştirilmiş açıklar içeren açık kaynak kodları onarmayı talep ettiklerini ifade ediyor.
O, bu tür işlemlerin, sorunların tespit edilmesi, hataların düzeltilmesi ve onarımın etkinliğinin doğrulanması dahil olmak üzere güvenlik ekibinin günlük çalışma süreçleri olduğunu belirtti. Bu yeteneğin bir sınırlamayı atlamak olarak görülmesi, modelin savunma senaryolarındaki değerini yalnızca azaltacaktır.
Ortaklar, sorunun Anthropic'a özgü olmadığını belirtti.
Açık mektup, ilgili yöntemlerin sadece Anthropic modellerine değil, OpenAI'nin GPT-5.5'i, Anthropic'in açıkça sunduğu Claude Opus 4.8 ve Sonnet'e, hatta Çinli model Kimi 2.7'ye bile benzer durumların yaşanabileceğini belirtti.
İşbirlik yapanlar, ABD hükümetinin ilgili kuralları oluştururken şeffaflığı artırmasını ve endüstri ile akademik世界的 araştırmalarına dayanarak sınırlamaları en aza indirmek için daha açık bir süreç izlemesini talep etti.
