- Anthropic, 30 Haziran'da ABD ihracat kontrolleri sona erdikten sonra Fable 5'i küresel olarak yeniden etkinleştirdi.
- Yeni koruma önlemleri, test edilen durumların %99'undan fazlasında bildirilen atlatma yöntemlerini engelliyor.
- Anthropic ve Project Glasswing ortakları, AI kaçışlarını değerlendirmek için ortak bir çerçeve oluşturuyor.
Anthropic, ABD hükümetinin 12 Haziran'da uyguladığı ve kullanıcıların milliyetini anlık olarak doğrulayamadığı için erişimi askıya almasına neden olan ihracat kontrollerini kaldırdıktan sonra Claude Fable 5 modeline küresel erişimi yeniden aktif etti.
30 Haziran itibarıyla kısıtlamalar kaldırıldığında, Fable 5 artık Claude Platformu, Claude.ai, Claude Code ve Claude Cowork üzerinde erişilebilir durumda, Mythos 5'e ise sınırlı sayıda onaylı ABD kurumunda erişim yeniden başlatıldı.
Yeniden kurulumun yanı sıra Anthropic, yeni siber güvenlik önlemlerini detaylandırdı, yapay zeka kaçışları için paylaşılan bir endüstri çatısı üzerindeki planları açıkladı ve ABD hükümet kurumlarıyla iş birliğini genişletti.
İki haftalık askıdan sonra ihracat kontrolleri kaldırıldı
Anthropic söyledi Fable 5 ve Mythos 5, 9 Haziran'da aynı temel modeli kullanarak başlatıldı, ancak her biri farklı amaçlar için tasarlandı. Fable 5, genel kullanıcılar için daha güçlü siber güvenlik korumalarıyla yayınlandı, Mythos 5 ise savunma siber güvenliği üzerinde çalışan seçili Project Glasswing ortaklarına sunuldu.
Dışa aktarma kontrolleri, Fable 5’in bazı korumalarını atlayan bir yöntem tanımlayan bir raporun ardından uygulandı. Anthropic’e göre, hükümet kurumları ve ortaklarla yapılan testlerde, raporda bahsedilen aynı yazılım zafiyetlerini tanımlayabilen birkaç başka AI modelinin olduğu ve her bir test edilen modelin tek bir zafiyeti istismar etmek için aynı demo üretme yeteneğine sahip olduğu ortaya çıktı.
Anthropic, raporlanan davranışın Mythos 5'e özgü yetenekleri ortaya çıkarmadığını, bunun yerine Fable 5’in önleyici güvenlik önlemleri kapsamında engellenen bir siber güvenlik görevi içerdiğini belirtti.
Yeni Güvenlik Önlemleri ve Sektör İşi Birliği
Rapor edilen atlatma yöntemini gidermek için Anthropic, test edilen durumların %99'undan fazlasında belirlenen tekniği engelleyen güncellenmiş bir güvenlik sınıflandırıcısı tanıttı. İstekler engellendiğinde kullanıcılar Claude Opus 4.8'e yönlendirilecektir. Şirket, güncellenmiş sistemin, daha fazla iyileştirme devam ederken, rutin kodlama ve hata ayıklama görevleri sırasında yanlış pozitifleri artırabileceğini de ekledi.
Ayrıca Anthropic, AI sızma tekniklerini değerlendirmek için ortak bir çerçeve geliştirmek amacıyla Amazon, Microsoft, Google ve diğer Project Glasswing ortakları ile çalışıyor. Önerilen sistem, yeni tespit edilen tekniklerin ciddiyetini belirlemeye yardımcı olmak üzere sızma tekniklerini yetenek kazancı, yetenek genişliği, silahlanma kolaylığı ve keşfedilebilirlik temelinde değerlendirecek.
Sorumluluk Reddi: Bu makalede sunulan bilgiler yalnızca bilgilendirme ve eğitim amaçlıdır. Makale, finansal öneri veya herhangi bir türde öneri oluşturmaz. Coin Edition, bahsedilen içerik, ürün veya hizmetlerin kullanılması sonucu oluşan herhangi bir kayıp için sorumlu değildir. Okuyucular, şirkete ilişkin herhangi bir eylemde bulunmadan önce dikkatli olmaları tavsiye edilir.
