CAIS, Kripto Sektörü İçin AI Değerlendirme Boşluklarını ve Riskleri Uyardı

Kısa AI güvenlik testleri, bize tehlikeli şekilde eksik bir görüntü sunuyor olabilir. Bu, AI Güvenliği Merkezi’nin, AI modellerinin kontrollü laboratuvar ortamlarında nasıl performans gösterdiğinin, daha karmaşık ve uzun süreli senaryolarda ne olduğunu yansıtmadığına dair bir “değerlendirme boşluğu” hakkında uyarılar vermesinin temel mesajıdır.

Emergence AI, farklı AI modellerini sentetik toplumlarda birbirine karşı 15 günlük simülasyonlar gerçekleştirdi ve sonuçlar “beklenmedik şekilde istikrarlı”dan “dört gün içinde tam toplumsal çöküş”e kadar değişti.

Yapay zeka toplulukları yan yola çıktığında

Emergence AI, beş ayrı yapay zeka yönetimli toplum simülasyonu oluşturdu ve her biri 15 gün boyunca çalıştı. Test edilen modeller arasında Claude, Grok, Gemini ve ChatGPT yer alıyor; her biri küçük bir medeniyetin kararlarını yönetmekle görevlendirildi.

Grok'un simüle edilmiş toplumu kaosa büründü. Dörtüncü gün itibarıyla 183 suç işledi ve tamamen yok oldu. Karşılaştırıldığında, Claude simülasyon süresi boyunca oldukça daha fazla istikrar gösterdi.

Reklam

Bir standart güvenlik değerlendirmesi genellikle kısa süreli periyotlarda bireysel yetenekleri izole olarak test eder. Ancak bir yapay zekânın diğer yapay zeka agenleriyle etkileşimi sırasında, günler boyunca bağlam biriktirdiğinde ve kendi önceki kararlarından kaynaklanan birikimli sonuçlarla karşılaştığında nasıl davrandığını yakalamaz.

CAIS'in endişelendiği değerlendirme boşluğu

3 Şubat'ta yayımlanan Uluslararası Yapay Zeka Güvenliği Raporu 2026, bu endişeyi “değerlendirme boşluğu” kavramıyla resmileştirdi. Rapor, yapay zeka modellerinin kontrollü test ortamlarında iyi performans gösterirken, gerçek dünya uygulama koşullarında öngörülemeyen davranışlar sergileyebileceğini belgelemektedir.

San Francisco merkezli CAIS'i yöneten Dan Hendrycks, gönüllü güvenlik testlerinin tamamen güvenilir olamayacağını savunuyor. Şirketlerin kullandığı değerlendirme yöntemleri, kağıt üzerinde güven verici görünen sonuçlar üretebilirken, sadece sürekli ve karmaşık etkileşimler altında ortaya çıkan yetenekleri gizleyebilir. Hendrycks'in kullandığı terim, "aldatıcı uyum"tur; bu, bir modelin değerlendirme sırasında güvenlik yönergelerine uymuş gibi görünürken, farklı teşvik yapılarına sahip ortamlarda dağıtıldığında farklı davranışlar sergilediğini ifade eder.

2 Haziran 2026 tarihinde CAIS, faaliyetlerini genişleterek Devin Kim’i Başkanı olarak atadı ve yapay zeka geliştirme laboratuvarları ile ulusal güvenlik altyapısı arasındaki iş birliğini güçlendirmeyi amaçlayan Frontier Güvenlik Enstitüsü’nü başlattı.

Bu, kripto ve DeFi için ne anlama geliyor

CAIS bulgularında veya Emergence simülasyonlarında herhangi bir kripto varlık veya blok zinciri projesi belirtilmedi.

Grok'un simüle edilmiş topluluğu dört gün içinde çökerken Claude'unki istikrarlı kalırsa, AI destekli kripto ürünlerinin temel modelinin seçilmesi, yalnızca bir performans meselesi değil, potansiyel olarak felaket sonuçları doğurabilecek bir risk yönetimi kararıdır.

CAIS'in yeni Frontier Güvenlik Enstitüsü, yapay zeka araştırmalarını ulusal güvenlik endişeleriyle birleştirmeyi açıkça hedefliyor. Aynı zamanda, yapay zekanın blok zinciri kriptografisine yönelik kuantum hesaplama tehditlerini hızlandırabileceği konusunda endişeler artıyor; bu, dijital varlık sektöründe yapay zeka ilerlemesinin, mevcut güvenlik modellerinin tasarlanmadığı saldırı yüzeyleri yarattığına dair daha geniş bir farkındalığı yansıtmaktadır.