Anthropic, endüri genelindeki AI geliştirme durdurulmasını öneriyor ve riskleri değerlendirmek için

Anthropic, Claude AI modelünün arkasındaki şirket, 4 Haziran'da bir yıl önce öncü bir AI laboratuvarından düşünülemez gibi görünen bir şey öneren bir blog yazısı yayınladı: tüm endüstride öncü AI geliştirme üzerinde yapılandırılmış, geçici bir duraklama.

Marina Favaro ve Jack Clark tarafından yazılan önerme, belirli ve gerçekten endişe verici bir sorunu hedefliyor. Yapay zeka modelleri, insan müdahalesi olmadan kendi yeteneklerini değiştirebilecek ve geliştirebilecek düzeylere geliyor.

Anthropic'in aslında önerdiği

Bu, her bir GPU’yu çıkarıp eve gitmek için bir çağrı değil. Anthropic, büyük AI laboratuvarlarının güvenlik araştırmaları ve doğrulama sistemleri yetişene kadar en gelişmiş geliştirme çalışmalarını geçici olarak durdurmayı kabul eden koordine edilmiş, çok taraflı bir çerçeve öneriyor.

Anthropic, tek taraflı eylemlerin, bir şirketin veya bir ülkenin yalnızca kendi başına frenlemesinin yetersiz ve belki de ters etki yaratabileceğini açıkça savunur. Öneri, ABD, Çin ve diğer ciddi yapay zeka programlarına sahip ülkelerdeki iyi kaynaklı laboratuvarlar arasında iş birliğini öngörür. Anthropic, doğrulama sorununu, denetçilerin güvene değil, kabul edilmiş algılama mekanizmaları aracılığıyla uyumu doğruladığı nükleer silah kontrolünden alınan terimlerle çerçevelendirir.

Reklam

Anthropic, bu tespit ve doğrulama araçlarını oluşturmaya yönelik kendi araştırmalarını gerçekleştireceğini açıkladı; laboratuvarın kamuoyuna bir duraklama ile uyum sağladığını iddia ederken gizlice öncü geliştirme çalışmalarını sürdürüp sürdürmediğini onaylayabilecek, yapay zeka silah denetçilerine denk gelen sistemler oluşturacak.

Bu sefer neden 2023'ten farklı olabilir

2023'te, GPT-4 seviyesinin üzerindeki AI eğitimi için altı aylık bir duraklama çağrısında bulunan bir açık mektup, araştırmacılar ve teknoloji öncülerinden binlerce imza topladı. Ancak neredeyse hiçbir etki yaratamadı. Rekabet baskıları, kolektif endişeden çok daha ikna edici oldu ve tüm büyük laboratuvarlar inşa etmeye devam etti.

Anthropic’in önerisi yapı olarak farklıdır. Şirket, imza ile desteklenen belirsiz bir durdurma talep etmek yerine, doğrulanabilir bir uyum sistemi önermektedir. Nükleer silah kontrolü benzerliği tamamen yanlış değildir: Uluslararası silah anlaşmaları, imzalayan tarafların küçük parmakla söz vermesi yerine, denetim sistemleri ve hile için uygulanan sonuçlar nedeniyle işe yarar.

2023'te özyinelemeli kendini geliştirme teorik bir endişeydi. Şimdi Anthropic'in kendi iç gözlemleri, mevcut modellerin giderek bağımsız olarak kodlama yeteneğine sahip olduğunu gösteriyor ve bir yapay zeka sisteminin kendi sonraki versiyonuna anlamlı katkıda bulunabileceği eşiğe yaklaşmasını sağlıyor.

Bu, yatırımcılar için ne anlama geliyor

AI ile ilişkili varlıklara, özellikle AI odaklı kripto tokenlere ve makine öğrenimini kullanan blok zinciri projelerine sahip herkes için, Anthropic’in önerisi risk hesaplamasına yeni bir değişken ekliyor. Koordine edilmiş bir durdurma çerçevesi, tamamen gerçeklemeseler bile, “AI’yi düzenlemeli miyiz?” sorusundan “sınırlar boyunca uyumu nasıl uygularız?” sorusuna geçiş yapıyor.

Yapay zeka tabanlı kripto projeleri, merkeziyetsiz hesaplama ağlarından AI ajan tokenlerine kadar, yapay zeka geliştirme hızının kesintisiz şekilde artmaya devam edeceği varsayımından değer sunumlarının bir kısmını türetir. İnanılır bir duraklama çerçevesi veya bu yönde ciddi bir düzenleyici hareket, bu değerlemelere belirsizlik katabilir.

Merkeziyetsiz doğrulama sistemleri, Anthropic'in aradığı çözümün bir parçası haline gelebilir. Dünyanın her yerindeki laboratuvarların geliştirme sınırlarına uyup uymadığını doğrulamanız gerekirse, şeffaf ve değiştirilmeye dirençli bir defter iş için en kötü araç değil.