Recursive Superintelligence, İlk Otomatik AI Araştıma Sistemi'nı Açıklıyor

Bazı günler önce Anthropic, 'AI Kendini İnşa Ederken' adlı bir makale yayınladı ve bu makale geniş çapta tartışmalara neden oldu. Makale, 2026 Mayıs itibarıyla Anthropic kod deposunun %80'inden fazlasının Claude tarafından yazıldığını ve mühendislerin günlük birleştirdiği kod miktarının 2024 yılına göre 8 kat arttığını ortaya koydu; bir iç testte, Claude bir eğitim kodunun çalışma hızını temel seviyeye göre yaklaşık 52 kat artırdı, ancak deneyimli bir insan araştırmacı genellikle 4 ila 8 saat içinde sadece 4 kat hızlanmayı başarabiliyordu.

Anthropic, bu yolu "özyinelemeli kendi kendini geliştirme" adlı daha derin bir hedefe doğru yönlendiriyor: AI sistemleri, insanlar her adımı yönlendirmeden, kendi sonraki versiyonlarını kendi kendine tasarlıyor, oluşturuyor ve eğitiyor. Şunu da dikkat çekiyor: şirket, özyinelemeli kendi kendini geliştirme anı geldiğinde, önde gelen AI geliştirme çalışmalarını ertelemeye veya geçici olarak durdurma seçeneğine sahip olmak için sektörün koordinasyonunu çağırıyor. Anthropic zaten bunu yapıyor: En son Claude Fable 5'in önde gelen AI geliştirme amaçlı kullanılmasını sınırlıyor.

Şu anda Recursive Superintelligence, otomatikleştirilmiş AI araştırmalarına ilk adımı attı.

Tian Yuan Dong'un ortak kurucusu olduğu bu yeni şirket, sadece bir ay önce gizli durumundan çıktı ve şimdi ilk açık teknoloji başarısını duyurdu. Onlar, açık bir otomatik bilgi keşif sistemi geliştirdiler ve üç temel testte SOTA sonuçları elde ettiler. Basitçe ifade edersek, AI'nın sizin yerinize deneyleri çalıştırmayı başardılar.

https://x.com/tydsh/status/2065062838255649082

İlk adım: Yapay zekânın deneylerinizi sizin yerinize yürütmesini sağlayın

Recursive, bu ilk kamuoyuna açık teknolojik başarı, "Otomatik AI Araştırmasına İlk Adımlar" adını taşımaktadır.

https://x.com/Recursive_SI/status/2064980090702962699
Depo adresi: https://github.com/recursive-org/first-steps-toward-automated-ai-research
Blog adresi: https://www.recursive.com/articles/first-steps-toward-automated-ai-research

Bu çalışmanın özü, AI araştırması döngüsünü kendi kendine ilerletebilen bir sistem kurmak ve üç temel testte en iyi sonucu elde etmektir.

Resmi sonuçları dağıtmadan önce, bu sistemin tasarım mantığını anlamak gerekir.

Geleneksel AI araştırma süreci, bir insanın "fikir üretme—kod yazma—deney çalıştırma—sonuçları analiz etme—tekrar fikir üretme" döngüsüne yüksek oranda bağımlıdır. Verimlilik sınırlaması hesaplama gücü değil, insandır. Dünyada öncü eğitim süreçleri tasarlayabilen araştırmacılar az sayıdadır ve her deney iterasyonu onların yoğun katılımını gerektirir.

Recursive sistemi, bu döngüyü otomatikleştirmeye çalışıyor.

Şu şekilde çalışır: Belirli bir optimizasyon hedefi için sistem otomatik olarak deney fikirleri önerir, kodu uygular, doğrulama yapar, bundan öğrenir ve sonraki arama adımını belirler. Birden fazla araştırma yolu paralel ilerletilebilir; etkili keşifler görevler arasında yeniden kullanılabilir ve ödül hilelemesini (reward hacking) tespit mekanizmaları, sistemin ölçüm göstergelerini yükseltmek için "kısa yol" kullanmasını önleyecek şekilde döngüye entegre edilmiştir, ancak hiçbir şeyi gerçekten iyileştirmemiştir.

Bu, tek bir soruna yönelik ince ayarlanmış özel bir araç değil, çok alanlı genel bir araştırma otomasyon çerçevesidir. Recursive, bunu üç farklı test senaryosuyla kanıtlamıştır.

Üç savaş alanı, üç yeni rekortmen

Senaryo 1: Sabit hesaplama bütçesiyle küçük model eğitimi (NanoChat Autoresearch)

Bu testin kuralları, Andrej Karpathy (GPT-2 yazarı ve eski OpenAI kurucu ortağı) tarafından başlatılan autoresearch projesinden gelmektedir: Bir GPU üzerinde, beş dakikalık sabit eğitim bütçesi verildiğinde, küçük bir dil modelini mümkün olduğunca düşük bir doğrulama kaybına (BPB ile ölçülen, ne kadar düşükse o kadar iyi) ulaştırmak.

Bu senaryo, otomatikleştirilmiş araştırmaya doğuştan uygundur: deney süreleri kısa, endeks varyansı düşük ve hile davranışları nispeten kolay tespit edilebilir. Bu nedenle, "autoresearch@home" adlı bir topluluk projesi uzun süredir bu referans üzerinde çalışmaktadır—onlarca insan araştırmacı ve yüzlerce AI ajanı birlikte sürekli olarak endeksleri düşürmektedir.

Recursive sistemi, aynı başlangıç koduyla başlayarak, BPB doğrulamasını topluluk en iyisi olan 0,9372'den 0,9109'a kadar ilerleterek 0,0263 BPB iyileştirme sağladı. Başka bir ifadeyle: Aynı eğitim kalitesiyle, Recursive çözümü, rakibin eğitim süresinin sadece %1,3'ü kadar sürede ulaşabilir.

Sistem tarafından tespit edilen iyileştirmeler, tek bir çözüm ile değil, mimari ayarlamalar, yardımcı kayıp, dikkat mekanizması değişiklikleri, iyileştirici davranışları, ağırlık çürümesi zamanlaması ve derleyici ayarları gibi birçok değişikliğin birleşimiyle elde edilmiştir. En kritik keşiflerden biri, daha zengin bir kısa bağlam bellek mekanizmasıdır: Dikkat değer yolu boyunca, bigram (bitişik kelime çiftleri) ve trigram (üçlü gruplar) bilgileri bir hash tablosuyla aynı anda gömülür ve öğrenilebilir bir kapı ağırlığı ile karıştırılır. Farklı Transformer katmanları, katmanlar arası tekrarlayan çakışmaları azaltmak için farklı hash fonksiyonları kullanır.

Bu teknik, DeepSeek Engram gibi çalışmalarla kavramsal olarak ilişkilidir, ancak sistem bunu henüz açık literatürde görülmemiş bir varyant olarak sabit bütçeli senaryolara uygulamıştır.

Szenaryo 2: Eğitim Hızı Sınırı Yarışı (NanoGPT Speedrun)

Eğer önceki senaryo, aktif bir topluluk başarısının üzerine bir adım daha atmaktı, bu senaryo çok daha zor.

NanoGPT Speedrun, Karpathy tarafından başlatılan ve iki yıldan fazla bir süredir topluluk tarafından optimize edilen başka bir referans: 8 adet H100 GPU üzerinde bir GPT modelini doğrulama kaybı 3.28 seviyesine getirmek için gereken en kısa süre. 2024 ortalarından beri, topluluk 83 kayıtlı katkıyla süreyi yaklaşık 45 dakikadan 79,7 saniyeye düşürdü. Her yeni çözüm, son derece optimize edilmiş kodun üzerine daha fazla zaman kazandırmayı gerektirir ve bu zorluk anlaşılmaktadır.

Recursive sistemi, mevcut en iyi çözümden başlayarak eğitim süresini 77,5 saniyeye indirerek 2,2 saniye tasarruf sağladı. Bu, son zamanlarda insan katkıda bulunanların sağlayabildiği iyileştirme miktarına eşit veya daha iyidir.

Bu sefer sistem tarafından bulunan temel teknikler şunlardır:

FP8 doğruluğunda dikkat hesaplamaları. Topluluk çözümü, modelin yalnızca son katmanında (dil modeli başlığı) FP8 (8-bit kayan nokta) hesaplamalarını kullanırken, sistem FP8'i dikkat katmanlarının matris işlemlerine kadar uzatır; ileri yayılımda Tensor Core verimliliğini iki katına çıkarmak için FP8 kullanılır, geri yayılımda ise kararlılığı korumak için BF16 korunur.

Optimizasyoncudaki soğutma keşif gürültüsü. Sistem, NorMuon optimizasyoncunun güncelleme adımlarına sıfır ortalama Gauss gürültüsü ekler; gürültü genliği, eğitim ilerledikçe doğrusal olarak sıfıra düşer. Bu, optimizasyoncuya «önce cesurca keşfet, ardından kararlı bir şekilde yakınsa» davranış modeli verir ve nihai çözümün daha düzgün bir kayıp havzasında bulunmasına yardımcı olur.

MLP çekirdeğini daha da sadeleştirilmiş bir şekilde entegre edildi. Sistem, ileri yayılımda ReLU karesi alınmış aktivasyon değerlerini yalnızca saklayan ve geri yayılımda çekirdek içinde kare alınmamış ara sonuçları yeniden hesaplayan bir Triton GPU çekirdeğini yeniden yazdı; bu, yüksek bant genişlikli bellekte tam bir aktivasyon tensörünün okuma/yazma döngüsünü ortadan kaldırarak donanım düzeyinde doğrudan bir hızlanma sağladı.

İki farklı profesyonel alanda: doğruluk stratejisi, optimizasyon tasarımı ve GPU çekirdek programlaması üzerinde üç iyileştirme yapıldı. Sistemin iki yıllık topluluk optimizasyonu sonucunda hâlâ iyileştirme alanı bulunduğu, kendi başına bir sorunu göstermektedir.

Sahne 3: GPU çekirdek optimizasyonu (SOL-ExecBench)

İlk iki senaryo model eğitimi düzeyinde çalışırken, üçüncü senaryo daha alt seviyeye iniyor: GPU hesaplama çekirdeklerinin optimizasyonu.

SOL-ExecBench, NVIDIA tarafından çıkarılan, matris çarpımı, indirgeme, normalleştirme katmanları, dikkat bileşenleri, kantizasyon rutinleri, birleşik bloklar gibi çeşitli gerçek iş yüklerini kapsayan 235 çekirdek yazma görevini içeren bir performans testidir. Puanlama ölçütü SOL puanıdır: 0,5 PyTorch temel uygulamasına, 1,0 ise donanım teorik sınırına karşılık gelir. Önceki en iyi açık sonuç 0,699 idi.

Recursive sistemi, 235 çekirdek üzerinde tamamen çalışır ve görevler arasında bulunan optimizasyon desenlerini (örneğin, bellek taşıma stratejileri, bloklama yöntemleri, indirgeme teknikleri) yeniden kullanmayı sağlar; bu da nihai puanı 0,754'e çıkararak donanım sınırına olan mesafeyi %18 azaltır.

Bu senaryo özel bir anlama sahiptir, çünkü çekirdek mühendisliği son derece uzmanlık gerektiren bir alandır—etkili Triton/CUDA çekirdekleri yazabilecek mühendisler dünya çapında nadirdir. Recursive ekibi, blogunda kendi kendilerinin çekirdek alanında uzman olmadığını itiraf ediyor: “Bu fikirler, bizim uzmanlık alanlarımızdan değil, sistemden geliyor.”

Recursive: Yapay Zeka ile rekürsiviteyi araştırmak ve Yapay Zekayı geliştirmek

Bu başarıyı duyuran şirket Recursive Superintelligence, 2025 sonunda ile 2026 başlarında kuruldu ve geçen ay gizli durumundan çıktı; kurucu üyeler arasında eski Meta FAIR araştırma bilimci direktörü Tian Yandong dışında şunlar yer alıyor:

Richard Socher, Recursive CEO, eski Salesforce baş bilim insanı

Alexey Dosovitskiy, önceki Google DeepMind araştırmacı bilim insanı ve Vision Transformer'in ilk yazarı, Google Scholar'da 160.000'den fazla alıntıya sahip.

Tim Rocktäschel, eski DeepMind Ana Bilim İnsanı ve UCL Yapay Zeka Profesörü

Peter Norvig, Google'nin eski araştırma direktörü, Stuart Russell ile birlikte yapay zeka alanının ünlü ders kitabını olan "Yapay Zeka: Modern Bir Yaklaşım"ı yazdı.

Caiming Xiong, eski Salesforce AI başkanı

Tim Shi, eski OpenAI araştırmacısı, Cresta girişimci AI şirketi kurucu ortağı ve CTO'su

Josh Tobin, Recursive CTO, önceki OpenAI ve Uber ATG araştırma sorumlusu

Jeff Clune, eski Google DeepMind araştırma başkanı, Kanada British Columbia Üniversitesi Bilgisayar Bilimleri profesörü

Bu girişim, henüz açık bir ürünü olmaksızın, GV (Google Venture) ve Greycroft tarafından öncülük edilen, NVIDIA ve AMD Ventures tarafından desteklenen 6,5 milyar dolarlık finansmanla 46,5 milyar dolarlık değerlemeye sahip oldu.

Şirketin temel savı, ismiyle doğrudan ilişkilidir: Kendi araştırma yeteneklerini özyinelemeli olarak artıran bir AI sistemi inşa etmek, AI'nın AI'nın geliştirme sürecine dahil olmasını ve hızlanmasını sağlamak ve nihayetinde sürekli kendini geliştiren bir döngü oluşturmak.

Daha fazla bilgi için, "Meta'dan ayrıldıktan sonra, Tian Yuan Dong yeni girişimini resmen duyurdu" haberiyle ilgilenin.

Elbette, yarışma düzeyinde Recursive yalnız değil. Yann LeCun'un AMI Labs şirketi, bu yıl Mart'ta 1 milyar dolarlık finansmanı tamamladı; David Silver'in Ineffable Intelligence şirketi ise Nisan'da 1,1 milyar dolarlık tohum sermayesini aldı. Her ikisi de benzer bir yöne işaret ediyor: AI sistemlerinin kendi kendine bilgi üretmesini ve insanların araştırmada yer almasını azaltmayı. Ancak açık sonuçların hızı açısından, Recursive'in bu "ilk adım"ı, şu ana kadar bu tür şirketler arasında en somut ve en yeniden üretilebilir teknik gösterilerden biri olmalı.

Rekürsif paradigmın alışı

Recursive tarafından yayınlanan bu sonuç, daha geniş bir endüstri bağlamında, AI sistemlerinin araştırmanın ana rolünü üstlenmesini sağlayan yeni bir AI araştırma modelinin ilk uygulamasını temsil eder.

Bu "özyinelemeli AI"nin temel mantığı karmaşık değil: AI, AI araştırmalarını artırır, geliştirilen AI ise kendini daha etkili bir şekilde artırır ve bu döngü devam eder. Tek bir büyük atılıma değil, sürekli atılımlar üreten bir sisteme dayanır.

Bu yaklaşım, AI araştırmasının kendi ekonomisi açısından önemli bir öneme sahiptir. Öncü modellerin eğitim süreci hâlâ belirli becerilere sahip az sayıdaki araştırmacıya yoğun şekilde bağımlıdır ve bu işi yapabilecek insanlar dünyada binlerce kişiden azdır. Eğer otomatikleştirilmiş bir araştırma sistemi bu işlerin en az bir kısmını üstlenirse, AI ilerleme hızı ve maliyet eğrisi değişecektir.

Bu değerlendirme, sektörün yakın zamanda dile getirdiği diğer seslerle de uyumludur. Örneğin, makalenin başında bahsedilen Anthropic’in “AI Kendini İnşa Ettiğinde” adlı çalışması, hafif bir ton taşımamaktadır—bu çalışma, rekürsif kendi kendini geliştirme anı geldiğinde, toplumsal yapıların ve uyum araştırmalarının tempo ile uyumlu kalması için ileri AI geliştirme çalışmalarını ertelemeye veya geçici olarak durdurma seçeneğine sahip olmak amacıyla sektörün koordinasyonunu talep etmektedir. Daha fazla bilgi için “AI Kendini Çok Hızlı Geliştiriyor, Anthropic Küresel Geliştirme Durdurma Çağrısında Bulunuyor” başlıklı makaleye bakın.

https://www.anthropic.com/institute/recursive-self-improvement

İki şey aynı anda gerçekleşiyor, ilginç. Bir tarafta Anthropic, bu yolun yönünü kaydediyor ve uyarıda bulunuyor; diğer tarafta Recursive gibi ekipler, bu yolu adım adım gerçekliğe dönüştürüyor.

Elbette, Recursive kendi kendini de şu anda "ilk adım" olarak tanımlıyor: Mevcut sistem, belirgin göstergelere, hızlı geri bildirimlere ve dolandırıcılığın tespit edilebildiği senaryolarda en iyi performansı gösteriyor; açık bilimsel sorunları kendi kendine ilerletebilmek için hâlâ oldukça uzak. Ödüllerin dolandırıcılıkla korunması, ölçeklendirme yolunda sürekli karşılaşılan temel zorluk olacaktır.

Ancak bir döngü zaten çalışmaya başladı. Sonraki soru, bunun ne kadar hızlı döneceği.

Bu yazı, WeChat hesabından "Makine Kalbi" (ID: almosthuman2014) tarafından paylaşılmıştır, yazar: Özyinelemeli Gelişen Makine Kalbi, editör: Panda