@subquadratic adlı yeni bir AI şirketi, modern AI'nın en esk

@subquadratic adlı yeni bir AI şirketi, modern AI'nın en eski sınırlarından birini kıran bir model çıkardı. Neden önemli olduğunu anlayabilmek için, daha önce kullandığınız her sohbet botunu sessizce şekillendiren tek bir matematik problemini anlamalısınız. - ➠ Sorun: AI Çiftlerle Okur, Çiftler Ölçeklenmez Modern tüm LLM'ler (ChatGPT, Claude, Gemini) metni, her kelimenin diğer tüm kelimelerle ilişkisini kontrol ederek okur. Bu iyi gibi görünür, ancak matematik yapınca: ▸ 10 kelime → 100 karşılaştırma ▸ 1.000 kelime → 1 milyon karşılaştırma ▸ 1 milyon kelime → 1 trilyon karşılaştırma Girişin iki katına çıkarmak, işi iki katına çıkarmaz. Dört katına çıkarır. Bu, karesel ölçeklenme olarak bilinir ve 2017'den beri AI'nın temelinde yer almaktadır. Bu sizin için ne anlama gelir: ▸ Uzun belgeler hızla pahalılaşır ▸ Modeller, uzun girdilerin derinliklerinde saklanan gerçekleri sıklıkla kaçırmaktadır ▸ Tam kod tabanları veya araştırma kütüphaneleri sığmaz Şimdi neden bağlam ne kadar uzunsa, LLM'lerinizin o kadar aptalca ve pahalı olduğunu biliyorsunuz. - ➠ Bugün AI Nasıl Sorunu Gizliyor Endüstri, matematiksel sorunu düzeltmek yerine çözümler geliştirdi: ▸ RAG: Bir arama motoru birkaç ilgili alıntı alır ve sadece bunları modele sunar ▸ Bölümleme: Uzun belgeler küçük parçalara bölünür ▸ Ajan sistemleri: Birden fazla AI çağrısı, kodla birleştirilmiş farklı parçaları işler ▸ FlashAttention: Aynı pahalı matematiği daha hızlı çalıştıran akıllı bellek hileleri Bu çözümler işe yarar ama hiçbirisi temel sorunu çözmez. Modern AI yığını (vektör veritabanları, alım süreçleri, vurgu mühendisliği) tamamen modellerin tüm içeriği aynı anda görememesi nedeniyle var olmuştur. — ➠ SubQ Ne Yapıyor Farklı SubQ, SSA (Karesel Olmayan Seyrek Dikkat) adlı yeni bir yaklaşım kullanıyor. Bir cümlede fikir: Her kelimeyi diğer tüm kelimelerle karşılaştırmak yerine, model soruya gerçekten önemli olan kelimeleri belirler ve gerisini görmezden gelir. Bu, ölçeklenmeyi kareselden doğrusala değiştirir. Girişin iki katına çıkarmak artık işi dört katına değil, iki katına çıkarır. Zor kısım fikir değil, çünkü insanlar bunu daha önce denemişlerdir. Her önceki girişim bir şeyi feda etti: ya doğruluk, ya uzun metinlerde saklanan gerçekleri bulma yeteneği, ya da verimlilik. Subquadratic, @alex_whedon ile kuruldu ve üçünü aynı anda çözdüklerini iddia ediyorlar. — ➠ Kanıtlar Üçüncü taraf tarafından doğrulanmış performans testleri: ▸ RULER 128K (uzun bağlamlı muhakeme testi) üzerinde Claude Opus 4.6 ile eşit ▸ MRCR v2 (çoklu kanıt alımı) üzerinde Opus 4.7, GPT 5.4 ve Gemini 3.1 Pro'yu yener; ancak Opus 4.6 ve GPT 5.5'e kaybeder ▸ SWE-Bench (gerçek kodlama görevleri) üzerinde Opus 4.6 ve Gemini 3.1 Pro'yu yener; Opus 4.7'den geride kalır ▸ 1 milyon token için FlashAttention'tan 52 kat daha hızlı ▸ Bir araştırma versiyonu, diğer öncü modellere göre yaklaşık 1.000 kat daha az dikkat hesaplama ile 12 milyon token işler Özetlemek gerekirse, bu "dünyanın en iyi modeli" değil. Temel olarak daha ucuz bir maliyet eğrisiyle öncü düzey doğruluk sunuyor. — ➠ Sam Altman Nerede Devreye Giriyor Altman'ın en büyük iki kamuoyu iddiası, SubQ'un çözmeye çalıştığı aynı soruna işaret ediyor. Maliyet konusunda: Şubat 2025'teki blog yazısında "Üç Gözlem" adlı yazısında Altman, AI kullanım maliyetinin her 12 ayda yaklaşık 10 kat düştüğünü yazdı. Buna "Moore Yasası'ndan inanılmaz daha güçlü" dedi. Tezine göre: Daha ucuz çıkarım, AI'nın nasıl şekilleneceğini belirleyen ana güçtür. Boyut konusunda: 2023'e geri dönersek, Altman daha büyük modeller çağı sona erdi demişti ve gerçek rekabet dolar başına yetenekti. Parametre sayısının yarışını 1990'ların çip GHz yarışına benzetmişti. Yanlış ekseni. SubQ bu iki iddiayı harfiyen alıyor. Sloganları "Verimlilik zekadır." Ancak: Altman'ın daha ucuz AI yolculuğu için belirttiği yol donanım ilerlemesi, yazılım optimizasyonu ve model distilasyonudur. Kendisi açıkça dikkat matematiğini yeniden tasarlamayı desteklememiştir. Yani SubQ'un tezi, ekonomik görüşüyle uyumlu ama aynı zamanda büyük laboratuvarların bir mimari doları unuttuğuna dair bir iddiadır. — ➠ Neden Önemli Eğer SubQ üretim ölçeğinde başarı sağlarsa: ▸ Kod tabanları tek bir sohbet olarak. Artık dosyaları yönetmek için çoklu ajan sistemlerine gerek yok. Model tüm repo'yu tutar. ▸ RAG isteğe bağlı hale gelir. Bugünki AI altyapısının çoğu, karesel tavanı telafi etmek için vardır. Tavan kaldırıldığında iskelet artık yük olur. ▸ Uzun süreli ajanlar artık bir hile olmaktan çıkar. Sürekli bellekli günlerce süren oturumlar doğaldır. ▸ Yeni uygulamalar mümkün olur. Çok pahalı olan iş yükleri (tam belge incelemesi, kapsamlı kod araması, uyumluluk taraması) rutin hale gelir. — ➠ Dürüst Uyarılar ▸ Özel beta aşamasında. Gerçek dünya güvenilirliği test edilmemiştir. Bu nedenle açıklamayı bir tezat olarak değerlendirin; birçok kişi bunun sadece performans eylemi olduğunu düşünüyor. ▸ MRCR v2 puanı (65,9%) iyi ama Opus 4.6 (78,3%) ve GPT 5.5 (74%)’den geride kalıyor. SSA daha verimli ama kesinlikle daha yetenekli değil. ▸ Performans testleri üçüncü taraf doğrulamasıyla kendi kendine yayımlanmıştır. Gerçek test akademik tekrardır. ▸ 12M token sonucu bir araştırma modelidir; satılan ürün değil (ki bu 1M). — ➠ Sonuç Dokuz yıldır her transformer tabanlı AI aynı karesel vergiyi ödüyordu. Subquadratic sonunda bunu yapmamanın yolunu bulduklarını iddia ediyor. Performans testleri en azından yön olarak doğru olduklarını gösteriyor. Altman üç yıldır endüstriye dolar başına yetenek yeni savaş alanı dedi. SubQ, bu savaşta çözmek yerine çözümler yığarak değil, temel matematiği değiştirerek kazanmaya çalışan ilk şirketlerden biri. Başarıyı sağlayıp sağlayamayacağı artık kamuoyuna açık bir deneysel soru haline geldi.