Büyük modeller sürekli büyüyor ve yaygın görüş, model parametrelerinin arttıkça insan düşüncesiyle daha fazla benzerlik kazanacağıdır. Ancak Zhejiang Üniversitesi ekibi, 1 Nisan'da Nature Communications dergisinde yayımlanan bir makalede (orijinal bağlantı: https://www.nature.com/articles/s41467-026-71267-5) farklı bir görüş öne sürdü. Araştırmacılar, modelin (özellikle SimCLR, CLIP, DINOv2) boyutu büyüdükçe spesifik nesneleri tanıma yeteneğinin gerçekten arttığını, ancak soyut kavramları anlama yeteneğinin artmadığını, hatta azaldığını keşfetti. Parametre sayısı 22,06 milyondan 304,37 milyona yükseldiğinde, spesifik kavram görevlerinde başarı oranı %74,94'ten %85,87'ye yükseldi, ancak soyut kavram görevlerinde başarı oranı %54,37'den %52,82'ye düştü.
İnsan ve model düşünme biçimlerinin farkı
İnsan beyni kavramları işlerken önce bir sınıflandırma ilişkisi oluşturur. Kaz ve baykuş farklı görünse de, ikisini de kuş kategorisine sokar. Daha yukarıda, kuşlar ve atlar hayvanlar kategorisine dahil edilebilir. İnsan, yeni bir şey gördüğünde genellikle önce bunun daha önce gördüğü hangi şeye benzediğini ve hangi kategoriye ait olabileceğini düşünür. İnsanlar yeni kavramları sürekli öğrenir ve deneyimleri bu ilişkilerle düzenler, böylece yeni nesneleri tanımlar ve yeni durumlara uyum sağlar.

Modeller de sınıflandırır, ancak oluşum şekilleri farklıdır. Anahtar olarak büyük ölçekli verilerde tekrar eden formlara dayanır. Belirli nesneler ne kadar sık ortaya çıkar ise, model o kadar kolay tanır. Daha büyük kategorilere geçildiğinde model zorlanır. Birden fazla nesne arasındaki ortak noktaları tespit edip bunları aynı kategoriye yerleştirmek gerekir. Mevcut modellerde burada hâlâ açıkça görülen eksiklikler vardır. Parametreler artırıldıkça spesifik kavram görevleri iyileşir, ancak soyut kavram görevleri bazen düşebilir.

İnsan beyni ve modelin ortak noktası, içlerinde bir sınıflandırma ilişkisi oluşturmasıdır. Ancak ikisinin vurguları farklıdır: insan beyninin yüksek düzeyli görsel bölgeleri, biyolojik ve biyolojik olmayan gibi büyük kategorileri doğal olarak ayırt eder. Model ise spesifik nesneleri ayırt edebilir, ancak bu daha büyük sınıflandırmaları kararlı bir şekilde oluşturmakta zorlanır. Bu fark, insan beyninin eski deneyimleri yeni nesnelere daha kolay uygulamasına neden olur; bu nedenle daha önce görmediğimiz şeylere hızlıca sınıflandırma yapabiliriz. Model ise mevcut bilgiye daha çok bağımlıdır ve yeni nesnelerle karşılaştığında daha kolay yüzeysel özelliklere takılı kalır. Makalede önerilen yöntem, bu özelliğe dayanarak, beyin sinyallerini kullanarak modelin iç yapısını kısıtlayarak, modelin insan beyninin sınıflandırma biçimine daha yakın hale gelmesini hedefler.
Zhejiang Üniversitesi ekibinin çözümü
Takımın sunduğu çözüm de özgün olup, parametreleri artırmaya devam etmek yerine, az sayıda beyin sinyaliyle denetim yapılmaktadır. Bu beyin sinyalleri, insanların resimler izlerkenki beyin aktivitelerinin kayıtlarından gelmektedir. Makalede orijinal olarak, insan kavramsal yapılarının DNN'lere transfer edildiği yazmaktadır. Bu, insan beyninin nasıl sınıflandırdığını, nasıl genelleştirdiğini ve nasıl benzer kavramları bir araya getirdiğini model尽可能 öğretilmesi anlamına gelir.

Takım, 150 bilinen eğitim sınıfı ve 50 görülmemiş test sınıfı ile deney yaptı. Sonuçlar, eğitim ilerledikçe model ile beyin temsili arasındaki mesafenin sürekli daraldığını gösterdi. Bu değişim, her iki sınıfta da görüldü, bu da modelin tek bir örnek değil, beynin daha yakın bir kavram organizasyonunu öğrenmeye başladığını gösteriyor.
Bu eğitimden sonra model, örnek sayısı azken öğrenme yeteneği arttı ve yeni durumlarda daha iyi performans gösterdi. Model, sadece çok az örnek verilerek biyolojik ve biyolojik olmayan gibi soyut kavramları ayırt etmeyi gerektiren bir görevde ortalama %20,5 ilerleme kaydetti ve çok daha büyük parametre sayısına sahip kontrol modellerini geçti. Takım ayrıca 31 ek test gerçekleştirdi ve tüm model türlerinde yaklaşık %10'luk bir iyileşme görüldü.
Geçtiğimiz yıllarda model endüstrisi, daha büyük modeller yolunu izlemişti. Zhejiang Üniversitesi ekibi ise başka bir yöne yöneldi: "daha büyük, daha iyi" yerine "yapılandırılmış, daha akıllı" yolunu seçti. Ölçeklendirme gerçekten faydalı olsa da, temel olarak tanıdık görevlerdeki performansı artırır. İnsanların sahip olduğu soyut anlama ve transfer yeteneği, AI için aynı derecede kritiktir ve bu, gelecekte AI'nın düşünme yapısının insan beynine daha çok benzer hale getirilmesini gerektirir. Bu yönün değeri, endüstrinin dikkatini yalnızca ölçeklendirme yerine, bilişsel yapıya yeniden odaklamasıdır.
Neosoul ve Gelecek
Bu, yapay zekânın evriminin sadece model eğitimi aşamasında gerçekleşmediğini gösteriyor. Model eğitimi, yapay zekânın kavramları nasıl organize edeceğini ve daha kaliteli bir yargı yapısı nasıl oluşturacağını belirleyebilir. Gerçek dünyaya girdikten sonra, yapay zekânın bir başka evrim aşaması başlıyor: AI agent'ların yargıları nasıl kaydediliyor, nasıl test ediliyor ve gerçek rekabet içinde insanlar gibi kendini öğrenerek ve geliştirmeye devam ediyor? Neosoul şu anda tam olarak bunu yapıyor. Neosoul, AI agent'ların yalnızca cevap üretmesini değil, bunları sürekli tahmin, sürekli doğrulama, sürekli sonuçlandırma ve sürekli filtreleme sisteminde yerleştiriyor; böylece agent'lar tahminler ile sonuçlar arasında kendilerini sürekli optimize ediyor, daha iyi yapılar korunuyor, daha kötü yapılar ise dışlanıyor. Zhejiang Üniversitesi ekibi ile Neosoul, aslında aynı hedefe işaret ediyor: Yapay zekânın sadece soruları çözebilmesi değil, kapsamlı bir düşünme yetisine sahip olup sürekli evrimleşmesi.
