Aliyun PAI, Çift Veri Döngüsü Eğitimli AgenticQwen Küçük Modelini Açık Kaynak Hale Getiriyor

AIMPACT mesajı, 27 Nisan (UTC+8), Beating izleme sistemi tarafından raporlananlara göre, Alibaba PAI ekibi, endüstriyel araç çağrısı için tasarlanmış küçük agent dil modeli AgenticQwen’i (8B ve 30B-A3B olmak üzere iki versiyon) yayınladı ve açık kaynak hale getirdi. Bu model serisi, yenilikçi bir “çift veri döngüsü” takviyeli öğrenme çerçevesiyle eğitildi ve çıkarım maliyetini büyük ölçüde azaltırken, yüz milyar parametreli büyük modellerin agent yeteneklerine yakın performans sağladı. Temel mekanizma, “çift veri döngüsü” eğitim yöntemidir. Geleneksel sentetik veriler, homojenleşme nedeniyle model performansını sınırlar; AgenticQwen, bu sorunu çözmek için iki döngü tanıttı: Çıkarım döngüsü, modelin hatalı cevaplarından daha zor varyasyonlar otomatik olarak üretir; Agent döngüsü ise modelin yürütme izini kullanarak basit doğrusal iş akışlarını (örneğin tek bir bilet rezervasyonu) kısıtlar, reddetme ve karşıt koşulları içeren çok dallı davranış ağaçlarına genişletir ve gerçek karmaşık karar verme senaryolarını simüle eder. Değerlendirmeler, AgenticQwen-8B’nin gerçek araç ortamlarında (TAU-2 ve BFCL-V4 gibi) ortalama 47,4 puan aldığını gösterdi; bu, temel Qwen3-8B’ye (23,8) kıyasla çok daha yüksek ve Qwen3-235B’ye (52,0) çok yakın bir seviyedir. AgenticQwen-30B-A3B (sadece 3B parametre aktif) 50,2 puan aldı. Şu anda model, Manus’a benzer içsel üretim sistemlerinde kullanılmaktadır ve 235B büyük modelle olan farkı (uçtan uca çıkarım süresi daha kısa) önemli ölçüde daraltmıştır; ancak makale, orijinal 40K bağlam uzunluğu sınırlaması nedeniyle küçük modellerin derin arama görevlerinde hala sınırlı kaldığını kabul etmektedir. (Kaynak: BlockBeats)