Aliyun PAI, Çift Veri Döngüsü Eğitimli AgenticQwen Küçük Modelini Açık Kaynak Hale Getiriyor

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
27 Nisan (UTC+8) tarihinde zincir içi haberlerde, Alibaba'nın PAI ekibi, endüstriyel araç çağrısı için küçük bir model olan AgenticQwen'i açık kaynak hale getirdi. MetaEra üzerine inşa edilen 8B ve 30B-A3B sürümleri, çıkarım maliyetlerini azaltmak için çift veri flywheel çerçevesini kullanıyor. AgenticQwen-8B, TAU-2 ve BFCL-V4'te 47,4 puan alarak Qwen3-8B'yi (23,8) geçti ve Qwen3-235B'ye (52,0) yaklaştı. AgenticQwen-30B-A3B (3B aktif parametre) 50,2 puan aldı. Model, şu anda üretim sistemlerinde kullanılmakta olup, 235B modellerle eşit çıkarım hızına sahip. Enflasyon verisi takibi ve diğer gerçek dünya görevleri bu sürümle daha verimli hale geldi.

AIMPACT mesajı, 27 Nisan (UTC+8), Beating izleme sistemi tarafından raporlananlara göre, Alibaba PAI ekibi, endüstriyel araç çağrısı için tasarlanmış küçük agent dil modeli AgenticQwen’i (8B ve 30B-A3B olmak üzere iki versiyon) yayınladı ve açık kaynak hale getirdi. Bu model serisi, yenilikçi bir “çift veri döngüsü” takviyeli öğrenme çerçevesiyle eğitildi ve çıkarım maliyetini büyük ölçüde azaltırken, yüz milyar parametreli büyük modellerin agent yeteneklerine yakın performans sağladı. Temel mekanizma, “çift veri döngüsü” eğitim yöntemidir. Geleneksel sentetik veriler, homojenleşme nedeniyle model performansını sınırlar; AgenticQwen, bu sorunu çözmek için iki döngü tanıttı: Çıkarım döngüsü, modelin hatalı cevaplarından daha zor varyasyonlar otomatik olarak üretir; Agent döngüsü ise modelin yürütme izini kullanarak basit doğrusal iş akışlarını (örneğin tek bir bilet rezervasyonu) kısıtlar, reddetme ve karşıt koşulları içeren çok dallı davranış ağaçlarına genişletir ve gerçek karmaşık karar verme senaryolarını simüle eder. Değerlendirmeler, AgenticQwen-8B’nin gerçek araç ortamlarında (TAU-2 ve BFCL-V4 gibi) ortalama 47,4 puan aldığını gösterdi; bu, temel Qwen3-8B’ye (23,8) kıyasla çok daha yüksek ve Qwen3-235B’ye (52,0) çok yakın bir seviyedir. AgenticQwen-30B-A3B (sadece 3B parametre aktif) 50,2 puan aldı. Şu anda model, Manus’a benzer içsel üretim sistemlerinde kullanılmaktadır ve 235B büyük modelle olan farkı (uçtan uca çıkarım süresi daha kısa) önemli ölçüde daraltmıştır; ancak makale, orijinal 40K bağlam uzunluğu sınırlaması nedeniyle küçük modellerin derin arama görevlerinde hala sınırlı kaldığını kabul etmektedir. (Kaynak: BlockBeats)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.