Rio de Janeiro Hükümeti, Geliştirilmiş Örtük Muhakeme ile 397 milyar parametreli AI modelini açtı

iconKuCoinFlash
Paylaş
AI summary iconÖzet
ME AI Haberi, Beating İzleme'ye göre, Brezilya Rio de Janeiro Belediyesi'ne ait IplanRIO, Hugging Face üzerinde Rio-3.5-Open-397B modelini açık kaynak olarak yayınladı. Bu model, Qwen 3.5 397B üzerine inşa edilmiş ve MoE mimarisini kullanmaktadır; toplam parametre sayısı yaklaşık 397 milyar, her Token için etkinleşen parametre sayısı yaklaşık 17 milyar, yaklaşık 1 milyon Token'lık bağlam desteği sunmaktadır ve MIT lisansı altında serbestçe kullanılabilir. Model kartına göre, Rio-3.5-Open-397B, SwiReasoning çıkarım çerçevesini entegre etmektedir. SwiReasoning, eğitim gerektirmeyen bir çıkarım yöntemidir ve bilgi entropisi değişikliklerine göre açık düşünce zinciri ile gizli vektör uzayı çıkarımı arasında geçiş yapar. Açık çıkarım, sonuçları doğal dil Token'larına dönüştürürken, gizli çıkarım gizli uzayda çoklu yolları keşfeder ve gereksiz metin çıktılarını azaltır. Takımın paylaştığı testlerde, Rio-3.5-Open-397B, gizli çıkarım etkinleştirildiğinde SWE-Bench Pro için 58.1, IMOAnswerBench için 89.5 puan almıştır. Karşılaştırma olarak, orijinal Qwen 3.5 397B sırasıyla 50.9 ve 80.9 puan alırken, yalnızca son eğitim uygulandığında ve gizli çıkarım devre dışı bırakıldığında sırasıyla 54.8 ve 84.5 puan elde etmiştir. Yani gizli çıkarım, modelin mutlak performansını iki katına çıkarmamıştır; ancak temel modele göre artış oranı neredeyse iki katına çıkmıştır. Uyumluluk ana sınırlamadır. Hugging Face tartışmalarında, takım üyeleri bu açık puanların SwiReasoning etkinleştirildiğinde elde edildiğini doğrulamıştır. SwiReasoning, çıkarım sırasında olasılık ağırlıklı sürekli "yumuşak gömme" vektörlerinin girdisi gerektirir; ancak llama.cpp gibi yalnızca ayrık Token ID üretimi destekleyen çıkarım motorları şu anda tam olarak uygulanamaz. Takım, gizli çıkarım devre dışı bırakıldığında modelin hâlâ orijinal Qwen 3.5 397B'den açıkça daha güçlü olduğunu belirtmektedir; ancak tam yeteneklerin ortaya çıkması için çıkarım çerçevesinin yumuşak gömme girdilerini desteklemesi gerekmektedir. (Kaynak: BlockBeats)
Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.