Kerajaan Rio de Janeiro Membuka Model AI 397B Parameter dengan Penalaran Implisit yang Ditingkatkan

ME AI mesej, menurut pemantauan Beating, syarikat maklumat dan perancangan bandar Rio de Janeiro, IplanRIO, yang berada di bawah kerajaan bandar Rio de Janeiro, Brazil, telah membuka sumber Rio-3.5-Open-397B di Hugging Face. Model ini didasarkan pada Qwen 3.5 397B yang telah dilatih lanjut, menggunakan arsitektur MoE, dengan jumlah parameter sekitar 397 miliar, dengan sekitar 17 miliar parameter yang diaktifkan per Token, menyokong konteks hingga sekitar 1 juta Token, dan dirilis di bawah lisensi MIT. Kartu model menunjukkan bahawa Rio-3.5-Open-397B mengintegrasikan kerangka kerja inferensi SwiReasoning. SwiReasoning adalah kaedah inferensi tanpa latihan yang berpindah antara rantai pemikiran eksplisit dan inferensi ruang vektor implisit berdasarkan perubahan entropi maklumat. Inferensi eksplisit bertanggungjawab untuk menulis kesimpulan sebagai Token bahasa semula jadi, manakala inferensi implisit meneroka pelbagai laluan dalam ruang tersembunyi untuk mengurangkan output teks yang tidak perlu. Ujian yang dinyatakan oleh pasukan menunjukkan bahawa Rio-3.5-Open-397B mencapai skor 58.1 pada SWE-Bench Pro dan 89.5 pada IMOAnswerBench apabila inferensi implisit diaktifkan. Sebagai perbandingan, versi asal Qwen 3.5 397B masing-masing mendapat 50.9 dan 80.9, manakala versi yang hanya dilatih lanjut tanpa mengaktifkan inferensi implisit masing-masing mendapat 54.8 dan 84.5. Dengan kata lain, inferensi implisit tidak menggandakan prestasi mutlak model, tetapi meningkatkan peningkatan relatif berbanding model asal hampir dua kali ganda. Kompatibiliti merupakan had utama. Dalam forum Hugging Face, ahli pasukan mengesahkan bahawa skor awam ini diperoleh dengan mengaktifkan SwiReasoning. SwiReasoning memerlukan input vektor 'soft embedding' berterusan yang ditimbang dengan kebarangkalian semasa inferensi, manakala enjin inferensi seperti llama.cpp yang hanya menyokong penghasilan ID Token diskret belum dapat melaksanakannya sepenuhnya. Pasukan menyatakan bahawa model masih jelas lebih kuat daripada versi asal Qwen 3.5 397B apabila inferensi implisit tidak diaktifkan, tetapi keupayaan penuh memerlukan penyesuaian kerangka kerja inferensi untuk menerima input soft embedding. (Sumber: BlockBeats)