El gobierno de Río de Janeiro lanza un modelo de IA de 397 mil millones de parámetros con razonamiento implícito mejorado

ME AI Noticia, según el monitoreo de Beating, la empresa municipal de información y planificación IplanRIO, bajo el gobierno municipal de Río de Janeiro, Brasil, ha abierto el código de Rio-3.5-Open-397B en Hugging Face. El modelo se basa en Qwen 3.5 397B tras un entrenamiento posterior, utiliza una arquitectura MoE, con aproximadamente 397 mil millones de parámetros en total y activa alrededor de 17 mil millones de parámetros por Token, soporta un contexto de hasta 1 millón de Tokens y se publica bajo la licencia MIT. La ficha del modelo indica que Rio-3.5-Open-397B integra el marco de razonamiento SwiReasoning. SwiReasoning es un método de razonamiento sin entrenamiento que alterna entre razonamiento en cadena de pensamiento explícita y razonamiento en espacio vectorial implícito según los cambios en la entropía de la información. El razonamiento explícito se encarga de escribir las conclusiones como Tokens de lenguaje natural, mientras que el razonamiento implícito explora múltiples caminos en el espacio oculto, reduciendo la salida de texto innecesaria. Las pruebas divulgadas por el equipo muestran que, al activar el razonamiento implícito, Rio-3.5-Open-397B obtiene una puntuación de 58.1 en SWE-Bench Pro y 89.5 en IMOAnswerBench. Como comparación, la versión original de Qwen 3.5 397B obtuvo 50.9 y 80.9 respectivamente; solo con entrenamiento posterior y sin activar el razonamiento implícito, alcanzó 54.8 y 84.5. Es decir, el razonamiento implícito no duplicó el rendimiento absoluto del modelo, pero casi duplicó la mejora relativa respecto al modelo base. La compatibilidad es la principal limitación. En el foro de Hugging Face, los miembros del equipo confirmaron que estas puntuaciones públicas se obtuvieron con SwiReasoning activado. SwiReasoning requiere ingresar vectores continuos «soft embeddings» ponderados por probabilidad durante la inferencia, y motores de inferencia como llama.cpp, que solo admiten generación de IDs de Tokens discretos, no pueden implementarlo completamente por ahora. El equipo indica que, sin activar el razonamiento implícito, el modelo sigue siendo claramente superior a la versión original de Qwen 3.5 397B, pero su capacidad completa requiere que el marco de inferencia admita entradas de soft embeddings. (Fuente: BlockBeats)