A empresa de TI IplanRIO, vinculada à prefeitura do Rio de Janeiro, Brasil, após treinamento adicional no modelo Alibaba Qwen 3.5-397B-A17B, lançou de forma aberta um grande modelo chamado Rio 3.5 Open 397B, entrando inesperadamente no top global de IA.Autor do artigo, fonte: Machine Heart
Hoje, além do Claude Fable 5 bloqueado globalmente (não nos EUA), a comunidade de IA foi invadida por um modelo de código aberto.

Um influenciador no Twitter descobriu que o modelo aberto Rio 3.5 397B, desenvolvido pela empresa de TI vinculada à prefeitura do Rio de Janeiro, superou modelos abertos como o Qwen 3.7 Plus em vários testes de referência, sendo que o modelo base desse modelo é o Qwen3.5-397B-A17B.


Outro usuário do Twitter, "Chubby", expressou surpresa: "Um modelo do qual nunca ouvi falar antes se tornou o SOTA de código aberto, superando até o Qwen 3.7."


Este já é o segundo modelo desta semana a ser pós-treinado com base no Qwen3.5 e a alcançar o nível de ponta. O outro é o Nex-N2-Pro 397B, também construído com base no Qwen3.5-397B-A17B, com desempenho comparável a modelos de ponta como GPT-5.5 e Opus 4.7.

O surgimento do Rio 3.5 levou Clem Delangue, cofundador e CEO da Hugging Face, a refletir: “O futuro da IA não é predestinado. O que acontecerá a seguir depende de nossas escolhas e ações: Caminho um: APIs proprietárias, poder centralizado, com o futuro decidido por poucos em Silicon Valley e Washington. Caminho dois: IA de código aberto, permitindo que todos participem, possuam e construam juntos — incluindo instituições como a cidade do Rio. Escolha seu caminho, amigo.”


A seguir, vamos entender os detalhes técnicos do modelo Rio 3.5 397B.

Rio 3.5 Open 397B é um modelo de IA geral de ponta desenvolvido pela IplanRIO, empresa de TI municipal sob o governo da cidade do Rio de Janeiro.
O modelo foi pós-treinado com base no Qwen 3.5 397B, alcançando o nível líder entre modelos abertos em benchmarks de programação de agentes, matemática, STEM, multilíngue e multimodal, com melhoria significativa em relação ao modelo base, e capaz de competir com os modelos abertos e fechados mais fortes do mundo.

As características principais do modelo incluem:
- 397B parâmetros totais, 17B parâmetros ativados, utilizando arquitetura de especialistas mistos (MoE);
- 1.010.000 tokens, ou seja, janela de contexto na faixa de 1 milhão;
- Integração do SwiReasoning: permite alternar dinamicamente entre raciocínio explícito e raciocínio no espaço latente, alcançando um melhor equilíbrio entre precisão e eficiência;
- Alta capacidade geral: destaca-se em programação de agentes, raciocínio, seguimento de instruções e tarefas multimodais;
- Alta capacidade multilíngue: desempenho sólido em português, inglês, chinês e dezenas de outros idiomas;
- Licenciado sob a licença MIT: totalmente aberto, para uso comercial e de pesquisa.
Entre eles, o SwiReasoning é um framework de inferência sem treinamento, baseado na pesquisa de Shi et al. de 2025, que permite alternar dinamicamente entre inferência em cadeia de pensamento explícita e inferência em espaço latente com base em sinais de confiança baseados em entropia. Isso melhora tanto a precisão quanto a eficiência de tokens. Durante o treinamento, o modelo também foi otimizado especificamente para aproveitar os ganhos de eficiência trazidos pela inferência no espaço latente.

Benchmark de programação de agentes e engenharia de software:

Benchmark de conhecimento e raciocínio:

Teste matemático:

Teste de referência multilíngue:

Benchmark de agentes e seguimento de instruções:

Link de referência:
https://x.com/kimmonismus/status/2065911865390063791
https://huggingface.co/prefeitura-rio/Rio-3.5-Open-397B
https://x.com/ZenMagnets/status/2065796012820848699
https://x.com/SemiAnalysis_/status/2065894494935933191
