NVIDIA libera código aberto do modelo Nemotron 3 Ultra de 550B com arquitetura híbrida Mamba-Transformer MoE

icon MarsBit
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
A NVIDIA lançou como código aberto seu modelo Nemotron 3 Ultra de 550B em 4 de junho de 2026, apresentando uma arquitetura híbrida Mamba-Transformer MoE. O modelo obteve 48 no índice de inteligência da Artificial Analysis, ficando em segundo lugar entre modelos de peso aberto nos EUA. Ele suporta uma janela de contexto de 1 milhão de tokens com baixo uso de memória e 5x maior throughput. A Agent Toolkit inclui NemoClaw e OpenShell. A análise on-chain mostra aumento na abertura de posições em ferramentas de negociação impulsionadas por IA. O modelo está disponível no Hugging Face, NVIDIA NIM e OpenRouter.

De acordo com o monitoramento da Beating, a NVIDIA lançou oficialmente em 4 de junho o modelo de linguagem grande de ponta Nemotron 3 Ultra, com 550 bilhões de parâmetros e 55 bilhões de ativações, otimizado para tarefas de agentes de longo prazo, como planejamento complexo, raciocínio e chamada de ferramentas. Na plataforma de benchmark terceirizada Artificial Analysis, o Nemotron 3 Ultra obteve uma pontuação de 48, sendo o modelo de peso aberto mais poderoso atualmente nos Estados Unidos, atrás apenas do Kimi K2.6 da Luna Dark, que obteve 54 pontos. Na arquitetura técnica, o modelo utiliza uma arquitetura Mamba-Transformer de especialistas mistos (MoE), alternando camadas de modelo de espaço de estado Mamba-2 com camadas de autoatenção Transformer, contornando o gargalo de memória causado pelo crescimento quadrático do cache KV em contextos extremamente longos, suportando uma janela de contexto de 1 milhão de tokens com custo de memória extremamente baixo. Em comparação com modelos densos de mesma escala, a arquitetura mista aumentou o throughput em 5 vezes e reduziu os custos de inferência em 30% para tarefas de agentes. No ecossistema, a NVIDIA lançou simultaneamente o pacote de ferramentas para agentes Agent Toolkit, incluindo o blueprint NemoClaw e o runtime OpenShell. O conteúdo aberto inclui diretamente os pesos do modelo, conjuntos de dados e receitas de treinamento. O modelo já está disponível no Hugging Face, NVIDIA NIM e OpenRouter, e provedores empresariais de busca por IA, como a Glean, já anunciaram sua integração, servindo como alternativa a modelos de linguagem grandes comerciais fechados.

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.