Según el monitoreo de Beating, NVIDIA lanzó oficialmente el modelo de lenguaje grande insignia Nemotron 3 Ultra, de 550 mil millones de parámetros y 55 mil millones de activaciones, el 4 de junio. Este modelo está optimizado para tareas de agentes de larga duración, como planificación compleja, razonamiento y llamadas a herramientas. En la plataforma de evaluación externa Artificial Analysis, Nemotron 3 Ultra obtuvo una puntuación de 48 puntos, convirtiéndose en el modelo de pesos abiertos más potente de Estados Unidos, solo superado por el Kimi K2.6 de Moonshot, que obtuvo 54 puntos. En términos de arquitectura técnica, el modelo emplea una arquitectura Mamba-Transformer con expertos mixtos (MoE), que alterna capas de modelo de espacio de estado Mamba-2 con capas de autoatención Transformer, evitando el cuello de botella de memoria causado por el crecimiento cuadrático del caché KV en contextos extremadamente largos, y permitiendo una ventana de contexto de 1 millón de tokens con un consumo de memoria extremadamente bajo. En comparación con modelos densos del mismo tamaño, esta arquitectura híbrida mejora el rendimiento en un 5 veces en tareas de agentes y reduce un 30% el costo de inferencia. En cuanto al ecosistema, NVIDIA lanzó simultáneamente el Kit de Herramientas para Agentes (Agent Toolkit), que incluye el blueprint NemoClaw y el entorno de ejecución OpenShell. El código abierto incluye directamente los pesos del modelo, los conjuntos de datos y las recetas de entrenamiento. El modelo ya está disponible en Hugging Face, NVIDIA NIM y OpenRouter, y servicios empresariales de búsqueda por IA como Glean ya han anunciado su integración, utilizando este modelo como alternativa a modelos grandes cerrados comerciales.
NVIDIA libera el modelo Nemotron 3 Ultra de 550B con arquitectura híbrida Mamba-Transformer MoE
MarsBitCompartir






NVIDIA lanzó como código abierto su modelo Nemotron 3 Ultra de 550B el 4 de junio de 2026, con una arquitectura híbrida Mamba-Transformer MoE. El modelo obtuvo 48 en el índice de inteligencia de Artificial Analysis, ocupando el segundo lugar entre los modelos de peso abierto en EE. UU. Admite una ventana de contexto de 1 millón de tokens con bajo uso de memoria y 5 veces mayor rendimiento. El Agent Toolkit incluye NemoClaw y OpenShell. El análisis en cadena muestra un aumento en el interés abierto en herramientas de trading impulsadas por IA. El modelo está disponible en Hugging Face, NVIDIA NIM y OpenRouter.
Fuente:Mostrar original
Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información.
Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.