Hewlett Packard Enterprise aumenta o rendimento do token de IA em nuvem privada em 20%

A Hewlett Packard Enterprise anunciou atualizações para sua plataforma Private Cloud AI em 16 de março, co-desenvolvida com a Nvidia, que proporcionam até 20% de melhoria no throughput de tokens para tarefas de inferência de IA. Novos gabinetes de expansão de rede permitirão que a plataforma seja escalada para 128 GPUs, com disponibilidade prevista para julho de 2026.

O que realmente está mudando

O throughput de tokens é a quantidade de fragmentos de texto (ou outros dados) que um modelo de IA pode processar por segundo. Um aumento de 20% significa que empresas que executam cargas de trabalho de IA generativa ou IA agente obtêm respostas significativamente mais rápidas sem precisar trocar o hardware.

A plataforma agora suporta GPUs Nvidia RTX PRO 6000 Blackwell Server Edition, especificamente projetadas para implantações em data centers empresariais, e não para o mercado de estações de trabalho ou consumidor.

A expansão para 128 GPUs por meio dos novos gabinetes de expansão permite que empresas executem modelos maiores ou atendam a mais usuários simultâneos. Para organizações que começaram pequenas com o Private Cloud AI e precisam crescer, isso remove o que antes era uma limitação rígida.

Anúncio

A HPE também está adicionando opções de implantação isolada, o que significa que todo o sistema pode operar completamente desconectado de redes externas, atendendo às necessidades de contratadas de defesa, sistemas de saúde ou instituições financeiras que lidam com dados regulamentados.

A plataforma é entregue como uma solução pronta, que inclui o hardware de servidores e armazenamento da HPE junto com o software Nvidia AI Enterprise, que contém microserviços de inferência NIM. Opções de formato compacto também fazem parte da linha atualizada.

A imagem maior: por que as empresas estão se tornando privadas

A HPE e a Nvidia começaram a lançar o Private Cloud AI por volta de meados de 2024, com o produto acumulando uma série de atualizações que ampliaram o suporte a GPUs, melhoraram os benchmarks de desempenho e adicionaram flexibilidade de implantação.

A Sky Co. é um cliente notável que implementou o HPE Private Cloud AI para operações de IA seguras no local, em junho de 2026.

O software HPE AI Essentials é embalado junto com o Nvidia AI Enterprise na oferta, fornecendo aos clientes uma pilha de software que gerencia a implantação e o monitoramento de modelos.

O que isso significa para os investidores

O cenário competitivo inclui a Dell, com suas próprias ofertas de fábrica de IA, e a Lenovo entrando na infraestrutura de IA empresarial. Provedores de nuvem também estão respondendo, oferecendo instâncias GPU reservadas com precificação mais previsível.

A disponibilidade em julho de 2026 para os racks de expansão significa que receitas significativas das configurações de 128 GPUs provavelmente não aparecerão nas demonstrações financeiras da HPE antes do final de 2026, no mínimo.