Bina-boost ng Hewlett Packard Enterprise ang throughput ng private cloud AI token ng 20%

Ipinahayag ng Hewlett Packard Enterprise ang mga update sa kanyang Private Cloud AI platform noong Marso 16, na co-engineered kasama ang Nvidia, na nagdadala ng hanggang 20% na pagpapabuti sa token throughput para sa mga gawain sa AI inference. Ang mga bagong rack para sa pagpapalawak ng network ay magpapahintulot sa platform na ma-scale hanggang 128 GPUs, na inaasahang magagamit noong Hulyo 2026.

Ano ang tunay na nagbabago

Ang token throughput ay ang bilang ng mga chunk ng teksto (o iba pang data) na kayang prosesuhin ng isang AI model bawat segundo. Ang isang pagtaas ng 20% ay nangangahulugan na mas mabilis ang mga tugon para sa mga negosyo na nagpapatakbo ng generative AI o agentic AI workload nang walang pagbabago sa hardware.

Ang platform ay nagtataglay na ng Nvidia RTX PRO 6000 Blackwell Server Edition GPUs, na partikular na disenyo para sa enterprise data center deployments kaysa sa workstation o consumer market.

Ang pag-scall sa 128 GPUs sa pamamagitan ng mga bagong expansion racks ay nagpapahintulot sa mga negosyo na pataasin ang mas malalaking model o magbigay serbisyo sa mas maraming magkakasamang user. Para sa mga organisasyon na nagsimula nang maliit sa Private Cloud AI at kailangang lumago, ito ay nag-alis sa dating isang mahigpit na limitasyon.

Pagsasabay

Dinagdagan din ni HPE ang mga opsyon ng air-gapped deployment, na nangangahulugan na ang buong sistema ay maaaring magtrabaho nang buong pagkakawala ng koneksyon sa mga panlabas na network, upang tugunan ang mga pangangailangan ng mga kontraktor ng depensa, mga sistema ng kalusugan, o mga institusyong pinansyal na mayroong reguladong data.

Ang platform ay ipinapadala bilang isang turnkey solution na naglalaman ng server at storage hardware ng HPE kasama ang Nvidia AI Enterprise software, na naglalaman ng NIM inference microservices. Ang mga opsyon na small-form-factor ay kabilang din sa updated na lineup.

Ang mas malaking larawan: bakit umuunlad ang mga korporasyon sa private

Simula sa gitna ng 2024, nagsimula ang HPE at Nvidia sa paglalabas ng Private Cloud AI, na nag-akumula ng isang serye ng mga update na nagpapalawak sa suporta sa GPU, nagpapabuti sa mga benchmark ng performance, at nagdaragdag ng flexibility sa deployment.

Ang Sky Co. ay isang nakikilalang customer na nag-deploy ng HPE Private Cloud AI para sa ligtas na on-premises na AI na operasyon kasalukuyan sa Hunyo 2026.

Ang HPE AI Essentials software ay kasama sa pakete kasama ang Nvidia AI Enterprise, nagbibigay sa mga customer ng software stack na nag-aalaga ng pag-deploy at pag-monitor ng model.

Ano ang ibig sabihin nito para sa mga investor

Ang kompetitibong landscape ay kasama ang Dell na may sariling mga alok sa AI factory at ang Lenovo na umuunlad sa enterprise AI infrastructure. Ang mga cloud provider ay sumasagot din sa pamamagitan ng pag-aalok ng reserved GPU instances na may mas maayos na pricing.

Ang availability noong July 2026 para sa mga expansion rack ay nangangahulugan na ang makabuluhang kita mula sa 128-GPU configurations ay malamang ay hindi makikita sa mga pampublikong panaanalapi ng HPE hanggang sa huli ng 2026 o mas maaga.