Hewlett Packard Enterprise mengumumkan pembaruan kepada platform AI Cloud Peribadinya pada 16 Mac, direka bersama dengan Nvidia, yang memberikan peningkatan sehingga 20% dalam throughput token untuk tugas inferens AI. Rak ekspansi rangkaian baharu akan membolehkan platform ini diubah suai sehingga 128 GPU, dengan ketersediaan dijadualkan pada Julai 2026.
Apa yang sebenarnya berubah
Throughput token ialah berapa banyak bahagian teks (atau data lain) yang boleh diproses oleh model AI setiap saat. Kenaikan 20% bermaksud perusahaan yang menjalankan beban kerja AI generatif atau AI agen mendapat respons yang lebih pantas secara bermakna tanpa perlu menggantikan peranti keras.
Platform kini menyokong GPU Nvidia RTX PRO 6000 Blackwell Server Edition, yang direka khas untuk penempatan pusat data perniagaan, bukan pasaran pekerjaan atau pengguna.
Penskalaan hingga 128 GPU melalui rak ekspansi baharu membolehkan perusahaan menjalankan model yang lebih besar atau melayani lebih banyak pengguna serentak. Bagi organisasi yang bermula kecil dengan Private Cloud AI dan perlu berkembang, ini menghilangkan batasan yang sebelumnya ketat.
HPE juga menambahkan pilihan pelaksanaan air-gapped, bermakna keseluruhan sistem boleh beroperasi sepenuhnya terpisah daripada rangkaian luar, memenuhi keperluan kontraktor pertahanan, sistem kesihatan, atau institusi kewangan yang menangani data yang diatur.
Platform ini dihantar sebagai penyelesaian siap pakai yang menggabungkan peranti pelayan dan penyimpanan HPE dengan perisian Nvidia AI Enterprise, yang termasuk perkhidmatan mikro inferens NIM. Pilihan bentuk kecil juga merupakan sebahagian daripada jajaran yang dikemaskini.
Gambaran yang lebih besar: mengapa perusahaan berpindah ke swasta
HPE dan Nvidia mula melancarkan AI Cloud Peribadi pada pertengahan 2024, dengan produk tersebut mengumpul serangkaian kemas kini yang memperluaskan sokongan GPU, meningkatkan tolok prestasi, dan menambah fleksibiliti pelaksanaan.
Sky Co. adalah salah satu pelanggan terkenal yang melaksanakan HPE Private Cloud AI untuk operasi AI di tempat yang selamat sehingga Jun 2026.
Perisian HPE AI Essentials disertakan bersama Nvidia AI Enterprise dalam tawaran ini, memberikan pelanggan satu tumpukan perisian yang mengendalikan penghantaran dan pemantauan model.
Apa yang bermaksud ini kepada pelabur
Lanskap persaingan termasuk Dell dengan tawaran pabrik AI sendiri dan Lenovo yang masuk ke infrastruktur AI perusahaan. Penyedia awan juga merespons dengan menawarkan contoh GPU yang dipesan sebelumnya dengan harga yang lebih dapat diramalkan.
Ketersediaan rak pengembangan pada Julai 2026 bermakna pendapatan bermakna daripada konfigurasi 128-GPU kemungkinan besar tidak akan muncul dalam laporan kewangan HPE sehingga akhir 2026 sekurang-kurangnya.
