Inovasi Model AI Mendorong Peluang Baru di Infrastruktur AI

Artikel | Alpha公社

Dalam beberapa waktu terakhir, bidang komunikasi jaringan AI semakin populer.

Di satu sisi, perusahaan rintisan komunikasi jaringan AI di Silicon Valley sering mendapatkan pendanaan besar, di sisi lain, saham perusahaan komunikasi jaringan AI di pasar sekunder, terutama perusahaan komunikasi optik, juga tumbuh pesat.

Mengapa popularitas komunikasi jaringan AI meningkat? Pada dasarnya, ini didorong oleh permintaan: ukuran model semakin besar, konsumsi token semakin banyak, dan daya komputasi menjadi langka. Untuk mendapatkan lebih banyak daya komputasi dengan biaya lebih rendah dari sisi daya komputasi, kita harus mencari solusi di tingkat teknologi dasar.

Mempercepat komunikasi antar chip, mempercepat komunikasi antar node, dan meningkatkan efisiensi seluruh infrastruktur komputasi adalah jalan yang sedang diverifikasi.

Sebuah perusahaan bernama Upscale AI baru-baru ini melakukan pendanaan besar. Pada September 2025, perusahaan ini mendapatkan pendanaan seed senilai $100 juta, yang dipimpin bersama oleh Mayfield dan Maverick Silicon, dengan partisipasi dari StepStone Group, Celesta Capital, Xora, Qualcomm Ventures, Cota Capital, MVP Ventures, serta Stanford University.

Pada Januari 2026, memperoleh pendanaan Seri A senilai $200 juta, dipimpin oleh Tiger Global, Premji Invest, dan Xora Innovation, dengan partisipasi Maverick Silicon, StepStone Group, Mayfield, Prosperity7 Ventures, Intel Capital, dan Qualcomm Ventures.

Baru-baru ini, muncul kabar bahwa perusahaan tersebut sedang bernegosiasi untuk pembiayaan putaran baru senilai $180 juta hingga $200 juta.

Parameter besar, MoE, konteks panjang, inovasi model mendorong inovasi jaringan komputasi AI

Sebuah perusahaan yang berdiri kurang dari satu tahun mengapa mampu mendapatkan pendanaan besar berturut-turut, hal ini sangat terkait dengan tim pendirinya. Faktanya, Upscale AI berasal dari Auradine, yang merupakan perusahaan infrastruktur AI baru yang kini telah berganti nama menjadi Velaura AI, berfokus pada penyediaan solusi komputasi ultra-rendah daya yang telah terbukti dan revolusioner untuk aplikasi AI di cloud, edge, dan fisik.

Barun Kar dan Rajiv K, sumber gambar: Upscale AI

Co-founder dan CEO Upscale AI, Barun Kar, sebelumnya adalah COO Auradine, sedangkan co-founder dan Executive Chairman Rajiv K sebelumnya adalah CEO Auradine, dan kini juga menjabat sebagai CEO Velaura AI. CTO Upscale AI, Puneet Agarwal, sebelumnya bekerja di Broadcom selama sepuluh tahun dan pernah menjadi CTO di divisi data center Marvell.

Barun Kar dan Rajiv K juga memiliki pengalaman bekerja di perusahaan besar sebelum memulai usaha sebelumnya, sehingga dapat dikatakan bahwa ini adalah tim yang telah lama berkecimpung di industri dan memiliki pengalaman yang kaya.

Komunikasi jaringan AI, mengapa penting? Ini harus dibahas dari dasar teknisnya.

Karakteristik beban komputasi AI adalah sinkronisasi yang sangat tinggi. Beban kerja modern seperti pelatihan model berskala besar, arsitektur MoE, dan inferensi terdistribusi memberikan tekanan sinkronisasi yang sangat tinggi pada jaringan.

Selama pelatihan, gradien parameter model harus ditransmisikan di antara ribuan GPU dalam gelombang yang sangat sinkron; komputasi inferensi menghasilkan lalu lintas fan-out skala besar sekaligus menuntut persyaratan latensi yang sangat ketat.

Jika jaringan tidak mampu mengikuti, GPU akan berhenti dan menunggu, latensi terus meningkat, dan efisiensi klaster komputasi runtuh.

Ini adalah ketidakcocokan arsitektur, bukan masalah yang bisa diselesaikan dengan optimasi.

Jaringan tradisional, yang mengejar universalitas, kini justru menjadi hambatan dalam skenario AI, karena kompleksitas yang diperkenalkan oleh kompatibilitas dengan berbagai beban. Komunikasi deterministik dan sinkronisasi kuat yang dibutuhkan oleh komunikasi kolektif GPU sedang melampaui batas desain jaringan tradisional.

Jaringan yang dibutuhkan oleh kluster komputasi AI harus mampu mendukung komunikasi deterministik, ter-sinkronisasi, dan ber-throughput tinggi dalam lingkungan berskala besar.

Jaringan AI harus dibangun ulang dari dasar, dirancang berdasarkan kebutuhan nyata akan koneksi Scale-Up dan Scale-Out.

Penguraian lebih lanjut jatuh pada model.

Kedua fitur model sekarang ini membuat tekanan besar pada jaringan kluster komputasi AI. Satu adalah skala parameter model yang meningkat secara eksponensial, dan yang lainnya adalah evolusi berkelanjutan dari konteks panjang dan Cot.

Sebagai contoh DeepSeek V4 pro yang baru dirilis, parameter ukurannya mencapai 1,6T dengan konteks hingga 1M. Ukuran 1,6T memerlukan memori 1,6T, yang pasti tidak cukup pada satu kartu, sehingga perlu dibagi ke sejumlah besar akselerator untuk dijalankan, dan komunikasi antar chip pun segera menjadi bottleneck.

Jendela konteks yang sangat panjang akan menyebabkan ukuran cache KV meledak, serta melebihi kapasitas memori HBM pada satu GPU. Semua ini menciptakan tekanan ganda terhadap kapasitas memori dan bandwidth komunikasi.

Bukan hanya inovasi tingkat chip, tetapi revolusi seluruh stack

Untuk melatih dan melakukan inferensi lancar pada model dengan parameter besar dan jendela konteks panjang, solusi sejati adalah mendefinisikan ulang "batas komputasi," sehingga lebih banyak GPU dapat terhubung melalui jaringan kecepatan super tinggi, memiliki latensi sub-mikrodetik dan kemampuan komunikasi kolektif ber-throughput tinggi, sehingga dapat dianggap sebagai satu "GPU super," sehingga muncul bentuk rak.

Dengan contoh NVIDIA NVL72, ia tidak lagi memperlakukan 72 GPU sebagai perangkat yang saling terpisah, melainkan menjalankannya sebagai mesin konsisten dengan semantik memori, dengan bandwidth NVLink internal mencapai 130 TB/s.

Di sini, diperkenalkan dua tingkat koneksi infrastruktur AI: interkoneksi GPU tingkat rak (Scale-Up) dan interkoneksi jaringan tingkat klaster (Scale-Out).

Kedua lapisan ini harus beroperasi secara sinergis agar ribuan GPU dapat bekerja secara efisien seperti mesin komputasi terdistribusi yang terpadu.

Untuk dua tingkat koneksi infrastruktur AI, Upscale AI mengembangkan arsitektur jaringan yang disesuaikan untuk AI. Untuk interkoneksi AI tingkat rak (Scale-Up), ia memiliki arsitektur chip SkyHammer, dan untuk struktur jaringan AI tingkat klaster (Scale-Out), ia memiliki Open Ethernet.

SkyHammer adalah arsitektur chip yang dirancang untuk mengatasi bottleneck jaringan Scale-Up AI, berbasis standar terbuka dengan tujuan mencapai latensi deterministik, bandwidth ekstrem, dan kinerja yang dapat diprediksi dalam skala sangat besar, memungkinkan GPU dan XPU beroperasi secara terkoordinasi sebagai mesin komputasi yang sangat sinkron.

Salah satu fiturnya adalah latency deterministik, yang mewakili waktu yang diperlukan untuk mentransmisikan data di antara berbagai komponen dalam rak, dan dapat dikendalikan dengan prediktabilitas tinggi.

Sumber gambar: Upscale AI

SkyHammer dibangun dari lapisan ASIC, dengan desain terpadu di tiga tingkat: chip, sistem, dan rak, memastikan setiap lapisan bekerja secara sinkron. Setiap elemennya dirancang ulang: mulai dari bagaimana data mengalir di dalam chip, hingga bagaimana fabric beradaptasi secara dinamis di bawah beban, hingga bagaimana superkluster tetap mempertahankan prediktabilitas di bawah tekanan sinkronisasi tinggi.

Ini mendukung standar baru seperti ESUN, UEC, UALink, dan juga menyediakan ruang untuk inovasi masa depan yang belum muncul. Dengan arsitektur yang fleksibel, SkyHammer dapat beradaptasi secara mulus dengan definisi standar baru tanpa perlu重构 atau kompromi, mencapai interoperabilitas dalam lingkungan yang terbuka dan beragam, sekaligus mempertahankan kinerjanya.

Produk berbasis arsitektur SkyHammer direncanakan dirilis pada tahun 2026.

Open Ethernet terutama ditujukan untuk arsitektur jaringan AI tingkat klaster (Scale-Out). Di tingkat klaster, sistem AI membutuhkan keterbukaan, interoperabilitas, serta bandwidth dalam jumlah besar.

Upscale AI telah menciptakan struktur jaringan Open Ethernet yang dioptimalkan untuk AI, yang akan dibangun berdasarkan chip switch Ethernet NVIDIA Spectrum-X dan sistem operasi jaringan SONiC, dengan dukungan end-to-end.

Dengan mengintegrasikan kemampuan telemetri asli ASIC, perilaku Ethernet deterministik tanpa kehilangan data, dan alur kerja jaringan standar industri, sistem dapat memberikan kinerja yang dapat diprediksi, operasi yang disederhanakan, dan keandalan tinggi dalam skala besar.

Singkatnya, ia dapat menghubungkan ribuan GPU menjadi satu jaringan berperforma tinggi yang terpadu, mendukung pelatihan terdistribusi dan inferensi skala besar.

Untuk proyek ini, Upscale AI bergabung dengan NVIDIA Partner Network dan sedang bekerja erat dengan NVIDIA serta mitra ekosistemnya untuk berkolaborasi dalam arsitektur referensi dan desain yang telah terbukti, guna mempercepat penerapan jaringan pusat data AI berskala besar.

Dapat dilihat bahwa apa yang dilakukan Upscale AI tidak berhenti pada penciptaan chip jaringan yang lebih cepat, tetapi mencapai keterkaitan erat antara chip, sistem, dan perangkat lunak. Untuk menjalankan kluster komputasi AI besar, diperlukan pemahaman terus-menerus tentang kondisi kemacetan, perilaku sinkronisasi, dan pemanfaatan GPU dalam seluruh struktur jaringan.

Ini mencakup: jaringan RDMA berkinerja tinggi, manajemen kemacetan adaptif, telemetri dan observabilitas berorientasi GPU, serta visibilitas operasional real-time yang mencakup seluruh struktur jaringan. Upscale AI akan mengoptimalkan semua aspek ini untuk membangun infrastruktur jaringan deterministik yang diperlukan untuk menjalankan kluster komputasi AI modern.

Ketidaksesuaian antara kebutuhan model dan infrastruktur komputasi AI menciptakan berbagai peluang kewirausahaan

Infrastruktur komputasi AI masih memiliki potensi pengembangan yang sangat besar. Faktanya, ia kemungkinan besar akan terus berada dalam keadaan inovasi bergantian dengan perangkat lunak AI, terutama model. Ketika arsitektur model mengalami inovasi, dan terjadi ketidaksesuaian struktural pada perangkat keras atau perangkat lunak infrastruktur komputasi AI, peluang baru muncul.

Saat ini, kombinasi arsitektur MoE, parameter super besar, jendela konteks yang sangat panjang, dan permintaan tinggi AI terhadap token telah menciptakan ketidakseimbangan antara pasokan dan permintaan kekuatan komputasi AI, sekaligus membuka peluang inovasi dalam infrastruktur kekuatan komputasi AI.

Di tingkat chip komputasi, dalam enam bulan terakhir kami memperhatikan Unconventional AI (mengumpulkan dana $475 juta), MatX (mengumpulkan dana $500 juta); di bidang desain chip yang diberdayakan AI, kami memperhatikan Ricursive (mengumpulkan dana $300 juta), Cognichip (mengumpulkan dana $60 juta); tentu saja juga jaringan interkoneksi pusat data AI, seperti Upscale AI (sudah mengumpulkan dana $300 juta, dan berencana mengumpulkan lagi $200 juta), Eridu (mengumpulkan dana $200 juta), Ethernovia (mengumpulkan dana $90 juta).

Model AI open-source Tiongkok telah mencapai kepemimpinan global, terutama DeepSeek V4 yang baru dirilis. Di tingkat infrastruktur AI, Tiongkok masih berada dalam posisi mengejar, tetapi ini juga menunjukkan ruang inovasi yang besar. Melihat pasar modal ventura Tiongkok, banyak perusahaan inovatif mulai muncul, dan sebagian di antaranya telah mencapai keberhasilan awal.