NVIDIA RTX Spark Mendifinisikan Ulang PC AI dengan Kinerja AI 1 Petaflop

Dalam dua tahun terakhir, produsen PC terus menyoroti parameter tertentu saat mempromosikan "AI PC": kemampuan NPU. Namun, baik 45 TOPS dari Intel Lunar Lake maupun 50 TOPS dari AMD Strix Point, angka-angka ini tetap berada pada tingkat yang relatif rendah. Hanya mampu melakukan blur latar belakang, pengurangan noise suara, dan menjalankan beberapa model sederhana di sisi perangkat, itulah batasnya.

Pada 31 Mei, NVIDIA memperkenalkan RTX Spark superchip di konferensi GTC 2026, mendorong angka ini ke 1 petaflop, atau 1000 TOPS. Bukan peningkatan 30% atau 50%, tetapi langsung melompat satu tingkat.

Dirilis bersamaan, beberapa berita lainnya: Microsoft memperbarui mekanisme keamanan bawaan Windows secara terpadu dengan RTX Spark, serta memperkenalkan runtime sandbox open-source NVIDIA, OpenShell, ke platform Windows; Adobe mengumumkan重构 ulang Photoshop dan Premiere dari dasar, secara khusus disesuaikan dengan arsitektur memori terpadu RTX Spark; Enam produsen OEM pertama telah mengonfirmasi akan meluncurkan laptop tipis dan desktop kompak yang dilengkapi chip ini pada musim gugur tahun ini.

Yang dilakukan NVIDIA di GTC kali ini bukan meluncurkan chip baru. Ia berusaha menetapkan standar perangkat keras baru untuk kategori "komputer AI pribadi".

gambar

Ketika GPU menjadi bintang utama PC

Pertama, lihat chip itu sendiri. Berdasarkan data yang diumumkan NVIDIA di GTC, RTX Spark mengintegrasikan GPU berarsitektur Blackwell dengan 6.144 inti CUDA, dipasangkan dengan CPU Grace berarsitektur Arm 20 inti yang dirancang bersama MediaTek, menggunakan proses TSMC 3nm. Perubahan kunci terletak pada arsitektur memori: memori terpadu hingga 128GB, di mana CPU dan GPU berbagi pool memori yang sama, sehingga data tidak perlu dipindahkan bolak-balik di antara keduanya.

Ini bertentangan dengan logika arsitektur PC masa lalu.

Struktur dasar PC tradisional adalah "CPU x86 sebagai prosesor utama, GPU terpisah sebagai aksesori opsional". Bahkan konsep AI PC yang baru muncul belakangan ini, pendekatan Intel dan AMD adalah dengan memasukkan NPU ke dalam CPU sebagai modul tambahan untuk akselerasi AI, dengan daya komputasi umumnya sekitar 40-50 TOPS. GPU tetap menjadi "perangkat eksternal".

RTX Spark mengalihkan kekuasaan. SoC ini menjadikan GPU sebagai tokoh utama, sementara CPU mundur ke peran pendukung. Nvidia menyatakan daya komputasi AI-nya adalah 1 petaflop FP4, setara dengan 1000 TOPS, lebih dari 20 kali lipat dari daya NPU yang terintegrasi pada PC AI generasi sebelumnya. Ini bukan sekadar percepatan di lintasan yang sama, melainkan start di lintasan yang berbeda.

Kecepatan respon produsen OEM mengonfirmasi penilaian ini. Menurut pengumuman resmi NVIDIA dan laporan lanjutan dari DIGITIMES, ASUS, Dell, HP, Lenovo, Microsoft Surface, dan MSI akan meluncurkan laptop tipis dan desktop kompak dengan RTX Spark pada musim gugur tahun ini, diikuti oleh model dari Acer dan Gigabyte. Hampir semua merek PC Windows utama telah bergabung.

gambar

RTX Spark bukanlah produk yang lahir dari nol. Pada awal 2025, chip inti Blackwell dan Grace yang sama pernah muncul dalam bentuk Project DIGITS dan DGX Spark, tetapi pada saat itu diposisikan sebagai superkomputer desktop Linux untuk pengembang, dengan ukuran sebesar desktop kecil. Satu tahun kemudian, arsitektur ini dipadatkan ke dalam ruang pendingin laptop tipis, sistem operasi diubah dari Linux menjadi Windows, dan target pengguna diperluas dari pengembang AI ke konsumen umum dan pengguna perusahaan. Inilah perubahan paling penting dalam peluncuran konsumen di GTC 2026: NVIDIA bukan sekadar meluncurkan mainan untuk pengembang, tetapi sedang membuka pintu menuju pasar konsumen.

Apakah model 120B cukup digunakan di lokal?

Angka daya komputasi dan memori pada akhirnya harus menjawab satu pertanyaan: bisa melakukan apa?

Jawaban yang diberikan NVIDIA di acara peluncuran adalah bahwa RTX Spark mendukung pelaksanaan lokal model besar dengan 120 miliar parameter, dengan jendela konteks hingga satu juta token. Apa artinya 120B? Sebagai perbandingan, praktik utama saat ini untuk menjalankan model lokal pada perangkat konsumen adalah menggunakan GPU RTX 4090 dengan memori 24GB yang, melalui kuantisasi dan kompresi, dapat menjalankan model dengan parameter 30B hingga 40B. Beberapa model kecil dapat berjalan cepat di GPU konsumen, seperti model 9B. Dari 9B hingga 120B, lompatan ini mengubah standar "cukup" untuk AI sisi perangkat.

128GB memori terpadu adalah prasyarat semua ini. Pada arsitektur PC tradisional, CPU memiliki memori sistem sendiri, GPU memiliki memori video sendiri, dan keduanya dipisahkan oleh batas fisik. Model besar yang melebihi kapasitas memori video tidak akan bisa berjalan sama sekali, atau memerlukan pemisahan model dan pertukaran memori yang rumit, sehingga kecepatannya menurun drastis. Arsitektur memori terpadu menghilangkan hambatan ini, dengan data model langsung dimasukkan ke dalam pool bersama 128GB yang dapat diakses oleh CPU dan GPU. Apple terlebih dahulu membuktikan kelayakan jalur teknologi ini untuk konsumen di Apple Silicon, dan sekarang NVIDIA membawanya ke dunia Windows.

Selain inferensi model besar, contoh penggunaan yang tercantum oleh NVIDIA juga mencakup pengeditan video 12K, rendering adegan 3D lebih dari 90GB, dan game ray tracing dengan kecepatan lebih dari 100 fps pada resolusi 1440p. Karakteristik umum dari skenario-skenario ini adalah volume data yang diproses dalam satu kali operasi sangat besar, sehingga PC tradisional either memerlukan waktu tunggu beberapa kali lebih lama atau bahkan tidak dapat menjalankannya sama sekali.

Masih ada jarak antara “didukung untuk dijalankan” dan “dapat digunakan dengan lancar”. NVIDIA belum mengumumkan kecepatan inferensi aktual model 120B di RTX Spark, maupun data latensi token pertama dalam skenario konteks jutaan token. Indikator kunci yang menentukan kecepatan inferensi konteks panjang adalah bandwidth memori. Sebagai perbandingan, DGX Spark yang menggunakan inti GB10 sama memiliki bandwidth memori sekitar 301 GB/s dalam pengujian nyata. Tingkat bandwidth ini cukup untuk menjalankan model 120B, tetapi saat menangani jendela konteks tingkat jutaan token, pengguna mungkin perlu menunggu beberapa detik sebelum melihat token pertama keluaran. Versi laptop RTX Spark mungkin mengalami penyesuaian bandwidth aktual akibat batasan daya.

Tambahkan kandang keamanan untuk agen AI

Rilisan inti lain selain daya komputasi adalah kolaborasi NVIDIA dan Microsoft di tingkat sistem. Bagian ini mungkin merupakan konten paling mudah diabaikan dalam rilis konsumen GTC 2026, tetapi memiliki dampak paling mendalam terhadap industri.

Sebuah komputer yang mampu menjalankan model 120B, jika diberikan kepada agen AI yang dapat mengoperasikan desktop secara mandiri, mengklik tombol, serta membaca dan menulis file, risiko keamanannya bukan lagi pada tingkat "akan kehilangan data atau tidak", melainkan "apakah agen tersebut akan melakukan hal-hal yang tidak Anda inginkan". Masalah ini tidak terselesaikan, perusahaan tidak mungkin menerapkan perangkat semacam ini kepada karyawan.

Solusi yang diberikan Microsoft dan NVIDIA adalah dua lapis pertahanan. Lapisan pertama, Microsoft meningkatkan mekanisme keamanan bawaan Windows, memberikan pemantauan dan pembatasan terhadap perilaku agen AI pada tingkat sistem operasi. Lapisan kedua, NVIDIA secara resmi memperkenalkan runtime OpenShell di platform Windows. Menurut dokumentasi resmi NVIDIA, OpenShell adalah runtime sandbox open-source yang menyediakan isolasi tingkat kernel. Ini menetapkan lingkungan operasional yang terkendali untuk agen AI, di mana agen dapat menjalankan tugas secara otonom, tetapi izinnya dibatasi ketat sehingga tidak dapat melampaui batas untuk mengakses file inti sistem, koneksi jaringan, atau data sensitif pengguna.

Arti kombinasi ini bagi pembelian perusahaan jelas. Sebelumnya, konsep "agen AI lokal" hanya berada pada tahap demonstrasi teknis. Perangkat keras bisa berjalan, tetapi kerangka keamanannya kosong. Tidak ada departemen TI perusahaan yang berani memasukkan perangkat dalam kondisi seperti ini ke dalam daftar pembelian. NVIDIA dan Microsoft menyisipkan lapisan isolasi standar di antara perangkat keras dan aplikasi, mengubah "bisa digunakan" menjadi "dapat dikelola".

Overhead kinerja OpenShell sendiri adalah variabel yang perlu dipantau. Isolasi sandbox biasanya menyebabkan penurunan kinerja tertentu, namun sejauh mana hal ini memengaruhi kecepatan inferensi atau respons sistem, NVIDIA belum merilis data resmi. Kompleksitas implementasi di sisi manajemen TI perusahaan, serta kompatibilitas dengan kebijakan keamanan yang ada, adalah masalah praktis yang baru dapat diverifikasi setelah perangkat OEM tersedia di pasaran.

Mengapa Adobe bersedia "membangun ulang dari dasar"?

Tingkat kerja sama dari pihak perangkat lunak biasanya menjadi indikator apakah platform perangkat keras baru dapat bertahan.

Tindakan yang diumumkan Adobe selama GTC merupakan sinyal terbesar di sisi perangkat lunak dalam rilis ini. Menurut blog resmi NVIDIA dan konfirmasi dari eksekutif Adobe, Adobe memulai重构 dasar Photoshop dan Premiere, secara khusus disesuaikan dengan arsitektur memori terpadu RTX Spark, dengan klaim peningkatan kinerja AI dan pemrosesan grafis hingga 2 kali lipat.

“Rekonstruksi lapisan bawah” bukan sekadar menambahkan plugin atau membuat lapisan kompatibilitas. Di PC tradisional, CPU dan GPU masing-masing memiliki ruang memori sendiri; ketika memproses file PSD ukuran besar atau timeline video 8K, data harus dipindahkan berulang-ulang di antara dua sistem memori, yang menjadi titik utama pemborosan kinerja. Memori terpadu RTX Spark memungkinkan CPU dan GPU berbagi langsung ruang 128GB yang sama, perubahan arsitektur ini memberikan nilai nyata bagi alur kerja kreator profesional. Adobe mengubah kode dasarnya, menunjukkan bahwa mereka mengakui arah arsitektur ini bukan sekadar gimmick pemasaran sementara.

Namun, patokan perbandingan untuk "percepatan 2x" ini tidak diungkapkan oleh NVIDIA maupun Adobe. Apakah dibandingkan dengan prosesor x86 generasi sama ditambah kartu grafis independen, atau dibandingkan dengan solusi NPU PC AI generasi sebelumnya? Hasilnya sangat berbeda. Sebelum kondisi benchmark diumumkan, nilai angka ini tetap diragukan.

Dukungan juga diumumkan oleh Blackmagic Design, ComfyUI, llama.cpp, OTOY, dan sejumlah perusahaan game. Perhatian layak diberikan pada kelanjutan ComfyUI dan llama.cpp, karena keduanya merupakan alat open-source paling aktif dalam alur kerja AI lokal saat ini. Dukungan awal dari komunitas pengembang sering kali mencerminkan potensi ekosistem platform secara lebih nyata daripada janji dari perusahaan besar.

NVIDIA sedang membangun pengalaman terintegrasi perangkat lunak dan perangkat keras, mirip dengan Apple, melalui ekosistem CUDA dan arsitektur memori terpadu di kalangan Windows. Perbedaannya, dinding milik Apple dibangun sendiri, sementara NVIDIA perlu meyakinkan Microsoft dan ISV untuk ikut membangunnya. Kesiapan Adobe untuk memulai dari tingkat dasar setidaknya menandakan bahwa batu pertama dinding tersebut sudah diletakkan.

Di luar parameter kertas

Kembali ke pertanyaan paling praktis: apakah perangkat ini benar-benar bisa dibeli, dan seperti apa pengalaman setelah membelinya?

Berdasarkan informasi yang dirilis NVIDIA, perangkat RTX Spark pertama akan tersedia di pasar pada musim gugur tahun ini, mencakup laptop tipis dan desktop kompak dari ASUS, Dell, HP, Lenovo, Microsoft Surface, dan MSI. Model dari Acer dan Gigabyte akan menyusul kemudian. Harga spesifik dan tanggal peluncuran pasti untuk semua OEM belum diumumkan.

Yang lebih penting daripada harga adalah beberapa faktor tak diketahui di tingkat fisik. Bagaimana menyeimbangkan konsumsi daya dan pendinginan saat memasukkan chip dengan daya komputasi 1 petaflop ke dalam laptop ringan? Bagaimana kinerja sehari-hari dan masa pakai baterai RTX Spark dalam skenario non-AI? Apakah bandwidth aktual 128GB memori terpadu pada bentuk laptop akan menyusut signifikan karena batasan daya?

Masalah-masalah ini merupakan ujian sejati dalam penerapan industri. Kinerja puncak sebuah chip pada prototipe teknik seringkali berbeda dengan kinerjanya dalam penggunaan sehari-hari selama 8 jam oleh konsumen. NVIDIA menekankan efisiensi daya RTX Spark dalam siaran persnya, tetapi tidak memberikan angka TDP spesifik atau data daya tahan baterai.

Dari sudut pandang struktur industri PC, munculnya RTX Spark menandai terbentuknya pola pembagian kerja baru. Selama tiga dekade terakhir, kekuasaan atas chip inti PC berada di tangan produsen prosesor x86, sementara produsen GPU meskipun semakin penting, tetap hanya menjadi "aksesoris yang dipasang di motherboard". NVIDIA kali ini menghadirkan sebuah SoC lengkap, dengan CPU, GPU, hingga pengendali memori semuanya terintegrasi, dan bagian CPU berarsitektur Arm dirancang oleh MediaTek. Struktur kekuasaan dalam rantai pasok PC sedang berubah dari "CPU x86 ditambah GPU opsional" menjadi "platform SoC yang berpusat pada GPU".

Perpindahan ini tidak akan selesai dalam satu hari. Strategi penetapan harga OEM, kinerja efisiensi energi produk nyata, kemajuan penyesuaian perangkat lunak ISV, dan siklus verifikasi pembelian pelanggan perusahaan—setiap tahap menentukan apakah RTX Spark akan menjadi koordinat baru dalam industri PC atau hanya demonstrasi teknologi yang awalnya tinggi tapi akhirnya menurun. Jawabannya setidaknya baru akan muncul pada musim gugur tahun ini.