NVIDIA RTX Spark Menentukan Semula PC AI dengan Prestasi AI 1 Petaflop

Dalam dua tahun terakhir, pengilang PC terus menekankan parameter berikut semasa mempromosikan "AI PC": kekuatan NPU. Namun, sama ada 45 TOPS daripada Intel Lunar Lake atau 50 TOPS daripada AMD Strix Point, nombor-nombor ini tetap berada pada tahap yang relatif rendah. Ia hanya mampu melakukan pemudaran latar belakang, pengurangan bunyi bising suara, dan menjalankan beberapa model sisi peranti berskala kecil, dan tidak lebih daripada itu.

Pada 31 Mei, RTX Spark superchip yang diperkenalkan oleh NVIDIA di konferensi GTC 2026 membawa angka ini ke 1 petaflop, iaitu 1000 TOPS. Bukan peningkatan 30% atau 50%, tetapi langsung melompat satu peringkat.

Dipaparkan bersamaan dengan beberapa berita lain: Microsoft bekerjasama dengan RTX Spark untuk meningkatkan mekanisme keselamatan asli Windows, serta memperkenalkan runtime sandbox open-source NVIDIA, OpenShell, ke platform Windows; Adobe mengumumkan bahawa mereka akan membina semula Photoshop dan Premiere dari dasar, secara khusus untuk menyesuaikan arsitektur memori seragam RTX Spark; Enam pengilang OEM pertama telah mengesahkan bahawa mereka akan melancarkan laptop nipis dan komputer desktop kompak yang dilengkapi cip ini pada musim gugur ini.

Apa yang NVIDIA lakukan di GTC kali ini bukanlah melancarkan cip baharu. Ia cuba menetapkan piawaian peranti baharu untuk kategori "komputer AI peribadi".

gambar

Apabila GPU menjadi bintang utama PC

Pertama, lihat cip itu sendiri. Berdasarkan data yang diumumkan oleh NVIDIA di GTC, RTX Spark mengintegrasikan GPU berarsitektur Blackwell dengan 6.144 inti CUDA, dipasangkan dengan CPU Grace berarsitektur Arm 20 inti yang dirancang bersama MediaTek, menggunakan proses TSMC 3nm. Perubahan utama terletak pada arsitektur memori: memori terpadu hingga 128GB, di mana CPU dan GPU berbagi satu kolam memori yang sama, sehingga data tidak perlu dipindahkan bolak-balik di antara keduanya.

Ini bertentangan dengan logik arsitektur PC sebelum ini.

Struktur asas PC tradisional ialah "CPU x86 sebagai pemproses utama, GPU bebas sebagai aksesori pilihan". Walaupun konsep AI PC yang baru-baru ini muncul, pendekatan Intel dan AMD ialah dengan membina NPU di dalam CPU sebagai modul tambahan untuk akselerasi AI, dengan kekuatan pengiraan biasanya pada empat puluh hingga lima puluh TOPS. GPU masih merupakan "peranti luar".

RTX Spark telah mengalihkan kekuasaan. SoC ini menjadikan GPU sebagai bintang utama, sementara CPU berpindah ke peranan sokongan. Kuasa AI yang diberikan oleh NVIDIA ialah 1 petaflop FP4, setara dengan 1000 TOPS, iaitu lebih daripada 20 kali ganda kuasa NPU yang dibina dalam PC AI generasi sebelumnya. Ini bukan sekadar peningkatan laju di trek yang sama, tetapi permulaan di trek yang berbeza.

Kelajuan tindakan pembuat peralatan asal membuktikan penilaian ini. Berdasarkan pengumuman rasmi NVIDIA dan laporan susulan DIGITIMES, ASUS, Dell, HP, Lenovo, Microsoft Surface dan MSI akan melancarkan laptop nipis dan komputer desktop kompak yang dilengkapi RTX Spark pada musim gugur ini, diikuti oleh model-model dari Acer dan Gigabyte. Hampir semua jenama PC Windows utama telah menyertai.

gambar

RTX Spark bukanlah produk yang diciptakan dari awal. Pada awal 2025, cip yang sama dengan inti Blackwell dan Grace pernah diperkenalkan dalam bentuk Project DIGITS dan DGX Spark, tetapi pada masa itu ia dikenal sebagai superkomputer desktop Linux untuk pengembang, dengan ukuran yang hampir sebesar komputer desktop kecil. Setahun kemudian, arsitektur ini dipadatkan ke dalam ruang pendingin laptop ramping, sistem operasi berubah dari Linux menjadi Windows, dan sasaran pengguna diperluas dari pengembang AI ke pengguna konsumen dan perusahaan biasa. Inilah perubahan paling penting dalam peluncuran konsumen di GTC 2026: NVIDIA bukan sekadar meluncurkan mainan untuk pengembang, tetapi sedang membuka pintu menuju pasaran konsumen.

Apakah model 120B cukup untuk dijalankan secara tempatan?

Nombor kekuatan pengiraan dan memori akhirnya perlu menjawab satu soalan: apa yang boleh dilakukan?

Jawapan yang diberikan oleh NVIDIA di acara pelancaran ialah, RTX Spark menyokong menjalankan model besar dengan 120B parameter secara tempatan, dengan jendela konteks sehingga satu juta token. Apakah maksud 120B? Sebagai perbandingan, amalan utama semasa ini untuk menjalankan model secara tempatan pada peranti pengguna ialah, RTX 4090 dengan memori GPU 24GB boleh menjalankan model dengan parameter 30B hingga 40B melalui kuantisasi dan pemampatan. Model-model kecil tertentu boleh dijalankan dengan pantas pada kad grafik pengguna ialah model 9B. Dari 9B ke 120B, lompatan ini telah mengubah takrif “cukup” untuk AI sisi hujung.

128GB memori seragam adalah prasyarat semua ini. Dalam arsitektur PC tradisional, CPU memiliki memori sistem sendiri, GPU memiliki memori video sendiri, dan keduanya dipisahkan oleh batas fisik. Model besar yang melebihi kapasitas memori video tidak akan berjalan sama sekali, atau memerlukan pemisahan model dan pertukaran memori yang kompleks, menyebabkan kecepatan menurun drastis. Arsitektur memori seragam menghilangkan hambatan ini, dengan data model langsung dimasukkan ke dalam pool bersama 128GB yang dapat diakses oleh CPU dan GPU. Apple terlebih dahulu membuktikan kelayakan jalur teknologi ini untuk konsumen di Apple Silicon, dan sekarang NVIDIA membawanya ke dunia Windows.

Selain inferens model besar, kes penggunaan yang disenaraikan oleh NVIDIA juga termasuk penyuntingan video 12K, render adegan 3D lebih daripada 90GB, dan permainan ray tracing dengan lebih daripada 100fps pada resolusi 1440p. Ciri sepunya kes-kes ini ialah jumlah data yang diproses dalam satu kali sangat besar, di mana PC tradisional either memerlukan masa menunggu beberapa kali ganda atau tidak mampu menjalankannya sama sekali.

Masih terdapat jarak antara “disokong” dan “mudah digunakan secara lancar”. NVIDIA tidak mengumumkan kelajuan inferens sebenar model 120B di atas RTX Spark, ataupun data latensi token pertama dalam skenario konteks jutaan token. Indikator utama yang menentukan kelajuan inferens konteks panjang ialah lebar pita memori. Sebagai perbandingan, DGX Spark yang menggunakan inti GB10 yang sama telah mengukur lebar pita memori sekitar 301 GB/s dalam ujian sebenar. Tahap lebar pita ini mencukupi untuk menjalankan model 120B, tetapi apabila mengendalikan jendela konteks berskala jutaan token, pengguna mungkin perlu menunggu beberapa saat sebelum melihat token keluaran pertama. Versi laptop RTX Spark mungkin mengalami penyesuaian lebar pita sebenar akibat hadapan kuasa.

Tambahkan sangkar keselamatan kepada agen AI

Penerbitan inti lain selain kekuatan pengiraan ialah kerjasama NVIDIA dan Microsoft pada peringkat sistem. Bahagian ini mungkin merupakan perkara yang paling mudah diabaikan dalam penerbitan konsumer GTC 2026, tetapi mempunyai kesan paling mendalam terhadap industri.

Komputer yang mampu menjalankan model 120B, jika diberikan kepada agen AI yang boleh mengendalikan desktop secara autonomi, mengklik butang, dan membaca serta menulis fail, risiko keselamatan bukan lagi pada tahap “akan kehilangan data atau tidak”, tetapi “akan agen melakukan perkara yang tidak anda inginkan atau tidak”. Masalah ini tidak diselesaikan, syarikat tidak mungkin meluluskan peranti semacam ini kepada pekerja.

Solusi yang diberikan oleh Microsoft dan NVIDIA adalah dua lapisan pertahanan. Lapisan pertama, Microsoft meningkatkan mekanisme keselamatan asli Windows, memantau dan mengawasi perilaku agen AI dari tingkat sistem operasi. Lapisan kedua, NVIDIA secara rasmi memperkenalkan runtime OpenShell ke platform Windows. Menurut dokumen rasmi NVIDIA, OpenShell adalah runtime sandbox open-source yang menyediakan isolasi tingkat kernel. Ia menetapkan lingkungan operasi yang boleh dikawal untuk agen AI, di mana agen tersebut boleh menjalankan tugas secara autonomi, tetapi kebenarannya dibatasi secara ketat dan tidak boleh melanggar akses ke fail inti sistem, sambungan rangkaian, atau data sensitif pengguna.

Makna kombinasi ini terhadap pembelian korporat adalah jelas. Sebelum ini, konsep “agen AI tempatan” hanya berada pada tahap demonstrasi teknikal. Peranti berjalan, tetapi kerangka keselamatan masih kosong. Tiada jabatan IT korporat yang berani memasukkan peranti dalam keadaan ini ke dalam senarai pembelian. NVIDIA dan Microsoft menyisipkan lapisan pemisahan standard di antara peranti dan aplikasi, mengubah “boleh digunakan” menjadi “boleh dikelola”.

Overhead prestasi OpenShell sendiri adalah pemboleh ubah yang perlu dipantau. Pemisahan sandbox biasanya membawa kehilangan prestasi tertentu, tetapi sejauh mana ia akan mempengaruhi kelajuan inferens atau respons sistem, NVIDIA belum mengeluarkan data sebarang. Kompleksiti penghantaran di sisi pengurusan IT perusahaan, serta keserasian dengan strategi keselamatan sedia ada, adalah masalah praktikal yang perlu diverifikasi setelah peranti OEM dilancarkan.

Mengapa Adobe bersedia "membangun semula dari dasar"?

Tingkat kerjasama daripada pembekal perisian biasanya menjadi petunjuk sama ada platform peranti keras baharu mampu menetapkan dirinya.

Tindakan yang diumumkan oleh Adobe semasa GTC merupakan isyarat terbesar dalam penerbitan ini dari segi perisian. Menurut blog rasmi NVIDIA dan pengesahan daripada eksekutif Adobe, Adobe telah memulakan semula struktur asas Photoshop dan Premiere, secara khusus disesuaikan dengan arkaitektur memori seragam RTX Spark, dengan mengklaim peningkatan prestasi AI dan pemprosesan grafik sehingga dua kali ganda.

“Rekabentuk asas” bukan sekadar menambah plugin atau membuat lapisan penyesuaian. Di komputer PC tradisional, CPU dan GPU masing-masing mempunyai ruang memori sendiri; semasa memproses fail PSD yang sangat besar atau garis masa video 8K, data perlu dipindahkan berulang-ulang antara dua set memori, yang merupakan kawasan utama pembaziran prestasi. Memori seragam RTX Spark membenarkan CPU dan GPU berkongsi ruang 128GB yang sama secara langsung, perubahan struktur ini memberi nilai praktikal kepada alur kerja pencipta profesional. Adobe telah mengubah kod asasnya, menunjukkan bahawa ia mengiktiraf arah struktur ini bukan sekadar taktik pemasaran sementara.

Namun, patutan "penggalak 2 kali" ini tidak dinyatakan oleh NVIDIA dan Adobe. Adakah ia dibandingkan dengan pemproses x86 generasi sama dengan kad grafik bebas, atau dengan penyelesaian NPU PC AI generasi sebelumnya? Keputusannya sangat berbeza. Sebelum syarat ujian pentaksiran dinyatakan, nilai nombor ini hanya boleh ditandakan dengan tanda soal.

Sokongan yang diumumkan secara serentak termasuk Blackmagic Design, ComfyUI, llama.cpp, OTOY, dan pelbagai pengeluar permainan. Sokongan daripada ComfyUI dan llama.cpp patut diperhatikan kerana kedua-duanya merupakan alat open-source yang paling aktif dalam alur kerja AI tempatan saat ini. Sokongan awal daripada komuniti pembangun sering kali mencerminkan potensi ekosistem platform dengan lebih jujur berbanding janji daripada syarikat besar.

NVIDIA sedang membina pengalaman serupa Apple yang terpadu perisian dan peranti di kalangan Windows melalui ekosistem CUDA dan arsitektur memori seragam. Perbezaannya ialah, tembok Apple dibina sendiri, manakala NVIDIA perlu meyakinkan Microsoft dan ISV untuk bersama-sama membina tembok itu. Kebersediaan Adobe untuk memulakan dari peringkat asas sekurang-kurangnya menunjukkan batu pertama tembok itu telah diletakkan.

Di luar parameter kertas

Kembali kepada soalan yang paling praktikal: adakah peranti-peranti ini benar-benar boleh dibeli, dan bagaimanakah pengalaman apabila membelinya?

Berdasarkan maklumat yang dikeluarkan oleh NVIDIA, peranti RTX Spark pertama akan dilancarkan pada musim gugur tahun ini, mencakupi notebook nipis dan komputer desktop kompak dari ASUS, Dell, HP, Lenovo, Microsoft Surface, dan MSI. Model dari Acer dan Gigabyte akan menyusul kemudian. Harga tepat dan tarikh pelancaran tepat untuk semua OEM belum diumumkan.

Yang lebih penting daripada harga ialah beberapa faktor tidak diketahui pada peringkat fizikal. Bagaimana menyeimbangkan penggunaan kuasa dan pembuangan haba apabila memasukkan cip dengan keupayaan 1 petaflop ke dalam laptop nipis dan ringan? Bagaimana prestasi harian dan jangka hayat bateri RTX Spark dalam skenario bukan AI? Akankah lebar pita sebenar memori seragam 128GB dalam bentuk laptop menyusut ketara akibat had penggunaan kuasa?

Masalah-masalah ini merupakan ujian sebenar kepada pelaksanaan industri. Kekuatan pemprosesan puncak satu cip pada prototaip kejuruteraan dan prestasi harian selama 8 jam di tangan pengguna akhir seringkali merupakan dua perkara yang berbeza. NVIDIA menekankan kecekapan tenaga RTX Spark dalam acara pelancaran, tetapi tidak memberikan nilai TDP atau data tempoh hidup yang spesifik.

Dari sudut pandang struktur industri PC, munculnya RTX Spark menandakan bahawa satu model pembahagian tugas baru sedang terbentuk. Selama tiga dekad, kuasa atas chip utama PC berada di tangan pengeluar prosesor x86, walaupun pengeluar GPU semakin penting, mereka tetap menjadi “aksesori yang dipasang pada papan induk”. NVIDIA kali ini mengeluarkan satu SoC yang lengkap, dengan CPU, GPU, dan pengawal memori semuanya diintegrasikan, bahagian CPU berarkitektur Arm direka oleh MediaTek. Struktur kuasa dalam rantai pasaran PC sedang berubah dari “CPU x86 ditambah GPU pilihan” kepada “platform SoC berpusatkan GPU”.

Peralihan ini tidak akan selesai dalam sehari. Strategi penentuan harga OEM, prestasi kecekapan tenaga produk sebenar, kemajuan penyesuaian perisai ISV, dan kitaran pengesahan pembelian pelanggan korporat—setiap tahap menentukan sama ada RTX Spark akan menjadi koordinat baharu dalam industri PC atau sekadar demonstrasi teknologi yang bermula tinggi tetapi akhirnya menurun. Jawapannya sekurang-kurangnya akan ditunggu sehingga musim luruh tahun ini.