Jensen Huang ingin anda berhenti mengklik. Semasa ucapan utamanya di GTC Taipei pada 1 Jun, CEO Nvidia itu mengumumkan bahawa paradigma puluhan tahun yang lalu untuk berinteraksi dengan komputer melalui papan kekunci, tetikus, dan skrin telah berakhir, digantikan oleh agen AI yang mendengar, memahami, dan bertindak atas nama anda.
Pusat perhatian pengumuman tersebut ialah superchip RTX Spark, yang dibangunkan bekerjasama dengan Microsoft, yang dianggap oleh Huang sebagai tulang belakang peranti untuk mengubah PC Windows daripada alat pasif menjadi rakan kerja proaktif seperti yang digambarkannya. Alih-alih membuka aplikasi dan meneroka menu, pengguna hanya perlu menyatakan objektif mereka dalam bahasa biasa dan membiarkan agen AI menangani selebihnya.
Dari klik ke perbualan
Cip RTX Spark direka untuk menjalankan agen AI secara tempatan pada PC, bermakna antaramuka perbualan tidak bergantung sepenuhnya kepada pemprosesan awan. Anggap ia bukan seperti meminta Siri untuk menetapkan penghitung masa, tetapi lebih seperti memberi arahan kepada seorang asisten yang cekap untuk menyelidik topik, menyusun laporan, memformatnya, dan menghantar e-mel kepada pasukan anda, semua daripada satu arahan lisan atau taip sahaja.
Nvidia juga memperkenalkan runtime OpenShell dan stack NemoClaw, dua komponen infrastruktur yang direka khas untuk melaksanakan sistem AI agen ini dengan selamat, terutamanya dalam persekitaran perniagaan di mana kepekaan data adalah penting.
Runtime OpenShell menyediakan lapisan eksekusi untuk agen AI, manakala NemoClaw mengendalikan pengurusan dan palang keselamatan yang diperlukan oleh syarikat sebelum membenarkan perisian autonomi dijalankan pada sistem dalaman mereka.
Vera Rubin dan ekonomi inferens
Huang juga mengesahkan bahawa sistem rak Nvidia Vera Rubin NVL72 akan memasuki penghasilan penuh pada musim gugur 2026. Nombor utama di sini: penurunan kos 10 kali ganda dalam inferens berbanding generasi sebelumnya. Inferens ialah proses menjalankan model AI yang telah dilatih untuk menghasilkan output. Mengurangkan kos itu sebanyak satu peringkat sangat penting kerana inferens merupakan tempat sebahagian besar perbelanjaan pengiraan berlaku apabila AI berkembang dari makmal penyelidikan ke dalam produk harian.
Kerjasama Microsoft dan apa yang ia isyaratkan
Cip RTX Spark dibangunkan bersama-sama dengan Microsoft. Kuliah utama Huang memperluas tema yang telah dipromosikan Nvidia di pelbagai acara GTC sepanjang 2026, masing-masing memperkuat narasi bahawa AI bukan sekadar ciri yang dipasang pada komputasi sedia ada.
Apa yang bermaksud ini kepada pelabur
Pengurangan kos inferens 10x daripada sistem Vera Rubin adalah nombor yang lebih berkesan bagi pasaran. Inferens yang lebih murah memperluaskan pasaran yang boleh dituju untuk aplikasi AI di semua industri, bermakna lebih banyak syarikat mampu melaksanakan AI dalam skala besar, yang bermakna lebih banyak permintaan untuk peranti Nvidia.
Setiap reka bentuk cip utama dan penyedia awan sedang berlumba untuk mengurangkan kos inferens. AMD, Intel, Google, dan Amazon semuanya mempunyai program silikon yang bersaing. Jika klaim 10x Nvidia berterusan dalam ujian dunia nyata, ia memperluaskan kepimpinan syarikat tersebut.
