NVIDIA RTX Spark ay bumabagong muli ang AI PC na may 1 Petaflop na AI performance

Sa nakalipas na dalawang taon, ang mga manufacturer ng PC ay paulit-ulit na binanggit ang isang parameter habang pinapakilala ang “AI PC”: ang NPU processing power. Ngunit, anuman ang 45 TOPS ng Intel Lunar Lake o ang 50 TOPS ng AMD Strix Point, ang mga numerong ito ay nananatili sa isang relatibong mababang antas. Kaya lang nila gawin ang background blur, voice noise reduction, at pagsasagawa ng ilang maliit na lokal na modelo, at wala nang higit pa.

Noong Mayo 31, ipinakita ng NVIDIA ang RTX Spark superchip sa GTC 2026, na nagdala sa bilang na 1 petaflop, o 1,000 TOPS. Hindi ito pagtaas ng 30% o 50%, kundi direkta na paglilipas ng isang antas.

Kasabay ng pagpapalabas ay may iba pang mga balita: sinuportahan ng Microsoft ang pag-update ng mga lokal na mekanismo ng seguridad sa Windows at isinama ang open-source sandbox runtime ng NVIDIA, ang OpenShell, sa platform ng Windows; inihayag ng Adobe ang pag-reconstruct sa panganib ng Photoshop at Premiere para sa espesyal na pagkakatugma sa unified memory architecture ng RTX Spark; at sinumpaan ng unang anim na OEM ang paglalabas ng mga light laptop at compact desktop na may chip na ito sa tag-araw na ito.

Hindi naglunsad ng bagong chip ang NVIDIA sa GTC na ito. Tinutukoy nito ang isang bagong hardware standard para sa kategorya ng "personal AI computer".

larawan

Kapag ang GPU ang pangunahing bida ng PC

Una, tingnan ang chip mismo. Ayon sa datos na ipinahayag ng NVIDIA sa GTC, ang RTX Spark ay may nakapagsasama na GPU na Blackwell arkitektura, 6,144 CUDA cores, kasama ang 20-core Arm arkitekturang Grace CPU na disenyo ng MediaTek, na gumagamit ng 3nm process ng TSMC. Ang pangunahing pagbabago ay nasa memorya arkitektura: hanggang 128GB na unified memory, kung saan ang CPU at GPU ay nagbabahagi ng iisang memory pool, kaya hindi na kailangang i-move ang data sa pagitan ng dalawa.

Bumabalik ito sa lohika ng nakaraang PC architecture.

Ang pangunahang istruktura ng tradisyonal na PC ay “x86 CPU bilang pangunahing processor, at hiwalay na GPU bilang opsyonal na aksesorio.” Kahit ang bagong konsepto ng AI PC na lumitaw sa nakaraang mga taon, ang paraan ng Intel at AMD ay ang pagtatanim ng isang NPU sa loob ng CPU bilang karagdagang module para sa AI acceleration, na karaniwang may kapasidad na apatnapu't limang TOPS. Ang GPU ay patuloy na “external.”

Ang RTX Spark ay nagbalik-balik sa kapangyarihan. Ang SoC na ito ay ginawa ang GPU bilang pangunahing tauhan, habang ang CPU ay naging suporta. Ang ibinigay ng NVIDIA na AI computing power ay 1 petaflop FP4, katumbas ng 1,000 TOPS, na higit sa 20 beses ang kalakasan ng NPU sa nakaraang AI PC. Hindi ito pagpapabilis sa parehong track—ito ay ang pagmimisit sa isang iba’t ibang track.

Ang bilis ng pagtugon ng OEM manufacturers ay nagpapatotoo sa pagtataya na ito. Ayon sa pormal na pahayag ng NVIDIA at sa mga sumunod na ulat mula sa DIGITIMES, ang ASUS, Dell, HP, Lenovo, Microsoft Surface, at MSI ay maglalabas ng mga light laptop at compact desktop computer na may RTX Spark sa kasalukuyang tag-araw, habang susundan ng Acer at Gigabyte ang kanilang mga modelo. Halos lahat ng pangunahing brand ng Windows PC ay nagsali na.

larawan

Hindi ang RTX Spark isang produkto na ipinanganak mula sa wala. Noong unang bahagi ng 2025, ang parehong chip na may Blackwell at Grace core ay ipinakita bilang Project DIGITS at DGX Spark, ngunit noong panahong iyon, ito ay inilalarawan bilang isang Linux desktop supercomputer para sa mga developer, na may sukat na katumbas ng isang maliit na desktop. Isang taon pagkatapos, ang arkitekturang ito ay na-press sa espasyo ng pagpapalamig ng isang thin-and-light laptop, ang operating system ay binago mula sa Linux patungo sa Windows, at ang target na user ay na-extend mula sa mga developer ng AI patungo sa karaniwang consumer at enterprise users. Ito ang pinakamahalagang pagbabago sa consumer-level launch sa GTC 2026: hindi naglalabas ang NVIDIA ng isang toy para sa mga developer, kundi hinahawakan ang pinto patungo sa consumer market.

Sapat ba ang 120B model na nakapagpapatakbo sa lokal?

Ang mga numero para sa hashing power at memory ay dapat sagutin ang tanong: Ano ang maaaring gawin?

Ang sagot ng NVIDIA sa kanilang pagpapakita ay ang RTX Spark ay sumusuporta sa lokal na pagpapatakbo ng malalaking modelo na may 120B na parameter, na may window ng konteksto na maaabot ang milyon na token. Ano ang ibig sabihin ng 120B? Bilang pagsasalungat, ang karaniwang praktika sa lokal na pagpapatakbo ng modelo sa consumer-grade hardware ay ang pagpapatakbo ng modelo na may 30B hanggang 40B na parameter gamit ang RTX 4090 na may 24GB VRAM sa pamamagitan ng quantization. Ang ilang maliit na modelo ay maaaring mabilis na ipatakbo sa consumer-grade GPU, tulad ng 9B model. Mula sa 9B papunta sa 120B, ang paglakas na ito ay bumabagabag muli ang “sapat” na pamantayan ng AI sa endpoint.

Ang 128GB na uniporme memory ay ang batayan ng lahat ng ito. Sa tradisyonal na arkitektura ng PC, may sariling sistemang memory ang CPU, at may sariling video memory ang GPU, na may pisikal na hangganan sa pagitan nila. Ang isang malaking modelo na hihigit sa kapasidad ng video memory ay o hindi kayang tumakbo, o kailangan ng komplikadong paghahati ng modelo at pagpalit ng memorya, na nagdudulot ng malaking pagbaba sa bilis. Ang arkitekturang uniporme memory ay nag-alis sa bottleneck na ito, kung saan direkta ang data ng modelo sa 128GB na shared pool, na ma-access ng CPU at GPU. Una ang Apple na ipinakita ang kakayahang konsumidor ng teknolohiyang ito sa Apple Silicon, at ngayon ay dinala nina NVIDIA ito sa Windows camp.

Bukod sa pag-iisip ng malalaking modelo, kasama sa mga kaso na listahan ng NVIDIA ang pag-edit ng 12K video, rendering ng 3D scene na higit sa 90GB, at光线追踪 game na higit sa 100fps sa 1440p resolution. Ang karaniwang katangian ng mga skenaryong ito ay ang napakalaking dami ng data na prosesuhin sa isang pagkakataon, kaya ang tradisyonal na PC ay kailangang maghintay ng ilang beses na mas mahaba kaysa sa oras ng pagproseso, o kaya ay hindi kayang i-run nang husto.

May malaking pagkakaiba sa pagitan ng “suportado” at “mabuting paggamit.” Hindi inilabas ng NVIDIA ang tunay na bilis ng inference para sa 120B model sa RTX Spark, o ang first-token latency sa mga skenaryo ng million-token context. Ang pangunahing marka na nagpapasya sa bilis ng long-context inference ay ang memory bandwidth. Bilang pagsasalungat, ang DGX Spark na gumagamit din ng GB10 core ay may nasukat na memory bandwidth na humigit-kumulang 301 GB/s. Ang antas na ito ng bandwidth ay sapat para sa 120B model, ngunit sa pagtratap ng context window na million-token level, maaaring kailanganin ng mga user na maghintay ng ilang segundo bago makita ang unang output token. Ang notebook version ng RTX Spark ay maaaring magkaroon ng dagdag na pagbabago sa actual bandwidth dahil sa mga limitasyon sa power consumption.

Magdagdag ng isang kagamitan para sa kaligtasan sa AI agent

Ang isa pang pangunahing paglabas, maliban sa computing power, ay ang pakikipagtulungan ng NVIDIA at Microsoft sa sistema level. Ang bahaging ito ay maaaring ang pinakamadaling makalimutan sa mga paglabas para sa consumer sa GTC 2026, ngunit ito ang may pinakamalalim na epekto sa industriya.

Isang computer na kayang patakbuhin ang isang 120B model, kung ibibigay sa isang AI agent na kayang mag-operate nang sarili sa desktop, i-click ang mga button, at basahin at isulat ang mga file, ang panganib sa kaligtasan ay hindi na sa antas ng “bibigyan ba nito ang data,” kundi “babaguhin ba ng agent ang mga bagay na hindi mo gustong gawin.” Hindi ito lutasin, imposible para sa mga negosyo na i-deploy ang ganitong kagamitan sa mga empleyado.

Ang mga solusyon na ibinigay ng Microsoft at NVIDIA ay dalawang hanay ng pagprotekta. Una, nilagyan ng pagpapabuti ng Microsoft ang native security mechanism ng Windows, upang suriin at limitahan ang pag-uugali ng AI agents sa antas ng operating system. Pangalawa, ipinakilala nang opisyal ng NVIDIA ang OpenShell runtime sa platform ng Windows. Ayon sa opisyal na dokumentasyon ng NVIDIA, ang OpenShell ay isang open-source sandbox runtime na nagtataguyod ng kernel-level isolation. Ito ay nagtatagpo ng isang kontroladong saklaw para sa mga AI agent, kung saan maaari silang mag-autonomous na magpapatupad ng mga gawain, ngunit ang kanilang mga pahintulot ay mahigpit na limitado at hindi sila makakapag-access sa mga core system files, network connections, o sensitibong data ng user.

Ang kahulugan ng kombinasyong ito sa pagbili ng mga kumpanya ay malinaw. Bago ito, ang konsepto ng “local AI agent” ay naiiwan sa antas ng teknikal na demo. Ang hardware ay gumagana, ngunit ang security framework ay walang laman. Walang corporate IT department ang magiging pahintulot na isama ang mga aparato na ganitong kalagayan sa kanilang listahan ng pagbili. Ang NVIDIA at Microsoft ay nagdagdag ng isang standardisadong isolation layer sa pagitan ng hardware at application, at nagbago ang “makagamit” sa “maaaring pamahalaan”.

Ang performance overhead ng OpenShell ay isang variable na kailangang obserbahan. Ang sandbox isolation ay karaniwang nagdudulot ng ilang pagbaba sa performance; kung gaano karami ang epekto nito sa inference speed o system response, wala pa ring pampublikong data mula sa NVIDIA. Ang complexity ng deployment sa enterprise IT management, at ang compatibility nito sa umiiral na security policies, ay mga praktikal na isyu na kailangang masuri pagkatapos ma-launch ang mga OEM device.

Bakit handa ang Adobe na “muling ibuksan mula sa paa”?

Ang antas ng pakikipag-ugnayan ng developer ng software ay karaniwang tanda kung makakapagtatag ng sariling lugar ang isang bagong hardware platform.

Ang mga aksyon na inanunsyo ni Adobe sa panahon ng GTC ay ang pinakamalaking signal sa software sa pagpapalabas na ito. Ayon sa opisyal na blog ng NVIDIA at sa pagpapatotoo ng mga eksperto ng Adobe, sinimulan ng Adobe ang pagsasaulo ng Photoshop at Premiere, na espesyal na disenyo para sa unipormeng memorya arkitektura ng RTX Spark, at ipinahayag na tumaas ang performance ng AI at graphics ng hanggang 2 beses.

Ang “pagsasabay ng pahinga” ay hindi lamang pagdaragdag ng isang plugin o paggawa ng isang layer ng pagkakatugma. Sa tradisyonal na PC, may sariling espasyo ng memorya ang CPU at GPU, at kapag pinapagana ang isang napakalaking PSD file o 8K video timeline, ang data ay paulit-ulit na iniiwan at iniiwan sa dalawang set ng memorya—ito ang pangunahing lugar ng pagkalansay ng performance. Ang nag-uunang memorya ng RTX Spark ay nagpapahintulot sa CPU at GPU na magbahagi ng iisang 128GB na espasyo, at ang pagbabagong ito ay may praktikal na halaga sa workflow ng mga propesyonal na tagagawa. Ang pagkilos ng Adobe sa ilalim na code ay nagpapatotoo na tinatanggap nila ang direksyong ito ng arkitektura bilang higit pa sa isang pansamantalang marketing gimmick.

Gayunpaman, ang batayan para sa “2x acceleration” ay hindi pa ipinahayag ng NVIDIA at Adobe. Ito ba ay ihahambing sa parehong henerasyon ng x86 processor kasama ang discrete GPU, o sa nakaraang solusyon ng NPU sa AI PC? Magkakaiba ang resulta. Bago maipahayag ang mga kondisyon ng benchmark, ang halaga ng numero na ito ay nagtataglay ng isang tanong.

Kasabay din ng pagpapahayag ay suportado ng Blackmagic Design, ComfyUI, llama.cpp, OTOY, at maraming kompanya sa larong video. Mahalaga ang pagkakaroon ng suporta mula sa ComfyUI at llama.cpp dahil sila ang pinakamalikhaing open-source na mga kasangkapan sa kasalukuyang lokal na AI workflow. Ang maagang suporta mula sa komunidad ng mga developer ay madalas na mas totoo kaysa sa mga pangako ng malalaking kumpanya sa pagpapakita ng potensyal ng isang platform.

Ang NVIDIA ay gumagamit ng CUDA ecosystem at unified memory architecture upang bumuo ng karanasan na katulad ng integrated hardware-software ni Apple sa loob ng Windows ecosystem. Ang pagkakaiba ay, ang pader ni Apple ay itinayo ng sarili niya, habang kailangan ng NVIDIA na paniwalaan ang Microsoft at ang mga ISV na magtulungan sa pagtatayo nito. Ang pagkakaroon ng Adobe na handang magsimula mula sa ilalim ay nagpapakita na ang unang bato ng pader ay nakaayos na.

Labis sa mga teknikal na spesipikasyon

Balik sa isang pinakapraktikal na tanong: Maaari ba talagang bilhin ang mga aparato na ito, at ano ang pakiramdam kapag nakuha mo na?

Batay sa impormasyon na inilabas ni NVIDIA, ang mga unang RTX Spark device ay magiging available sa autumn ng taong ito, kasama ang mga thin-and-light laptop at compact desktop mula sa ASUS, Dell, HP, Lenovo, Microsoft Surface, at MSI. Susundan ng mga modelo ng Acer at Gigabyte. Walang ipinahayag ang mga partikular na presyo at eksaktong petsa ng paglabas para sa bawat OEM.

Mas mahalaga kaysa sa presyo ang ilang hindi kilalang factor sa pisikal na lebel. Paano balansahin ang pagkakasunog at pagpapalamig kapag isinaksak ang chip na may 1 petaflop ng computing power sa isang makitid at magaan na laptop? Paano ang pang-araw-araw na performance at battery life ng RTX Spark sa mga non-AI na scenario? Bababa ba nang malaki ang actual bandwidth ng 128GB na unified memory sa laptop form factor dahil sa mga limitasyon sa pagkakasunog?

Ang mga tanong na ito ay tunay na pagsubok sa pagpapatupad sa industriya. Ang peak computing power ng isang chip sa isang engineering prototype ay kadalasang iba sa kanyang actual na performance sa kamay ng konsyumer nang 8 oras araw-araw. Pinahalagahan ng NVIDIA ang energy efficiency ng RTX Spark sa kanilang pagpapahayag, ngunit hindi ibinigay ang mga partikular na TDP o battery life data.

Mula sa pananaw ng estruktura ng industriya ng PC, ang pagkakaroon ng RTX Spark ay nagtuturo ng isang bagong modelo ng paghahati ng trabaho. Sa nakaraang tatlong dekada, ang kontrol sa pangunahing chip ng PC ay nasa kamay ng mga tagagawa ng x86 processor, habang ang mga tagagawa ng GPU ay kahit na lalong mahalaga, ay patuloy na itinuturing na “mga aksesorio na isasaksak sa motherboard.” Ang ipinakita ng NVIDIA ay isang buong SoC, kung saan ang CPU, GPU, at controller ng memorya ay lahat ay ikinabukod, at ang CPU na batay sa Arm architecture ay disenyo ng MediaTek. Ang istruktura ng kapangyarihan sa产业链 ng PC ay nagpapalit mula sa “x86 CPU kasama ang opsyonal na GPU” patungo sa “SoC platform na nakatuon sa GPU.”

Hindi ito magiging ganap sa loob ng isang araw. Ang pricing strategy ng OEM, ang tunay na epekto sa enerhiya ng produkto, ang pag-adapt ng software ng ISV, at ang cycle ng pag-verify ng pagbili ng mga korporatibong kliyente—bawat hakbang ay nagdedesisyon kung ang RTX Spark ay magiging bagong coordinate sa industriya ng PC, o isa pang teknikal na demo na mataas ang simula ngunit mababa ang tapos. Ang sagot ay hindi mababago hanggang sa tag-lamig ng taong ito.