NVIDIA RTX Spark กำหนดนิยามใหม่ของ AI PC ด้วยประสิทธิภาพ AI 1 Petaflop

ในสองปีที่ผ่านมา ผู้ผลิตพีซีมักอ้างถึงพารามิเตอร์หนึ่งเมื่อโปรโมต “AI PC” นั่นคือ กำลังการประมวลผล NPU แต่ไม่ว่าจะเป็น 45 TOPS ของ Intel Lunar Lake หรือ 50 TOPS ของ AMD Strix Point ตัวเลขเหล่านี้ยังคงอยู่ในระดับที่ค่อนข้างอ่อนแอเท่านั้น สามารถใช้ทำพื้นหลังเบลอ ลดเสียงรบกวนจากเสียงพูด และรันโมเดลขนาดเล็กบนอุปกรณ์ปลายทางได้ แต่ก็แค่นั้นเท่านั้น

วันที่ 31 พฤษภาคม NVIDIA ได้เปิดตัว RTX Spark ซูเปอร์ชิปในการประชุม GTC 2026 ซึ่งเพิ่มค่าดังกล่าวขึ้นเป็น 1 petaflop หรือ 1,000 TOPS ไม่ใช่การเพิ่มขึ้นเพียง 30% หรือ 50% แต่ก้าวข้ามระดับจำนวนไปหนึ่งลำดับ

ในเวลาเดียวกันยังมีข่าวอื่นๆ อีกหลายฉบับ: Microsoft ได้ปรับปรุงกลไกความปลอดภัยแบบเนทีฟของ Windows ร่วมกับ RTX Spark และนำ OpenShell ซึ่งเป็น runtime แบบโอเพนซอร์สของ NVIDIA มาใช้บนแพลตฟอร์ม Windows; Adobe ประกาศรีวิศวกรรม Photoshop และ Premiere ใหม่ทั้งหมดเพื่อรองรับสถาปัตยกรรมหน่วยความจำร่วมของ RTX Spark; ผู้ผลิตอุปกรณ์ต้นทางหกรายแรกได้ยืนยันว่าจะเปิดตัวแล็ปท็อปแบบบางเบาและเดสก์ท็อปขนาดกะทัดรัดที่ติดตั้งชิปนี้ในฤดูใบไม้ร่วงปีนี้

สิ่งที่ NVIDIA ทำในงาน GTC ครั้งนี้ ไม่ใช่การเปิดตัวชิปใหม่ แต่กำลังพยายามกำหนดมาตรฐานฮาร์ดแวร์ใหม่สำหรับหมวดหมู่ “คอมพิวเตอร์ AI ส่วนบุคคล”

รูปภาพ

เมื่อ GPU กลายเป็นดาวเด่นของ PC

ก่อนอื่นมาดูชิปนี้เอง ตามข้อมูลที่ NVIDIA เปิดเผยในงาน GTC RTX Spark รวมชิป GPU แบบ Blackwell พร้อม CUDA Core 6,144 แกน ร่วมกับ CPU Arm Grace 20 แกน ที่ออกแบบร่วมกับ MediaTek และผลิตด้วยกระบวนการ 3nm ของ TSMC การเปลี่ยนแปลงที่สำคัญอยู่ที่สถาปัตยกรรมหน่วยความจำ: หน่วยความจำแบบรวมสูงสุด 128GB โดย CPU และ GPU ใช้หน่วยความจำร่วมกัน ข้อมูลจึงไม่จำเป็นต้องถ่ายโอนไปมาระหว่างสองหน่วย

ขัดแย้งกับตรรกะของสถาปัตยกรรมพีซีในอดีต

โครงสร้างพื้นฐานของ PC แบบดั้งเดิมคือ “CPU x86 เป็นโปรเซสเซอร์หลัก และ GPU แบบแยกเป็นอุปกรณ์เสริม” แม้แต่แนวคิด AI PC ที่เพิ่งเกิดขึ้นในช่วงไม่กี่ปีที่ผ่านมา ทั้ง Intel และ AMD ก็ยังคงใช้วิธีการฝัง NPU ไว้ภายใน CPU เพื่อทำหน้าที่เป็นโมดูลเสริมสำหรับการเร่งความเร็ว AI โดยมีพลังการประมวลผลโดยทั่วไปอยู่ที่ประมาณสี่สิบถึงห้าสิบ TOPS ในขณะที่ GPU ยังคงเป็น “อุปกรณ์ต่อพ่วง”

RTX Spark ได้เปลี่ยนการจัดสรรอำนาจใหม่ ชิป SoC นี้ทำให้ GPU เป็นตัวหลัก ขณะที่ CPU ถอยไปเป็นตัวรอง นิวเทอดาให้พลังการประมวลผล AI ที่ 1 petaflop FP4 ซึ่งเทียบเท่ากับ 1000 TOPS หรือมากกว่า 20 เท่าของ NPU รุ่นก่อนหน้าที่ติดตั้งใน AI PC นี่ไม่ใช่แค่การเร่งความเร็วบนเส้นทางเดิม แต่เป็นการเริ่มต้นบนเส้นทางใหม่

ความเร็วในการติดตามของผู้ผลิต OEM ยืนยันการวิเคราะห์นี้ ตามประกาศอย่างเป็นทางการของ NVIDIA และรายงานเพิ่มเติมจาก DIGITIMES บริษัท ASUS, Dell, HP, Lenovo, Microsoft Surface และ MSI จะเปิดตัวโน้ตบุ๊กแบบบางเบาและเดสก์ท็อปขนาดกะทัดรัดที่มาพร้อม RTX Spark ในฤดูใบไม้ร่วงปีนี้ ส่วน Acer และ Gigabyte จะตามมาภายหลัง แบรนด์ Windows PC รายใหญ่เกือบทั้งหมดได้เข้าร่วมแล้ว

รูปภาพ

RTX Spark ไม่ใช่ผลิตภัณฑ์ที่เกิดขึ้นจากศูนย์ ในต้นปี 2025 ชิป Blackwell ร่วมกับ Grace Core เดียวกันเคยเปิดตัวในรูปแบบ Project DIGITS และ DGX Spark แต่ในเวลานั้นถูกกำหนดให้เป็นซูเปอร์คอมพิวเตอร์สำหรับเดสก์ท็อปบน Linux โดยมีขนาดใกล้เคียงกับคอมพิวเตอร์ตั้งโต๊ะขนาดเล็ก หนึ่งปีต่อมา สถาปัตยกรรมนี้ถูกบีบอัดให้อยู่ในพื้นที่ระบายความร้อนของแล็ปท็อปแบบบางเบา ระบบปฏิบัติการเปลี่ยนจาก Linux เป็น Windows และกลุ่มเป้าหมายขยายจากนักพัฒนา AI ไปสู่ผู้บริโภคทั่วไปและผู้ใช้งานองค์กร นี่คือการเปลี่ยนแปลงที่น่าสังเกตที่สุดในการเปิดตัวระดับผู้บริโภคที่ GTC 2026: NVIDIA ไม่ได้กำลังเปิดตัวของเล่นสำหรับนักพัฒนา แต่กำลังผลักประตูเข้าสู่ตลาดผู้บริโภค

การรันโมเดล 120B บนอุปกรณ์ส่วนตัวเพียงพอหรือไม่

ตัวเลขของพลังการคำนวณและหน่วยความจำสุดท้ายต้องตอบคำถามนี้: ทำอะไรได้บ้าง?

ในงานเปิดตัว NVIDIA ได้ตอบว่า RTX Spark รองรับการรันโมเดลขนาดใหญ่ 120B พารามิเตอร์แบบออฟไลน์ โดยหน้าต่างบริบทสามารถถึงล้านโทเค็น 120B หมายถึงอะไร? เพื่อเป็นการเปรียบเทียบ ปัจจุบันการปฏิบัติที่แพร่หลายในการรันโมเดลแบบออฟไลน์บนฮาร์ดแวร์ระดับผู้บริโภคคือการใช้ GPU RTX 4090 ที่มีหน่วยความจำ 24GB โดยผ่านการบีบอัดแบบควอนไทซ์เพื่อรันโมเดลขนาด 30B ถึง 40B พารามิเตอร์ โมเดลขนาดเล็กบางตัวสามารถรันได้อย่างรวดเร็วบนการ์ดจอระดับผู้บริโภคคือโมเดลขนาด 9B จาก 9B ไปสู่ 120B การกระโดดครั้งนี้ได้กำหนดมาตรฐานใหม่สำหรับความ “เพียงพอ” ของ AI บนอุปกรณ์ปลายทาง

หน่วยความจำร่วม 128GB เป็นเงื่อนไขพื้นฐานสำหรับทุกสิ่งนี้ ในสถาปัตยกรรม PC แบบดั้งเดิม CPU มีหน่วยความจำระบบของตัวเอง และ GPU มีหน่วยความจำกราฟิกของตัวเอง ซึ่งมีขอบเขตทางกายภาพระหว่างกัน โมเดลขนาดใหญ่ที่เกินขีดจำกัดหน่วยความจำกราฟิกจะไม่สามารถทำงานได้เลย หรือต้องใช้การแบ่งโมเดลและสลับหน่วยความจำที่ซับซ้อน ทำให้ความเร็วลดลงอย่างมาก สถาปัตยกรรมหน่วยความจำร่วมได้กำจัดข้อจำกัดนี้ โดยข้อมูลโมเดลจะถูกเก็บไว้ในบ่อแชร์ขนาด 128GB ซึ่ง CPU และ GPU สามารถเข้าถึงได้ทั้งคู่ Apple ได้พิสูจน์ความเป็นไปได้ของเส้นทางเทคโนโลยีนี้สำหรับผู้ใช้ทั่วไปครั้งแรกบน Apple Silicon และตอนนี้ NVIDIA ได้นำมันมาสู่โลกของ Windows

นอกจากการให้เหตุผลกับโมเดลขนาดใหญ่ ตัวอย่างการใช้งานอื่นๆ ที่ NVIDIA ระบุยังรวมถึงการแก้ไขวิดีโอ 12K การเรนเดอร์ฉาก 3D ที่มีขนาดเกิน 90GB และเกมเรย์เทรซซิงที่มีความละเอียด 1440p และความเร็วเกิน 100 fps การใช้งานเหล่านี้มีจุดร่วมคือปริมาณข้อมูลที่ต้องประมวลผลในแต่ละครั้งมีขนาดใหญ่มาก คอมพิวเตอร์ทั่วไปจะต้องรอเวลาเป็นหลายเท่าของเวลาการประมวลผล หรือไม่สามารถรันได้เลย

ยังมีช่องว่างระหว่าง “รองรับการใช้งาน” กับ “ใช้งานได้อย่างลื่นไหล” NVIDIA ยังไม่ได้เปิดเผยความเร็วการให้บริการจริงของโมเดล 120B บน RTX Spark หรือข้อมูลความล่าช้าของโทเค็นแรกในสถานการณ์บริบทหลายล้านโทเค็น ตัวชี้วัดหลักที่กำหนดความเร็วในการให้บริการบริบทยาวคือแบนด์วิดธ์หน่วยความจำ โดยอ้างอิงจาก DGX Spark ที่ใช้แกน GB10 เดียวกัน แบนด์วิดธ์หน่วยความจำในการทดสอบจริงอยู่ที่ประมาณ 301 GB/s ระดับแบนด์วิดธ์นี้สามารถรันโมเดล 120B ได้ แต่เมื่อจัดการกับหน้าต่างบริบทระดับล้านโทเค็น ผู้ใช้อาจต้องรอเป็นเวลาหลายวินาทีก่อนจะเห็นโทเค็นแรกที่แสดงผล รุ่นแล็ปท็อปของ RTX Spark อาจมีการปรับเปลี่ยนแบนด์วิดธ์จริงเนื่องจากข้อจำกัดด้านการใช้พลังงาน

เพิ่มกรงความปลอดภัยให้กับตัวแทน AI

อีกหนึ่งการเปิดตัวหลักที่สำคัญนอกเหนือจากพลังการคำนวณ คือความร่วมมือระดับระบบระหว่าง NVIDIA และ Microsoft ส่วนนี้อาจเป็นเนื้อหาที่ถูกมองข้ามมากที่สุดในการเปิดตัวระดับผู้บริโภคของ GTC 2026 แต่กลับมีผลกระทบลึกซึ้งที่สุดต่ออุตสาหกรรม

คอมพิวเตอร์ที่สามารถรันโมเดลขนาด 120B หากมอบให้ตัวแทน AI ที่สามารถควบคุมเดสก์ท็อป คลิกปุ่ม และอ่านเขียนไฟล์ได้ด้วยตนเอง ความเสี่ยงด้านความปลอดภัยจะไม่เหลือแค่ระดับ “จะสูญเสียข้อมูลหรือไม่” อีกต่อไป แต่จะกลายเป็น “ตัวแทนจะทำสิ่งที่คุณไม่ต้องการให้ทำหรือไม่” หากไม่แก้ไขปัญหานี้ บริษัทไม่สามารถติดตั้งอุปกรณ์ดังกล่าวให้พนักงานได้

แนวทางของไมโครซอฟต์และนิวเดียเป็นการป้องกันสองชั้น ชั้นแรก ไมโครซอฟต์ได้อัปเกรดกลไกความปลอดภัยแบบดั้งเดิมของ Windows เพื่อให้สามารถติดตามและจำกัดพฤติกรรมของตัวแทน AI ในระดับระบบปฏิบัติการ ชั้นที่สอง นิวเดียได้เปิดตัว OpenShell Runtime อย่างเป็นทางการบนแพลตฟอร์ม Windows ตามเอกสารอย่างเป็นทางการของนิวเดีย OpenShell เป็น runtime แบบโอเพ่นซอร์สที่ให้การแยกส่วนระดับเคอร์เนล มันกำหนดขอบเขตการดำเนินการที่ควบคุมได้สำหรับตัวแทน AI ซึ่งตัวแทนสามารถดำเนินงานได้อย่างอิสระภายในขอบเขตนี้ แต่สิทธิ์จะถูกจำกัดอย่างเข้มงวด ไม่สามารถเข้าถึงไฟล์หลักของระบบ การเชื่อมต่อเครือข่าย หรือข้อมูลที่เป็นความลับของผู้ใช้ได้

ความหมายของคอมโบนี้ต่อการจัดซื้อขององค์กรนั้นชัดเจน ก่อนหน้านี้ แนวคิดเรื่อง “AI agent แบบท้องถิ่น” ยังคงอยู่ในขั้นตอนการสาธิตทางเทคนิค ฮาร์ดแวร์สามารถทำงานได้ แต่กรอบความปลอดภัยยังว่างเปล่า ไม่มีแผนกไอทีขององค์กรใดกล้ารวมอุปกรณ์ในสถานะเช่นนี้เข้าไปในรายการจัดซื้อ NVIDIA และ Microsoft ได้แทรกชั้นการแยกส่วนมาตรฐานระหว่างฮาร์ดแวร์และแอปพลิเคชัน ทำให้ “ใช้งานได้” เปลี่ยนเป็น “จัดการได้”

การใช้งาน OpenShell นั้นเป็นตัวแปรที่ยังต้องติดตามดูเรื่องภาระด้านประสิทธิภาพ การแยกสภาพแวดล้อมแบบ sandbox มักจะก่อให้เกิดการสูญเสียประสิทธิภาพในระดับหนึ่ง แต่ผลกระทบต่อความเร็วในการให้เหตุผลหรือการตอบสนองของระบบยังไม่มีข้อมูลที่ NVIDIA เปิดเผยอย่างเป็นทางการ ความซับซ้อนในการปรับใช้ในฝั่งการจัดการไอทีขององค์กร และความเข้ากันได้กับกลยุทธ์ด้านความปลอดภัยที่มีอยู่แล้ว เป็นปัญหาที่ต้องรอการยืนยันหลังจากอุปกรณ์ OEM วางจำหน่าย

ทำไม Adobe ถึงยินดี "รีโครงสร้างจากพื้นฐาน"

ระดับความร่วมมือจากผู้ผลิตซอฟต์แวร์มักเป็นเครื่องชี้วัดว่าแพลตฟอร์มฮาร์ดแวร์ใหม่จะสามารถยืนหยัดได้หรือไม่

การกระทำที่ Adobe ประกาศในช่วง GTC ถือเป็นสัญญาณที่ใหญ่ที่สุดในแง่ซอฟต์แวร์ของชุดการเปิดตัวนี้ ตามการยืนยันจากบล็อกอย่างเป็นทางการของ NVIDIA และผู้บริหารของ Adobe ได้เริ่มต้นการรีโครงสร้างพื้นฐานของ Photoshop และ Premiere เพื่อปรับให้เข้ากับสถาปัตยกรรมหน่วยความจำร่วมของ RTX Spark โดยอ้างว่าประสิทธิภาพของ AI และการประมวลผลกราฟิกสามารถเพิ่มขึ้นได้ถึง 2 เท่า

การรีโครงสร้างพื้นฐาน ไม่ใช่แค่การเพิ่มปลั๊กอินหรือสร้างชั้นการปรับให้เข้ากัน ในคอมพิวเตอร์แบบดั้งเดิม CPU และ GPU มีพื้นที่หน่วยความจำของตนเองแยกกัน เมื่อประมวลผลไฟล์ PSD ขนาดใหญ่มากหรือเส้นเวลาวิดีโอ 8K ข้อมูลต้องถูกถ่ายโอนซ้ำๆ ระหว่างหน่วยความจำสองชุด ซึ่งเป็นจุดที่สูญเสียประสิทธิภาพอย่างรุนแรง RTX Spark ด้วยหน่วยความจำร่วมเดียวกัน ทำให้ CPU และ GPU สามารถแชร์พื้นที่ 128GB เดียวกันได้โดยตรง การเปลี่ยนแปลงโครงสร้างนี้มีคุณค่าจริงต่อกระบวนการทำงานของผู้สร้างเนื้อหาระดับมืออาชีพ Adobe จึงปรับโค้ดพื้นฐานเพื่อรองรับสิ่งนี้ ซึ่งแสดงให้เห็นว่าพวกเขาเห็นว่าทิศทางสถาปัตยกรรมนี้ไม่ใช่แค่กลยุทธ์การตลาดชั่วคราว

อย่างไรก็ตาม ฐานการเปรียบเทียบสำหรับ “การเร่งความเร็ว 2 เท่า” นี้ยังไม่ได้เปิดเผยโดย NVIDIA และ Adobe ว่าเป็นการเปรียบเทียบกับโปรเซสเซอร์ x86 รุ่นเดียวกันพร้อมการ์ดจอแยก หรือกับโซลูชัน NPU ของ AI PC รุ่นก่อนหน้า? ผลลัพธ์จะแตกต่างกันอย่างมาก ก่อนที่เงื่อนไขการทดสอบจะถูกเปิดเผย ตัวเลขนี้ยังคงมีความน่าเชื่อถือเป็นคำถาม

นอกจากนี้ยังมีการประกาศการสนับสนุนจาก Blackmagic Design, ComfyUI, llama.cpp, OTOY และบริษัทเกมหลายแห่ง การที่ ComfyUI และ llama.cpp เข้าร่วมนั้นน่าสนใจ เนื่องจากเป็นเครื่องมือโอเพ่นซอร์สที่ใช้งานอย่างแพร่หลายที่สุดในงานไหลเวียน AI แบบท้องถิ่นในปัจจุบัน การสนับสนุนจากชุมชนนักพัฒนาในระยะเริ่มต้นมักสะท้อนศักยภาพของระบบนิเวศแพลตฟอร์มได้แท้จริงมากกว่าคำมั่นสัญญาจากบริษัทขนาดใหญ่

NVIDIA กำลังใช้ระบบนิเวศ CUDA และสถาปัตยกรรมหน่วยความจำแบบรวม เพื่อสร้างประสบการณ์ที่คล้ายกับ Apple ที่ผสานซอฟต์แวร์และฮาร์ดแวร์เข้าด้วยกันในระบบนิเวศ Windows ความแตกต่างคือ กำแพงของ Apple ถูกสร้างขึ้นโดยตัวเอง ในขณะที่ NVIDIA ต้องโน้มน้าวให้ Microsoft และ ISV ร่วมกันสร้างกำแพงนี้ การที่ Adobe ยินดีเริ่มต้นจากพื้นฐาน แสดงว่าก้อนอิฐก้อนแรกของกำแพงนี้ได้ถูกวางลงแล้ว

นอกเหนือจากพารามิเตอร์บนกระดาษ

กลับไปที่คำถามที่เป็นรูปธรรมที่สุด: อุปกรณ์เหล่านี้สามารถซื้อได้จริงหรือไม่ และเมื่อซื้อแล้วจะได้รับประสบการณ์อย่างไร?

ตามข้อมูลที่ NVIDIA เปิดเผย อุปกรณ์ RTX Spark รุ่นแรกจะวางขายในฤดูใบไม้ร่วงปีนี้ ครอบคลุมโน้ตบุ๊กแบบบางเบาและเดสก์ท็อปขนาดกะทัดรัดจาก ASUS, Dell, HP, Lenovo, Microsoft Surface และ MSI โดยรุ่นของ Acer และ Gigabyte จะตามมาภายหลัง ราคาอย่างเป็นทางการและวันวางขายที่แน่นอนของ OEM ทั้งหมดยังไม่ได้เปิดเผย

สิ่งที่สำคัญกว่าราคาคือปัจจัยที่ยังไม่ทราบในระดับกายภาพ การใส่ชิปที่มีพลังการประมวลผล 1 petaflop ลงในแล็ปท็อปที่บางและเบา จะสมดุลการใช้พลังงานและการระบายความร้อนอย่างไร? ประสิทธิภาพในการใช้งานทั่วไปและการใช้งานแบบพกพาของ RTX Spark ในสถานการณ์ที่ไม่ใช่ AI เป็นอย่างไร? แบนด์วิดธ์จริงของหน่วยความจำร่วม 128GB ในรูปแบบแล็ปท็อปจะลดลงอย่างชัดเจนเพราะข้อจำกัดด้านการใช้พลังงานหรือไม่?

这些问题是工业化落地的真正考验。一颗芯片在工程样机上的峰值算力和它在消费者手中每天8小时的实际表现，往往是两回事。英伟达在发布会上强调了RTX Spark的能效比，但没有给出具体的TDP数值或续航数据。

จากมุมมองของโครงสร้างอุตสาหกรรม PC การปรากฏตัวของ RTX Spark บ่งชี้ถึงรูปแบบการแบ่งงานใหม่ที่กำลังเกิดขึ้น ในสามทศวรรษที่ผ่านมา อำนาจในการตัดสินใจเกี่ยวกับชิปหลักของ PC อยู่ในมือของผู้ผลิตโปรเซสเซอร์ x86 แม้ว่าผู้ผลิต GPU จะมีความสำคัญเพิ่มขึ้นเรื่อยๆ แต่ก็ยังคงเป็นเพียง “อุปกรณ์เสริมที่เสียบบนเมนบอร์ด” ครั้งนี้ NVIDIA ได้นำเสนอ SoC แบบครบวงจร ซึ่งรวม CPU, GPU และตัวควบคุมหน่วยความจำไว้ด้วยกันทั้งหมด ส่วน CPU บนสถาปัตยกรรม Arm ได้รับการออกแบบโดย MediaTek โครงสร้างอำนาจในห่วงโซ่อุตสาหกรรม PC กำลังเปลี่ยนจาก “CPU x86 บวกกับ GPU ที่เลือกได้” เป็น “แพลตฟอร์ม SoC ที่เน้น GPU เป็นศูนย์กลาง”

การเปลี่ยนแปลงนี้จะไม่เกิดขึ้นภายในหนึ่งวัน กลยุทธ์การตั้งราคาของ OEM ประสิทธิภาพการใช้พลังงานของผลิตภัณฑ์จริง ความคืบหน้าในการปรับซอฟต์แวร์ของ ISV และวงจรการตรวจสอบการซื้อของลูกค้าองค์กร แต่ละขั้นตอนล้วนกำหนดว่า RTX Spark จะกลายเป็นจุดอ้างอิงใหม่ของอุตสาหกรรม PC หรือเป็นเพียงการสาธิตเทคโนโลยีที่เริ่มต้นสูงแต่จบลงต่ำ คำตอบจะต้องรอจนถึงฤดูใบไม้ร่วงปีนี้