AMD ส่งการ์ดเร่งความเร็ว AI ระดับสูงสุด MI300X ให้กับบริษัทสตาร์ทอัพ tiny corp ซึ่งผู้ก่อตั้งคือ George Hotz ที่เคยปลดล็อก iPhone ตอนอายุ 17 ปี Hotz เชื่อว่ากำแพง CUDA ของ NVIDIA ไม่ใช่สิ่งที่ข้ามไปไม่ได้ เขาพัฒนาสแต็กการเรียนรู้เชิงลึกแบบเปิดแหล่งรหัส tinygrad ด้วยโค้ดประมาณสองหมื่นบรรทัด เพื่อท้าทายระบบนิเวศ CUDA จากมุมมองซอฟต์แวร์ จนถึงเดือนพฤษภาคม 2026 มูลค่าตลาดของ NVIDIA อยู่ที่ประมาณเจ็ดเท่าของ AMD ซึ่งลดลงจากช่องว่างสิบหกเท่าเมื่อหนึ่งปีก่อน tiny corp ยังขายคอมพิวเตอร์ Tinybox ที่ใช้ฮาร์ดแวร์ของ AMD โดยมีเป้าหมายเพื่อทำให้พลังการประมวลผลกลายเป็นสินค้าโภคภัณฑ์ผู้เขียนบทความ แหล่งที่มา: 新智元
ในเดือนมีนาคม 2025 จอร์จ ฮอตซ์ ได้โพสต์บทความบนบล็อกส่วนตัว โดยมีหัวข้อเพียงสองคำว่า: AMD YOLO ซึ่งหมายถึง “ไม่มีทางถอยหลัง ทุกอย่างพนันบน AMD”
Hotz ระบุในบทความว่า: AMD กำลังจัดส่ง MI300X สองหน่วย (การ์ดเร่งความเร็ว AI ระดับสูงสุดของ AMD สำหรับศูนย์ข้อมูล) ที่เราต้องการ ซึ่งอยู่ในระหว่างการจัดส่ง
MI300X เป็นผลิตภัณฑ์旗舰ของ AMD ที่ลงทุนในพลังการประมวลผล AI โดยปกติแล้วจะถูกบริษัทคลาวด์และบริษัทโมเดลขนาดใหญ่รอคิวซื้อ แต่ตอนนี้กลับต้องถูกจัดส่งไปยัง tiny corp: บริษัทเล็กๆ ที่ยังไม่มีสำนักงานจริง และดำเนินงานผ่าน GitHub และ Discord
ผู้รับพัสดุนี้ รู้จักกันในชื่อเล่นว่า geohot — George Hotz
ชื่อ geohot ได้รับความรู้จักครั้งแรกจากวิดีโอหนึ่งในปี 2007 เมื่อเขาอายุ 17 ปี และสามารถปลดล็อก iPhone รุ่นแรกได้
ในปี 2007 จอร์จ ฮอตซ์ อายุ 17 ปี ได้แสดง iPhone รุ่นแรกของโลกที่ถูกปลดล็อกต่อหน้ากล้อง วิดีโอดังกล่าวมีผู้ดูมากกว่าสองล้านครั้ง ทำให้ชื่อ geohot แพร่กระจายไปทั่ววงการแฮกเกอร์
ต่อมาเขาถูกฟ้องร้องเพราะถอดรหัส Sony PS3 และครั้งนี้ เขาต้องการทำสิ่งที่ใหญ่กว่าเดิม: โจมตีกำแพงป้องกัน CUDA ของ NVIDIA จากด้านซอฟต์แวร์
"CUDA เป็นระบบนิเวศ ไม่ใช่กำแพงกัน"
"CUDA เป็นระบบนิเวศ ไม่ใช่แนวป้องกัน"
Hotz กล่าวในบล็อกว่า CUDA (แพลตฟอร์มการคำนวณ GPU ของ NVIDIA) ไม่ใช่กำแพงป้องกันอย่างที่ผู้คนคิด มันเป็นเพียงระบบนิเวศในระยะเริ่มต้น
เขาโพสต์ภาพหน้าจอทวิตเตอร์ไว้ในบล็อกของเขา ตั้งแต่เดือนมกราคม 2025 เขาได้เรียกการส่งชิป AMD ว่าเป็น “การทดสอบวัฒนธรรม”: เพื่อดูว่า AMD ยินดีที่จะลงทุนในซอฟต์แวร์หรือไม่
ในบล็อกโพสต์เดือนมีนาคม เขาสรุปว่า AMD ผ่านการทดสอบ เขาเชื่อว่า AMD จะไม่ละทิ้งซอฟต์แวร์ และหากเป็นเช่นนั้น NVIDIA ก็ไม่มีเหตุผลใดเลยที่จะมีมูลค่าสูงกว่า AMD ถึง 16 เท่า
หมายความว่า ณ ขณะนั้น มูลค่าตลาดของ NVIDIA อยู่ที่ประมาณ 16 เท่าของ AMD แต่ฮาร์ดแวร์ของทั้งสองบริษัทไม่ได้แตกต่างกันมากขนาดนั้น AMD ยังสามารถสร้าง Tensor Core ที่มีปริมาณการประมวลผลเป็นสองเท่าบนสถาปัตยกรรม RDNA4 ในขณะที่ NVIDIA กลับลดประสิทธิภาพลงครึ่งหนึ่งบนการ์ดของตนเอง
ความแตกต่าง 16 เท่านั้นมาจากไหน? คำตอบของฮอตซ์คือซอฟต์แวร์ แม่นยำยิ่งขึ้นคือความซับซ้อนของซอฟต์แวร์ และระบบนิเวศที่เกิดขึ้นจากความซับซ้อนนั้น
นักพัฒนาคุ้นเคยกับ CUDA และเครื่องมือต่างๆ ถูกออกแบบมาเพื่อรองรับ CUDA จึงไม่มีใครอยากใช้งานฮาร์ดแวร์ของ AMD แม้ว่าจะดีแค่ไหนก็ตาม สิ่งที่ขัดขวาง AMD ไม่ใช่ชิป แต่คือการขาดชุดซอฟต์แวร์ที่แข็งแกร่ง
นี่คือการตัดสินของ Hotz ไม่ใช่ข้อสรุปอย่างเป็นทางการของ AMD
เขาไม่ได้พูดแค่ปากเปล่า แต่ยังลงทุนเงินของตัวเอง 250,000 ดอลลาร์สหรัฐเพื่อซื้อ AMD แสดงความเห็นเชิงบวกอย่างเปิดเผย และเดิมพันเป็นเวลาห้าปี เขาเขียนไว้ในบล็อกว่า:
หรือ NVIDIA ถูกประเมินสูงเกินไปอย่างรุนแรง หรือ AMD ถูกประเมินต่ำเกินไปอย่างรุนแรงฮ็อตซ์เขียนข้อความนี้ในเดือนมีนาคม 2025 โดยมูลค่าตลาดของ NVIDIA อยู่ที่ประมาณ 16 เท่าของ AMD
จนถึงเดือนพฤษภาคม 2026 มูลค่าตลาดของ NVIDIA อยู่ที่ประมาณ 5.2 ล้านล้านดอลลาร์สหรัฐ ในขณะที่ AMD อยู่ที่ประมาณ 760,000 ล้านดอลลาร์สหรัฐ ช่องว่างลดลงเหลือประมาณ 7 เท่า ภายในปีนี้ ราคาหุ้นของ AMD พุ่งขึ้นอย่างมากจากความต้องการศูนย์ข้อมูล AI โดยเพิ่มขึ้นมากกว่า NVIDIA อย่างมีนัยสำคัญ
แน่นอนว่านี่ไม่ได้พิสูจน์ว่า Hotz ถูกต้อง การประเมินใหม่ของ AMD มาจากปริมาณการจัดส่ง GPU และรายงานผลการดำเนินงานของตัวเอง แต่ทิศทางของอารมณ์ตลาดก็ยืนยันการตัดสินใจของ Hotz: ช่องว่าง 16 เท่านั้น ไม่ได้มั่นคงอย่างที่คิด
จากปลดล็อก iPhone ถึงท้าทายอำนาจการคำนวณ
โปรแกรมเมอร์ที่ไม่เคยผลิตชิปมาก่อน จะกล้าท้าทาย NVIDIA ได้อย่างไร? เรื่องนี้เริ่มต้นเมื่อเขาอายุ 17 ปี
ในฤดูร้อนปี 2007 แอปเปิลเปิดตัว iPhone รุ่นแรกที่ผูกกับ AT&T เฉพาะทาง ฮอตซ์ อายุ 17 ปี ซึ่งเป็นผู้ใช้ T-Mobile ต้องการ iPhone แต่ไม่ต้องการเปลี่ยนผู้ให้บริการ จึงตัดสินใจถอดประกอบโทรศัพท์เครื่องนี้
ตามที่นิตยสาร The New Yorker รายงาน เขาใช้ไขควงเปิดฝาหลัง ค้นหาชิปเบสแบนด์ที่จำกัดผู้ให้บริการ แล้วเชื่อมสายไฟเข้าไปและจ่ายแรงดันเพื่อรบกวนรหัสของมัน วันรุ่งขึ้น เขาประกาศต่อหน้ากล้องว่า: “นี่คือ iPhone ตัวแรกของโลกที่ถูกปลดล็อก”
วิดีโอ那段มีผู้ดูมากกว่าสองล้านครั้ง ทำให้เขาเป็นแฮกเกอร์ที่มีชื่อเสียงที่สุดในโลกในเวลานั้น สองปีต่อมา เขาหันไปเจาะระบบ索尼 PS3 ซึ่งถูกเรียกว่าเป็นคอนโซลเกมที่ไม่สามารถถูกเจาะได้ จากนั้นเขาถูก索尼ฟ้องร้อง และสุดท้ายก็ตกลงกันได้
ในปี 2011 โซนีได้ฟ้องร้องจอร์จ ฮอตซ์ เกี่ยวกับการเจาะระบบ PS3 คดีนี้สุดท้ายจบลงด้วยการไกล่เกลี่ยนอกศาล โดยฮอตซ์ยอมรับคำสั่งห้ามอย่างถาวรและสัญญาว่าจะไม่แตะต้องผลิตภัณฑ์ของโซนีอีก
Hotz ให้นิยามง่ายๆ แก่แฮกเกอร์ว่า: แฮกเกอร์สำหรับคอมพิวเตอร์ ก็เหมือนช่างประปาสำหรับท่อ
วิธีการของเขาไม่เปลี่ยนแปลงมาหลายสิบปีแล้ว: ในระบบปิด ให้หาชิ้นส่วนที่สามารถ “พูดคุย” กับคุณได้ แล้วหาวิธีทำให้มันเชื่อฟัง
เขียนโค้ดใหม่ทั้งชุด AMD ด้วยสองหมื่นบรรทัด
iPhone และ PS3 แสดงให้เห็นถึงความสามารถของ Hotz
แต่เพื่อใช้งาน CUDA ได้ แค่คนเดียวไม่เพียงพอ ต้องมีสิ่งที่แท้จริง นั่นคือ tinygrad มันคือสแต็กการเรียนรู้เชิงลึกแบบเปิดแหล่งที่มาที่ Hotz เป็นผู้นำ
ที่จริงแล้ว ความหลงใหลของโฮตซ์ในการทำลายระบบปิดนั้น ได้ขยายจากอุปกรณ์อิเล็กทรอนิกส์เพื่อผู้บริโภคไปสู่อุตสาหกรรมแล้ว ในปี 2015 เขาได้ก่อตั้งบริษัทขับขี่อัตโนมัติ comma.ai และแทบจะเปลี่ยนแปลงระบบขับขี่อัตโนมัติที่สามารถวิ่งบนทางด่วนได้ด้วยตัวเองในโรงจอดรถ ซึ่งเปรียบเทียบได้กับเทสลา
ปัจจุบัน comma.ai ยังคงดำเนินการอยู่ และโมเดลการขับขี่แบบเปิดแหล่งที่มา openpilot ของมันทำงานบน tinygrad
GitHub อย่างเป็นทางการอธิบายว่าเป็นระบบแบบ end-to-end ที่รวมทุกอย่างตั้งแต่ไลบรารีเทนเซอร์ การอนุพันธ์อัตโนมัติ IR (การแทนค่าระดับกลาง) และคอมไพเลอร์ ไปจนถึง Just-In-Time compilation การประมวลผลกราฟ และตัวประกอบการปรับแต่งรวมถึงส่วนโหลดข้อมูลที่จำเป็นสำหรับการฝึกอบรม
จุดเด่นหลักของระบบชุดนี้คือความเรียบง่าย
tinygrad ได้รับการสนับสนุนสำหรับ backend หลายตัว เช่น CUDA, AMD, METAL, QCOM และ WEBGPU เมื่อคู่แข่งต้องเรียนรู้ชุดคำสั่งที่ซับซ้อนทั้งชุดเพื่อรองรับฮาร์ดแวร์ใหม่ tinygrad แค่ต้องการให้ฮาร์ดแวร์ใหม่สามารถรันการคำนวณพื้นฐานประมาณ 25 แบบ เช่น การบวก ลบ คูณ และหาร ก็สามารถเชื่อมต่อได้
แต่จุดหลักที่ฮอตซ์ลงทุนจริงๆ คือสาย AMD
ในเดือนมกราคม 2025 tiny corp ได้เขียนไดรเวอร์ รันไทม์ ไลบรารี และซิมูเลเตอร์ของตนเองแล้ว ชุด AMD นี้มีโค้ดประมาณ 12,000 บรรทัด และเหลือเพียง RDNA3 assembler เท่านั้นที่ยังขาดอยู่เพื่อให้ “สมบูรณ์แบบด้วยตนเอง”
ในเดือนมีนาคม โฮตซ์ประกาศบนบล็อกว่า tiny corp ได้สร้างชุดสแต็ก AMD ที่สมบูรณ์ตั้งแต่ฮาร์ดแวร์จนถึงชั้น PyTorch โดยมีข้อยกเว้นเพียงแค่กรอบงานคอมไพเลอร์ LLVM
เขายังเสริมว่า นักพัฒนาไม่จำเป็นต้องเรียนรู้วิธีเขียน tinygrad แต่สามารถใช้โค้ด PyTorch ที่คุ้นเคยได้ตามเดิม โดยระบบพื้นฐานจะแปลงอัตโนมัติเป็นสแต็กของ AMD
12,000 บรรทัดนั้นเป็นเพียงขนาดของชุด AMD รุ่นเดือนมกราคม 2025 เท่านั้น โปรเจกต์ tinygrad ยังคงเติบโตอย่างต่อเนื่อง จนถึงเวอร์ชัน v0.13.0 ได้เพิ่มเป็น 22,853 บรรทัด ส่วน Hotz ให้ตัวเลขในปลายปี 2025 ว่าไม่รวมการทดสอบอยู่ที่ 18,935 บรรทัด
แต่ไม่ว่าจะเป็น 12,000 หรือ 18,000 เมื่อวางไว้ในกรอบอุตสาหกรรมก็เป็นการเปรียบเทียบที่น่าทึ่ง
สแต็กซอฟต์แวร์ที่สามารถขับเคลื่อน GPU และรันการฝึกอบรมได้ มีรหัสหลายล้านบรรทัด โดยใช้คำพูดของ Hotz tinygrad เล็กกว่าถึง 1000 เท่า
นั่นหมายความว่า ความซับซ้อนของ CUDA ไม่ได้ถูกสร้างขึ้นจากกฎทางฟิสิกส์ มันสามารถถูกเขียนใหม่โดยทีมเล็กๆ ด้วยแนวคิดที่เรียบง่าย ซึ่งเป็นสิ่งที่ Hotz เชื่ออย่างแน่นอน
Tinybox วางเครื่องคำนวณพลังงานบนชั้นวางสินค้า
หากเรื่องนี้จบลงเพียงเท่านี้ tinygrad ก็ยังคงเป็นเพียงโครงการบน GitHub แต่ความทะเยอทะยานของ Hotz ไม่ได้หยุดเพียงแค่โค้ด
Tiny Corp กำลังขายคอมพิวเตอร์รุ่น Tinybox อย่างเป็นทางการ บนเว็บไซต์ทางการมีรุ่น Red, Green, Pro และ Exa พร้อมรายละเอียดสเปก ราคา และข้อมูลการจัดส่งที่เปิดเผยทั้งหมด หลังจากสั่งซื้อและชำระเงิน จะจัดส่งภายในหนึ่งสัปดาห์
Tinybox เคยเปรียบเทียบกับเครื่องที่มีราคาสูงกว่าประมาณ 10 เท่าในการทดสอบมาตรฐาน MLPerf Training 4.0 ตามที่ Hotz เปิดเผยในบล็อกของเขาระหว่างปลายปี 2025 เส้นผลิตภัณฑ์คอมพิวเตอร์นี้สร้างรายได้ประมาณ 2 ล้านดอลลาร์สหรัฐต่อปี ซึ่งเขาใช้เงินนี้เพื่อสนับสนุนการวิจัยและพัฒนาของ tiny corp ทั้งหมด
ในบล็อกเดียวกัน ฮอตซ์ยังระบุว่า พวกเขาได้ลงนามสัญญากับ AMD เพื่อใช้ MI350X ในการรันการฝึก MLPerf สำหรับ Llama 405B และกระบวนการเจรจาสัญญาดังกล่าวเกิดขึ้นอย่างเปิดเผยบน Twitter
tiny corp กำหนดภารกิจของตนเป็นประโยคเดียว: เปลี่ยน petaflop ให้เป็นสินค้า
Petaflop เป็นหน่วยความเร็วในการคำนวณ หมายถึงการดำเนินการจุดลอยตัวหนึ่งล้านล้านครั้งต่อวินาที (10^15) และเป็นหน่วยที่ใช้วัดสมรรถนะของซูเปอร์คอมพิวเตอร์และพลังการคำนวณด้าน AI
ฮ็อตซ์ต้องการที่จะทำให้การคำนวณแบบจุดลอยตัวหนึ่งพันล้านล้านครั้งต่อวินาทีเป็นสินค้าที่ทุกคนสามารถใช้งาน AI ได้
เมื่อพลังการคำนวณสามารถกำหนดราคาและสั่งซื้อได้เหมือนอุปกรณ์อิเล็กทรอนิกส์บริโภค และจัดส่งภายในหนึ่งสัปดาห์ แนวคิดเรื่อง “ความหายากของพลังการคำนวณ” อาจเริ่มคลายตัวลง
เส้นทางใหม่
เรื่องของ Hotz ไม่ได้มีความหมายอยู่ที่จุดเด่นอย่าง “แฮกเกอร์คนเดียวต่อสู้กับ NVIDIA และยุติ CUDA” CUDA ยังคงเป็นตัวเลือกเริ่มต้นของนักพัฒนาส่วนใหญ่ในวันนี้
สิ่งที่สำคัญจริงๆ คือสมมติฐานที่ Hotz ได้เดิมพัน: ความซับซ้อนของสแต็กซอฟต์แวร์ AI สามารถถูกบีบอัดให้เล็กมากได้ เมื่อสมมติฐานนี้พิสูจน์ว่าถูกต้อง ค่าประเมินส่วนที่ NVIDIA สร้างขึ้นจาก CUDA อาจต้องถูกคำนวณใหม่
และเกมการพนันครั้งนี้ ก็ไม่ใช่เรื่องของฮอตซ์คนเดียวอีกต่อไป เขาเขียนไว้ในบทความเรื่อง “Five Years of tinygrad” ปลายปี 2025: รหัสบรรทัดแรกถูกส่งเมื่อเดือนตุลาคม 2020 ผ่านไปห้าปี ตอนนี้บริษัทมีคนทั้งหมด 6 คน หลายคนได้ทุ่มเทเวลาหลายปีแล้ว
ในมุมมองของฮอตซ์ ปัญหาฮาร์ดแวร์ของ AMD ไม่ใหญ่เท่ากับปัญหาซอฟต์แวร์ นี่คือการตัดสินใจของผู้ประกอบการ ไม่ใช่คำแถลงอย่างเป็นทางการของ AMD ในมูลค่าตลาดที่สูงกว่า NVIDIA ถึง 16 เท่า มีส่วนใดบ้างที่มาจากฮาร์ดแวร์ และมีส่วนใดบ้างที่มาจากกำแพงซอฟต์แวร์ที่กำลังถูกถอดออกทีละบรรทัด
Hotz ได้ตั้งระยะเวลาสำหรับการเดิมพัน 250,000 ดอลลาร์ของตนเอง: กลับมาดูอีกครั้งในอีกห้าปี
ยังไม่มีใครรู้ว่าการเดิมพันนี้จะถูกบันทึกเป็นความฝันของแฮกเกอร์ หรือจุดเริ่มต้นของเส้นทางใหม่ แต่ความหนาแน่นของกำแพงพลังการคำนวณ ได้มีบางคนเริ่มวัดใหม่ด้วยโค้ดแล้ว
