DeepSeek V4 และ Meituan LongCat 2.0 ทำลายขีดจำกัดพารามิเตอร์ล้านล้าน

บริษัท AI ในประเทศเริ่มพยายามสร้างเส้นทางของตนเอง

ตั้งแต่ต้นปีนี้ วงการเทคโนโลยีต่างประเทศต่างจับตามองปัญหาพลังงานการคำนวณของจีน

ในเดือนมกราคม มาสก์กล่าวในพอดีว่า จีนจะมีกำลังการประมวลผล AI มากกว่าภูมิภาคอื่นๆ ทั่วโลกอย่างมาก ในเดือนกุมภาพันธ์ โอตติแมน ซีอีโอของ OpenAI กล่าวว่า ความก้าวหน้าทางเทคโนโลยีของจีนในด้านปัญญาประดิษฐ์นั้น “เร็วอย่างน่าตกใจ” ฮวง เหรินซวน ซีอีโอของ NVIDIA ก็ได้แสดงความเห็นหลายครั้งว่า “การจำกัดเทคโนโลยี AI ของจีนกลับจะเร่งให้จีนพัฒนาเทคโนโลยีของตนเอง”

ปี 2025 สามารถเรียกได้ว่าเป็นปีของการรวมตัวของด้านอุปทาน บริษัท GPU ของจีน เช่น Moore Threads และ Muxi Semiconductor ต่างเข้าสู่ตลาดทุนอย่างต่อเนื่อง ทำให้ฐานอุตสาหกรรมของโมเดลขนาดใหญ่ของจีนลึกซึ้งยิ่งขึ้น ในปี 2026 การเปลี่ยนแปลงจะถ่ายทอดไปยังห่วงโซ่อุปทานด้านล่าง โดยในปลายเดือนเมษายน โมเดลขนาดใหญ่ของจีนหลายรุ่นได้เปิดตัวเวอร์ชันใหม่

วันที่ 20 เมษายน โมเดล Kimi K2.6 ที่เชี่ยวชาญในการเขียนโค้ดระยะยาวได้เปิดตัวโดย Moonshot; วันที่ 24 เมษายน เปิดตัว DeepSeek V4; จากนั้น LongCat-2.0-Preview ของ Meituan เปิดให้ทดสอบ ทั้งสองโมเดลมีพารามิเตอร์รวมกันเกินล้านล้าน และรองรับบริบทยาวสูงสุด 1M

ควร值得一提ว่า DeepSeek V4 ได้ดำเนินการย้ายและปรับให้เข้ากับแพลตฟอร์ม Huawei Ascend จากระบบ NVIDIA ในขณะที่ Meituan LongCat2.0 เป็นโมเดลขนาด万亿พารามิเตอร์ที่ใช้พลังการประมวลผลของประเทศในการฝึกฝนและการให้บริการทั้งหมด โดยใช้ชิปพลังการประมวลผลของประเทศระหว่าง 50,000 ถึง 60,000 ตัว

เป็นเวลานาน ผู้ประกอบการ AI ในจีน มักใช้กลยุทธ์การใช้แนวทางที่สุกงอมอยู่แล้ว ตอนนี้ บริษัท AI ในประเทศเริ่มทดลองสร้างเส้นทางของตนเอง

สร้างถนนในป่า

คุณจะทำภารกิจที่ยากลำบากให้สำเร็จได้อย่างไร

คำตอบของนักเขียนนิยายวิทยาศาสตร์อาร์เธอร์ คลาร์กคือ: "วิธีเดียวคือทำให้สิ่งที่เป็นไปไม่ได้กลายเป็นจุดเริ่มต้นของการก้าวไปข้างหน้า"

DeepSeek V4 ตั้งแต่กำหนดวันเปิดตัวครั้งแรกจนถึงการเปิดตัวอย่างเป็นทางการ ได้มีการปรับเปลี่ยนเวลาหลายครั้ง ผู้เชี่ยวชาญภายนอกคาดการณ์ว่า原因之一คือจำเป็นต้องย้ายโค้ดหลักออกจาก CUDA ของ NVIDIA

ระบบนิเวศ CUDA ได้รับการพัฒนาอย่างต่อเนื่องมาหลายสิบปี จึงเป็นแพลตฟอร์มการพัฒนาที่มีฟังก์ชันทรงพลังและเครื่องมือครบครัน ในขณะที่ระบบนิเวศพลังการประมวลผลของประเทศยังอยู่ในขั้นตอนเริ่มต้นของการสร้างขึ้น การย้ายโค้ดหมายถึงทีมพัฒนาต้องดำเนินการรีเฟรชโครงสร้างพื้นฐานจำนวนมาก

สุดท้าย DeepSeek ทำสำเร็จ สองวันหลังเปิดตัว V4 ธนาคารโจนส์ แอนด์ โจนส์ ระบุในรายงานว่า V4 สามารถปรับให้เข้ากับชิป HuaWei Ascend ได้สำเร็จ ยืนยันความเป็นไปได้ของพลังการประมวลผลภายในประเทศในการใช้งาน AI รุ่นล่าสุด และ DeepSeek ได้ลดต้นทุนการให้บริการอย่างมีนัยสำคัญผ่านนวัตกรรมพื้นฐานเช่นสถาปัตยกรรมการให้ความสนใจแบบผสม

DeepSeek ใช้วิธีการของเหล่าผู้ชื่นชอบเทคโนโลยีในการลดต้นทุนและเพิ่มประสิทธิภาพ โดยการเขียนโค้ดใหม่ครึ่งหนึ่งของงานโมเดลขนาดใหญ่เพื่อทำการย้ายระบบอย่างเข้มข้น ในวันเดียวกัน LongCat-2.0-Preview ของ Meituan ถูกดำเนินการโดยตรงบนพลังการประมวลผลของประเทศ

ในระดับวิศวกรรม ความท้าทายที่เกิดขึ้นกับพลังการคำนวณของจีนมีอะไรบ้าง? มาดูตัวอย่างจาก LongCat-2.0-Preview กัน

ความท้าทายประการแรกอยู่ในระดับทางกายภาพ: ความจุและแบนด์วิธของหน่วยความจำกราฟิกบนฐานฮาร์ดแวร์ของจีนนั้นแตกต่างจากชิปของ NVIDIA เมื่อฝึกและปรับใช้โมเดลพารามิเตอร์ล้านล้าน ทีมเมี่ยนตูมีความท้าทายด้านวิศวกรรมอย่างมาก จำเป็นต้องใช้ความพยายามเพิ่มเติมในการปรับแต่งกลยุทธ์การประมวลผลแบบขนานและเพิ่มประสิทธิภาพหน่วยความจำกราฟิก

ความท้าทายที่สองคือระดับความสุกงอมของระบบนิเวศซอฟต์แวร์ เพื่อให้แน่ใจว่าการฝึกอบรมทั้งหมดแม่นยำและสามารถทำซ้ำได้ตามลักษณะเฉพาะของชิปภายในประเทศ ทีมงานจำเป็นต้องเขียนใหม่และปรับปรุงโอเปอเรเตอร์หลัก รวมถึงพัฒนาโอเปอเรเตอร์แบบกำหนดได้ทั้งหมดด้วยตนเอง

ความท้าทายข้อที่สามคือความเสถียรของคลัสเตอร์หมื่นการ์ด โดยบนคลัสเตอร์ขนาดใหญ่ที่ใช้การ์ดประมวลผลภายในประเทศจำนวน 50,000 ถึง 60,000 การ์ด ความล้มเหลวของฮาร์ดแวร์เป็นเรื่องที่หลีกเลี่ยงไม่ได้ ดังนั้นทีมงานจึงได้สร้างระบบความผิดพลาดและกู้คืนอัตโนมัติอย่างสมบูรณ์

สุดท้าย ทีมงานได้ออกแบบให้เข้ากับลักษณะเฉพาะของฮาร์ดแวร์ภายในประเทศอย่างเหมาะสม โดยปรับทั้งกรอบการฝึกอบรมและโครงสร้างโมเดล ทำให้สามารถข้ามข้อจำกัดของการปรับใช้กรอบงานทั่วไป และเพิ่มประสิทธิภาพการคำนวณ

การปรับปรุงอัลกอริธึมของ DeepSeek ได้ลดข้อจำกัดด้านพลังการคำนวณและลดราคาของโมเดลลง ในขณะที่การประยุกต์ใช้งานของ Meituan ได้พิสูจน์ความเป็นไปได้ของชิปภายในประเทศ การสำรวจเหล่านี้ยังช่วยสะสมความสามารถและประสบการณ์ด้านวิศวกรรมให้กับระบบนิเวศชิปภายในประเทศ

เลียง เวินเฟิงเคยกล่าวว่า: “เราไม่ได้ตั้งใจจะเป็นปลาแซลมอน แต่กลับกลายเป็นปลาแซลมอนโดยไม่ตั้งใจ” และตอนนี้ “ผลกระทบของปลาแซลมอน” ได้ปรากฏขึ้นแล้ว และ DeepSeek ไม่ได้อยู่เพียงลำพัง

จากจุดเดียวไปสู่ระบบ

ตัง ดาวอเชิง จาก Tencent Cloud เคยเปรียบเทียบว่า: “แบบจำลองขนาดใหญ่คือเครื่องยนต์ ผู้ใช้งานคือคนขับ” ผู้ใช้งานมักสังเกตเห็นประสิทธิภาพของเครื่องยนต์ได้ง่าย แต่คนขับที่เก่งจะตระหนักว่าเชื้อเพลิงและพื้นฐานของรถก็มีความสำคัญไม่แพ้กัน

การพัฒนาพลังการคำนวณของจีน พึ่งพาความก้าวหน้าร่วมกันของ产业链ทั้งหมด บริษัทหลักในแต่ละขั้นตอนกำลังต่อเติมจุดอ่อนอย่างต่อเนื่อง

ในแง่การผลิต ข้อมูลสาธารณะแสดงให้เห็นว่าปริมาณชิปของจีนกำลังเพิ่มขึ้นอย่างต่อเนื่อง แต่มีโครงสร้างแบบ "ดัมเบล" โดยกระบวนการผลิตที่เป็นผู้ใหญ่เหนือ 28nm ครองสัดส่วนหลัก ขณะที่กำลังการผลิตของกระบวนการขั้นสูงที่ 14nm และต่ำกว่ายังคงหายาก

ในสถานการณ์ที่ขาดเครื่องลิธอกรุ่น EUV บริษัทอย่าง SMIC และ Hua Hong Semiconductor กำลังพัฒนาเทคโนโลยีการสัมผัสหลายครั้งเพื่อค้นหาจุดสมดุลภายในขีดจำกัดทางกายภาพ รายงานจากหลายแหล่งแสดงว่าอัตราการผลิตที่ผ่านการตรวจสอบของเทคโนโลยี N+2 ของ SMIC (เทียบเท่า 7nm) ได้ vượtเกิน 80% ซึ่งหมายความว่าได้ข้ามขีดจำกัดของการผลิตเชิงพาณิชย์แล้ว

ในด้านพลังการคำนวณ ชิปภายในประเทศยังคงมีช่องว่างในด้านพลังการคำนวณต่อการ์ดเมื่อเทียบกับ NVIDIA การทดลองผลิตภัณฑ์เช่น Huawei Ascend 910C แสดงให้เห็นว่า ด้วยอัตราการเร่งเชิงเส้นของคลัสเตอร์ที่สูงสุด สามารถฝึกโมเดลขนาดใหญ่มากได้

ผู้ที่ครอบครองระบบนิเวศจะครอบครองโลก” เหตุผลสำคัญที่ทำให้กำแพงป้องกันที่สร้างขึ้นโดย NVIDIA CUDA แข็งแกร่งคือการก่อตั้งมาตรฐานความเข้ากันได้ของซอฟต์แวร์และฮาร์ดแวร์ที่ใช้ได้ทั่วไป

อุตสาหกรรมยังตระหนักถึงจุดนี้เช่นกัน ตัวอย่างเช่น Cambricon ได้เปิดตัวแพลตฟอร์มซอฟต์แวร์พื้นฐานที่รองรับเฟรมเวิร์กหลักๆ เพื่อลดอุปสรรคในการย้ายถ่ายของนักพัฒนา ส่วนระบบโอเพนซอร์สที่นำโดยสถาบันวิจัยปัญญาประดิษฐ์ Zhixian ได้สร้างอินเทอร์เฟซพื้นฐานที่เป็นมาตรฐานเดียวกัน ทำให้โมเดลระดับบนสามารถทำงานได้บนชิปภายในประเทศหลายประเภท

บริษัทอินเทอร์เน็ตรายใหญ่ของจีนยังมีการเคลื่อนไหวหลายอย่าง เช่น กลยุทธ์สองทางของไบดู และการลงทุนหมื่นล้านหยวนของ ByteDance ทั้งหมดนี้มุ่งหาทางแก้ไขที่ดีกว่าสำหรับฐานพลังการคำนวณ

จากข้อมูลที่เปิดเผย ภายในไม่กี่ปีที่ผ่านมา Meituan ได้ลงทุนในบริษัทอย่างน้อย 21 แห่งที่เกี่ยวข้องกับภาคเซมิคอนดักเตอร์/อุปกรณ์อัจฉริยะและโมเดลขนาดใหญ่ทั่วไป ซึ่งรวมถึงบริษัทในระดับพลังการประมวลผลชิป เช่น Moore Threads และ Muxi Semiconductor รวมถึงบริษัทในด้านชิปภาพ เช่น Axinom Intelligence และยังรวมถึงบริษัทหลายแห่งในตลาดย่อยต่างๆ เช่น วัสดุใหม่ เช่น Guangzhou Zhongshan และ Dongfang Suanxin

ในขณะที่ยังคงติดตามเทคโนโลยีอย่างต่อเนื่อง ทุนจากอุตสาหกรรมยังทำหน้าที่เป็นผู้ลงทุนและร่วมสร้างพลังการคำนวณ ซึ่งค่อยๆ ก่อให้เกิดวัฏจักรเชิงบวก

จากโลกดิจิทัล ไปสู่ภารกิจจริง

ปัจจุบันปัญญาประดิษฐ์กำลังอยู่ที่จุดเปลี่ยนสำคัญของคลื่นลูกที่สาม โมเดลขนาดใหญ่กำลังผลักดันให้มันก้าวจากปัญญาประดิษฐ์แบบจำกัดไปสู่ปัญญาประดิษฐ์ทั่วไป และที่สำคัญยิ่งกว่านั้น คือการผลักดันหุ่นยนต์ให้ก้าวจากยุคหุ่นยนต์เฉพาะทางรุ่น 1.0 สู่ยุคปัญญาประดิษฐ์แบบรวมร่างทั่วไปรุ่น 2.0

คำพูดของหวังจงหยวน ประธานสถาบันปัญญาประดิษฐ์จีนปักกิ่ง ชี้ให้เห็นว่าจุดสำคัญของความสามารถด้าน AI คือโลกทางกายภาพ

ในทางหนึ่ง ผู้ผลิตภายในประเทศจำนวนมากกำลังมุ่งเน้นให้โมเดลขนาดใหญ่สามารถ “อ่านหนังสือนับพันเล่ม” บนคลาวด์ เพื่อเพิ่มความฉลาดและความแม่นยำในการให้เหตุผลของโมเดล ในทางตรงกันข้าม ยังต้องทำให้โมเดลขนาดใหญ่สามารถ “เดินทางไกลนับหมื่นลี้” เช่น โมเดล Wenxin ถูกฝังเข้าไปในระบบการตัดสินใจของรถยนต์ขับเคลื่อนอัตโนมัติ ขณะที่โซลูชันการตรวจสอบคุณภาพในอุตสาหกรรมของโมเดล Hunyuan ได้ถูกนำไปใช้ในหลายสถานการณ์บนสายการผลิต

บริการจัดส่งอาหาร บริการที่ร้าน และบริการที่พักและท่องเที่ยวของ Meituan สร้างเครือข่ายการดำเนินงานที่ซับซ้อนที่สุดในชีวิตประจำวัน ที่นี่มีสถานการณ์จริงจำนวนมาก: ตั้งแต่ความเร็วในการจัดเตรียมอาหารจากครัวร้านอาหาร ไปจนถึงเส้นทางการจัดส่งของพนักงานจัดส่งในฝนตกหนัก และถึงคำพูดหนึ่งคำของผู้ใช้ในยามดึกว่า “อยากกินหมูกระทะ”

หวังซิงเคยระบุอย่างชัดเจนว่า จะอัปเกรดแอป Meituan เป็นแอปที่ขับเคลื่อนด้วย AI ก่อนเป็นอันดับแรก ซึ่งหมายความว่า เป้าหมายของการฝึก LongCat ไม่ใช่แค่ตอบคำถามว่า “ร้านไหนมีเนื้อผัดอร่อย” แต่ต้อง “ค้นหาร้านนั้น เลือกคูปอง团购ที่ดีที่สุด แล้วจองที่นั่งสองที่สำหรับวันศุกร์สองวัน เวลา 19:00 น.”

นี่หมายความว่าผลลัพธ์ของการส่งมอบงานมีความสำคัญเป็นพิเศษ และอธิบายได้ว่าทำไม Meituan จึงเน้นการสร้างฐาน AI สำหรับโลกทางกายภาพ

จากขั้นตอนการปรับพารามิเตอร์ไปสู่การดำเนินการด้วยพลังการคำนวณ โมเดลขนาดใหญ่ของประเทศกำลังก้าวข้ามจาก “ใช้ได้” สู่ “ใช้งานดี”

ไม่มีทางลัดบนเส้นทางนี้ ในอนาคต เมื่ออัลกอริทึม กำลังการประมวลผล ทุน และบริบทยังคงเกิดปฏิกิริยาทางเคมีต่อเนื่อง เรื่องราวของ AI ของจีน也将翻过「จุดเด่นเดียว」ไปสู่「การวิวัฒนาการแบบระบบ」

บทความนี้มาจาก微信号 “Lan Dong Business” โดย Yu Weilin