ทำไมปัญญาประดิษฐ์ของจีนจึงพัฒนาเร็วมาก? ข้อมูลเชิงลึกจากห้องปฏิบัติการ

icon MarsBit
แชร์
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconสรุป

expand icon
ภาคปัญญาประดิษฐ์ของจีนกำลังเร่งตัวขึ้น ขับเคลื่อนโดยความมุ่งเน้นด้านวิศวกรรมที่แข็งแกร่ง การร่วมมือแบบโอเพ่นซอร์ส และการพัฒนาแบบทีม ห้องปฏิบัติการให้ความสำคัญกับการดำเนินการมากกว่าการรับรองจากบุคคล ความสนใจเปิดในสินทรัพย์ที่เกี่ยวข้องกับปัญญาประดิษฐ์กำลังเพิ่มขึ้นเมื่อบริษัทชั้นนำอย่าง Alibaba และ ByteDance ขยายอิทธิพลของตน ดัชนีความกลัวและความโลภของตลาดปัญญาประดิษฐ์แสดงถึงความเชื่อมั่นที่เพิ่มขึ้น การสนับสนุนจากรัฐบาลและโครงสร้างพื้นฐานข้อมูลยังช่วยเร่งความเร็วต่อไป

บรรณาธิการหมายเหตุ: ห้องปฏิบัติการ AI ของจีนกำลังกลายเป็นแรงผลักดันที่ไม่สามารถมองข้ามได้ในการแข่งขันโมเดลขนาดใหญ่ระดับโลก ข้อได้เปรียบของพวกเขาไม่ได้อยู่ที่แค่มีบุคลากรจำนวนมาก ความสามารถด้านวิศวกรรมที่แข็งแกร่ง และการอัปเดตที่รวดเร็ว แต่ยังมาจากวิธีการจัดองค์กรที่เป็นรูปธรรมมากกว่า: พูดน้อยเรื่องแนวคิด ทำโมเดลให้มากขึ้น; ลดการเน้นบุคคลสำคัญ แต่เน้นการดำเนินงานของทีม; ลดการพึ่งพาบริการภายนอก และมีแนวโน้มที่จะควบคุมสแต็กเทคโนโลยีหลักของตนเอง

ผู้เขียนบทความนี้ นาธาน แลมเบิร์ต ได้เยี่ยมชมห้องปฏิบัติการ AI ชั้นนำหลายแห่งในจีน และพบว่าระบบนิเวศ AI ของจีนไม่เหมือนกับของสหรัฐฯ อย่างสมบูรณ์ โดยสหรัฐฯ มุ่งเน้นที่รูปแบบดั้งเดิม การลงทุนจากทุน และอิทธิพลส่วนบุคคลของนักวิทยาศาสตร์ชั้นนำ ในขณะที่จีนมีจุดแข็งในการตามให้ทันอย่างรวดเร็วในทิศทางที่มีอยู่แล้ว โดยใช้การเปิดแหล่งรหัส การปรับปรุงด้านวิศวกรรม และการมีส่วนร่วมของนักวิจัยรุ่นเยาว์จำนวนมาก เพื่อผลักดันความสามารถของโมเดลให้ก้าวไปสู่จุดสูงสุดอย่างรวดเร็ว

สิ่งที่ควรให้ความสนใจมากที่สุด ไม่ใช่การที่ AI ของจีนได้ก้าวข้ามสหรัฐอเมริกาหรือไม่ แต่คือการที่เส้นทางการพัฒนาที่แตกต่างกันสองแบบกำลังเกิดขึ้น: สหรัฐอเมริกาดูเหมือนการแข่งขันระดับแนวหน้าที่ขับเคลื่อนโดยทุนและห้องปฏิบัติการชั้นนำ ในขณะที่จีนดูเหมือนการแข่งขันในภาคอุตสาหกรรมที่ขับเคลื่อนโดยความสามารถด้านวิศวกรรม ระบบนิเวศแบบเปิดแหล่งรหัส และจิตสำนึกในการควบคุมเทคโนโลยีของตนเอง

นี่หมายความว่า การแข่งขันด้าน AI ในอนาคตจะไม่ใช่แค่การแข่งขันในตารางอันดับโมเดล แต่ยังรวมถึงความสามารถในการจัดการ ระบบนิเวศนักพัฒนา และความสามารถในการดำเนินการในอุตสาหกรรมด้วย การเปลี่ยนแปลงที่แท้จริงของ AI ของจีนอยู่ที่มันไม่ได้แค่เลียนแบบซิลิคอนแวลลีย์อีกต่อไป แต่กำลังมีส่วนร่วมในขอบเขตระดับโลกด้วยวิธีของตนเอง

以下为原文:

นั่งอยู่บนรถไฟความเร็วสูงรุ่นใหม่ที่วิ่งจากหางโจวไปเซี่ยงไฮ้ ฉันมองออกไปนอกหน้าต่าง เห็นเส้นขอบภูเขาที่ชัดเจน มีกังหันลมกระจายอยู่บนยอดเขา สร้างเงา轮廓ภายใต้แสงอาทิตย์ยามเย็น ภูเขาเป็นพื้นหลัง ขณะที่ด้านหน้าคือทุ่งกว้างใหญ่สลับกับตึกสูงจำนวนมาก

ฉันกลับมาจากจีนด้วยความถ่อมตัวอย่างยิ่ง การไปยังสถานที่ที่แปลกใหม่มากมาย แต่ได้รับการต้อนรับอย่างอบอุ่น เป็นประสบการณ์ที่อุ่นใจและเต็มไปด้วยความเป็นมนุษย์อย่างมาก ฉันมีโอกาสได้พบกับผู้คนจำนวนมากในระบบนิเวศ AI ซึ่งก่อนหน้านี้ฉันรู้จักเพียงจากไกลๆ; และพวกเขาต้อนรับฉันด้วยรอยยิ้มอันสดใสและความกระตือรือร้น ทำให้ฉันตระหนักอีกครั้งว่า งานของฉันและระบบนิเวศ AI ทั้งหมดนั้นล้วนมีลักษณะระดับโลก

จิตใจของนักวิจัยจีน

บริษัทจีนที่กำลังพัฒนาโมเดลภาษาสามารถถือได้ว่าเหมาะสมอย่างยิ่งในฐานะผู้ตามอย่างรวดเร็วในเทคโนโลยีนี้ พวกเขาก่อตั้งขึ้นบนพื้นฐานของวัฒนธรรมการศึกษาและการทำงานที่ยาวนานของจีน พร้อมทั้งมีวิธีการสร้างบริษัทเทคโนโลยีที่แตกต่างเล็กน้อยจากตะวันตก

หากพิจารณาจากผลลัพธ์ เช่น โมเดลที่ใหม่ที่สุดและใหญ่ที่สุด รวมถึงงานไหลเวียนแบบเอเจนต์ที่โมเดลเหล่านี้สนับสนุน และพิจารณาจากปัจจัยการลงทุน เช่น นักวิทยาศาสตร์ที่ยอดเยี่ยม ข้อมูลขนาดใหญ่ และทรัพยากรการคำนวณที่เร่งความเร็ว ห้องปฏิบัติการของจีนและห้องปฏิบัติการของสหรัฐฯ ดูเหมือนจะคล้ายคลึงกันโดยทั่วไป ความแตกต่างที่แท้จริงและยั่งยืนนั้นปรากฏขึ้นในวิธีการจัดระเบียบและสร้างรูปแบบของปัจจัยเหล่านี้

ฉันเคยเชื่อว่าเหตุผลหนึ่งที่ห้องปฏิบัติการของจีนเก่งมากในการตามทันและรักษาตำแหน่งไว้ใกล้เคียงกับจุดสูงสุด คือวัฒนธรรมของพวกเขามีความเข้ากันได้ดีกับภารกิจนี้ แต่ก่อนที่จะพูดคุยกับคนจริงๆ ฉันรู้สึกว่าไม่เหมาะสมที่จะสรุปความรู้สึกนี้ว่ามีอิทธิพลสำคัญใดๆ หลังจากได้พูดคุยกับนักวิทยาศาสตร์ที่ยอดเยี่ยม ถ่อมตัว และเปิดรับหลายรายในห้องปฏิบัติการชั้นนำของจีน ความคิดของฉันหลายอย่างจึงชัดเจนขึ้น

การสร้างโมเดลภาษาขนาดใหญ่ที่ดีที่สุดในวันนี้ขึ้นอยู่กับงานที่ละเอียดรอบด้านตลอดทั้งเทคโนโลยีสแต็ก: ตั้งแต่ข้อมูล รายละเอียดสถาปัตยกรรม ไปจนถึงการนำอัลกอริธึมการเรียนรู้แบบเสริมแรงมาใช้งาน แต่ละส่วนของโมเดลอาจให้ผลลัพธ์ที่ดีขึ้นเล็กน้อย และการรวมผลลัพธ์เหล่านี้เข้าด้วยกันเป็นกระบวนการที่ซับซ้อน ในกระบวนการนี้ งานของบุคคลที่ฉลาดมากบางคนอาจต้องถูกเลื่อนออกไป เพื่อให้โมเดลโดยรวมสามารถบรรลุการเพิ่มประสิทธิภาพแบบหลายเป้าหมายได้สูงสุด

นักวิจัยชาวอเมริกันดูเหมือนจะเชี่ยวชาญในการแก้ปัญหาของแต่ละส่วนอย่างมาก แต่อเมริกามีวัฒนธรรมที่เน้นการ “พูดแทนตัวเอง” มากกว่า เมื่อคุณเป็นนักวิทยาศาสตร์ การที่คุณริเริ่มเรียกร้องความสนใจให้กับงานของคุณ มักจะนำไปสู่ความสำเร็จที่มากขึ้น; และวัฒนธรรมสมัยใหม่กำลังผลักดันเส้นทางชื่อเสียงรูปแบบใหม่ นั่นคือการกลายเป็น “นักวิทยาศาสตร์ AI ชั้นนำ” ซึ่งจะนำไปสู่ความขัดแย้งโดยตรง

มีข่าวลืออย่างกว้างขวางว่า กลุ่ม Llama เคยล่มสลายภายหลังจากการฝังความต้องการทางผลประโยชน์เข้าไปในโครงสร้างองค์กรแบบชั้นHierarchy เนื่องจากแรงกดดันทางการเมือง ฉันยังได้ยินจากห้องปฏิบัติการอื่นๆ ว่าบางครั้งอาจจำเป็นต้อง “ปลอบใจ” นักวิจัยชั้นนำ เพื่อให้พวกเขาหยุดบ่นว่าความคิดของตนไม่ได้ถูกนำเข้าไปในโมเดลสุดท้าย ไม่ว่าเรื่องนี้จะเป็นความจริงทั้งหมดหรือไม่ ความหมายก็ชัดเจน: ความตระหนักรู้ในตนเองและความปรารถนาในการเลื่อนตำแหน่งทางอาชีพ ล้วนสามารถขัดขวางการสร้างโมเดลที่ดีที่สุดได้ แม้แต่ความแตกต่างทางวัฒนธรรมเล็กน้อยระหว่างสหรัฐอเมริกาและจีน ก็อาจส่งผลกระทบอย่างมีนัยสำคัญต่อผลลัพธ์สุดท้าย

ความแตกต่างบางส่วนเกี่ยวข้องกับว่าในจีนใครเป็นผู้พัฒนาโมเดลเหล่านี้ ในห้องปฏิบัติการทั้งหมด มีความจริงที่ชัดเจนอย่างหนึ่ง: ผู้มีส่วนร่วมหลักมีสัดส่วนใหญ่เป็นนักศึกษาที่ยังเรียนอยู่ ห้องปฏิบัติการเหล่านี้ค่อนข้างใหม่ ซึ่งทำให้ฉันนึกถึงวิธีการจัดองค์กรของเราที่ Ai2: นักศึกษาถูกมองว่าเป็นเพื่อนร่วมงานและถูกรวมเข้าไปในทีมภาษาแบบใหญ่อย่างตรงไปตรงมา

สิ่งนี้แตกต่างอย่างมากจากห้องปฏิบัติการชั้นนำของสหรัฐอเมริกา ในสหรัฐอเมริกา บริษัทต่างๆ เช่น OpenAI, Anthropic, Cursor ไม่ได้จัดโอกาสการฝึกงานเลย บริษัทอื่นๆ เช่น Google อาจมีการเสนอการฝึกงานที่เกี่ยวข้องกับ Gemini แต่หลายคนกังวลว่า การฝึกงานของพวกเขาอาจถูกแยกออกจากงานหลักที่แท้จริง

โดยสรุป ความแตกต่างทางวัฒนธรรมเล็กน้อยนี้อาจช่วยเพิ่มความสามารถในการสร้างโมเดลได้ด้วยวิธีต่างๆ เช่น ผู้คนมีความเต็มใจที่จะทำงานที่ไม่หรูหราเพื่อปรับปรุงโมเดลสุดท้าย; ผู้เริ่มต้นเข้าร่วมในการสร้าง AI อาจไม่ได้รับอิทธิพลจากวัฏจักรการพนัน AI หลายรอบก่อนหน้า จึงสามารถปรับตัวเข้ากับวิธีการทางเทคนิคสมัยใหม่ได้เร็วขึ้น 事实上 นักวิทยาศาสตร์จีนคนหนึ่งที่ฉันได้พูดคุยด้วยมองเห็นจุดนี้อย่างชัดเจนว่าเป็นข้อได้เปรียบ: ระดับความรู้สึกตัวตนที่ต่ำกว่าทำให้โครงสร้างองค์กรสามารถขยายตัวได้ง่ายขึ้น เนื่องจากผู้คนน้อยลงที่พยายาม “เล่นระบบ”; บุคลากรจำนวนมากเหมาะอย่างยิ่งในการแก้ปัญหาที่มีการพิสูจน์แนวคิดแล้วในที่อื่นๆ เป็นต้น

สิ่งนี้สอดคล้องกับแนวโน้มในการพัฒนาความสามารถของโมเดลภาษาในปัจจุบัน ซึ่งขัดแย้งกับอคติที่รู้จักกันดี: ผู้คนมักคิดว่านักวิจัยจีนมีผลงานวิจัยเชิงสร้างสรรค์ที่เปิดพื้นที่ใหม่แบบ “จากศูนย์ถึงหนึ่ง” น้อยกว่า

ในการเยี่ยมชมห้องปฏิบัติการที่มีลักษณะเชิงวิชาการหลายครั้งในทริปนี้ ผู้บริหารหลายคนกล่าวว่าพวกเขากำลังส่งเสริมวัฒนธรรมการวิจัยที่มีความทะเยอทะยานมากขึ้น พร้อมกันนั้น ผู้เชี่ยวชาญด้านเทคนิคบางคนที่เราได้พูดคุยด้วยกลับสงสัยว่าการปรับเปลี่ยนวิธีการวิจัยทางวิทยาศาสตร์นี้จะสามารถบรรลุผลได้ในระยะสั้นหรือไม่ เนื่องจากต้องมีการออกแบบระบบการศึกษาและระบบแรงจูงใจใหม่ทั้งหมด ซึ่งการเปลี่ยนแปลงนี้มีขนาดใหญ่มากและยากที่จะเกิดขึ้นภายใต้สมดุลทางเศรษฐกิจในปัจจุบัน

วัฒนธรรมนี้ดูเหมือนกำลังฝึกฝนนักเรียนและวิศวกรรุ่นใหม่ให้เชี่ยวชาญในการสร้างเกมกับโมเดลภาษาขนาดใหญ่ และแน่นอนว่าจำนวนของพวกเขาเองก็มีมากอย่างเหลือเกิน

นักเรียนเหล่านี้บอกฉันว่า จีนกำลังเผชิญกับการสูญเสียบุคลากรที่คล้ายกับสหรัฐอเมริกา: ผู้คนจำนวนมากที่เคยพิจารณาเส้นทางวิชาการตอนนี้ตัดสินใจอยู่ในภาคอุตสาหกรรม ประโยคที่น่าสนใจที่สุดมาจากการวิจัยคนหนึ่งที่เคยต้องการเป็นศาสตราจารย์ เขาบอกว่าเขาอยากเป็นศาสตราจารย์เพราะต้องการใกล้ชิดกับระบบการศึกษา แต่เขาก็เสริมต่อว่า การศึกษาถูกแก้ไขแล้วโดยโมเดลภาษาขนาดใหญ่ — “ทำไมนักเรียนยังต้องมาคุยกับฉันอีก!”

นักเรียนที่เข้าสู่วงการโมเดลภาษาขนาดใหญ่ด้วยมุมมองใหม่ๆ ถือเป็นข้อได้เปรียบ ในช่วงไม่กี่ปีที่ผ่านมา เราได้เห็นรูปแบบหลักของโมเดลภาษาขนาดใหญ่เปลี่ยนแปลงอย่างต่อเนื่อง: จากการขยาย MoE ไปสู่การขยายการเรียนรู้แบบเสริมแรง และ再到การสนับสนุนเอเจนต์ การทำสิ่งใดสิ่งหนึ่งในเรื่องเหล่านี้ให้สำเร็จ จำเป็นต้องรับข้อมูลพื้นฐานจำนวนมากอย่างรวดเร็ว ทั้งจากวรรณกรรมโดยรวมและเทคโนโลยีภายในบริษัท

นักเรียนคุ้นเคยกับการทำสิ่งเหล่านี้ และยินดีที่จะวางความคาดหวังทั้งหมดเกี่ยวกับ “สิ่งใดควรได้ผล” ด้วยทัศนคติที่ถ่อมตัว พวกเขาลงมือทำอย่างเต็มที่ ทุ่มเทชีวิตเพื่อให้ได้โอกาสปรับปรุงโมเดล

นักเรียนเหล่านี้ยังตรงไปตรงมาอย่างน่าอัศจรรย์ และไม่มีการพูดคุยเชิงปรัชญาที่อาจทำให้นักวิทยาศาสตร์เสียสมาธิ เมื่อฉันถามพวกเขาว่ามองอย่างไรต่อผลกระทบทางเศรษฐกิจหรือความเสี่ยงทางสังคมในระยะยาว นักวิจัยจีนที่มีมุมมองซับซ้อนและต้องการมีอิทธิพลต่อประเด็นเหล่านี้มีน้อยกว่ามาก พวกเขาเชื่อว่าบทบาทของตนเองคือการสร้างโมเดลที่ดีที่สุด

ความแตกต่างนี้ละเอียดอ่อนและสามารถปฏิเสธได้ง่าย แต่มันจะรู้สึกชัดเจนที่สุดเมื่อคุณพูดคุยกับนักวิจัยผู้มีความสง่างามและฉลาด ซึ่งสามารถสื่อสารด้วยภาษาอังกฤษได้อย่างชัดเจน เป็นเวลานาน: เมื่อคุณถามถึงคำถามเชิงปรัชญาที่ลึกซึ้งเกี่ยวกับ AI คำถามพื้นฐานเหล่านี้จะลอยอยู่ในอากาศ และคู่สนทนาแสดงความสับสนอย่างเรียบง่าย สำหรับพวกเขา นี่คือข้อผิดพลาดทางหมวดหมู่

แม้แต่นักวิจัยคนหนึ่งยังอ้างถึงการวิเคราะห์ที่มีชื่อเสียงของ Dan Wang: เมื่อเทียบกับสหรัฐอเมริกาที่ถูกควบคุมโดยทนายความ จีนถูกบริหารโดยวิศวกร ในบริบทของประเด็นเหล่านี้ เขาใช้การเปรียบเทียบนี้เพื่อเน้นความตั้งใจที่จะสร้างสิ่งใหม่ ในจีน ยังไม่มีเส้นทางเชิงระบบใดที่สามารถสร้างอิทธิพลของนักวิทยาศาสตร์จีนในระดับสตาร์ได้เหมือนกับพอดีคส์ระดับซูเปอร์มาสต์อย่าง Dwarkesh หรือ Lex

ฉันพยายามให้นักวิทยาศาสตร์จีนแสดงความคิดเห็นเกี่ยวกับความไม่แน่นอนทางเศรษฐกิจในอนาคตที่เกิดจาก AI ปัญหาที่เกินกว่าความสามารถของ AGI แบบง่ายๆ หรือการถกเถียงทางศีลธรรมเกี่ยวกับวิธีที่โมเดลควรจะแสดงพฤติกรรม; ปัญหาเหล่านี้ทั้งหมดทำให้ฉันเห็นพื้นฐานการเติบโตและการศึกษาของนักวิทยาศาสตร์เหล่านี้ (แก้ไขแล้ว) พวกเขาให้ความสนใจอย่างมากกับงานของตนเอง แต่พวกเขาเติบโตขึ้นในระบบที่ไม่ส่งเสริมการอภิปรายหรือการแสดงความคิดเห็นเกี่ยวกับว่าสังคมควรจัดองค์ประกอบอย่างไรหรือควรเปลี่ยนแปลงอย่างไร

เมื่อมองในมุมกว้าง โดยเฉพาะปักกิ่ง รู้สึกเหมือนเบย์แอเรีย: ห้องปฏิบัติการที่มีการแข่งขันสูง ซึ่งอาจอยู่ห่างเพียงไม่กี่นาทีโดยเดินหรือเรียกแท็กซี่ หลังจากลงเครื่องบิน ฉันแวะไปที่ศูนย์ปักกิ่งของอาลีบาบาบนทางไปยังโรงแรม ในช่วง 36 ชั่วโมงถัดไป เราไปเยี่ยม Zhipu AI, Moonshot AI, มหาวิทยาลัยชิงหัว, Meituan, Xiaomi และ 01.ai

การนั่ง DiDi ในจีนสะดวกมาก หากคุณเลือกรถรุ่น XL มักจะได้รับการจัดสรรให้เป็นรถ面包ไฟฟ้าขนาดเล็กที่มีเก้าอี้นวด พวกเราได้สอบถามนักวิจัยเกี่ยวกับการแข่งขันเพื่อแย่งชิงบุคลากร พวกเขาบอกว่ามันคล้ายคลึงกับสิ่งที่เราเคยประสบในสหรัฐอเมริกามาก มีความปกติที่นักวิจัยจะเปลี่ยนงาน และผู้คนมักเลือกที่จะไปที่ไหนก็ตามที่มีบรรยากาศที่ดีที่สุดในขณะนั้น

ในจีน ชุมชนโมเดลภาษาขนาดใหญ่รู้สึกเหมือนระบบนิเวศมากกว่าเผ่าที่ต่อสู้กันเอง ในการสนทนาส่วนตัวหลายครั้ง ฉันได้ยินเกี่ยวกับความเคารพต่อเพื่อนร่วมวงการเกือบทั้งหมด ห้องปฏิบัติการทุกแห่งในจีนต่างกลัว ByteDance และโมเดล DouBao ที่เป็นที่นิยม เพราะเป็นห้องปฏิบัติการปิดแหล่งที่นำหน้าเพียงแห่งเดียวในจีน ในขณะเดียวกัน ห้องปฏิบัติการทุกแห่งต่างให้ความเคารพอย่างมากต่อ DeepSeek ถือว่าเป็นห้องปฏิบัติการที่มีรสนิยมทางการวิจัยสูงที่สุดในระดับการดำเนินการ เมื่อคุณพูดคุยกับสมาชิกห้องปฏิบัติการในสหรัฐอเมริกาในบริบทที่ไม่เปิดเผย ความตึงเครียดมักจะระเบิดขึ้นอย่างรวดเร็ว

สิ่งที่ทำให้ฉันประทับใจที่สุดจากความถ่อมตัวของนักวิจัยจีนคือพวกเขามักจะยกไหล่และบอกว่านั่นไม่ใช่ปัญหาของพวกเขาในระดับธุรกิจ ในขณะที่ในสหรัฐอเมริกา ดูเหมือนทุกคนจะมุ่งความสนใจไปที่แนวโน้มอุตสาหกรรมในระดับระบบนิเวศต่างๆ ตั้งแต่ผู้ขายข้อมูล ไปจนถึงพลังการคำนวณ และการระดมทุน

ความแตกต่างและจุดคล้ายกันระหว่างอุตสาหกรรม AI ของจีนกับห้องปฏิบัติการตะวันตก

การสร้างโมเดล AI ในวันนี้น่าสนใจเพราะมันไม่ได้เป็นเพียงการรวมนักวิจัยที่เก่งกาจไว้ในอาคารเดียวกันเพื่อร่วมกันสร้างสิ่งมหัศจรรย์ทางวิศวกรรมอีกต่อไป อดีตเคยเป็นแบบนั้น แต่เพื่อรองรับธุรกิจ AI โมเดลภาษาขนาดใหญ่กำลังกลายเป็นสิ่งที่ผสมผสาน: เกี่ยวข้องกับการสร้าง การปรับใช้ การระดมทุน และการผลักดันให้การรับใช้สิ่งประดิษฐ์นี้เกิดขึ้น

บริษัท AI ชั้นนำอยู่ในระบบนิเวศที่ซับซ้อน ระบบนิเวศเหล่านี้ให้ทุน กำลังการประมวลผล ข้อมูล และทรัพยากรอื่นๆ เพื่อขับเคลื่อนขอบเขตของความก้าวหน้าอย่างต่อเนื่อง

ในระบบนิเวศตะวันตก วิธีการบูรณาการองค์ประกอบต่างๆ ที่จำเป็นสำหรับการสร้างและรักษาโมเดลภาษาขนาดใหญ่ได้รับการอธิบายและวาดภาพอย่างค่อนข้างสมบูรณ์แล้ว ตัวอย่างเช่น Anthropic และ OpenAI ดังนั้น หากเราสามารถพบว่าห้องปฏิบัติการของจีนมีวิธีคิดที่แตกต่างอย่างชัดเจนในประเด็นเหล่านี้ เราจะสามารถมองเห็นว่าบริษัทต่างๆ อาจลงทุนในความแตกต่างที่มีความหมายใดในอนาคต แน่นอนว่าอนาคตเหล่านี้ยังจะได้รับอิทธิพลอย่างมากจากข้อจำกัดด้านการระดมทุนและ/หรือพลังการประมวลผล

ฉันได้จัดทำสรุปผลการเรียนรู้ที่สำคัญที่สุดในระดับอุตสาหกรรม AI จากการพูดคุยกับห้องปฏิบัติการเหล่านี้ดังนี้:

ประการแรก ความต้องการ AI ในประเทศได้เริ่มปรากฏสัญญาณเบื้องต้น
มีสมมติฐานที่ถูกพูดถึงอย่างกว้างขวางว่า ตลาดปัญญาประดิษฐ์ของจีนจะเล็กกว่า เพราะบริษัทจีนมักไม่เต็มใจจ่ายเงินสำหรับซอฟต์แวร์ จึงไม่สามารถปลดปล่อยตลาดการคำนวณที่ใหญ่พอจะสนับสนุนห้องปฏิบัติการได้

แต่การพิจารณาข้อนี้ใช้ได้เฉพาะกับค่าใช้จ่ายด้านซอฟต์แวร์ที่สอดคล้องกับระบบนิเวศ SaaS ซึ่งในประวัติศาสตร์ของจีนนั้นเคยมีขนาดเล็กมาโดยตลอด ในทางกลับกัน จีนยังคงมีตลาดคลาวด์ที่ใหญ่โตอยู่

คำถามสำคัญที่ยังไม่มีคำตอบคือ: การใช้จ่ายของบริษัทจีนในด้าน AI จะคล้ายกับตลาด SaaS ซึ่งมีขนาดเล็กกว่า หรือคล้ายกับตลาดคลาวด์ซึ่งเป็นการใช้จ่ายเชิงพื้นฐาน? คำถามนี้แม้แต่ในห้องปฏิบัติการของจีนเองก็กำลังถกเถียงกันอยู่ โดยรวมแล้ว ฉันรู้สึกว่า AI กำลังเข้าใกล้ตลาดคลาวด์มากขึ้น และไม่มีใครกังวลจริงจังว่าตลาดที่เกิดขึ้นรอบเครื่องมือใหม่นี้จะไม่สามารถเติบโตได้

ที่สอง นักพัฒนาส่วนใหญ่ได้รับอิทธิพลอย่างมากจาก Claude
แม้ว่า Claude จะถูกห้ามอย่างเป็นทางการในจีน แต่นักพัฒนา AI ส่วนใหญ่ในจีนหลงรัก Claude และวิธีที่มันเปลี่ยนแปลงวิธีการสร้างซอฟต์แวร์ของพวกเขา เพียงเพราะจีนในอดีตไม่ค่อยเต็มใจซื้อซอฟต์แวร์ ไม่ได้หมายความว่าฉันจะคิดว่าจีนจะไม่เกิดการเติบโตอย่างมหาศาลในความต้องการด้านการประมวลผลเชิงเหตุผล

นักเทคนิคจีนมีความเป็นจริง ถ่อมตัว และมีแรงจูงใจสูง ความรู้สึกนี้ชัดเจนกว่าประเพณีในอดีตใดๆ ที่ว่า “ไม่ต้องจ่ายเงินซื้อซอฟต์แวร์”

นักวิจัยจีนบางส่วนกล่าวถึงการใช้เครื่องมือของตนเองในการสร้าง เช่น เครื่องมือบรรทัดคำสั่งของ Kimi หรือ GLM แต่ทุกคนต่างกล่าวถึงการใช้ Claude อย่างน่าประหลาดใจ แทบไม่มีใครพูดถึง Codex แม้ว่า Codex จะกำลังได้รับความนิยมอย่างรวดเร็วในเขตอ่าว

ประการที่สาม บริษัทจีนมีทัศนคติเรื่องสิทธิ์ในเทคโนโลยี
วัฒนธรรมจีนกำลังรวมเข้ากับเครื่องจักรทางเศรษฐกิจที่ทำงานอย่างรุนแรง สร้างผลลัพธ์ที่ยากจะคาดเดาได้ หนึ่งในความรู้สึกที่ลึกซึ้งที่สุดที่ฉันได้รับคือ จำนวนแบบจำลอง AI ที่มากมายสะท้อนถึงความสมดุลเชิงปฏิบัติของบริษัทเทคโนโลยีจำนวนมากที่นี่ ไม่มีแผนการรวมใดๆ

อุตสาหกรรมนี้ถูกกำหนดโดยความเคารพต่อ ByteDance และ Alibaba ซึ่งถือเป็นผู้เล่นรายใหญ่ที่มีทรัพยากรเข้มแข็งและคาดว่าจะชนะตลาดหลายแห่ง DeepSeek เป็นผู้นำด้านเทคโนโลยีที่ได้รับความเคารพ แต่ห่างไกลจากผู้นำตลาด พวกเขาเป็นผู้กำหนดทิศทาง แต่ไม่มีโครงสร้างทางเศรษฐกิจที่จะชนะตลาด

นี่จึงทิ้งไว้ซึ่งบริษัทเช่น Meituan หรือ Ant Group ชาวตะวันตกอาจรู้สึกประหลาดใจที่เห็นพวกเขาก็กำลังพัฒนาโมเดลเหล่านี้ แต่ในความเป็นจริง พวกเขาเห็นชัดเจนว่า โมเดลภาษาขนาดใหญ่เป็นหัวใจของผลิตภัณฑ์เทคโนโลยีในอนาคต จึงจำเป็นต้องมีพื้นฐานที่แข็งแกร่ง

เมื่อพวกเขานำโมเดลทั่วไปที่แข็งแกร่งมาปรับแต่งเพิ่มเติม ข้อเสนอแนะจากชุมชนโอเพนซอร์สจะช่วยเสริมความแข็งแกร่งให้กับเทคโนโลยีของพวกเขา ในขณะเดียวกันพวกเขาก็สามารถเก็บเวอร์ชันที่ปรับแต่งภายในไว้ใช้สำหรับผลิตภัณฑ์ของตนเอง จิตสำนึกแบบ “เปิดก่อน” ในอุตสาหกรรมนี้ถูกกำหนดโดยความเป็นจริงนิยม: มันช่วยให้โมเดลได้รับข้อเสนอแนะที่แข็งแกร่ง ช่วยตอบแทนชุมชนโอเพนซอร์ส และเสริมพลังให้กับภารกิจของตนเอง

ประการที่สี่ การสนับสนุนจากรัฐบาลมีอยู่จริง แต่ขนาดยังไม่ชัดเจน
ผู้คนมักอ้างว่ารัฐบาลจีนกำลังช่วยอย่างแข็งขันในการเปิดการแข่งขันโมเดลภาษาขนาดใหญ่ แต่นี่เป็นระบบราชการที่มีหลายระดับและค่อนข้างกระจายอำนาจ โดยแต่ละระดับไม่มีคู่มือการดำเนินงานที่ชัดเจนกำหนดว่าตนเองควรทำอะไร

ย่านต่างๆ ในปักกิ่งแข่งขันกันเพื่อดึงดูดบริษัทเทคโนโลยีให้ตั้งสำนักงานในพื้นที่ของตน การ “ช่วยเหลือ” ที่เสนอให้กับบริษัทเหล่านี้แทบแน่นอนรวมถึงการตัดขั้นตอนทางราชการที่ยุ่งยาก เช่น การยกเลิกใบอนุญาต แต่การช่วยเหลือแบบนี้จะไปได้ไกลแค่ไหน? หน่วยงานรัฐในระดับต่างๆ สามารถช่วยดึงดูดบุคลากรที่มีความสามารถได้หรือไม่? พวกเขาสามารถช่วยลักลอบนำชิปเข้ามาได้หรือไม่?

ตลอดกระบวนการเข้าชม มีการกล่าวถึงความสนใจหรือความช่วยเหลือจากภาครัฐหลายครั้ง แต่ข้อมูลที่เกี่ยวข้องยังไม่เพียงพอที่จะรายงานรายละเอียดในลักษณะที่แน่นอน หรือช่วยให้ฉันสร้างมุมมองที่มั่นใจเกี่ยวกับว่ารัฐบาลสามารถเปลี่ยนเส้นทางการพัฒนา AI ของจีนได้อย่างไร

นอกจากนี้ยังไม่มีสัญญาณใดๆ ที่บ่งชี้ว่าผู้นำระดับสูงสุดของรัฐบาลจีนมีอิทธิพลต่อการตัดสินใจทางเทคนิคใดๆ ของโมเดล

ห้า อุตสาหกรรมข้อมูลยังด้อยพัฒนาเมื่อเทียบกับตะวันตก
ก่อนหน้านี้เราได้ยินมาว่า Anthropic หรือ OpenAI ใช้เงินมากกว่า 10 ล้านดอลลาร์สหรัฐสำหรับสภาพแวดล้อมเดียว และมีค่าใช้จ่ายสะสมทุกปีเพื่อผลักดันขอบเขตของการเรียนรู้แบบเสริมแรงอยู่ในระดับหลายร้อยล้านดอลลาร์สหรัฐ ดังนั้น เราจึงอยากรู้ว่าห้องปฏิบัติการของจีนกำลังซื้อสภาพแวดล้อมเดียวกันจากบริษัทอเมริกันอยู่หรือไม่ หรือมีระบบนิเวศภายในประเทศที่ทำหน้าที่เป็นภาพสะท้อนรองรับพวกเขา

คำตอบไม่ได้หมายถึง “ไม่มีอุตสาหกรรมข้อมูล” ในความหมายที่สมบูรณ์ แต่หมายถึงตามประสบการณ์ของพวกเขา คุณภาพของอุตสาหกรรมข้อมูลค่อนข้างต่ำ ดังนั้นในหลายกรณี วิธีที่ดีกว่าคือการสร้างสภาพแวดล้อมหรือข้อมูลภายในเอง นักวิจัยมักใช้เวลาจำนวนมากในการสร้างสภาพแวดล้อมสำหรับการฝึกฝนการเรียนรู้แบบเสริมแรง ในขณะที่บริษัทขนาดใหญ่เช่น ByteDance และ Alibaba สามารถมีทีมทำเครื่องหมายข้อมูลภายในเพื่อสนับสนุนสิ่งนี้ ทั้งหมดนี้สอดคล้องกับทัศนคติ “สร้างเองแทนการซื้อ” ที่กล่าวถึงก่อนหน้านี้

ที่หก ความต้องการชิป NVIDIA เพิ่มขึ้นอย่างมาก
พลังการประมวลผลของ NVIDIA เป็นมาตรฐานทองคำสำหรับการฝึกอบรม และความก้าวหน้าของทุกคนถูกจำกัดโดยการขาดแคลนพลังการประมวลผลเพิ่มเติม หากมีอุปทานเพียงพอ แน่นอนว่าพวกเขาจะซื้อ ตัวเร่งความเร็วอื่นๆ เช่น Huawei ได้รับการประเมินในเชิงบวกสำหรับการให้บริการแบบอินเฟอร์เรนซ์ ห้องปฏิบัติการนับไม่ถ้วนสามารถเข้าถึงชิปของ Huawei ได้

จุดสำคัญเหล่านี้แสดงให้เห็นถึงระบบนิเวศ AI ที่แตกต่างอย่างมาก การนำวิธีการดำเนินงานของห้องปฏิบัติการตะวันตกมาใช้กับคู่แข่งจีนอย่างรวดเร็วมักนำไปสู่ข้อผิดพลาดทางหมวดหมู่ คำถามหลักคือ ระบบนิเวศที่แตกต่างเหล่านี้จะผลิตโมเดลที่มีความแตกต่างอย่างมีนัยสำคัญหรือไม่ หรือโมเดลจีนจะยังคงถูกตีความว่าคล้ายกับโมเดลชั้นนำของสหรัฐฯ เมื่อ 3 ถึง 9 เดือนก่อน

ข้อสรุป: ความสมดุลทั่วโลก

ก่อนการเดินทางครั้งนี้ ฉันรู้จักจีนน้อยมาก; แต่เมื่อจากไป ฉันรู้สึกว่าเพิ่งเริ่มต้นเรียนรู้จริงๆ จีนไม่ใช่สถานที่ที่สามารถอธิบายด้วยกฎหรือสูตรใดๆ แต่เป็นสถานที่ที่มีกลไกและปฏิกิริยาทางเคมีที่แตกต่างอย่างมาก วัฒนธรรมของมันเก่าแก่และลึกซึ้งมาก และยังคงผูกพันอย่างแน่นแฟ้นกับวิธีการสร้างเทคโนโลยีภายในประเทศ ยังมีอีกมากมายที่ฉันต้องเรียนรู้

องค์ประกอบหลายส่วนของโครงสร้างอำนาจในสหรัฐอเมริกาปัจจุบัน ใช้ทัศนคติเกี่ยวกับจีนของตนเป็นเครื่องมือทางจิตใจสำคัญในการตัดสินใจ หลังจากที่ฉันได้พูดคุยแบบเป็นทางการหรือไม่เป็นทางการกับห้องปฏิบัติการ AI ชั้นนำของจีนเกือบทุกแห่ง ฉันพบว่าจีนมีคุณลักษณะและสัญชาตญาณหลายประการที่วิธีการตัดสินใจของตะวันตกยากจะสร้างแบบจำลองได้

แม้ว่าฉันจะถามโดยตรงว่าแล็บเหล่านี้ทำไมถึงเปิดเผยโมเดลที่แข็งแกร่งที่สุดของพวกเขา ฉันก็ยังพบว่ายากที่จะเชื่อมโยงความคิดแบบ “เจ้าของ” กับการสนับสนุนอย่างจริงใจต่อระบบนิเวศให้สมบูรณ์

ห้องปฏิบัติการที่นี่มีความเป็นจริงสูง และไม่ได้เป็นผู้ยึดมั่นอย่างเคร่งครัดในเรื่องโอเพนซอร์ส ไม่ใช่ว่าทุกโมเดลที่พวกเขาสร้างจะถูกเปิดเผยอย่างเป็นทางการ แต่พวกเขามีเจตนาอย่างลึกซึ้งในการสนับสนุนนักพัฒนา สนับสนุนระบบนิเวศ และใช้การเปิดเผยเป็นวิธีในการเข้าใจโมเดลของตนเองให้ลึกยิ่งขึ้น

แทบทุกบริษัทเทคโนโลยีขนาดใหญ่ของจีนกำลังพัฒนาโมเดลภาษาขนาดใหญ่ทั่วไปของตนเอง เราได้เห็นแล้วว่าบริษัทบริการแบบแพลตฟอร์มอย่าง Meituan และบริษัทเทคโนโลยีผู้บริโภคขนาดใหญ่อย่าง Xiaomi ได้เปิดตัวโมเดลที่มีน้ำหนักเปิดให้ใช้งาน บริษัทที่คล้ายกันในสหรัฐอเมริกามักจะซื้อบริการเท่านั้น

บริษัทเหล่านี้สร้างโมเดลภาษาขนาดใหญ่ไม่ใช่เพื่อแสดงตัวตนในสิ่งใหม่ที่กำลังเป็นที่นิยม แต่เนื่องจากความปรารถนาที่ลึกซึ้งและพื้นฐานกว่า: การควบคุมเทคโนโลยีสแต็กของตนเองและพัฒนาเทคโนโลยีที่สำคัญที่สุดในปัจจุบัน เมื่อฉันเงยหน้าขึ้นจากแล็ปท็อป ฉันมักจะเห็นป้ายเครนจำนวนมากบนเส้นขอบฟ้า ซึ่งชัดเจนว่าสอดคล้องกับวัฒนธรรมและการสร้างสรรค์ที่กว้างขวางยิ่งขึ้นของจีน

นักวิจัยจากจีนมีความอบอุ่น ความน่ารัก และความจริงใจ ซึ่งทำให้รู้สึกใกล้ชิดมาก บนระดับส่วนบุคคล บทสนทนาทางภูมิรัฐศาสตร์ที่โหดร้ายซึ่งเราคุ้นเคยในสหรัฐอเมริกานั้น ไม่ได้ซึมซาบเข้าไปในตัวพวกเขาเลย โลกนี้ควรจะมีความเป็นบวกอย่างเรียบง่ายแบบนี้มากขึ้น ในฐานะสมาชิกของชุมชน AI ตอนนี้ฉันกังวลมากขึ้นว่า ระหว่างสมาชิกและกลุ่มต่างๆ กำลังเกิดช่องว่างขึ้นรอบๆ ป้ายกำกับสัญชาติ

หากฉันบอกว่าฉันไม่ต้องการให้ห้องปฏิบัติการของสหรัฐอเมริกาเป็นผู้นำที่ชัดเจนในทุกส่วนของเทคโนโลยี AI นั่นคือการพูดโกหก โดยเฉพาะอย่างยิ่งในสาขาโมเดลเปิดที่ฉันใช้เวลาลงทุนไปมาก ฉันเป็นชาวอเมริกัน นี่คือความชอบที่ซื่อสัตย์

ในขณะเดียวกัน ฉันหวังว่าระบบนิเวศนี้จะเติบโตอย่างรุ่งเรืองทั่วโลก เพราะจะช่วยสร้าง AI ที่ปลอดภัย เข้าถึงได้ง่าย และมีประโยชน์มากขึ้นสำหรับโลก ในขณะนี้ คำถามคือ ห้องปฏิบัติการของสหรัฐฯ จะดำเนินการเพื่อครองตำแหน่งผู้นำนี้หรือไม่

ขณะที่ฉันเขียนบทความนี้ ข่าวลือเพิ่มเติมเกี่ยวกับคำสั่งบริหารที่มีผลต่อโมเดลเปิดกำลังแพร่กระจายอยู่ ซึ่งอาจทำให้ความร่วมมือระหว่างผู้นำของสหรัฐฯ กับระบบนิเวศทั่วโลกซับซ้อนยิ่งขึ้น—สิ่งนี้ไม่ได้ทำให้ฉันมีความมั่นใจมากขึ้น

ขอบคุณทุกคนที่ยอดเยี่ยมที่ฉันได้มีโอกาสพูดคุยด้วยที่ Yue Zhi An Mian, ZhiPu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai และองค์กรอื่นๆ ทุกคนเต็มไปด้วยความกระตือรือร้นและมีความเมตตาอย่างยิ่งในการแบ่งปันเวลาของตนเอง ขณะที่ความคิดของฉันเริ่มชัดเจนขึ้น ฉันจะยังคงแบ่งปันการสังเกตเกี่ยวกับจีน ทั้งในแง่ของวัฒนธรรมโดยรวมและในตัวเองของสาขา AI

ชัดเจนว่าความรู้เหล่านี้จะเกี่ยวข้องโดยตรงกับเรื่องราวที่กำลังเกิดขึ้นกับการพัฒนาล่าสุดของ AI

แหล่งที่มา:แสดงต้นฉบับ
คำปฏิเสธความรับผิดชอบ: ข้อมูลในหน้านี้อาจได้รับจากบุคคลที่สาม และไม่จำเป็นต้องสะท้อนถึงมุมมองหรือความคิดเห็นของ KuCoin เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลทั่วไปเท่านั้น โดยไม่มีการรับรองหรือการรับประกัน และจะไม่ถูกตีความว่าเป็นคำแนะนำทางการเงินหรือการลงทุน KuCoin จะไม่รับผิดชอบต่อความผิดพลาดหรือการละเว้นในเนื้อหา หรือผลลัพธ์ใดๆ ที่เกิดจากการใช้ข้อมูลนี้ การลงทุนในสินทรัพย์ดิจิทัลอาจมีความเสี่ยง โปรดประเมินความเสี่ยงของผลิตภัณฑ์และความเสี่ยงที่คุณยอมรับได้อย่างรอบคอบตามสถานการณ์ทางการเงินของคุณเอง โปรดดูข้อมูลเพิ่มเติมได้ที่ข้อกำหนดการใช้งานและเอกสารเปิดเผยข้อมูลความเสี่ยงของเรา