DeepSeek V4 وMeituan LongCat 2.0 ي突破 تريليون معاملة

icon MarsBit
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
لقد تجاوز كل من DeepSeek V4 وMeituan LongCat 2.0-Preview عتبة التريليون معلمة، مع دعم لطول سياق 1M. انتقل DeepSeek V4 من NVIDIA CUDA إلى Huawei Ascend. يستخدم LongCat 2.0 ما بين 50,000 و60,000 شريحة محلية للتدريب والاستنتاج. لا يزال مؤشر الخوف والطمع مرتفعًا مع اكتساب نماذج الذكاء الاصطناعي المحلية زخمًا.

تبدأ الشركات الصينية للذكاء الاصطناعي في محاولة بناء مساراتها الخاصة.

في بداية هذا العام، كان مجتمع التكنولوجيا الخارجي يركز على مشكلة قوة الحوسبة في الصين.

في يناير، وصف ماسك في بودكاست أن الصين ستتفوق بكثافة على باقي أنحاء العالم في قوة الحوسبة للذكاء الاصطناعي. وفي فبراير، قال سام ألتمن، الرئيس التنفيذي لشركة OpenAI، إن التقدم التقني للصين في مجال الذكاء الاصطناعي "مذهل". كما أكّد الرئيس التنفيذي لشركة NVIDIA، هوانغ رينشون، مرارًا وتكرارًا علنًا أن: "فرض قيود على تقنية الذكاء الاصطناعي في الصين سيُسرّع من تطويرها الذاتي".

يمكن اعتبار عام 2025 عام تجميع العرض. حيث توالى دخول وحدات معالجة الرسوميات المحلية مثل MoLine و MuXi股份 إلى الأسواق المالية، مما عزز الأساس الصناعي للنماذج الكبيرة المحلية. وفي عام 2026، انتقلت التغييرات إلى أسفل سلسلة التوريد، حيث أطلقت عدة نماذج كبيرة محلية إصدارات جديدة في أواخر أبريل.

في 20 أبريل، أطلقت Moonshot نموذج Kimi K2.6 المتميز في كتابة الكود الطويل؛ وفي 24 أبريل، أُطلق DeepSeek V4؛ ثم فُتح اختبار LongCat-2.0-Preview من Meituan، حيث تجاوز مجموع معلمات كلا النموذجين تريليونًا، ويدعمان كلاهما سياقًا فائق الطول يصل إلى 1M.

جدير بالذكر أن DeepSeek V4 أكملت الانتقال والتكيف من نظام NVIDIA إلى منصة Huawei Ascend؛ بينما يعتمد LongCat2.0 من Meituan بالكامل على قدرات الحوسبة المحلية للتدريب والاستنتاج، وهو نموذج ضخم بحجم تريليون معلمة، واستخدم ما بين 50,000 و60,000 شريحة حوسبة محلية.

لطالما كان استراتيجية عاملين الذكاء الاصطناعي في الصين هي الاعتماد على الحلول الناضجة القائمة. الآن، تبدأ شركات الذكاء الاصطناعي المحلية في محاولة بناء مساراتها الخاصة.

بناء طرق في البرية

كيف يمكنك إكمال مهمة صعبة؟

إجابة الكاتب العلمي الخيالي آرثر كلارك: "الطريقة الوحيدة هي جعل المستحيل نفسه نقطة انطلاق للتقدم."

تم تعديل موعد إصدار DeepSeek V4 عدة مرات منذ التحديد الأولي، ويعتقد الكثيرون خارجيًا أن أحد الأسباب هو الحاجة إلى نقل الكود الأساسي من CUDA الخاص بـ NVIDIA.

بعد عقود من التحسين، أصبحت بيئة CUDA منصة تطوير قوية ومتكاملة بالأدوات. أما بيئة الحوسبة المحلية، فهي لا تزال في مراحلها الأولى من البناء. عملية نقل الكود تعني أن فرق التطوير تحتاج إلى إجراء إعادة هيكلة كبيرة للإطارات الأساسية.

في النهاية، نجح DeepSeek في تحقيق ذلك؛ حيث أشار تقرير جي بي مورغان بعد يومين من إصدار V4 إلى أن V4 نجحت في التوافق مع شرائح HuaWei Ascend، مما أثبت إمكانية استخدام الحوسبة المحلية في الاستنتاجات المتقدمة للذكاء الاصطناعي؛ كما قلّص DeepSeek بشكل ملحوظ تكلفة الاستنتاج من خلال ابتكارات تقنية أساسية مثل بنية الانتباه المختلطة.

يستخدم DeepSeek أسلوبًا تقنيًا لخفض التكاليف وزيادة الكفاءة، مُنجزًا نقلًا صعبًا من خلال إعادة كتابة نصف كمية عمل النموذج الكبير. وفي نفس اليوم، تم فتح اختبار LongCat-2.0-Preview من Meituan، والذي يعمل مباشرة على البنية التحتية الحاسوبية المحلية.

على المستوى الهندسي، ما هي التحديات التي تواجه قوة الحوسبة المحلية؟ دعونا ننظر إلى LongCat-2.0-Preview كمثال.

أول صعوبة هي من الناحية المادية. هناك فروق في سعة ذاكرة العرض وعرض النطاق الترددي بين البنية الأساسية المحلية وشرائح NVIDIA، مما يشكل تحديًا هندسيًا كبيرًا لفريق ميتوان عند تدريب ونشر نماذج ببارامترات تريليونية، حيث يجب تخصيص مزيد من الجهد لضبط استراتيجيات التوازي وتحسين ذاكرة العرض.

الصعوبة الثانية هي نضج البيئة البرمجية؛ لضمان الدقة والقابلية لإعادة الإنتاج طوال عملية التدريب وفقًا لخصائص الرقائق المحلية، يجب على الفريق إعادة كتابة وتحسين العوامل الأساسية، فضلًا عن تطوير عوامل محددة بالكامل ذاتيًا.

الصعوبة الثالثة هي استقرار تجمعات وحدات الحوسبة بكميات ضخمة، حيث يصعب تجنب الأعطال المادية في تجمعات ضخمة تستخدم بين 50,000 و60,000 وحدة حوسبة محلية. ولذلك، طور الفريق نظامًا كاملاً للتحمّل والأعطال التلقائية.

أخيرًا، بناءً على خصائص الأجهزة المحلية، قام الفريق بتصميم مخصص للإطار التدريبي وهياكل النموذج، مما كسر قيود التوافق مع الإطارات العامة ورفع أداء الحساب.

تحسين خوارزميات DeepSeek خفّض عتبة القوة الحسابية وخفض سعر النموذج؛ بينما أثبتت الممارسات الهندسية لـ Meituan جدوى الرقائق الصينية. هذه الاستكشافات ساهمت أيضًا في تراكم القدرات الهندسية والخبرات لبيئة الرقائق الصينية.

قال ليان وينفنغ: "لم نكن نقصد أن نصبح سمكة قطّة، لكننا أصبحناها بالصدفة"، والآن يظهر تأثير سمكة القطّة، ولا يقف ديبسيك وحيدًا.

من نقطة واحدة إلى نظام

كان تانغ داوشينغ من تينسنت كلاود قد استخدم هذا التشبيه: "النموذج الكبير هو المحرك، والمستخدم هو السائق". يلاحظ المستخدمون بسهولة أداء المحرك، لكن السائق الممتاز سيدرك أن الوقود والشassis مهمان بنفس القدر.

تطور قوة الحوسبة في الصين يعتمد على التقدم المتكامل لسلسلة الصناعة بأكملها. جميع الشركات الأساسية في كل مرحلة تواصل سد الثغرات.

في جانب التصنيع، تُظهر البيانات العامة أن إنتاج الصين من الرقائق يرتفع بشكل متواصل، لكنه يمتلك هيكلًا على شكل دمبل، حيث تشكل العمليات الناضجة فوق 28 نانومتر الغالبية المطلقة، بينما لا تزال طاقة الإنتاج للعمليات المتقدمة 14 نانومتر وأقل نادرة.

في مواجهة غياب آلات الليثوغرافيا EUV، تعمل شركات مثل SMIC وHua Hong Semiconductor على تطوير تقنيات متعددة التعرض، وتسعي للوصول إلى توازن ضمن الحدود الفيزيائية. وتشير تقارير متعددة إلى أن معدل الإنتاج الناجح لتقنية N+2 الخاصة بـ SMIC (المكافئة لـ 7 نانومتر) قد تجاوز 80٪، مما يعني أنها عبورت عتبة الإنتاج التجاري الضخم.

في جانب القوة الحسابية، لا تزال الرقائق المحلية تواجه فجوة في الأداء الفردي مقارنةً بمنتجات نيفيديا. تُظهر تجارب منتجات مثل هواوي كونتينغ 910C أنه يمكن تحقيق تدريب نماذج ضخمة من خلال تحقيق نسبة تسريع خطية قصوى في المجموعات.

"من يمتلك النظام يمتلك العالم." أحد الأسباب الرئيسية لعمق الحاجز التنافسي الذي بناه NVIDIA CUDA هو تشكيل معيار متوافق عالميًا للبرمجيات والأجهزة.

يُدرك صناع القطاع أيضًا هذا الأمر. على سبيل المثال، أطلقت Cambricon منصة برمجيات أساسية متوافقة مع الإطارات الرئيسية، مما يقلل من عتبة انتقال المطورين. كما قاد معهد Zhiyuan لبحوث الذكاء الاصطناعي نظامًا مفتوح المصدر يبني واجهات أساسية موحدة تسمح للنماذج العلوية بالعمل على أنواع متعددة من الرقائق المحلية.

كما أن شركات الإنترنت الكبرى في الصين قامت بعدة خطوات، مثل الاستراتيجية الثنائية لبايدو والاستثمار الضخم بقيمة تريليون يوان من قبل دوتايي، وكلها تسعى للعثور على حلول أفضل لبناء البنية التحتية للحوسبة.

وفقًا للبيانات العامة، فقد استثمرت Meituan في ما لا يقل عن 21 شركة تغطي مجالات أشباه الموصلات/الأجهزة الذكية والنماذج الكبيرة العامة. وتشمل هذه الشركات كلًا من Moortian و Muxi Shares في طبقة قوة المعالجة للرقائق، وأيكسين يوانزي في مجال رقائق الرؤية، بالإضافة إلى شركات متعددة مثل Guangzhou Zhongshan و Dongfang Suangxin في قطاعات فرعية مثل المواد الجديدة.

في حين يتم متابعة التطورات التقنية باستمرار، فإن رؤوس الأموال الصناعية أيضًا تلعب دورًا كمستثمرين وشركاء في بناء القوة الحسابية، مما يشكل تدريجيًا دورة إيجابية.

من العالم الرقمي إلى المهام الواقعية

يمر الذكاء الاصطناعي حاليًا عند نقطة تحول مهمة في الموجة الثالثة، حيث تدفع النماذج الكبيرة تطوره من الذكاء الاصطناعي الضيق إلى الذكاء الاصطناعي العام، والأهم من ذلك، أنها تدفع الروبوتات من عصر الروبوتات المتخصصة 1.0 إلى عصر الذكاء الجسدي العام 2.0.

كلمات وانغ تشونغ يوان، رئيس معهد بكين للذكاء الاصطناعي، تشير إلى أن النقطة الأساسية لقدرات الذكاء الاصطناعي هي العالم المادي.

من ناحية، تعمل العديد من الشركات المحلية على تمكين النماذج الكبيرة من "قراءة عشرات الآلاف من الكتب" في السحابة، لتعزيز ذكاء النموذج وصرامة استنتاجه المنطقي. ومن ناحية أخرى، يجب أيضًا تمكين النماذج الكبيرة من "السفر آلاف الأميال"؛ على سبيل المثال، تم تضمين نموذج وينشين في نظام اتخاذ القرار للقيادة الذاتية؛ كما ظهرت حلول فحص الجودة الصناعية لنموذج هون يوان في عدة سيناريوهات خطوط إنتاج.

تشكل خدمات التسليم من ميتوان، والزيارات إلى المتاجر، والإقامة والسفر، شبكة تنفيذ مهام الأكثر تعقيدًا في الحياة اليومية. هنا توجد كميات هائلة من السيناريوهات الواقعية: من سرعة إعداد الطعام في مطبخ المطعم، إلى مسارات التسليم التي يسلكها السائقون في عاصفة مطرية، وحتى عبارة واحدة من مستخدم في منتصف الليل: "أريد تناول الـ hot pot".

حدد وانغ شينغ بوضوح أن هدفه هو ترقية تطبيق Meituan أولاً إلى تطبيق "مدعوم بالذكاء الاصطناعي". وهذا يعني أن هدف تدريب LongCat ليس فقط الإجابة عن سؤال "أي مطعم يقدم لحمًا مقلّيًا لذيذًا"، بل أيضًا "العثور على هذا المطعم، واختيار أفضل قسيمة شراء جماعي، ثم حجز مقعدين يومي الجمعة الساعة 7 مساءً".

هذا يعني أن فعالية تسليم المهمة تكتسب أهمية كبيرة، وهو ما يفسر سبب تركيز Meituan على بناء قاعدة ذكاء اصطناعي للعالم المادي.

من تحسين المعلمات إلى تشغيل القوة الحسابية، تكمل النماذج الكبيرة المحلية تطورها من "قابلة للاستخدام" إلى "سهلة الاستخدام".

لا توجد طريقة مختصرة لهذا الطريق. في المستقبل، عندما تستمر الخوارزميات والقدرة الحسابية والأموال والسيناريوهات في إنتاج تفاعل كيميائي، ستنتقل قصة الذكاء الاصطناعي الصينية من صفحة "الاختراق النقطي" إلى صفحة "التطور النظامي".

هذا المقال من حساب WeChat "Lan Dong Business"، المؤلف: يو وييلين

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.