تركز استراتيجية الذكاء الاصطناعي لـ ByteDance لعام 2026 على أربع مجالات رئيسية: نماذج العالم، ونموذج الفيديو Seedance، والبرمجة، وتجزئة DouBao.
كاتب المقال: تشou شين يو
المصدر: 36氪
استنادًا إلى مصادر متعددة، تعلم "الظهور الذكي" أن هناك أربعة محاور مهمة لـ ByteDance AI في عام 2026:
زيادة الاستثمار في تدريب النماذج العالمية، وبحلول نهاية العام، достиг مستوى أداء النموذج مستوى أفضل نموذج عالمي حاليًا، Google Genie 3.
يستمر نموذج الفيديو في الحفاظ على قيادته، واستكشاف اتجاهات جديدة مثل "الإنشاء الديناميكي".
تعزيز أساسيات البرمجة، وتطبيق مبدأ Dogfooding في البرمجة (إعادة تغذية البيانات، التقييم، وتشكيل دورة تحسين مستمرة)، وتحسين قدرات الوكلاء.
تعزيز قدرات豆包 التجارية، مع التركيز على السيناريوهات الرئيسية "المكتبية".
الأرض غير المكتشفة لـ ByteDance: نماذج العالم في مصفوفة الذكاء الاصطناعي لـ ByteDance، هناك Seed 2.0 الذي مكن ByteDance أخيرًا من الدخول إلى الطليعة الأولى للنماذج الكبيرة في الصين، وSeedance 2.0 الذي وصل إلى مستوى SOTA العالمي، بالإضافة إلى أن DouBao حقق تفوقًا كبيرًا على الجانب التطبيقي—ومن مصادر متعددة، تعلمنا أن عدد المستخدمين النشطين اليوميين لـ DouBao وصل إلى 200 مليون بعد عيد الربيع عام 2026.
"لا توجد نقاط ضعف واضحة." هكذا قيم أحد استراتيجيي الذكاء الاصطناعي في شركة كبيرة مصفوفة أعمال بايت دانس في مجال الذكاء الاصطناعي.
لكن بين جميع النماذج، يفتقر إلى النموذج الكبير الذي يُعدّ المفتاح للمرحلة التالية في أبحاث النماذج الكبيرة: نموذج العالم.
أبلغنا عدة أشخاص مقربين من فريق Seed أن ByteDance دخلت سباق نماذج العالم متأخرة. في عام 2024، تولّى تشو تشانغ، الذي انضم حديثًا من علي بابا إلى ByteDance، قيادة أبحاث نماذج العالم.
لكن في ذلك الوقت، كان التقييم الداخلي هو أن مسار النموذج العالمي وسيناريوهات التجارية لم تكن واضحة، والأهم هو الفوز في معركة النماذج المرئية.
حتى عام 2025، أنشأ Byte صغيرًا فريق بحثي لاستكشاف مسار VLA (نموذج الرؤية-اللغة-الحركة) في النماذج العالمية. وكان قائد الفريق اثنين:
أولاً، لي هانغ، مدير مختبر الذكاء الاصطناعي في ByteDance — في أبريل 2025، دُمج مختبر الذكاء الاصطناعي بالكامل (بما في ذلك فريق الروبوتات) داخل Seed، وأحد الأهداف هو تحسين كفاءة التواصل بين النماذج والتطبيقات (الذكاء المتجسد) — بناءً أساسًا على بيانات المحاكاة لتدريب نماذج العالم.
الآخر هو وانغ وينتشيان، باحث متعدد الوسائط في Seed، يركز أساسًا على التدريب باستخدام البيانات الطبيعية.
في عام 2026، وضع وو يونغهوي هدفًا واضحًا لنموذج العالم خلال اجتماع全员 لـ Seed: إطلاق نسخة واحدة على الأقل من نموذج العالم بحلول نهاية عام 2026، بأداء يوازي أفضل نموذج عالمي حاليًا — Genie 3 الذي أطلقته Google في أغسطس 2025.
لكن وفقًا للتقدم الحالي، فإن سرعة المتابعة غير كافية. أخبرنا شخص قريب من Seed أن وو ينغهوي ذكر عدة مرات داخل اجتماعات Seed أن نماذج Word و الذكاء الجسدي لـ Byte لم تحقق التوقعات.
كما كشف أعضاء آخرون من Seed أن التقييم الداخلي أظهر أن الأداء الشامل لنموذج عالم Byte يفتقد بنسبة 10% إلى أحدث المعايير العالمية حتى مطلع عام 2026.
لكن هذه المعركة تمثل المستقبل.
من ناحية أخرى، فإن النماذج العالمية تفتح أمامها أسواق الذكاء الجسدي بحجم يتجاوز مليار دولار أمريكي على الأقل، بالإضافة إلى مشاهد ألعاب وتسلية ذات إمكانيات هائلة.
أشار باحث سابق من Seed إلينا بأن سيناريوهات تطبيق روبوتات بايت دانس السابقة كانت تتركز أساسًا على نقل البضائع والنقل الصناعي، لكن التقييم الداخلي أشار إلى أن السقف كان منخفضًا، "وأن روبوتات الشكل البشري التي تتمتع بإمكانات سوقية أوسع هي الاتجاه الذي سيدخله بايت دانس بالتأكيد."
من ناحية أخرى، لا تزال هناك العديد من الخلافات حول مسار نماذج العالم، بما في ذلك فريق توليد الفيديو، وفريق VLA (نماذج الرؤية-اللغة-الحركة)، وفريق JEPA (التنبؤ بالبكسل).
"بالنظر إلى كثافة المواهب وحجم الاستثمارات في البايت، من المرجح جدًا أن تفوز." قال لنا مستثمر في الذكاء الاصطناعي، "إذا لم تراهن، فستخسر بالتأكيد."
منذ عام 2026، أجرت ByteDance العديد من التعديلات حول تدريب النماذج العالمية بهدف الدخول ضمن الطليعة العالمية.
وفقًا لـ "الظهور الذكي"، بعد عيد الربيع عام 2026، أنشأت Seed مجموعة بحثية جديدة للنماذج العالمية، ويقودها فان هاوتشي، الباحث السابق في مختبر FAIR التابع لـ Meta، ويتقديم التقارير إلى تشو تشانغ، المسؤول عن التعددية النمطية والنماذج العالمية في Seed؛
في الوقت نفسه، تم دمج مجموعتي البحث اللتين كان يقودهما لي هانغ ووانغ وينتشيان، وتمت إدارتهما بشكل موحد تحت تقارير زهو تشانغ.
أبلغ عدة أشخاص مطلعين "البروز الذكي" أن فريق البحث الذي يقوده لي هانغ ووانغ وينتشيان كان يركز بشكل رئيسي على VLA، ويسعى إلى "العفوية" و"الواقعية"، بهدف تطبيقات الذكاء الجسدي؛ بينما يسلك الفريق الجديد بقيادة فان هاوتشي مسار المحاكاة ثلاثية الأبعاد، مع التركيز على تطبيقات الترفيه والألعاب.
بالإضافة إلى توسيع القوى العاملة وطرق الاستكشاف، فإن نموذج العالم يحظى بأعلى مستوى من الاستثمارات المالية مقارنة باتجاهات النماذج الأخرى مثل النصوص والبرمجة والفيديو.
يُلاحظ بوضوح ميزانية البيانات. أخبرنا أحد موظفي منصة ByteDance أن استراتيجية "الكمية" في بيانات التدريب، التي حققت عوائد كبيرة سابقًا على نماذج اللغة الكبيرة (LLM) وSeedance 2.0، يخطط الفريق لتطبيق نفس "استراتيجية بحر البيانات" على تدريب نماذج العالم.
ويقابل ذلك أيضًا استثمارًا أعلى في البيانات — فقد تعلمنا من مصادر متعددة أن ميزانية بايت دانس المخصصة لتدريب نماذج العالم عام 2026 (بما في ذلك VLA ومقاطع الفيديو الطويلة ونمط 3D إلخ) هي الأعلى بين جميع النماذج، وبلغت ملايين اليوان.
ذكر مزود بيانات أن بايتيدو تُخصص في بيانات نماذجها العالمية ما يصل إلى 3-4 أضعاف ما تُخصصه الشركات الأخرى.
البرمجة: السعي وراء قدرات أكثر تطورًا في هندسة البيانات هو أساس، وهو ما يحدد الحد الأقصى لأداء الوكلاء — وقد أصبح هذا إجماعًا في الصناعة.
ذكر عدة أشخاص مطلعين لنا على أهمية ByteDance لـ Coding. "لطالما كانت استثمارات ByteDance في Coding مرتفعة جدًا، وهي ثاني أعلى استثمار بعد نموذج العالم لهذا العام." أخبرنا شخص قريب من Seed مجلة "الظهور الذكي".
على سبيل المثال، سيتم شراء البيانات داخليًا بشكل موجه، أو دراسة عينات بيانات التدريب للنماذج الرائدة في الترميز الخارجي مثل Claude Code و CodeX.
في مؤتمر Force لـ Volcano Engine عام 2025، أشار هونغ دينغكون، نائب الرئيس التقني في ByteDance، أيضًا إلى أن الترميز، كمهمة عالية التهيكل ودقيقة منطقيًا، يتطلب متطلبات عالية على فهم النموذج للهياكل الدلالية المعقدة، والاستدلال المنطقي، وتصميم الخوارزميات، والتعبير الدقيق، ويمكنه دعم استكشاف الحد الأقصى للذكاء النموذجي.
لكن في الخارج، ظل وجود أعمال بيتينغ Coding ضعيفًا. سواء كان نموذج Doubao-Seed-Code المُصدر في نوفمبر 2025 أو أداة البرمجة بالذكاء الاصطناعي Trae المُصدرة في بداية عام 2025، فإن الأداء والضجيج لم يرقيا إلى مستوى GLM 5 من Zhipu و K2 من Moonshot.
يُقيّم أحد المطلعين أن سبب صعوبة تحقيق تقدم في فعالية البرمجة في ByteDance يكمن في غياب تدفق البيانات. نظرًا لحدود قدرات النموذج، لا ترغب أي من الأعمال المرتبطة بـ ByteDance في استخدام Seed-Code.
حتى تطبيق AI Coding Trae، فإن أول النماذج التي تم دمجها كانت DeepSeek وClaude Code، بالإضافة إلى نموذج الترميز الذي تم تدريبه داخليًا في المنتج.
وهذا يؤدي إلى أن نموذج ترميز بايت يفتقر إلى التغذية الراجعة من تطبيقات واقعية.
منذ عام 2026، شعر العديد من موظفي ByteDance بأن مختلف أقسام الأعمال تزيد من دعمها لنموذج Seed. أخبر موظف من فريق Seed "الظهور الذكي" أنه لم يكن لدى ByteDance سابقًا قيود على استخدام أقسام الأعمال لنماذج ترميز طرف ثالث في التطوير، لكن منذ عام 2026، تم إلزام عدة أقسام تطبيقية باستخدام نموذج Seed.
ومع ذلك، فإن سرعة توظيف المواهب من قبل Seed تباطأت قليلاً مع زيادة الاستثمار في البيانات.
أبلغ مُستَشَارُ التوظيف في مجال الذكاء الاصطناعي "الظهور الذكي" أن قسم الموارد البشرية في ByteDance يُرسل إشارات خارجية مفادها أن عصر التوظيف الواسع النطاق والمرتفع الأجر قد انتهى، والآن تكمن المهمة في تطوير وترقية المواهب الشابة وتحسين معاملة خبراء الخوارزميات.
حاليًا، تُفتح فرص التوظيف القليلة المتاحة لـ Seed بشكل رئيسي أمام خبراء الذكاء الاصطناعي من شركات خارجية كبيرة مثل DeepSeek وOpenAI وDeepMind وMeta، مثل غو دايا، العضو الأساسي السابق في DeepSeek، ودونغ شين، الباحث السابق في NVIDIA.
كيف تحتفظ Seedance بمكانتها كأفضل حل في العالم عام 2026؟ الهدف الآخر لـ ByteDance في نماذج الذكاء الاصطناعي هو الحفاظ على مركزية Seedance كأفضل حل عالمي في مجال توليد الفيديو.
قال مؤسس شركة ناشئة في توليد الفيديوهات لـ "الظهور الذكي": "نجاح Seedance 2.0 هو انتصار للبيانات." وقد تبين أن كمية البيانات التدريبية الضخمة وفريق التقييم الذي يضم أكثر من 2000 شخص هما ما أدى إلى الأداء المتميز لـ Seedance 2.0.
لكن الاعتماد المستمر على أسلوب التدريب القائم على "الكمية" يحمل مخاوف خفية. تشير بعض الدراسات إلى ظاهرة "قانون العكس للتوسع" في مجال توليد الفيديو، وببساطة، كلما زادت بيانات التدريب، زاد احتمال أن يصبح النموذج "كسلان" ويتعلم فقط بعض الإطارات الرئيسية، بينما يتجاهل السرد الكامل—وبالتالي، فإن عائدات زيادة كمية البيانات تميل إلى الانخفاض مع تقدم التدريب.
أبلغنا اثنان من المصادر المطلعة على الجانب البيانات أن Seedance قد وصلت إلى الحد الأقصى في التدريب المسبق، ولتحسين الأداء من الآن فصاعدًا، يجب تنقية بيانات التدريب وإجراء تدريب دقيق أكثر بعد التدريب المسبق.
في الوقت نفسه، تعد قدرة "الإنشاء الديناميكي" اتجاهًا جديدًا تركز عليه فرقة Seedance عام 2026.
ما يُسمى بـ"الإنشاء الديناميكي"، أي الفيديوهات التفاعلية، يعني أن المستخدمين يمكنهم إدخال أوامر لتعديل محتوى الفيديو وحبكته في أي وقت. وفي هذا المجال، ظهرت شركة Vivix AI التي تقدر قيمتها بـ1.32 مليار دولار أمريكي (تأسست من قبل ليو يو، المدير السابق للبحث المتقدم في SenseTime).
أبلغ عدة مصادر مطلعة "الظهور الذكي" أن تشو تشانغ كانت دائمًا متفائلة بشأن آفاق تطبيق التوليد الديناميكي.
يمكن تحويل الفيديو التفاعلي إلى ألعاب صغيرة، أو إلى مسلسلات تفاعلية، كما يمكنه أيضًا الربط مع استكشاف نماذج العالم (حيث يُعد توليد الفيديو مسارًا واحدًا من مسارات استكشاف نماذج العالم)، وفقًا لشخص قريب من Seed.
تسريع تجارية دوباء وتوسيعها خارج الصين. قدمت 36Kr تقريرًا حصريًا يفيد بأن دوباء من المقرر أن تطلق محتوى مدفوعًا رسميًا في أواخر يونيو؛ في الوقت نفسه، تخطط دوباء لربط نفسها مع التجارة الإلكترونية على دوين، لتحسين سيناريوهات الدفع.
في بداية مايو 2026، قام DouBao بتحديث خطط الاشتراك المدفوع على App Store، حيث تراوحت أسعار الاشتراك الشهري بين المجاني و500 يوان.
في 3 يونيو، أعلنت Baoding أيضًا عن إطلاق "Baoding Pro" المخصص لاحتياجات الإنتاجية للمحترفين، ويشمل خدمات متخصصة مثل تطوير البرمجيات، وتحليل البيانات، والتصميم المهني، وأتمتة العمليات، وتحليلات المالية، والبحث العلمي.
أفاد عدة مصادر مطلعة أن عدد المستخدمين النشطين اليوميين لـ DouBao تجاوز 200 مليون بعد عيد الربيع. "إن ميزانية التسويق لـ DouBao هذا العام منخفضة جدًا." وفقًا لمصدر مطلع، فإن ارتفاع عدد المستخدمين النشطين اليوميين يسبب تكاليف استدلال وضغوط تشغيلية مرتفعة، وبالتالي فإن دفع DouBao نحو التجارية في هذا الوقت يهدف إلى خفض وتيرة النمو وتحقيق الاستدامة الذاتية.
أما توليد عروض PowerPoint، فهو النقطة المحورية الأساسية التي يبني من خلالها DouBao وعي المستخدمين بالدفع. قال شخص قريب من DouBao لـ "الظهور الذكي": "يهدف DouBao إلى تعزيز وظيفة توليد عروض PowerPoint بهدف فرض رسوم على الموظفين في القطاعات عالية القيمة مثل المالية والقانون." وفي المرحلة القادمة، يخطط DouBao أيضًا لطرح إصدار مؤسسي، وربطه بأنظمة الشركات الداخلية، لكنه لا يزال يناقش داخل الفريق طرق الدمج المحددة.
أشار إلى أن هذه الفكرة مستوحاة من نماذج الأعمال التجارية في الخارج. حاليًا، تم التحقق من مسار التسويق القائم على فرض رسوم على سيناريوهات المكتب في الخارج. وفقًا للبيانات التي كشفت عنها Anthropic، وصل ARR إلى 1 مليار دولار بعد ستة أشهر فقط من إطلاق Claude Code؛ وبعد عام من الإطلاق، وصل ARR في فبراير 2026 إلى 2.5 مليار دولار.
التدفق النقدي الملحوظ الذي أنشأه Claude Code لسيناريوهات تطوير الشركات، مكن Anthropic، التي تأسست بعد OpenAI بست سنوات، من تجاوز ARR الخاص بـ OpenAI في بداية هذا العام.
الآن، المشكلة التي يجب على دوباء حلها هي تحويل تصور المستخدمين لها من "بوابة عامة" يمكنها الإجابة على أي سؤال مجانًا إلى "مساعد مكتبي" يساعدك على تحسين كفاءتك، رغم أنه يتطلب دفعًا.
لكن السوق الذي تسعى豆包 للدخول إليه بدأ يزدحم. أشار أشخاص من豆包 إلى "الظهور الذكي" أنه أثناء البحث مع العملاء المؤسسيين، اكتشفت ByteDance أن سوق أدوات الذكاء الاصطناعي للشركات قد احتله بالفعل العديد من مزودي حلول الذكاء الاصطناعي الصناعية، وسيواجه豆包 المتأخر تكاليف أعلى للحصول على العملاء.
من خلال "البروز الذكي"، تم التعرف على أن التوسع الدولي هو أحد المهام المهمة لـ DouBao هذا العام.
سابقًا، تجاوز عدد المستخدمين النشطين يوميًا لتطبيق Dola النسخة الدولية لـ DouBao عشرة ملايين بنهاية عام 2025. ووفقًا لما علمته "الظهور الذكي"، فإن هدف نمو Dola لعام 2026 هو الوصول إلى 30 مليون مستخدم نشط يوميًا بنهاية العام.
قال مصدر مطلع إن الدول الناطقة بلغات صغيرة هي الأسواق المستهدفة الرئيسية لـ Dola. حاليًا، تم احتلال سوق روبوتات الدردشة الذكية في الخارج بشكل أساسي من قبل ChatGPT وClaude وGemini. إن تجنب المنافسة المباشرة مع "الثلاثة الكبار للذكاء الاصطناعي" في أسواق أوروبا وأمريكا الشمالية والدخول بتمايز إلى أسواق اللغات الصغيرة هي استراتيجية نمو Dola.
تُظهر البيانات الخارجية أنه منذ الربع الثاني من عام 2025، ظهرت Dola بشكل متكرر في قوائم تحميل التطبيقات في إندونيسيا وماليزيا والمكسيك.
——
منذ انضمامه إلى بايت دانس قبل عام، كان هدف وو يونغهوي هو قيادة فريق Seed لتصحيح الأخطاء وتطوير نماذج SOTA في آنٍ واحد. وفي عام 2026، يهدف بايت دانس إلى أن يكون الفائز في كل ساحة من ساحات الذكاء الاصطناعي.
اليوم، بدأت Seed 2.0 وSeedance 2.0 في إظهار نتائجها المبكرة، وستُستخدم خبرات Seed في الهندسة والبيانات والمواهب بطريقة أكثر كفاءة في الحرب الجديدة.
(ساهمت دينغ يينغ يي، مؤلفة "الظهور الذكي"، في هذا المقال.)
