محرك قوة عصر الذكاء الاصطناعي قد تحوّل من النموذج إلى التوكن
على مدار السنتين الماضيتين، ركز السرد الرئيسي في صناعة الذكاء الاصطناعي على "حرب النماذج الكبيرة" التي أطلقتها الشركات الكبرى. انتقل حجم المعلمات من مئات المليارات إلى تريليونات، وزادت تكلفة التدريب من عدة ملايين دولار إلى مئات الملايين، وتم توسيع مجموعات GPU من آلاف البطاقات إلى عشرات الآلاف. كان الجميع يتحدثون عن أي النماذج أقوى وأيها أقرب إلى الذكاء العام الاصطناعي، كأن نقطة النهاية في تنافس الذكاء الاصطناعي هي أداء النموذج الكبير نفسه.
أما مع حلول عام 2026، فقد تغير منطق دفع صناعة الذكاء الاصطناعي. ترى تقرير جي بي مورغان الأحدث أن العامل الحقيقي الذي سيُحفز التوسع المستمر للبنية التحتية للذكاء الاصطناعي في المستقبل لن يكون تدريب النماذج، بل الطلب الهائل على الاستدلال (Inference) للذكاء الاصطناعي. ففي المستقبل، لن تكون النماذج الكبيرة هي الوحيدة التي تستهلك أكبر قدر من قوة الحوسبة، بل ستكون وكلاء الذكاء الاصطناعي المنتشرة عالميًا. فكل استدعاء، وكل تفاعل، وكل تنفيذ للمهمة، يُستهلك في جوهره رموزًا (Token). وتدخل صناعة الذكاء الاصطناعي من "عصر النماذج" إلى "عصر الصناعة الترميزية (Token Industrial Era)".
لأن ما سيقود حقًا عالم الذكاء الاصطناعي في المستقبل ليس النموذج نفسه فحسب، بل النظام المحيط بالرمز المميز (Token) الذي يشمل الإنتاج والتوزيع والجدولة والاستهلاك. خاصة مع بدء ظهور وكلاء الذكاء الاصطناعي (AI Agent) على نطاق واسع، سيصبح السؤال الأهم في صناعة الذكاء الاصطناعي هو كيفية توليد الرموز المميزة في الوقت الفعلي، وتوزيعها عبر المناطق، وجدولتها ديناميكيًا، واستهلاكها بكفاءة.
كما اقترح هوانغ رينشون مؤخرًا، فإن الذكاء الاصطناعي ليس صناعة برمجيات بسيطة، بل هي نظام بنية تحتية مشابه للطاقة والإنترنت. وفي هيكله "الكعكة الخمسية"، يتم تقسيم صناعة الذكاء الاصطناعي إلى خمس طبقات: الطاقة، والرقائق، والبنية التحتية، والنماذج، والتطبيقات. ومع انتقال صناعة الذكاء الاصطناعي تدريجيًا من "عصر التدريب" إلى "عصر الاستنتاج"، فإن GoodVision AI تميل إلى فهم سلسلة القيمة الاقتصادية للذكاء الاصطناعي بأكملها كـ"هيكل كعكة سباعي" يدور حول Token:
الطبقة الأولى: الكهرباء — الأساس الطاقي لعصر الذكاء الاصطناعي
الطبقة الثانية: AIDC — مصنع الرموز
الطبقة الثالثة: GPU — معدات إنتاج Token
الطبقة الرابعة: LLM – محرك إنتاج الرموز
الطبقة الخامسة: توزيع الرموز – "شبكة الكهرباء" في عصر الذكاء الاصطناعي
الطبقة السادسة: تحسين الرموز والجدولة الذكية — دماغ عصر الذكاء الاصطناعي
الطبقة السابعة: وكيل الذكاء الاصطناعي — نقطة استهلاك الرمز المميز
من الطاقة ووحدات معالجة الرسوميات إلى مراكز بيانات الذكاء الاصطناعي وعقد الحافة، ثم إلى استنتاج النماذج والجدولة الذكية، تتشكل صناعة الذكاء الاصطناعي نظامًا صناعيًا "مُرمّزًا" لم يسبق له مثيل.
But at this stage, this system is still far from mature.
يملك البعض أحدث وحدات معالجة الرسوميات (GPU)، لكنهم محدودون بالطاقة؛ ويُنشئ آخرون مراكز ضخمة للذكاء الاصطناعي (AIDC)، لكنهم يفتقرون إلى جدولة فعالة؛ ويُطور آخرون عوامل ذكاء اصطناعي قوية، لكنهم يواجهون تكاليف استنتاج مرتفعة وتأخيرات؛ ويملك آخرون عقدًا حافة، لكنهم لا يستطيعون تكوين شبكة متناسقة ومتكاملة. على الرغم من النمو السريع لسلسلة التوريد بأكملها، إلا أن هناك فجوات وازدواجيات وعوائق كفاءة كبيرة بين الطبقات المختلفة.
ولكن فقط عندما يتم ربط هذه الطبقات السبع من البنية التحتية معًا وتنسيقها وربطها بشكل فعلي، سينتقل قطاع الذكاء الاصطناعي من "عصر الأدوات" اليوم إلى "عصر التبني الواسع النطاق" الخاص بالعالم الذكي.
الطبقة الأولى من الكعكة: الطاقة — وقود عصر الذكاء الاصطناعي
الثورة الصناعية ناضلت من أجل الفحم والنفط، وعصر الإنترنت ناضل من أجل الحركة الخادمة والخوادم، أما في عصر الذكاء الاصطناعي، فإن الحرب الأساسية تعود مرة أخرى إلى الطاقة.
لأن الذكاء الاصطناعي يستهلك في النهاية الكهرباء. إن استهلاك مركز بيانات ذكاء اصطناعي ضخم يقارب استهلاك مدينة متوسطة الحجم. وتواجه مراكز بيانات الذكاء الاصطناعي الجديدة حول العالم نفس المشكلة: يمكن شراء وحدات معالجة الرسوميات، ويمكن بناء الأراضي، لكن إمدادات الكهرباء لا تواكب، كما أن إدارة الشبكة الكهربائية لا تواكب.
وهذا هو السبب في أن越来越多 من شركات الذكاء الاصطناعي تعيد تركيز انتباهها على البنية التحتية للطاقة. في GTC 2026، عرّف هوانغ رينشون مراكز البيانات المستقبلية على أنها "مصانع التوكنات"، حيث سيُنبثق من أعلى سلسلة التوريد في هذه المصانع صناعة طاقة فائقة.
في السوق الصيني، تمثل شركات مثل تشانغجيانغ للطاقة الكهرومائية، والصين للطاقة النووية، والصين للطاقة النووية الواسعة، وطاقة الثلاثة بحيرات، ولونغيوان للطاقة الريحية، وهاودا للطاقة الجديدة، مجالات الطاقة الأساسية مثل الطاقة الكهرومائية، والطاقة النووية، وطاقة الرياح، والطاقة الشمسية. وتشكل الطاقة النووية والطاقة الكهرومائية، بفضل قدرتهما على توفير كهرباء مستقرة، مصادر الطاقة الأساسية الأهم لـ AIDC؛ بينما تستفيد طاقة الرياح والطاقة الشمسية من الطلب المتزايد في قطاع الذكاء الاصطناعي على الطاقة الخضراء ومتطلبات ESG. ومع تقدم مبادرة "الحسبة الشرقية والحساب الغربي" وبناء مراكز بيانات ضخمة للذكاء الاصطناعي، فإن العلاقة التكاملية بين مراكز الطاقة الجديدة ومراكز الحوسبة تتعزز بسرعة.
في السوق الأمريكية، تستفيد كبريات شركات الطاقة التقليدية مثل NextEra Energy وDominion Energy وDuke Energy وSouthern Co. وExelon من توسع مراكز البيانات التي تعتمد على الذكاء الاصطناعي. حيث تُعد NextEra الرائدة في الطاقة الخضراء في أمريكا الشمالية؛ وتسيطر Dominion على موارد نقل الكهرباء الأساسية في "ممر مراكز البيانات" في شمال فرجينيا؛ بينما تصبح Exelon مستفيدة رئيسية من الطلب المتزايد على "طاقة مستقرة على مدار الساعة" بفضل قدرتها على توليد الكهرباء من الطاقة النووية. بشكل عام، فإن قطاع الطاقة العالمي ينتقل تدريجيًا من كونه خدمة عامة تقليدية إلى أن يصبح طبقة الموارد الأساسية في عصر البنية التحتية للذكاء الاصطناعي.

بشكل عام، فإن مشهد المنافسة في هذا المستوى يتحول من "منافسة أسعار الكهرباء" بين شركات الطاقة التقليدية إلى "منافسة على حق تأمين الطاقة" بين مراكز بيانات الذكاء الاصطناعي من الطرف السفلي، ومزودي السحابة، وشركات الطاقة. من يستطيع تأمين طاقة طويلة الأجل ومستقرة ومنخفضة التكلفة، يمتلك أول جوهرة التنين لإنتاج التوكنات.
الطبقة الثانية من الكعكة: AIDC — مصنع مواد التوكن
لا معنى لوحدة GPU واحدة، المهم حقًا هو مجموعات التحجيم. وهكذا ظهرت AIDC.
إنها مثل مصانع الصلب ومحطات الطاقة وخطوط التجميع في العصر الصناعي، حيث تجمع آلاف وحدات GPU معًا لتشكيل قدرة إنتاج ثابتة للرموز. لكن مشاكل المصانع بدأت تظهر: غالبًا ما يستغرق بناء مراكز بيانات الذكاء الاصطناعي التقليدية ما بين 18 إلى 36 شهرًا، وقد يستغرق توسيع شبكة الكهرباء وقتًا أطول. عندما تنمو متطلبات الذكاء الاصطناعي بوتيرة أسية، لم يعد معدل بناء مراكز البيانات في العصر القديم قادرًا على تلبية احتياجات الاقتصاد الجديد للرموز.
في سوق الأسهم الأمريكية، تُعد Equinix واحدة من أبرز مشغلي مراكز البيانات على مستوى العالم، حيث تمتلك أكثر من 240 مركز بيانات في أكثر من 30 دولة. إن ميزتها الأساسية لا تقتصر فقط على عدد مراكز البيانات، بل تكمن في قدرتها العالمية على الاتصال وموارد الشبكة منخفضة التأخير، مما يجعلها عقدًا أساسيًا في بنية التخزين الحاسوبي للذكاء الاصطناعي.
تقوم Digital Realty بالدخول إلى بنية تحتية للذكاء الاصطناعي من خلال منصة PlatformDIGITAL، وتشمل عملائها مزودي السحابة الكبيرة والمؤسسات المالية.
في السوق الصيني، تعد رونزي تكنولوجيا واحدة من أكثر مشغلي AIDC تمثيلاً في أسهم A. لقد تطورت أنشطتها الأساسية تدريجياً من IDC التقليدي إلى مراكز الحوسبة للذكاء الاصطناعي، وتكمن قدرتها التنافسية الأساسية في مراكز البيانات الكبيرة وموارد الطاقة وقدرات صيانة AIDC. وفي الوقت نفسه، تواصل شركات مثل أوفيه داتا وشانغهاي أونلاين التوسع في مجالات مراكز البيانات الإقليمية والبنية التحتية السحابية واستضافة حوسبة الذكاء الاصطناعي. أما شينغوا سونغ، فتركز نشاطها في AIDC على التعاون مع القطاعين الحكومي والتجاري وأبحاث العلوم.
أما الفئة الأخرى من اللاعبين، فهي تأتي من "التحول من مناجم التعدين". فشركات مثل CoreWeave وIREN وApplied Digital وCipher Mining، التي كانت في الأصل مرتبطة بكثير من أنشطة تعدين العملات المشفرة، انتقلت بسرعة نحو بنية تحتية لقوة الحوسبة الخاصة بالذكاء الاصطناعي مع ارتفاع الطلب على وحدات معالجة الرسومات (GPU) للذكاء الاصطناعي. وتُركّز IREN على نموذج "الطاقة الخضراء + قوة الحوسبة للذكاء الاصطناعي"، من خلال بناء مراكز بيانات عالية الكثافة لوحدات GPU باستخدام الطاقة المتجددة. كما تقوم Applied Digital وCipher Mining أيضًا بالتحول من مناجم التعدين التقليدية إلى بنية تحتية للحوسبة عالية الأداء للذكاء الاصطناعي.

بالإضافة إلى ذلك، بدأت مصانع الذكاء الاصطناعي المُهمَّشة والصغيرة والقابلة للتقسيم تصبح اتجاهًا جديدًا. تمامًا كما انتقل عصر الإنترنت من الحواسيب الضخمة إلى الحوسبة السحابية، فإن قوة معالجة الذكاء الاصطناعي تحتاج إلى الانتقال تدريجيًا من العقد المركزية الضخمة نحو عقد حافة إقليمية.
لذلك، اختارت GoodVision AI مسارًا آخر: بناء مصنع ذكاء اصطناعي أكثر خفة ووحداتية وقابلًا للنسخ السريع. مقارنةً بمراكز البيانات الضخمة التقليدية للذكاء الاصطناعي، تركز GoodVision AI بشكل أكبر على قدرة النشر الإقليمي، وكفاءة مجموعات GPU عالية الكثافة، والتكامل المتناغم بين الطاقة والقدرة الحسابية.
المنطق الأساسي ليس بناء مركز بيانات ضخم واحد، بل نشر عقد AI Factory بسرعة في المناطق ذات الكثافة السكانية العالية، عادةً ما تكون مراكز حسابية للاستنتاج بسعة 2-4 ميغاواط. هذا النموذج لا يسمح فقط بالوصول الأسرع إلى موارد الطاقة المحلية، بل يتناسب أيضًا مع اتجاه انتشار طلبات الاستنتاج الخاصة بالذكاء الاصطناعي نحو الحافة في المستقبل.
إذا كان AIDC التقليدي يشبه مصانع الصلب الضخمة في العصر الصناعي، فإن ما بنته GoodVision AI يشبه أكثر "مصنع رموز إقليمي" في عصر الذكاء الاصطناعي—أخف، وأكثر مرونة، وأقرب إلى المستخدم، وأكثر ملاءمة لاتجاه تطوير شبكة الاستدلال الموزعة عالميًا في المستقبل.
الطبقة الثالثة من الكعكة: GPU — معدات إنتاج التوكن
إذا كانت الكهرباء هي الطاقة، فإن GPU هي معدات الإنتاج. في السنوات الأولى من الانفجار في مجال الذكاء الاصطناعي، كانت GPU تخدم بشكل رئيسي التدريب؛ لكن في المستقبل، ستكون الطلب الأكبر من الاستدلال. لأن التدريب يقتصر على عدد قليل من الشركات الرائدة، بينما سيتسرب الاستدلال إلى كل تطبيق، وكل جهاز، وكل طرفية. تحتاج الروبوتات إلى الاستدلال، وتحتاج السيارات ذاتية القيادة إلى الاستدلال، وتحتاج نظارات الذكاء الاصطناعي إلى الاستدلال، وحتى التعاون المستقبلي بين وكلاء الذكاء الاصطناعي سيستهلك التوكنات في الوقت الفعلي.
تظل NVIDIA حاليًا اللب الأساسي لصناعة شرائح الذكاء الاصطناعي العالمية. إن منتجات GPU الخاصة بها مثل H100 وB200 وBlackwell تُعرّف تقريبًا المعايير العالمية الحالية للتدريب والاستدلال في مجال الذكاء الاصطناعي. والأهم من ذلك، أن NVIDIA لا تبيع الشرائح فحسب، بل بنت أيضًا نظامًا بيئيًا كاملًا عبر مجموعات البرمجيات والعتاد مثل CUDA وTensorRT وDGX وHGX، وبالتالي فإن منافسيها لا يحتاجون فقط إلى التحدي من حيث أداء GPU، بل أيضًا إلى التحدي الكامل للنظام البيئي للبرمجيات الخاصة بالذكاء الاصطناعي.
AMD هي المنافس الرئيسي الحالي في مجال وحدات معالجة الرسومات، وتشمل منتجاتها الأساسية وحدات معالجة الرسومات للذكاء الاصطناعي مثل MI300X. مقارنةً بـ NVIDIA، تُركز AMD على البيئة المفتوحة ومنصة البرمجيات ROCm، بهدف جذب مطوري الذكاء الاصطناعي والعملاء المؤسسيين من خلال نهج أكثر انفتاحًا.
تمثل Broadcom و Marvell مسارًا آخر — ASIC والاتصالات عالية السرعة. مع تعقيد مشاهد الاستنتاجات الخاصة بالذكاء الاصطناعي، بدأت المزيد من الشركات في تجربة تصميم شرائح ASIC مخصصة للحصول على كفاءة طاقية أعلى وتكاليف أقل.
تدخل إنتل سوق الذكاء الاصطناعي من خلال معالجات الخوادم وبطاقات تسريع Gaudi AI، وتأمل في الاستفادة من بيئتها الخاصة بالمعالجات لإعادة المشاركة في منافسة البنية التحتية للذكاء الاصطناعي.
في السوق الصيني، تُعد كامبريدج إنترناشيونال أحد أكثر الشركات تمثيلاً للرقائق الصينية الصنع للذكاء الاصطناعي، وتُركّز على رقائق سين يوان للذكاء الاصطناعي، وبنية إطار عمل ذكاء اصطناعي مطورة ذاتياً تُسمى Neuware. أما هاوجوانغ إنفو، فتمتلك ترخيصاً لتصميم AMD Zen، وتُركّز بشكل رئيسي على سوق DCU وتقديم استنتاجات الذكاء الاصطناعي.
شركات GPU صينية مثل Moortec و Suanyuan Technology و Muxi Shares و Biren Technology تمثل اتجاه "الاستبدال المحلي" للرقائق الصينية للذكاء الاصطناعي. وتشدد هذه الشركات بشكل عام على التوافق مع بيئة CUDA وتحاول بناء مجموعات GPU محلية.

من بيئة CUDA إلى ذاكرة HBM، ثم إلى نواة Tensor، فإن جوهر صناعة الذكاء الاصطناعي بأكملها هو في الواقع تحسين كفاءة إنشاء الرموز (Token) في وحدة الزمن. في الوقت نفسه، فإن وحدات المعالجة الرسومية (GPU) والبنية التحتية المرتبطة بها مثل الخوادم، وحدات الضوء، والتبريد السائل، والمفاتيح التبديلية، مرتبطة ارتباطًا وثيقًا بكفاءة إنتاج الرموز (Token).
هذه الأشياء ليست ببريق شركات مثل NVIDIA وOpenAI، لكنها تحدد ما إذا كان عالم الذكاء الاصطناعي بأكمله قادرًا على العمل فعليًا. تمامًا كما لم تكن الثورة الصناعية مجرد اختراع للبخار، بل احتاجت أيضًا إلى السكك الحديدية والشبكات الكهربائية والموانئ. الثورة الذكية الاصطناعية لن تكون مجرد ثورة برمجية، بل هي ترقية عالمية لسلسلة التوريد تشمل الطاقة والرقائق والشبكات والحوسبة السحابية والبنية التحتية.

فييرتيف هي الشركة الرائدة عالميًا في أنظمة UPS وإدارة الطاقة لمراكز البيانات، وتقدم حلولًا لتزويد مراكز البيانات بالطاقة، وتوزيع الطاقة في الخزائن، وأنظمة التكييف الدقيق.
إنويك هي الشركة الرائدة في الصين في مجال أنظمة التبريد السائل والتحكم في درجة الحرارة في سوق الأسهم A، وعملاؤها يشملون شركات الإنترنت الكبرى مثل BAT. مع ارتفاع قوة GPU، يصبح التبريد السائل معيارًا مهمًا لمرافق الذكاء الاصطناعي (AIDC).
تتمتع شركات مثل Zhongheng Electric و Kehua Data و Kstar بمكانة مهمة في مجالات أنظمة UPS وأنظمة الطاقة وتزويد مراكز البيانات بالطاقة.
في مجال الشبكات ووحدات الضوء، تستفيد شركات مثل Zhongji Xuchuang و Xinyisheng و Tianfu Communications من الطلب المتزايد بشكل كبير على الاتصالات عالية السرعة داخل مجموعات الذكاء الاصطناعي.
أما في مجال الخوادم الكاملة، فتتحمل شركات مثل Dell وHPE وSupermicro وLenovo وInspur مسؤولية التجميع والتسليم الكبيرة للخوادم الخاصة بالذكاء الاصطناعي.
على الرغم من أن هذه الطبقة لا تواجه المستخدم النهائي مباشرة، إلا أنها تحدد ما إذا كان يمكن لبنية تحتية للذكاء الاصطناعي أن تعمل بثبات فعلي. التبريد السائل، وحدات الطوارئ غير المنقطعة، ووحدات الضوء، والمفاتيح، والتخزين الطاقي وخوادم كاملة، تصبح مثل السكك الحديدية والشبكات الكهربائية والموانئ في العصر الصناعي، الأعمال الحقيقية "لبيع المجرف" في عالم الذكاء الاصطناعي.
الطبقة الرابعة من الكعكة: LLM – محرك إنتاج التوكنات
يحدد نموذج اللغة الكبير (LLM) كيفية فهم وتكوين وتنظيم الرموز. على مدار العامين الماضيين، أطلقت شركات مثل OpenAI وAnthropic وGoogle وMeta وxAI وDeepSeek سباقًا عالميًا على النماذج الكبيرة. حيث انتقل حجم المعلمات من مئات المليارات إلى تريليونات، وتوسعت قدرات النماذج من توليد النصوص إلى تعددية الوسائط والاستدلال والبرمجة وتعاون الوكلاء والذاكرة الطويلة الأمد.
لكن مع تطور الصناعة، بدأ السوق يدرك أن ما سيصبح مهمًا حقًا في المستقبل لن يكون فقط "من يمتلك أكبر نموذج"، بل من يستطيع تشغيل النموذج باستمرار بتكلفة أقل وكفاءة أعلى. فبحد ذاته، لا يخلق النموذج قيمة مباشرة، بل إن العملية الاستدلالية الناتجة عن استدعاء النموذج باستمرار هي التي تخلق القيمة.
وهذا يعني أن نماذج اللغة الكبيرة تنتقل تدريجيًا من "عرض قدرات النموذج" في الماضي إلى أن تصبح "محرك إنتاج الرموز" في عالم الذكاء الاصطناعي.
تتنافس النماذج المغلقة والمفتوحة المصدر مثل OpenAI وAnthropic وGoogle Gemini وMeta Llama على بوابة مستقبل نظام الذكاء الاصطناعي؛ بينما تبدأ لاعبون ناشئون مثل DeepSeek بإعادة تشكيل مشهد المنافسة في الصناعة من خلال تكاليف أقل وكفاءة استدلال أعلى. الآن، يتحول التنافس على مستوى نماذج اللغة الكبيرة تدريجيًا بعيدًا عن التركيز فقط على عدد المعلمات، وتتحول معايير التقييم تدريجيًا إلى مقارنات متعددة الأبعاد:
تكلفة الرمز
كفاءة الاستدلال
سياق القدرة
التعاون بين عوامل متعددة
Long-term memory
قدرة النموذج على التكامل مع البنية التحتية

في عصر الذكاء الاصطناعي، المهم حقًا ليس فقط أن تكون النماذج الكبيرة "ذكية"، بل ما إذا كان يمكن تشغيلها على نطاق عالمي وباستمرار وبتكلفة منخفضة. لدى GoodVision AI أيضًا حلول تحسين خاصة بها على هذا المستوى: من خلال التعاون مع مصنعي النماذج الكبيرة، يتم نشر النماذج الكبيرة في مراكز بيانات AI Factory، مما يحول الأعمال من تأجير قوة الحوسبة التقليدية إلى تقديم خدمات Token مباشرة؛ هذا لا يزيد فقط من هامش الربح، بل يجعل تجربة المستخدم أكثر ودية أيضًا.
الطبقة الخامسة من الكعكة: توزيع الرموز – "شبكة الكهرباء" في عصر الذكاء الاصطناعي
بعد اكتمال AIDC، ظهر السؤال التالي: كيف يمكن استخدام هذه القدرة الحاسوبية من قبل العالم بأسره؟
وهكذا ظهرت منصات تأجير القوة الحسابية. فهي تشبه "نظام الشبكة الكهربائية" في عصر الذكاء الاصطناعي، حيث تُفكك موارد GPU المركزية وتوزعها، ثم تُؤجر حسب الطلب للمطورين والشركات وتطبيقات الذكاء الاصطناعي.
تظل AWS وAzure وGoogle Cloud وعلي بابا كلاود وتينسنت كلاود اللاعبين الأكثر قوة في هذا الطبقة. فهي تمتلك أكبر بنية تحتية للحوسبة السحابية عالميًا، وتدمج موارد AI GPU تدريجيًا في أنظمتها الخاصة للبنية التحتية كخدمة (IaaS).
لكن في الوقت نفسه، بدأت مجموعة من "السحابات الأصلية للذكاء الاصطناعي" في الازدهار بسرعة. شركات مثل CoreWeave وNebius وNscale، التي بنت منصات سحابية مبنية على GPU خصيصًا لاحتياجات تدريب واستنتاج الذكاء الاصطناعي. مقارنةً بشركات السحابة التقليدية، فهي أكثر مرونة، وأكثر تركيزًا على مهام الذكاء الاصطناعي، وأكثر كفاءة في تحسين مجموعات GPU.
CoreWeave هي واحدة من أكثر الشركات تمثيلاً لـ NeoCloud حاليًا. بدأت بتركيزها على تعدين الإيثيريوم، ثم انتقلت بالكامل إلى خدمات سحابة GPU للذكاء الاصطناعي، وهي الآن واحدة من الشركات الرائدة في البنية التحتية للذكاء الاصطناعي التي تدعمها NVIDIA بشكل مكثف.
تستهدف منصات السحابة الخفيفة مثل DigitalOcean وVultr المطورين والشركات الناشئة الصغيرة والمتوسطة، مع التركيز على النشر السريع وخدمات GPU منخفضة التكلفة.
في السوق الصيني، تُعد شركات مثل UCloud، Kingsoft Cloud، وCapital Online، بخلاف الشركات العملاقة، موردين رئيسيين في سوق تأجير GPU السحابي وقوة الحوسبة للذكاء الاصطناعي. إن هيكل المنافسة في هذا المستوى يشبه تمامًا شبكة الكهرباء في مراحلها المبكرة: كيفية توزيع قوى الحوسبة المتناثرة بكفاءة.

الطبقة السادسة من الكعكة: تحسين الرموز والجدولة الذكية — دماغ عصر الذكاء الاصطناعي
ربما تكون هذه الطبقة من "الكعكة" الأقل تقديرًا ولكن الأكثر أهمية. مع الانفجار في استخدام الوكلاء الذكاء الاصطناعي، اكتشف الناس أن ليس كل المهام تستحق استدعاء النموذج الكبير الأغلى. العديد من المهام البسيطة يمكن إنجازها بواسطة نماذج محلية؛ والعديد من المهام في الوقت الفعلي أكثر ملاءمة للاستدلال الطرفي؛ والعديد من المهام المتعلقة بالخصوصية لا يمكن حتى رفعها إلى السحابة. بعد سؤال "هل هناك قوة حوسبة؟"، ظهر سؤال آخر، وهو "كيف نستخدم قوة الحوسبة بذكاء أكبر؟"
مع النمو الأسي في الطلب على الرموز، فإن "جعل النموذج المناسب، على القوة الحسابية المناسبة، يعالج المهمة المناسبة" هو المفتاح لاستخدام الرموز بشكل منطقي وفعال. وهذا بالضبط أحد الاتجاهات التي تسعى GoodVision AI لتحقيقها بالإضافة إلى تطوير مصانع رموز الذكاء الاصطناعي.
مثل نظام الكهرباء اليوم: بعض الطلب يأتي من الشبكات الكبيرة؛ وبعض الطلب يأتي من الألواح الشمسية على الأسطح. أما ما يهم حقًا، فهو الطبقة الوسطى من "نظام التوزيع الذكي".
سيكون بنية الذكاء الاصطناعي المستقبلي هي نفسها: تُنفَّذ المهام البسيطة بواسطة نماذج صغيرة محلية، وتُستدعى المهام المعقدة من نماذج كبيرة سحابية، وتُعالج المهام ذات الخصوصية العالية على الحافة، وتُوزَّع المهام ذات التزامن العالي عبر التخطيط الديناميكي الهجين للسحابة.
بالإضافة إلى Goodvision AI، فإن شركات مثل Qingyun Technology و Lambda و OpenRouter و Fireworks AI هي أيضًا رائدة في تحسين الرموز والتوزيع الذكي.
وهناك تداخل كبير بين لاعبي هذه الطبقة من "الكعكة" والطبقتين السابقتين — AIDC وتأجير القوة الحسابية. مع استمرار توسع موارد GPU وعقد المناطق وحجم مهام الاستنتاج، لم يعد "امتلاك القوة الحسابية" كافيًا لبناء حواجز طويلة الأمد. وبدأت越来越多 من مشغلي AIDC ومنصات GPU السحابية تدرك أن العامل الحقيقي الذي سيحدد الكفاءة والأرباح في المستقبل ليس فقط عدد GPU، بل كيفية التوزيع الديناميكي للنماذج والقوة الحسابية وتدفق الرموز.
لذلك، بدأت العديد من المنصات التي كانت تركز سابقًا على AIDC وGPU السحابي في التوسع نحو "طبقة التوزيع الذكي". على سبيل المثال، تسعى شركات مثل UCloud وCapital Online وSugon في السوق الصينية إلى دمج بنية تحتية لـ GPU سحابية، وموارد متعددة السحابات، وقدرات جدولة الاستنتاج، تدريجيًا من "بيع القوة الحسابية" إلى "تحسين القوة الحسابية".

الطبقة السابعة من الكعكة: النماذج والوكلاء – مستهلكو الرموز
رغم أن هذه الطبقة الأقرب إلى المستخدمين وأسهلها في جذب الحركة، إلا أن المنافسة فيها أيضًا الأكثر شدة. في GTC 2026، طرح هوانغ رينشون وجهة نظر مفادها أن كل شركة في المستقبل ستُصبح "منتجة للرموز واستهلاكة للرموز".
يمكن لوكيل ذكاء اصطناعي أن يستدعي في نفس الوقت نماذج متعددة وأدوات متعددة وواجهات برمجة تطبيقات متعددة، ويستمر في إجراء الاستدلال والتخطيط والتنفيذ. وهذا يعني أن كمية الرموز التي يستهلكها الذكاء الاصطناعي في المستقبل ستتجاوز بكثير حجم المحادثات الحالية بين البشر والذكاء الاصطناعي. بعض المستخدمين المكثفين للذكاء الاصطناعي اليوم يبنون أنظمة متزامنة متعددة الوكلاء تتفاعل مع بعضها البعض، ويشكل استهلاكهم اليومي لـ 1 مليار رمز أمرًا طبيعيًا تمامًا.
ليس المستقبل هو استخدام مليار شخص للذكاء الاصطناعي، بل مليارين أو حتى تريليون عامل ذكي اصطناعي يعملون معًا ويستدعيون بعضهم البعض. وسيتحول العائق الحقيقي من "قدرة النموذج" إلى "كفاءة جدولة الرموز".
بالطبع، الشركات التكنولوجية الكبرى مثل Microsoft و Google و Meta و Amazon تدمج قدرات الذكاء الاصطناعي تدريجيًا في جميع منتجاتها من خلال أنظمة المكاتب والبحث والشبكات الاجتماعية والخدمات السحابية.
تتقدم شركات البرمجيات المؤسسية مثل Adobe وSalesforce وServiceNow وPalantir بسرعة في مجال وكلاء الذكاء الاصطناعي المؤسسية وسير العمل التلقائي. في الوقت نفسه، تصبح Hugging Face "Github" عصر الذكاء الاصطناعي. فهي ليست فقط مجتمعًا للنماذج، بل أيضًا بنية تحتية مهمة لبيئة تطوير الذكاء الاصطناعي العالمية.
في السوق الصيني، تُطلق شركات مثل iFlytek وKunlun Tech و360 وKingsoft Office وSenseTime استراتيجياتها حول مساعدين ذكيين، وأدوات مكتبية ذكية، ووكلاء ذكيين.
عندما يتشكل "الكعكة السبع طبقات" حقًا، سيبدأ عالم الذكاء الاصطناعي حقًا
صناعة الذكاء الاصطناعي اليوم لا تزال تقع ضمن نظام بنية تحتية لم يكتمل نضجه بعد.
يملك البعض أحدث وحدات معالجة الرسوميات (GPU)، لكنهم محدودون بالطاقة؛ ويُنشئ آخرون مراكز ضخمة للذكاء الاصطناعي (AIDC)، لكنهم يفتقرون إلى جدولة فعالة؛ ويُطور آخرون نماذج ووكلاء قوية، لكنهم يواجهون تكاليف استنتاج مرتفعة وتأخيرات؛ ويملك آخرون عقدًا حافة، لكنهم لا يستطيعون تكوين شبكة متكاملة ومتناسقة.
من الكهرباء وAIDC وGPU إلى LLM وتوزيع الرموز والجدولة الذكية ووكلاء الذكاء الاصطناعي، على الرغم من أن سلسلة صناعة الذكاء الاصطناعي بأكملها تشهد نموًا سريعًا، إلا أن هناك فجوات وازدواجية وحواجز كفاءة كبيرة بين المستويات المختلفة.
ولكن فقط عندما يتم بناء هذه "الكعكة السبع طبقات" بالكامل وبدء عملها بتناغم فعّال، ستدخل صناعة الذكاء الاصطناعي حقًا من "عصر الأدوات" الحالي إلى "عصر التبني الواسع النطاق" الخاص بالعالم الذكي.
في عالم الذكاء الاصطناعي المستقبلي، لن يكون الأمر مقتصرًا على عدد قليل من شركات التكنولوجيا الكبرى التي تدرّب نماذج كبيرة، بل سيكون مكونًا من مليارات وكلاء الذكاء الاصطناعي المتصلين باستمرار، والمتعاونين باستمرار، والمستخدمين للطاقة الحاسوبية والرموز باستمرار. كل محادثة، وكل استدلال، وكل استدعاء لأداة، وكل تنفيذ تلقائي للمهام، يتوافق خلفه مع تشغيل متكامل للطاقة، ووحدات معالجة الرسوميات، والشبكة، وأنظمة الجدولة، وعقد الاستدلال.
وهذا يعني أيضًا أن صناعة الذكاء الاصطناعي تتطور تدريجيًا من "المنطق البرمجي" السابق إلى نظام صناعي ضخم يغطي الطاقة والرقائق والحوسبة السحابية وشبكات الحافة والجدولة الذكية.
كما أن الثورة الصناعية لم تكن تحتاج فقط إلى المحرك البخاري، بل أيضًا إلى السكك الحديدية، وشبكات الكهرباء، والموانئ؛ وكذلك فإن الثورة الرقمية لم تكن تحتاج فقط إلى أجهزة الكمبيوتر، بل أيضًا إلى الألياف البصرية، ومراكز البيانات، والحوسبة السحابية. علامة نضج الثورة الذكية الحقيقية لن تكون مجرد تطبيق شهير واحد، بل ستكون بدء تشكيل "شبكة بنية تحتية ذكية" عالمية قادرة على إنتاج وتوزيع وتنسيق واستهلاك الرموز بشكل مستمر.
وعندما تُربط هذه الطبقات السبع من البنية التحتية معًا في النهاية، سيُعاد تشكيل منطق المنافسة في صناعة الذكاء الاصطناعي بالكامل. ربما لا تكون الشركات الأكثر أهمية في المستقبل هي تلك التي تمتلك أكبر النماذج فحسب، بل تلك القادرة على ربط الطاقة والحوسبة والشبكة والنماذج وتدفق الرموز.

