انخفاض أسعار النموذج الصيني للذكاء الاصطناعي، وتوسيع فجوة التكلفة مع المنافسين الأمريكيين

CoinDesk تقرير:

وأفادت وسائل إعلام أجنبية أن شركات الصين الرائدة في نماذج الذكاء الاصطناعي قلّلت مؤخرًا أسعار واجهات برمجة التطبيقات، حيث أعلنت DeepSeek و Xiaomi عن ترتيبات تسعير جديدة، في حين تتجه نماذج المختبرات الرائدة في الولايات المتحدة نحو أسعار أعلى. وهذا يوسع الفجوة بين النماذج المتقدمة في الصين والولايات المتحدة من حيث تكلفة الاستنتاج.

بالنسبة للعملاء المؤسسيين، فإن سعر النموذج يُظهر بشكل رئيسي من خلال تكلفة واجهة برمجة التطبيقات المحسوبة حسب الرمز. بعد توصيل التطبيق بالنموذج، تنشأ تكاليف من المدخلات والمخرجات وحالات التخزين المؤقت الناجحة، وبالتالي فإن أي تغيير في السعر_unitي يؤثر مباشرة على الجدوى التجارية للمنتج الذكي.

ديب سيك تخفض الأسعار بالتزامن مع شاومي

DeepSeek قام في 22 مايو بتحويل الخصم البالغ 75% على V4-Pro إلى سعر دائم. بعد التعديل، أصبح سعر الإدخال للنموذج 0.435 دولار لكل مليون توكين، وسعر الإخراج 0.87 دولار.

في 26 مايو، خفّضت Xiaomi سعر واجهة برمجة تطبيقات MiMo-V2.5، حيث انخفض سعر الإدخال لنسخة Pro من 0.0036 دولار لكل مليون توكن، مع انخفاضات تصل إلى 99% في بعض المشاريع. وفقًا لخطة التسعير الجديدة من Xiaomi، زاد عدد التوكنات التي يمكن الحصول عليها بنفس السعر بنسبة 5 إلى 8 أضعاف.

التخفيض يعود إلى تحسين الاستدلال

تشير المقالة إلى أن هذه الخفض في الأسعار ليس مجرد إجراء تسويقي. وقال روفولي، رئيس فريق MiMo في Xiaomi والمطور الأساسي السابق في DeepSeek، إن التوفير الرئيسي يأتي من تحسينات في التخزين المؤقت وإطار الاستدلال. يمكن للنظام إعادة استخدام معلومات أكثر تم معالجتها مسبقًا، مما يقلل من الحسابات المتكررة، وبالتالي خفض تكاليف التخزين والاستدلال.

وفقًا لقولهم، أدت التحسينات ذات الصلة إلى زيادة ملحوظة في قدرة معالجة التوكنات المخزنة مؤقتًا، مع انخفاض تكلفة التخزين والمعالجة الإجمالية بنسبة حوالي 80%. عند أسعار API الجديدة، يمكن للمحرك الاستنتاجي في بيئة الإنتاج تحقيق التوازن بين الإيرادات والتكاليف تقريبًا حتى عند التشغيل بالقرب من الحد الأقصى للسعة.

أما نهج DeepSeek، فهو يقلل تكلفة حساب السياق من خلال ضغط بنية النموذج. وتشير المقالة إلى أن V4 تستخدم آليتي انتباه متناوبة، مما يقلل بشكل ملحوظ حجم ذاكرة التخزين المؤقت KV في سيناريوهات السياق الطويل، ويخفض تكلفة الاستدلال لكل رمز. ففي حسابات السياق بمليون رمز، لا تتجاوز ذاكرة التخزين المؤقت KV لـ V4-Pro حوالي عشرة بالمئة من نظيرتها في الجيل السابق، وتبلغ تكلفة الاستدلال لكل رمز حوالي 27% من الجيل السابق.

Prices of U.S. models move in opposite directions

تشير المقالة إلى أن النماذج الرائدة في الولايات المتحدة لم تتبع اتجاه خفض الأسعار مؤخرًا. فقد رفعت OpenAI سعر الإخراج لـ GPT-5.5، الذي أُطلق في أواخر أبريل، إلى 30 دولارًا لكل مليون توكين، أي حوالي ضعف السعر السابق. بينما ظل سعر Claude Opus 4.7 من Anthropic دون تغيير، إلا أن تحديث مُقسّم التوكينات يعني أن نفس النص قد ينتج عددًا أكبر من التوكينات، مما قد يزيد الفاتورة الفعلية بنسبة تصل إلى 35%.

على النقيض، حصل DeepSeek V4-Pro على 80.6% في معيار الكود SWE-Verified، وهو قريب من 80.8% لـ Claude Opus 4.6، لكن فرق السعر بين الإخراج يصل إلى عدة أضعاف. بعد آخر تعديل للأسعار، وصلت Xiaomi MiMo-V2.5-Pro أيضًا إلى نفس سعر الإدخال والإخراج لـ DeepSeek V4-Pro.

كما ذكر المقال، فإن شركات النماذج الصينية الأخرى مثل MiniMax و Moonshot AI و Z.AI تحافظ أيضًا على أسعار منخفضة. وفقًا للمقارنة الواردة في المقال، فإن فرق السعر بين النماذج المتقدمة في الصين والولايات المتحدة في الربع الثاني من عام 2026 يتراوح تقريبًا بين 15 و 30 ضعفًا؛ وإذا تم احتساب خصومات التخزين المؤقت، فسيتوسع هذا الفرق أكثر.