أطلقت علي بابا كلاود التخزين المؤقت الضمني لـ Qwen3.7-Max، مما يقلل تكاليف الإدخال بنسبة تصل إلى 80%

icon MarsBit
مشاركة
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconملخص

expand icon
تُقدّم علي بابا كلاود التخزين المؤقت الضمني لـ Qwen3.7-Max، مما يقلل تكاليف الإدخال بنسبة تصل إلى 80%. التحديث متاح الآن على BaiLian، دون الحاجة إلى أي تغييرات في الكود. الآن، تكلفة_hits في التخزين المؤقت تساوي 20% من رموز الإدخال، وهو مثالي لسير العمل النصية الطويلة وسير العمل الخاصة بالوكلاء. قد تستفيد قوائم الرموز الجديدة من هذا الدعم الكفوء. كما يدعم النموذج التخزين المؤقت الصريح بنسبة 10%، لكنه يتطلب إعدادًا يدويًا. غالبًا ما تُبرز أخبار أسعار العملات المشفرة مثل هذه الابتكارات القائمة على خفض التكاليف.

وفقًا لمراقبة Beating، أعلنت فرقة Qwen التابعة لعلي بابا عن تمكين التخزين المؤقت الضمني التلقائي بشكل افتراضي للنموذج الرائد Qwen3.7-Max على منصة BaiLian التابعة لعلي سحابة. لا يحتاج المطورون إلى تعديل الكود أو تحديد معلمات إضافية للتمتع بتخفيض التكاليف الناتج عن التخزين المؤقت. في آلية التسعير الجديدة، سيتعرف النظام تلقائيًا على البادئات السياقية المكررة في الطلبات. عند حدوث تطابق في التخزين المؤقت، تُفرض تكلفة رموز الإدخال الخاصة بالجزء المطابق فقط بنسبة 20% من السعر الأصلي، مما يلغي مباشرة 80% من تكلفة الإدخال. يُستهدف التخزين المؤقت الضمني بشكل مباشر التكاليف الهائلة في سيناريوهات النصوص الطويلة ووكلاء Agent. عند تشغيل مهام متقدمة مثل الترميز الذاتي، يحتاج Qwen3.7-Max ذو نافذة سياقية بطول مليون رمز إلى قراءة متكررة ومتكررة لمكتبات كود ضخمة أو وثائق معرفية. أفاد مطور قام باختبار Qwen3.7 أنه استهلك ما يقارب مليون رمز في أقل من ساعة واحدة لبناء نموذج تجريبي للعبة "حرب الدبابات" على الويب. إذا تم السماح للوكلاء بالتنفيذ الذاتي في الخلفية لمراجعة الكود والتكرار الدوري، فقد يصل الاستهلاك اليومي بسهولة إلى مئات الملايين من الرموز. إن التنافس في أسعار التخزين المؤقت من قبل المنافسين هو عامل آخر مباشر دفع علي بابا إلى خفض الأسعار. سابقًا، جذب DeepSeek V4-Pro عددًا كبيرًا من المطورين بفضل سعر التخزين المؤقت المنخفض جدًا. بعد الإعلان عن تخفيض دائم في أواخر مايو، تم خفض تكلفة تطابق التخزين المؤقت لـ DeepSeek V4-Pro إلى 0.003625 دولار أمريكي فقط لكل مليون رمز (ما يعادل حوالي 0.025 يوان صيني)، أي إلغاء مباشر لـ 99.17% من التكلفة مقارنة بسعر الإدخال القياسي. قام عدد كبير من المطورين، باستخدام أدوات متخصصة مثل Reasonix، بدفع معدل تطابق التخزين المؤقت في الجلسة الواحدة إلى حد أقصى بلغ 99%، مما جعل فواتير تشغيل الوكلاء في الجلسات الطويلة شبه صفرية. أمام ضغط المنافسة، لم يُطلق Qwen3.7-Max فقط التخزين المؤقت الضمني دون أي تهيئة، بل حافظ أيضًا على نمط التخزين المؤقت الصريح الذي يتطلب الإعلان اليدوي عن علامة cache_control. مقارنة بالتخزين المؤقت التلقائي، فإن التخزين المؤقت الصريح يتميز بدرجة أعلى من اليقين في التطابق، مع تكلفة تطابق تصل إلى 10% فقط من السعر القياسي للإدخال (عشر السعر)، لكنه يتطلب دفع إضافي بنسبة 125% عند إنشاء التخزين المؤقت لأول مرة، كما أن عمر كتلة التخزين المؤقت لا يتجاوز 5 دقائق (يتم إعادة ضبط العد عند كل تطابق).

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.