تطلق Inception Labs Mercury 2، وهو نموذج لغوي ضخم مُحسّن للنشر السريع لتطبيقات الكريبتو

في هذا الأسبوع، أحدثت Inception Labs ضجة في سباق الذكاء الاصطناعي مع Mercury 2، وهو نموذج لغوي جديد من نوع "الانتشار" تصفه الشركة بأنه أسرع نموذج لغوي من حيث الاستدلال في العالم. وفي الاختبارات المرجعية واختبارات العملاء، يبرز زعم Mercury 2 الأساسي في معدل الإنتاجية الخام: حوالي 1000 رمز في الثانية مقابل حوالي 89 رمزًا/ثانية لنموذج Claude Haiku 4.5 Reasoning من Anthropic و71 رمزًا/ثانية لنموذج GPT-5 Mini من OpenAI. وهذا يضعه مباشرة في نفس الفئة عالية السرعة التي ربطتها جوجل لاحقًا بنموذج DiffusionGemma الخاص بها — مرحبًا بكم في ما يسميه البعض عصر الانتشار للنماذج اللغوية الكبيرة. ما الذي يفعله نماذج الانتشار بشكل مختلف: - تولد الروبوتات المحادثة التقليدية النص حرفًا واحدًا في كل مرة، وتتحقق من كل خطوة أثناء التقدم. أما نماذج الانتشار فتبدأ بحزمة نصية تحتوي على رموز وهمية مشوشة، ثم تُحسّن هذه الحزمة عبر عدة جولات متوازية حتى يظهر الجواب النهائي — وهي تقنية مستوحاة من منشئي الصور مثل Stable Diffusion. - النتيجة هي معدل إنتاجية متوازية أعلى بكثير وتدفق أسرع خلال الجلسات الطويلة: تكملة تلقائية فورية، ودورات أسرع للرمز أو الخطط، ووكلاء فرعيون يمكنهم إجراء العديد من المكالمات المساعدة السريعة دون إبطاء النظام بأكمله. المعايير والمقارنات المباشرة: - في AIME 2026 (المستند إلى مسائل حقيقية من امتحان الرياضيات الأمريكي المُدعى، وتم تقييمه كنسبة مئوية من المسائل المُحلّة)، حصل Mercury 2 على 90%. وحصل DiffusionGemma من جوجل على 69.1% في نفس الاختبار، بينما حصل Gemma 4 القياسي (غير الانتشاري) على 88.3%. - في GPQA، وهو معيار علمي على مستوى الدكتوراه، يتقلص الفرق: Mercury 2 عند 77% مقابل 73.2% لـ DiffusionGemma. لا تزال إرشادات جوجل الخاصة توصي باستخدام Gemma 4 القياسي للتطبيقات التي تتطلب أعلى جودة مطلقة، مشيرةً إلى أن DiffusionGemma يتخلف عنه في جميع الجوانب. الأداء والتكلفة في العالم الحقيقي: - مزاعم Mercury 2 حول السرعة ليست مجرد أرقام مختبرية. فقد استبدلت شركة Augment Code، وهي شركة تعمل على وكيل ذكاء اصطناعي للبرمجة، Claude Opus 4.7 من Anthropic بـ Mercury 2 في وكيل فرعي مخصص لتقليل السياق، وأبلغت عن انخفاض بنسبة 82% في زمن الاستجابة وتخفيض بنسبة 90% في التكلفة، مع الحفاظ على جودة إخراج مماثلة (وفقًا لدراسة حالة مشتركة). الأصول والتمويل: - يعتمد نهج Inception على أبحاث الانتشار التي قام بها المؤسس ستيفانو إيرمون، أستاذ جامعة ستانفورد الذي شارك في كتابة أعمال مبكرة حول انتشار القوائم المستندة إلى النقاط المستخدمة في توليد الصور. وقد جمعت الشركة جولة تمويل بقيمة 50 مليون دولار بدعم من ذراع الاستثمار في شركة Nvidia، بالإضافة إلى مستثمرين فرديين مثل أندرو نغ وأندريه كارباتي. حاليًا، يتوفر Mercury 2 عبر واجهة برمجة التطبيقات/السحابة — لا تُنشر أوزان النموذج بشكل عام. تحذيرات عملية والبنية الجديدة: - تتفوق نماذج الانتشار اللغوية حيثما تكون السرعة ومعدل الإنتاجية العاليان مهمين (التحرير الفوري، العديد من المكالمات المساعدة الصغيرة، واجهات الصوت، إلخ)، لكنها ليست بالضرورة الأنسب للمهام الصعبة جدًا في مجال الاستدلال المتقدم، حيث قد لا تزال النماذج التكرارية الكبيرة تحتفظ بميزة. - من حيث البنية، التحول الكبير هو نحو "أوركسترا" من الوكلاء الفرعيين المتخصصة (المستدلين، الملخصين، الموجهين، المدققين). فالنماذج التكرارية التي تولد الرموز واحدة تلو الأخرى تجعل العديد من المكالمات المساعدة بطيئة ومكلفة؛ بينما تجعل نماذج الانتشار المتوازية هذه المكالمات رخيصة بما يكفي لاستخدامها بحرية. - لا يزال النظام البيئي يسعى للحاق بالركب: تحتاج المحاكيات المحلية واطارات الوكلاء والبنية التحتية الأخرى إلى النضج لجعل نماذج الانتشار سلسة في كل مكان. أين يهم هذا بالنسبة للعملات المشفرة وويب3: - تقلل النماذج اللغوية الأسرع والأرخص من عوائق الخدمات الحساسة للزمن سواء على السلسلة أو خارجها: - أدوات مطورين فورية لبرمجة العقود الذكية و"البرمجة بالشعور" التي تتزامن مع التعديلات; - أنظمة دعم متعددة الوكلاء والروبوتات لـ DAOs تتطلب العديد من المكالمات الفرعية السريعة; - واجهات صوت أو دردشة منخفضة التأخير للمحفظات وتطبيقات اللامركزية أو مشغلي العقد المتوفرين على طلب; - تكاليف استنتاج أقل للعمليات السابقة للنواقل، وأنظمة المراقبة والإشعارات. - على نطاق واسع، يمكن أن يترجم معدل الإنتاجية الأعلى على وحدات معالجة الرسوميات العادية إلى توفيرات كبيرة في التكلفة والطاقة للمشاريع التي تنفذ عددًا كبيرًا من عمليات الذكاء الاصطناعي. الخلاصة: يُدخل Mercury 2 نماذج الانتشار اللغوية إلى ربع "السريع والجيد"، مقدّمًا تحسينات دراماتيكية في زمن الاستجابة والتكلفة للمهام الثقيلة من حيث معدل الإنتاجية مع الحفاظ على جودة تنافسية. لن يستبدل كل فئة من النماذج، لكنه يفتح إمكانيات عملية جديدة للمطورين في مجال العملات المشفرة وغيرهم الذين يركزون على السرعة والاستجابة وأنظمة الوكلاء المتعددة — بشرط أن تلحق الأدوات والمحاكيات المحيطة بالركب.