تقدم Ramp Labs حلاً جديداً لمشاركة الذاكرة بين الوكلاء المتعددين، مع تقليل استخدام الرمز بنسبة تصل إلى 65%

KuCoinFlash

وقت الإصدار: 11‏/04‏/2026، 05:20:46

ملخص

لقد اقترحت Ramp Labs، وهي شركة بنية تحتية للذكاء الاصطناعي، حلاً جديداً لمشاركة الذاكرة متعددة الوكلاء يُسمى "Latent Briefing" للحد من استخدام الرموز بنسبة تصل إلى 65%. يُقلل هذا الأسلوب من حجم ذاكرات KV النموذجية الكبيرة، مما يحسن الكفاءة دون فقدان الدقة. في اختبارات LongBench v2، انخفض استهلاك الرموز بنسبة 65%، مع توفير متوسط قدره 49% للنصوص متوسطة الطول. وزادت الدقة بنسبة 3 نقاط مئوية، واستغرق الضغط فقط 1.7 ثانية—أي أسرع بـ20 مرة. يستخدم النظام Claude Sonnet 4 كمنظم وQwen3-14B كنموذج عامل. يتماشى هذا الحل مع الامتثال لـ MiCA ويدعم مبادرات CFT من خلال تعزيز الشفافية التشغيلية.

أخبار ME، 11 أبريل (UTC+8): أطلقت شركة البنية التحتية للذكاء الاصطناعي Ramp Labs دراسة بحثية بعنوان "Latent Briefing"، تحقق من خلال ضغط مباشر لذاكرة KV للنماذج الكبيرة مشاركة فعالة للذاكرة بين أنظمة الوكلاء المتعددة، مع تقليل كبير في استهلاك الرموز دون خسارة في الدقة. في الهياكل الشائعة للوكلاء المتعددة، يقوم المنسق (Orchestrator) بتفكيك المهام ودعوة نماذج العامل (Worker) بشكل متكرر، ومع تمديد سلسلة الاستدلال، يزداد استهلاك الرموز بشكل أسّي. الفكرة الأساسية لـ "Latent Briefing" هي: استخدام آلية الانتباه لتحديد الأجزاء الحاسمة حقًا في السياق، والتخلص المباشر من المعلومات الزائدة على مستوى التمثيل، بدلاً من الاعتماد على ملخصات LLM بطيئة أو استرجاع RAG غير مستقر. في اختبارات معيار LongBench v2، أظهرت هذه الطريقة أداءً متميزًا: انخفض استهلاك الرموز في نموذج العامل بنسبة 65٪، وبلغ الوسيط الموفر للرموز في المستندات متوسطة الطول (من 32k إلى 100k) 49٪، وارتفع الدقة الإجمالية بنسبة حوالي 3 نقاط مئوية مقارنة بالخط الأساسي، مع وقت إضافي قدره حوالي 1.7 ثانية فقط لكل عملية ضغط، أي أسرع بحوالي 20 مرة من الخوارزمية الأصلية. تم إجراء التجارب باستخدام Claude Sonnet 4 كمنسق وQwen3-14B كنموذج عامل، وشملت سيناريوهات متعددة من المستندات مثل الأوراق الأكاديمية والوثائق القانونية والروايات وتقارير الحكومة. كما اكتشف البحث أن العتبة المثلى للضغط تختلف حسب صعوبة المهمة وطول المستند — فالمهام الصعبة تناسب الضغط الجريء لتصفية الضوضاء الاستدلالية الاستباقية، بينما تناسب المستندات الطويلة الضغط الخفيف للحفاظ على المعلومات الحاسمة الموزعة. (المصدر: BlockBeats)

المصدر:عرض النسخة الأصلية

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات. يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.