أخبار ME، في 21 أبريل (UTC+8)، وفقًا لمراقبة Beating، أعلنت هايهاو شين، المهندسة الرئيسية للذكاء الاصطناعي في Intel، أن Intel رفعت ثلاثة إصدارات مكمّلة من نموذج الفيديو Wan 2.2 الخاص بـ Alibaba على Hugging Face بتنسيق INT4: T2V-A14B (نص إلى فيديو)، وI2V-A14B (صورة إلى فيديو)، وTI2V-5B (مزيج نص وصورة إلى فيديو)، حيث تم ضغط جميعها باستخدام AutoRound إلى W4A16. شين هو أحد المؤلفين الرئيسيين لأداة التكميم AutoRound. يقلل INT4 حجم كل وزن من 2 بايت بتنسيق BF16 إلى 0.5 بايت، مما يقلص حجم الوزن إلى حوالي ربع الحجم الأصلي. كانت النسختان A14B الأصليتان تستخدمان بنية MoE، بإجمالي 27B معلمة و14B مُفعّلة في كل خطوة، وذكرت الوثائق الرسمية أن تشغيل 720p يتطلب على الأقل 80 جيجابايت من ذاكرة الفيديو على بطاقة واحدة؛ بينما كان TI2V-5B نموذجًا كثيفًا، ويمكنه تشغيل 720p@24fps على بطاقة 4090 دون تكميم. لم تُنشر مقارنات فعلية لذاكرة الفيديو وجودة الصورة بعد التكميم من قبل Intel، ويجب الانتظار حتى يتم إعادة إنتاجها من قبل طرف ثالث. كما أن مسارات الاستدلال لهذه النماذج الثلاثة لا تستخدم vLLM الرئيسي، بل يشير README إلى فرع Intel الخاص vllm-omni (feats/ar-w4a16-wan22)، ويجب تثبيت هذا الفرع لتشغيل الخدمة. (المصدر: BlockBeats)
أصدرت إنتل ثلاثة إصدارات مُكمّمة بـ INT4 من نماذج فيديو Alibaba Wan2.2
KuCoinFlashمشاركة






في 21 أبريل (UTC+8)، أعلنت هايهاو شين، المهندسة الرئيسية للذكاء الاصطناعي في إنتل، عن إصدار ثلاثة إصدارات مُكمَّمة بـ INT4 من نموذج فيديو Wan2.2 التابع لشركة علي بابا على Hugging Face. تشمل النماذج T2V-A14B وI2V-A14B وTI2V-5B، والتي تم ضغطها جميعًا باستخدام أداة AutoRound التابعة لإنتل إلى W4A16. تقلل الكمية المُكمَّمة بـ INT4 من كل وزن من 2 بايت (BF16) إلى 0.5 بايت، مما يجعل حجم الوزن حوالي ربع الحجم الأصلي. تستخدم النماذج A14B بنية MoE بإجمالي 27B معلمة و14B نشطة لكل خطوة، وتحتاج إلى ما لا يقل عن 80 جيجابايت من ذاكرة GPU لتشغيل فيديو 720P على بطاقة واحدة. أما TI2V-5B فهو نموذج كثيف يمكنه تشغيل فيديو 720P@24fps على بطاقة 4090. لم تكشف إنتل بعد عن أداء الذاكرة وجودة النماذج المُكمَّمة، والتي تتطلب اختبارات من طرف ثالث. لا تستخدم النماذج خط أنابيب الاستنتاج vLLM الرئيسي، بل تشير بدلاً من ذلك إلى فرع vllm-omni الداخلي لإنتل (feats/ar-w4a16-wan22)، والذي يجب تثبيته لتشغيل الخدمة. يبرز هذا الإصدار التحول المستمر نحو كفاءة الحوسبة، مع آثار على أنظمة إثبات العمل (PoW) وإثبات الحصة (PoS).
المصدر:عرض النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات.
يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.