انٹیل نے الی بابا وان2.2 ویڈیو ماڈلز کے تین INT4 کوانتائزڈ ورژن جاری کیے

iconKuCoinFlash
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
21 اپریل (UTC+8) کو، انٹیل کے سربراہ AI انجینئر ہائیہاؤ شین نے ہگنگ فیس پر علی بابا کے وان2.2 ویڈیو ماڈل کے تین INT4 کوانتائزڈ ورژن جاری کرنے کا اعلان کیا۔ یہ ماڈلز T2V-A14B، I2V-A14B اور TI2V-5B شامل ہیں، جنہیں سب Intel کے AutoRound ٹول کا استعمال کرتے ہوئے W4A16 تک کمپریس کیا گیا ہے۔ INT4 کوانتائزیشن ہر وزن کو 2 بائٹس (BF16) سے 0.5 بائٹس تک کم کردیتی ہے، جس سے وزن کا سائز اصل سے تقریباً ایک چوتھائی ہو جاتا ہے۔ A14B ماڈلز MoE آرکیٹیکچر استعمال کرتے ہیں جن میں کل 27B پیرامیٹرز اور ہر مرحلے میں 14B فعال ہوتے ہیں، جس کے لیے ایک ہی کارڈ پر 720P ویڈیو کے لیے کم از کم 80GB GPU میموری درکار ہوتی ہے۔ TI2V-5B ایک ڈینس ماڈل ہے جو 4090 پر 720P@24fps چلا سکتا ہے۔ انٹیل نے اب تک کوانتائزڈ ماڈلز کی میموری اور معیار کی پرفارمنس کا انکشاف نہیں کیا ہے، جن کے لیے تھرڈ پارٹی ٹیسٹنگ درکار ہے۔ یہ ماڈلز مین vLLM انفرنس پائپ لائن کا استعمال نہیں کرتے بلکہ Intel کے اندر کے vllm-omni برانچ (feats/ar-w4a16-wan22) کو اشارہ کرتے ہیں، جسے سروس چلانے کے لیے ضرور انسٹال کرنا ہوگا۔ اس جاری کرنے سے حسابی کارآمدی میں جاری تبدیلی کا اظہار ہوتا ہے، جس کا PoW اور PoS دونوں سسٹمز پر اثر پڑتا ہے۔

ME نیوز کے مطابق، 21 اپریل (UTC+8) کو، Beating کی نگرانی کے مطابق، Intel کے سربراہ AI انجینئر Haihao Shen نے اعلان کیا ہے کہ Intel نے Hugging Face پر Alibaba کے Wan 2.2 ویڈیو ماڈل کے تین INT4 کوانتائزڈ ورژن اپ لوڈ کیے ہیں: T2V-A14B (ٹیکسٹ ٹو ویڈیو)، I2V-A14B (ایمیج ٹو ویڈیو) اور TI2V-5B (ٹیکسٹ اور ایمیج مکسڈ ٹو ویڈیو)، جنہیں سب کو AutoRound کے ذریعے W4A16 تک دبایا گیا ہے۔ Shen خود AutoRound کے اہم مصنفین میں سے ایک ہیں۔ INT4 ہر وزن کو BF16 کے 2 بائٹس سے 0.5 بائٹس تک دباتا ہے، جس سے وزن کا حجم تقریباً اصل کا ایک چوتھائی ہو جاتا ہے۔ A14B کے دو ماڈلز اصل میں MoE آرکٹیکچر پر مبنی تھے، جن کے کل پیرامیٹرز 27B تھے اور ہر مرحلہ پر 14B فعال ہوتے تھے؛ آفیشل دستاویزات کے مطابق 720P چلانے کے لیے کم از کم 80GB VRAM درکار ہوتا ہے؛ TI2V-5B ایک ڈینس ماڈل ہے، جس کا اصل ورژن 4090 پر 720P@24fps چلا سکتا ہے۔ INT4 کوانتائزڈ ورژن کا عملی VRAM اور تصویر کی معیار کا موازنہ Intel نے شائع نہیں کیا، اس کے لیے تین شخصی ریپلیکیشن کا انتظار ہے۔ تینوں ماڈلز کا انفرینس لینک vLLM کے مرکزی شاخ پر نہیں جاتا، README vLLm-omni کی اپنی شاخ (feats/ar-w4a16-wan22) کی طرف اشارہ کرتا ہے، جسے سروس شروع کرنے کے لیے انسٹال کرنا ضروری ہے۔ (ذرائع: BlockBeats)

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔