گوگل ریسرچ نے ٹربوکوانت کا تعارف کرایا: 3-بٹ کوانتائزیشن، بے کاری کے بغیر، انفرنس کو تکراراً 8 گنا تیز کرے

iconKuCoinFlash
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
گوگل ریسرچ نے ٹربوکوانت کا ایک 3-بٹ کوانتائزیشن طریقہ متعارف کرایا ہے جس سے KV کیش میموری کا استعمال 6 گنا کم ہو جاتا ہے بغیر کسی درستگی کے نقصان کے۔ NVIDIA H100 GPU پر، 4-بٹ توجہ کے حسابات 32-بٹ ماڈلز کے مقابلے میں 8 گنا تیز چل رہے ہیں۔ جیما اور مسٹرل پر لمبی بینچ، نیڈل ان ای ہیکسٹ، اور زیرو اسکرولز کے ساتھ ٹیسٹ کرنے پر، یہ طریقہ بہترین نتائج دیا۔ امیر زندیہ اور وہاب میرکونی نے KAIST اور NYU کے ساتھ مل کر اس پیپر کو تیار کیا ہے جو ICLR 2026 میں شائع ہوگا۔ آن-چین ڈیٹا سے پتہ چلتا ہے کہ کارکردگی میں اضافے کے باعث آلٹ کوائنز میں دلچسپی بڑھ رہی ہے۔

1M AI News کی نگرانی کے مطابق، گوگل ریسرچ نے کمپریشن الگورتھم TurboQuant جاری کیا ہے، جو بڑے زبان ماڈل کے KV کیش کو 3 بٹ تک کم کر سکتا ہے، جس سے میموری استعمال کم سے کم 6 گنا کم ہو جاتا ہے، بغیر ٹریننگ یا فائن ٹیوننگ کے اور ماڈل کی درستگی میں کوئی کمی نہیں آتی۔ 4 بٹ موڈ میں، نیکوڈیا H100 GPU پر توجہ کی حساب کتاب کی رفتار 32 بٹ بغیر کمپریشن والے بنیادی ماڈل کے مقابلے میں اس تک پہنچ سکتی ہے۔

ٹیم نے LongBench، Needle In A Haystack، ZeroSCROLLS جیسے لمبے سیاق و سباق کے معیارات پر Gemma اور Mistral ماڈلز کے ساتھ ٹیسٹ کیا، جس میں TurboQuant نے تمام ٹیسٹس میں بہترین کارکردگی دکھائی۔ یہ الگورتھم دو ذیلی الگورتھمز پر مشتمل ہے: PolarQuant جو قطبی تبدیلی کے ذریعے روایتی کوانتائزیشن طریقوں کے میموری کے اخراجات کو ختم کرتا ہے، اور QJL جو باقی کی غلطی کو صرف 1 بٹ سے درست کرتا ہے۔

یہ تحقیق گوگل ریسرچ کے امیر زندیہ اور وائس پریزیڈنٹ اور گوگل فیلو وہاب میرکرونی کی قیادت میں، جنوبی کوریا کے KAIST اور نیو یارک یونیورسٹی کے ساتھ تعاون سے کی گئی، اور ICLR 2026 پر شائع ہوگی۔ گوگل کے مطابق، اس ٹیکنالوجی کا ایک بنیادی استعمال جیمینی جیسے ماڈلز کے KV کیش بانٹنے کا حل تلاش کرنا ہے۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔