مصنف: شن چاؤ ٹیک فلو
گوگل کی ایک تحقیقی تحریر جس میں دعویٰ کیا گیا کہ AI کے میموری استعمال کو 1/6 تک کم کر دیا گیا ہے، نے پچھلے ہفتے میکرون، سینڈسک سمیت عالمی اسٹوریج چپ کے شیئرز کی 900 ارب امریکی ڈالر کی قیمت کو ختم کر دیا۔
تاہم، پیپر کے جاری ہونے کے صرف دو دن بعد، الگورتھم کے "دبانے" والے مقابلہ کرنے والے—زیورخ فیڈرل ٹیکنالوجی انسٹی ٹیوٹ کے پوسٹ ڈاکٹریل گاو جیانگ نے ایک دس ہزار الفاظ کا علیحدہ خط جاری کیا، جس میں گوگل ٹیم کو الزام دیا گیا کہ انہوں نے اپنے مقابلہ کرنے والوں کا ایک کور CPU پر پائیتھن اسکرپٹ کے ساتھ ٹیسٹ کیا، جبکہ اپنے آپ کو A100 GPU پر ٹیسٹ کیا، اور مسئلہ کے بارے میں تحریر کرنے سے پہلے ہی خبردار کیا جا چکا تھا، لیکن انہوں نے اصلاح کرنے سے انکار کر دیا۔ زھیہو پر پڑھنے کی تعداد فوراً 4 ملین سے زائد ہو گئی، اسٹینفورڈ NLP کا آفیشل اکاؤنٹ نے اسے شیئر کیا، اور اکادمک دنیا اور مارکیٹ دونوں میں ہلچل مچ گئی۔
(حوالہ: ایک تحقیقی مقالہ جس نے اسٹوریج شیئرز کو گرا دیا)
ایک متنازعہ کا مرکزی مسئلہ پیچیدہ نہیں ہے: کیا گوگل کی طرف سے بڑے پیمانے پر فروغ دی گئی، جس نے عالمی چپ سیکٹر میں خوف کے ساتھ فروخت کا باعث بنی، ایک AI ٹاپ کانفرنس کی تحریر، ایک پہلے سے شائع شدہ کام کو نظام مند انداز میں غلط پیش کرتی ہے اور جان بوجھ کر ناانصافی والے تجربات کے ذریعے جعلی پرفارمنس کے فائدے کا نرخ بناتی ہے؟
ٹربوکوانت نے کیا کیا: AI کے "نوٹس کے کاغذ" کو اپنے اصل سائز کا چھٹا حصہ کر دیا
بڑے زبان ماڈل جواب تیار کرتے وقت، پہلے گنتی کی گئی چیزوں کو دوبارہ دیکھنے کے لیے لکھتے ہوئے پیچھے مڑتے ہیں۔ یہ درمیانی نتائج عارضی طور پر گرافکس میموری میں محفوظ ہوتے ہیں، جسے صنعت میں «KV Cache» (کلید-قدرت کی کیش) کہا جاتا ہے۔ بات چیت جتنا لمبی ہوگی، اس «نوٹس کا کاغذ» کتنا موٹا ہوگا، گرافکس میموری کا استعمال اتنا زیادہ ہوگا، اور اس کا خرچ بھی اتنا زیادہ ہوگا۔
گوگل ریسرچ ٹیم نے تیار کیا گیا ٹربوکوانت الگورتھم، جس کا مرکزی دعویٰ یہ ہے کہ یہ اس کھاکے کو اصل سے 1/6 تک دبائے گا، جبکہ درستگی میں کوئی نقصان نہیں اور استدلال کی رفتار تکریباً 8 گنا تک بڑھ جائے گی۔ اس تحقیقی مقالہ کو اپریل 2025 میں پہلی بار اکیڈمک پریپرینٹ پلیٹ فارم arXiv پر شائع کیا گیا، جنوری 2026 میں AI کے بہترین کنفرنس ICLR 2026 میں قبول کر لیا گیا، اور 24 مارچ کو گوگل کے سرکاری بلاگ پر دوبارہ پیش کیا گیا۔
ٹیکنیکل طور پر، ٹربو کوئنٹ کا خیال اس طرح سمجھا جا سکتا ہے: پہلے ایک ریاضیاتی تبدیلی کے ذریعہ بے ترتیب ڈیٹا کو ایک یکساں فارمیٹ میں "دھو" دیا جاتا ہے، پھر پہلے سے حساب کیا گیا بہترین کمپریشن ٹیبل استعمال کرتے ہوئے ہر ڈیٹا کو الگ الگ کمپریس کیا جاتا ہے، اور آخر میں ایک 1 بٹ کے ایرر کاریکشن میکنزم کے ذریعہ کمپریشن کے باعث پیدا ہونے والے حسابی انحرافات کو درست کیا جاتا ہے۔ کمیونٹی نے اس کے کمپریشن اثرات کو مستقل طور پر تصدیق کر لیا ہے، اور ریاضیاتی اہمیت حقیقی ہے۔
مسئلہ یہ نہیں کہ ٹرورکوانت استعمال کیا جا سکتا ہے یا نہیں، بلکہ یہ ہے کہ گوگل نے اسے " مقابلہ کرنے والوں سے کہیں زیادہ بہتر" ثابت کرنے کے لیے کیا کیا۔
گو جیانگ کا علیحدہ خط: تین الزامات، جن میں سے ہر ایک اہم نکتہ چھوتا ہے
27 مارچ کو رات 10 بجے، گاو جیانگ نے زہی ہو پر لمبا مضمون شائع کیا، اور ICLR کے آفیشل ریویو پلیٹ فارم OpenReview پر باقاعدہ تبصرہ جمع کرایا۔ گاو جیانگ RaBitQ الگورتھم کے پہلے مصنف ہیں، جسے 2024 میں ڈیٹا بیس کے شعبے کے سب سے بڑے کانفرنس SIGMOD میں شائع کیا گیا، جس کا مقصد ایک ہی قسم کا مسئلہ — اعلیٰ ڈایمنشنل ویکٹرز کا موثر طریقے سے دباؤ — حل کرنا تھا۔

اس کے الزامات تین ہیں، جن میں سے ہر ایک کی تصدیق ای میل کے ریکارڈ اور وقت کی ترتیب سے ہوتی ہے۔
الزام ایک: دوسرے کے مرکزی طریقہ کار کا استعمال کیا گیا، مکمل مضمون میں کوئی حوالہ نہیں دیا گیا۔
ٹربوکوئنٹ اور ریبٹ کی ٹیکنیکل بنیاد میں ایک اہم مشترکہ مرحلہ ہے: ڈیٹا کو دبائے جانے سے پہلے اسے "تصادفی گھمانا"۔ اس مرحلے کا مقصد اصل میں غیر منظم توزیع والے ڈیٹا کو پیش گوئی کے قابل ایک سامان توزیع میں تبدیل کرنا ہے، جس سے دباؤ کی پیچیدگی میں بڑی کمی آتی ہے۔ یہ دونوں الگورتھمز کا سب سے اہم اور سب سے زیادہ مشترکہ حصہ ہے۔
ٹریبوکوئنٹ کے مصنف نے اپنے جائزہ کے جواب میں یہ بات تسلیم بھی کی ہے، لیکن مکمل تحقیقی مقالے میں کبھی بھی اس طریقہ کار اور رابٹ کیس کے درمیان تعلق کا صاف طور پر ذکر نہیں کیا۔ اہم ترین پس منظر یہ ہے کہ ٹریبوکوئنٹ کے دوسرے مصنف، ماجد دلیری، نے جنوری 2025 میں گاؤ جین یانگ ٹیم سے رابطہ کیا اور اپنے رابٹ کیس کے سورس کوڈ سے تبدیل کردہ پائتھن ورژن کو ٹیسٹ کرنے میں مدد کا تقاضا کیا۔ اس ای میل میں دوبارہ تشکیل دینے کے مراحل اور ایرر معلومات تفصیل سے بیان کی گئی تھیں — یعنی ٹریبوکوئنٹ ٹیم کو رابٹ کیس کے ٹیکنیکل تفصیلات کا بہت اچھا علم تھا۔
ایک نامعلوم ICLR ریویوور نے بھی مستقل طور پر دونوں کے استعمال کیے جانے والے ایک ہی ٹیکنالوجی کو نوٹ کیا اور اس کی مکمل تفصیل کا مطالبہ کیا۔ لیکن نہایت نسخے میں، TurboQuant ٹیم نے صرف اضافی تبادلہ خیال نہیں کیا، بلکہ RaBitQ کے لیے اصل متن میں موجود (پہلے سے ناقص) تفصیل کو بھی اضافے میں منتقل کر دیا۔
دوسرا الزام: بے بنیاد طور پر دوسرے نظریے کو "دوسرا بہترین" قرار دینا۔
ٹربوکوانت کے مقالے نے RaBitQ کو براہ راست "نظریاتی طور پر دوسری درجہ کا" (suboptimal) قرار دے دیا، کیونکہ RaBitQ کا ریاضیاتی تجزیہ "کچھ خاکہ پر مبنی" تھا۔ لیکن گاؤ جیانگ نے اشارہ کیا کہ RaBitQ کے وسعت یافتہ مقالے نے ثابت کر دیا ہے کہ اس کی کمپریشن غلطی ریاضیاتی طور پر بہترین حد تک پہنچ گئی ہے — اس نتیجے کو تھیوریٹیکل کمپیوٹر سائنس کے سب سے اعلیٰ کنفرونسرز میں شائع کیا گیا ہے۔
مئی 2025 میں، گاو جیانگنگ کی ٹیم نے RaBitQ نظریہ کی بہترین صلاحیت کی وضاحت کے لیے متعدد ای میلز بھیجے تھے۔ ٹربروکوئنٹ کے دوسرے مصنف دالیری نے تصدیق کی ہے کہ انہوں نے تمام مصنفین کو آگاہ کر دیا ہے۔ تاہم، تحقیقی مقالہ میں آخر تک "دوسرا بہترین" کا اظہار برقرار رکھا گیا، اور کوئی رد عمل نہیں دیا گیا۔
دوسرا الزام: تجربے کے مقابلے میں «بائیں ہاتھ کو بندھا ہوا، دائیں ہاتھ میں چاقو»۔
یہ مکمل مضمون کی سب سے زیادہ تباہ کن بات ہے۔ گاو جیانگ نے اشارہ کیا کہ ٹربوکوانت کے مقالے میں رفتار کے مقابلے میں دو ناانصافی والی شرائط شامل کی گئیں:
پہلا، RaBitQ کے افسران نے بہترین C++ کوڈ (ڈیفالٹ طور پر متعدد تھریڈز کی حمایت کرتا ہے) فراہم کیا، لیکن TurboQuant ٹیم نے اس کا استعمال نہیں کیا، بلکہ RaBitQ کا اپنا ترجمہ شدہ Python ورژن استعمال کیا۔ دوسرا، RaBitQ کی ٹیسٹنگ ایک کور CPU کے ساتھ اور متعدد تھریڈز بند کرکے کی گئی، جبکہ TurboQuant نے NVIDIA A100 GPU استعمال کیا۔
ان دو شرائط کے مجموعی اثر کے طور پر، پڑھنے والے کو یہ نتیجہ ملتا ہے کہ "RaBitQ، TurboQuant سے کئی درجہ بڑھ کر سست ہے"، لیکن یہ نہیں جانتے کہ یہ نتیجہ اس بنیاد پر ہے کہ گوگل ٹیم نے اپنے مقابلہ کرنے والے کو ہاتھ پاؤں باندھ کر دوڑ کا مقابلہ کروایا۔ تحقیقی مقالے میں ان تجرباتی شرائط کے فرق کو کافی حد تک نہیں ظاہر کیا گیا۔
گوگل کا جواب: "تصادفی گھومانا ایک عام ٹیکنالوجی ہے، ہر مضمون کا حوالہ دینا ناممکن ہے"
گو جیانگ نے کہا کہ ٹربوکوئنٹ ٹیم نے مارچ 2026 میں ای میل کے جواب میں کہا: "عشوائی روٹیشن اور جانسن-لینڈن اسٹریس تبدیلی کا استعمال اس شعبے کی معیاری تکنیک ہے، اور ہم ان تمام پیپرز کا حوالہ نہیں دے سکتے جن میں ان طریقوں کا استعمال کیا گیا ہے۔"
گو جیانگنگ ٹیم کا خیال ہے کہ یہ ایک مفہوم کا تبادلہ ہے: سوال یہ نہیں کہ کیا ہم نے تمام رینڈم روٹیشن استعمال کرنے والے پیپرز کا حوالہ دینا چاہیے، بلکہ یہ ہے کہ RaBitQ پہلا کام تھا جس نے اس طریقہ کو ویکٹر کمپریشن کے ساتھ ملا کر اسی مکمل مسئلے کے تناظر میں اس کی بہترین صلاحیت ثابت کی، اس لیے TurboQuant کا پیپر دونوں کے درمیان تعلق کو درست طریقے سے بیان کرے۔
ستانفورڈ NLP گروپ کا افسانوی X اکاؤنٹ گاو جیانگ کے بیان کو ریٹویٹ کر چکا ہے۔ گاو جیانگ ٹیم نے ICLR OpenReview پلیٹ فارم پر ایک علیحدہ تبصرہ جاری کیا ہے اور ICLR کانفرنس کے چیئرمین اور اخلاقی کمیٹی کو ایک باقاعدہ شکایت جمع کرائی ہے، اور بعد میں وہ arXiv پر تفصیلی ٹیکنیکل رپورٹ جاری کریں گے۔

انڈیپینڈنٹ ٹیکنیکل بلاگر ڈاریو سیلوٹی نے اپنے تجزیے میں نسبتاً ناپسندیدہ جائزہ دیا: ٹربروکوئنٹ کے ریاضیاتی طریقہ کار میں حقیقی اہمیت ہے، لیکن RaBitQ کے ساتھ اس کا تعلق پیپر میں بیان کردہ سے کہیں زیادہ قریب ہے۔
900 ارب ڈالر کی مارکیٹ کی قیمت ختم: تحقیقی مضمون کے تناظر میں مارکیٹ کا خوف
یہ تعلیمی جدل بہت حساس وقت پر پیش آیا۔ گوگل نے 24 مارچ کو اپنے باضابطہ بلاگ پر ٹربوکوانت کا اعلان کیا، اس کے بعد عالمی اسٹوریج چپ سیکٹر پر شدید فروخت کا دباؤ پڑا۔ CNBC سمیت کئی خبروں کے مطابق، میکرون ٹیکنالوجی نے لگاتار چھ تجارتی دن تک گرنے کا رجحان جاری رکھا اور کل مجموعی طور پر 20 فیصد سے زائد کمی آئی؛ سینڈسک کا ایک دن کا نقصان 11 فیصد تھا؛ جنوبی کوریا کی ایس کے ہائیسیس نے تقریباً 6 فیصد کمی دی، سامسنگ الیکٹرانکس نے تقریباً 5 فیصد کمی دی، اور جاپان کی کائیشہ نے تقریباً 6 فیصد کمی دی۔ مارکیٹ کا خوف مکمل طور پر سادہ اور بے رحم تھا: سافٹ ویئر کمپریشن AI انفرنس کے میموری کے تقاضوں کو 6 گنا کم کر سکتا ہے، جس سے اسٹوریج چپس کے تقاضے کے مستقبل پر ساختی طور پر منفی اثر پڑے گا۔
جوسف مور، مارشل سٹینلی کے تجزیہ کار، نے 26 مارچ کے اپنے رپورٹ میں اس منطق کو مسترد کرتے ہوئے مائکرون اور سینڈاسک کے لیے "خریدیں" کا درجہ برقرار رکھا۔ مور نے کہا کہ ٹربوکوانت صرف KV کیش جیسے ایک خاص قسم کی کیش کو دباتا ہے، نہ کہ کل میموری استعمال کو، اور اسے "عام پیداواری بہتری" قرار دیا۔ ویلز فارگو کے تجزیہ کار اینڈریو روچا نے بھی جیونز پیراڈوکس کا حوالہ دیتے ہوئے کہا کہ اگر کارکردگی میں اضافہ سے لاگت کم ہو جائے تو اس سے AI ڈپلومنٹ کا احجام بڑھ سکتا ہے، جس سے آخرکار میموری کی مانگ بڑھے گی۔
پرانے مقالے، نیا پیکیج: AI تحقیق سے مارکیٹ نریٹیو تک کا رابطہ خطرہ
ٹیکنیکل بلاگر بن پولڈیان کے تجزیہ کے مطابق، ٹربو کوئنٹ کا پیپر اپریل 2025 میں پہلے ہی جاری کر دیا گیا تھا، نئی تحقیق نہیں۔ 24 مارچ کو گوگل نے اپنے آفیشل بلاگ کے ذریعے اسے دوبارہ پیک کرکے فروخت کیا، لیکن مارکیٹ نے اسے ایک نئی کامیابی کے طور پر قیمت دے دی۔ اس "پرانا پیپر، نیا اعلان" کے اشتہاری اقدام کے ساتھ ساتھ پیپر میں ممکنہ تجرباتی جھکاؤ، AI تحقیق کے اکادمک پیپرز اور مارکیٹ نریٹو کے درمیان منتقل ہونے کے نظام کے نظام گت ریسک کو ظاہر کرتا ہے۔
ای آئی انفراسٹرکچر کے سرمایہ کاروں کے لیے، جب کوئی تحقیقی مقالہ "کئی درجہ بندیوں" کی کارکردگی میں اضافے کا دعویٰ کرتا ہے، تو پہلے یہ پوچھنا ضروری ہے کہ بنچ مارک کے مقابلے کے شرائط منصفانہ ہیں یا نہیں۔
گاؤ جیانیانگ ٹیم نے واضح کر دیا ہے کہ وہ مسئلے کے باقاعدہ حل کو آگے بڑھانے پر زور دیں گے۔ گوگل نے تکراری خط کے مخصوص الزامات پر اب تک کوئی باقاعدہ جواب نہیں دیا ہے۔
