یہ مضمون عالمی بڑی کمپنیوں کے خود ساختہ AI چپس کے موجودہ ترتیب کا گہرا جائزہ پیش کرے گا، مالیاتی اور بنیادی ٹیکنالوجی کے منطق کے حوالے سے ثابت کرے گا کہ خود ساختہ چپس میں بڑی رقم لگانا ٹیکنالوجی کے بڑے ٹیکنالوجی کے لیے ضروری انتخاب کیوں ہے، اور اس کے سامنے کھڑے چیلنجز اور مستقبل کے کمپوٹنگ لینڈسکیپ کے نتائج کا تجزیہ کرے گا۔

مضمون کے مصنف، ذریعہ: 0x9999in1، ME News

مقدمہ

2022 کے آخر سے جنریٹو AI کے افراط کے بعد، عالمی ٹیک صنعت نے بڑے ماڈلز کو مرکز بناتے ہوئے ایک نئی تسلسل کی دوڑ شروع کر دی ہے۔ اس دوڑ میں، کمپوٹنگ طاقت ایک بنیادی انفراسٹرکچر بن گئی ہے۔ نوڈیا (Nvidia) نے اپنے جنرل پرپوز گرافکس پروسیسر (GPU) کے شعبے میں طویل عرصے کی تجربہ اور CUDA سافٹ ویئر ایکوسسٹم کی مکمل حکمرانی کے ذریعے AI کی اس لہر میں سب سے زیادہ منافع حاصل کیا ہے۔ تاہم، 70 فیصد سے زائد سود کی شرح اور مانگ سے زیادہ پیداوار کی وجہ سے عالمی کلاؤڈ سروس فراہم کنندگان (CSP) اور AI ٹیک گینٹس "نوڈیا کے لیے کام کرنے" کی کمپوٹنگ پریشانی میں مبتلا ہو گئے ہیں۔

اس حوالے سے، "ME News ٹھنڈی" نے مشاہدہ کیا ہے کہ عالمی سطح پر بڑے ٹیکنالوجی کمپنیاں اپنی حکمت عملی کو بنیادی ہارڈویئر کی طرف مائل کر رہی ہیں اور ایک بے مثال "خود ساز AI چپ" کی لہر شروع کر دی ہے۔ شمالی امریکہ کی گوگل، ایمزون، مائیکروسافٹ، میٹا سے لے کر چین کی ہواوی، بائیدو، علی بابا، اور ڈائیز جنٹی تک، بڑی کمپنیوں کا چپ بنانا اب صرف ابتدائی "آزمائش" نہیں رہا، بلکہ کمپنی کے زندہ یا مردہ ہونے کا مرکزی حکمت عملی بن چکا ہے۔ اس مضمون میں، ہم عالمی بڑی کمپنیوں کے خود ساز AI چپس کے ترتیب کے موجودہ حالات کا گہرا جائزہ لیں گے، معاشیات اور بنیادی ٹیکنالوجی کے منطق کے حوالے سے ثابت کریں گے کہ خود ساز چپس میں بڑی رقم لگانا ٹیکنالوجی کمپنیوں کے لیے انتہائی ضروری کیوں ہے، اور ان کے سامنے آنے والے چیلنجز اور مستقبل کے کمپوٹنگ لینڈسکیپ کے نتائج کا تجزیہ کریں گے۔

عالمی سطح پر بڑے ٹیکنالوجی کمپنیوں کی خود ساختہ AI چپس کی منصوبہ بندی کی موجودہ حالت

ابھی، عالمی بڑی کمپنیوں کے خود ساختہ AI چپس بنیادی طور پر کلاؤڈ (ڈیٹا سینٹر) پر مرکوز ہیں، جو تربیت (Training) اور استنباط (Inference) کے دو بڑے سیناریوز پر مشتمل ہیں۔ نیکوڈیا کے عام مقاصد کے راستے کے برعکس، بڑی کمپنیاں عام طور پر مخصوص اطلاقی سرکٹ (ASIC) آرکیٹیکچر استعمال کرتی ہیں، جس سے کچھ عامیانہ صلاحیت کا تبادلہ کرتے ہوئے، خاص اندر کے کاروباری سیناریوز میں بہترین توانائی کا نسبت حاصل ہوتا ہے۔

شمالی امریکہ کے کلاؤڈ فراہم کنندگان کی تین طاقتیں اور ایک نئی چیلنج کرنے والی کمپنی

شمالی امریکہ کے چار بڑے کلاؤڈ پریوڈرز (چار ہائپر اسکیلرز) خود کی گئی چپس پر عمل کرنے میں وقت کا فرق رکھتے ہیں، لیکن اب وہ مکمل طور پر شامل ہو چکے ہیں اور نیوڈیا کی کمپوٹنگ پر انحصار کے لیے ایک "ہیج پول" تشکیل دے دیا ہے۔

گوگل: خود کی تیار کردہ راستے کا مکمل پیشگام اور معیار

گوگل دنیا کا پہلا بڑا کمپنی تھا جس نے گہری سیکھنے کی ضرورت کو بنیادی ہارڈویئر پر نئی ضرورت کے طور پر سمجھا۔ 2015ء میں، گوگل نے اپنے اندر پہلی نسل کا ٹینسر پروسیسنگ یونٹ (TPU) لاگو کیا۔ تقریباً دس سال کی ترقی کے بعد، موجودہ TPU اب چھٹی نسل (Trillium) تک پہنچ چکا ہے۔

گوگل کی طاقت اس کے بند生态系统 میں ہے: نیچے کی طرف TPU ہارڈویئر، درمیانی سطح پر XLA کمپائلر اور JAX فریم ورک، اور اوپر کی طرف Gemini بڑا ماڈل۔ اس مکمل سافٹ ویئر اور ہارڈویئر کے ہم آہنگی کی وجہ سے، گوگل نے نیوڈیا کے GPU کلبسٹرز پر انحصار کیے بغیر دنیا کے بہترین متعدد ماڈلز کو تربیت دیا ہے۔ TPU v5p اور Trillium میں انٹرکنیکشن بینڈ ویتھ اور ہائی بینڈ ویتھ میموری (HBM) میں نمایاں بہتری، گوگل کی فوق العادہ سائز کلبسٹر (Cluster) نیٹ ورکنگ صلاحیت پر نیوڈیا کے NVLink کے مقابلے کی صلاحیت کا ثبوت ہے۔

亚马逊 (AWS): لاگت اور صارف کی منتخب کرنے کی آزادی پر مبنی

AWS کا چپ ڈیزائن کرنے کا سفر 2015 میں Annapurna Labs کی خریداری سے شروع ہوا۔ AI کے شعبے میں، AWS نے Trainium (ٹریننگ پر مرکوز) اور Inferentia (استنتاج پر مرکوز) دو مصنوعات کی لائنیں تیار کیں۔ AWS کی حکمت عملی بہت عملی ہے: وہ خود کی ڈیزائن کردہ چپس کے ذریعے GPU کو مکمل طور پر بدلنے کی کوشش نہیں کرتا، بلکہ AWS کے کلاؤڈ گاہکوں کو اعلیٰ قیمت اور کارکردگی کا آپشن فراہم کرتا ہے۔ AWS کے افسانوی اعداد و شمار کے مطابق، Inferentia2 چپ کا استعمال کرتے ہوئے بڑے ماڈلز کا استنتاج کرنے پر، ہر واٹ پر کارکردگی دوسرے Amazon EC2 انسٹنس سے 50 فیصد زیادہ ہوتی ہے۔

مائیکروسافٹ اور میٹا: بے‌اختیار ادائیگی سے فعال تبدیلی تک

مایکروسافٹ اور میٹا پہلے نوڈیا کے H100/A100 کے سب سے بڑے خریدار تھے۔ 2023 کے آخر میں، مایکروسافٹ نے OpenAI کی تربیت اور اپنے Copilot کے کاروبار کو سہارا دینے کے لیے اپنی خود ساختہ AI ایکسلریٹر چپ Azure Maia 100 کا اعلان کیا۔ یہ چپ تائیوان سیمیکنڈکٹر مینوفیکچرنگ کمپنی کی 5nm پروسیس پر بنائی گئی ہے اور اسے کلاؤڈ ٹریننگ اور انفرنس کے لیے خصوصی طور پر ڈیزائن کیا گیا ہے۔

میٹا کا راستہ اس کے اپنے کاروبار کے ساتھ بہت زیادہ مطابقت رکھتا ہے۔ اس نے MTIA (Meta Training and Inference Accelerator) چپ کو ابتدائی طور پر گہری سیکھنے کے تجویز ماڈلز (DLRM) کے لیے ڈیزائن کیا تھا، جو فیس بک اور انستاگرام کے اشتہارات کو بہتر بنانے کے لیے استعمال ہوتا تھا۔ جب Llama سیریز کے اوپن سورس بڑے ماڈلز کا انفجار ہوا، تو نئی نسل کی MTIA چپ نے جنریٹو AI انفرنس کے لیے مزید طاقتور سپورٹ فراہم کیا، جس کا مقصد اربوں کالوں کی مہنگی انفرنس لاگت کو کم کرنا ہے۔

چینی بڑے کمپنیوں کا ملکی تبدیلی اور ایکوسسٹم کی کامیابی

شمالی امریکہ کے بڑے کمپنیوں کے خرچے کم کرنے اور کارکردگی بڑھانے کے منطق کے برعکس، چینی ٹیک گیگنٹس امریکی اعلیٰ AI چپس کی برآمد پر پابندی کے پیش نظر AI چپس کا خود ساختہ طریقہ “底线防御” اور “سلسلہ تأمین کی حفاظت” کے استراتیجی پہلو رکھتے ہیں۔

ہواوی: گھریلو کمپوٹنگ طاقت کا اہم ستون

ہواوی اسینڈ (Ascend) سیریز موجودہ دور میں چین میں واحد پروڈکٹ ہے جو نیوڈیا A100/H20 کے ساتھ بڑے پیمانے پر کلستر ٹریننگ میں متبادل کے طور پر کام کرتی ہے۔ اسینڈ 910B نے دا ونچی آرکیٹیکچر (Da Vinci) استعمال کیا ہے، جو CANN (کمپیوٹیشنل آبجیکٹ نیٹ ورک نیورل آرکیٹیکچر) لیئر اور مائنڈ اسپور جیسے چینی فریم ورکس کے ساتھ گہری طور پر جڑا ہوا ہے۔ اب تک، چین کے زیادہ تر ہیڈنگ لارج مڈلز (جیسے کہ کیوبا سائن فائرو، زھی پو AI وغیرہ) نے اسینڈ کے کمپوٹنگ انفراسٹرکچر پر مبنی ایڈاپٹیشن اور ٹریننگ مکمل کر لی ہے یا اس پر کام جاری ہے۔

انٹرنیٹ کے بڑے کمپنیوں کا عملی طریقہ: بیڈو، علی بابا اور ڈیٹی جنگ

بیڈو کا کُنلِنگ شِن ایک پہلے سے ہی چل رہا انٹرنیٹ گیگنٹ کا خود ساختہ AI چپ ہے، جو اب تک تیسری نسل تک پہنچ چکا ہے اور ون شِن یِ یان کے بڑے ماڈل کے استدلال اور کچھ مائیکرو ٹیوننگ کو مکمل طور پر سپورٹ کرتا ہے۔ علی پنگ تُو کے سیمی کنڈکٹر نے ہانگ گوانگ 800 متعارف کرایا ہے، جو علی کے اندر کے الیکٹرانک کامرس سرچ، تصویر شناخت جیسے اعلیٰ کنکرنس استدلال کے مناظر پر مرکوز ہے۔ جِٹ ڈانس، جو دنیا بھر میں سب سے بڑھ کر ریکومینڈیشن الگورتھم کی کمپوٹنگ ضرورت رکھتا ہے، اس نے تاخیر سے داخلہ لیا ہے لیکن اپنے دوباؤ بڑے ماڈل اور TikTok/ڈیوشن کی روزمرہ کی بڑی استدلال کی ضرورت کا مقابلہ کرنے کے لیے ٹی ایس ایم سی اور بروکوم جیسے چپ ڈیزائن اور فارم مینوفیکچررز کے ساتھ تعاون کرتے ہوئے مخصوص AI ASIC چپس کا تعاون کر رہا ہے۔

جدول 1: عالمی بڑے ٹیکنالوجی کمپنیوں کے AI چپس کی ترتیب کا جائزہ

گہری تجزیہ: بڑی کمپنیاں خود کی ڈیزائن کردہ AI چپ میں بڑی رقم کیوں لگا رہی ہیں؟

ایک جدید پروسیس (جیسے 5nm/3nm) کے AI چپ کی ترقی کے لیے، لائن اسکریننگ کا خرچ کئی کروڑ امریکی ڈالر ہو سکتا ہے، اور اس کے لیے بڑے پیمانے پر چپ ڈیزائن اور سافٹ ویئر تصدیق ٹیم کو برقرار رکھنا ضروری ہے۔ اس انتہائی اونچے رکاوٹ کے باوجود، ٹیکنالوجی کے بڑے کمپنیاں اس طرف متواصل طور پر بڑھ رہی ہیں۔ "ME News سوچ" کا خیال ہے کہ اس کے پیچھے واضح تجارتی منطق، سپلائی چین کا مقابلہ اور بنیادی ٹیکنالوجی کے قوانین ہیں۔

ہائی ہیش ریٹ کی لاگت اور بزنس ماڈل کی غیر قابل برقراری

موجودہ جنریٹو AI کے بزنس ماڈل کو بڑی "انورس" خطرہ کا سامنا ہے۔ ایک تریلین پیرامیٹر GPT-4 لیول کے بڑے ماڈل کو تربیت دینے کے لیے کئی ماہ تک ہزاروں H100 GPU درکار ہوتی ہیں، جس کا صرف ہارڈویئر کیپٹل اخراج (CapEx) کئی ارب ڈالر ہوتا ہے۔ اور ماڈل کو ڈپلوی کرنے کے بعد، مستقل استدلال (Inference) کا خرچہ ایک بے حد گڑھا بن جاتا ہے۔

نیوڈیا کا وہ مالیاتی اقدار جو ٹریلین ڈالر سے زیادہ ہیں، بنیادی طور پر پورے AI صنعت کو ایک مہنگا "کمپوٹیشنل ٹیک" وصول کرنے کا نتیجہ ہے۔ جنرل پرپوز GPU کو گرافکس رینڈرنگ (Graphics)، ڈبل پریسیژن فلوٹنگ پوائنٹ آپریشنز (FP64) جیسے فنکشنز کو بھی شامل کرنا پڑتا ہے، جن کے لیے چپ کے ٹرانزسٹرز کا بڑا حصہ استعمال ہوتا ہے، لیکن صرف ڈیپ لرننگ (جو بنیادی طور پر FP16، FP8 یا INT8 پر منحصر ہے) میں ان کا کوئی فائدہ نہیں۔ بڑی کمپنیاں GPU خریدتی ہیں، جس سے وہ ان غیر استعمال شدہ "ڈارک سلیکون (Dark Silicon)" کے لیے ادائیگی کرتی ہیں۔

اپنے خود ساختہ کسٹمائز ASIC چپوں کے ذریعے، بڑی کمپنیاں تمام زائد فنکشنز کو ختم کر سکتی ہیں اور ہر ایک سیلیکون کے رقبے کو ٹینسر کمپوٹیشن اور میموری بینڈ ویتھ کے بہترین استعمال کے لیے استعمال کر سکتی ہیں۔ صنعت کے جائزہ کے مطابق، خاص بڑے پیمانے پر انفرنس کے مناظر میں، خود ساختہ ASIC کی ایک بار کی کمپوٹیشن لاگت (TCO) عام GPU کی تین سے پانچ گناں کم ہوتی ہے۔ میٹا، بائٹڈانس جیسی کمپنیوں کے لیے جو روزانہ اربوں انفرنس کالز کرتی ہیں، اگر خود ساختہ چپوں کو بڑے پیمانے پر لاگو کیا جائے تو سالانہ آپریشنل اخراجات (OpEx) میں دس ارب ڈالر کی بچت ہوگی۔ چند ارب ڈالر کے چپ ڈویلپمنٹ میں سرمایہ کاری کرکے دس ارب ڈالر کی لاگت بچانے کا یہ انتہائی واضح مالی فائدہ ہے۔

سلسلہ ترسیل کی سلامتی اور جغرافیائی سیاسی خطرات کا ہیج

لاکن لاگت کے علاوہ، سپلائی چین کی کمزوری ٹیکنالوجی کے بڑے کمپنیوں کے سر پر دھوئیں کی تلوار کی طرح معلق ہے۔ نوڈیا کے پاس پیداوار کے تقسیم پر مکمل اختیار ہے، اور H100/B200 جیسی مرکزی گرافکس کارڈز کی ڈیلیوری کا دورہ اکثر کئی ماہ تک ہوتا ہے۔ کمپوٹیشنل پاور کے بغیر، بڑی کمپنیوں کے AI کاروبار کی ترقی روک جاتی ہے۔

اپنے چپس کی ترقی کا بنیادی مقصد نوویدا کے ساتھ "بازاری طاقت" (Bargaining Power) بڑھانا ہے۔ چاہے بڑی کمپنیاں سب سے آگے کے ماڈل ٹریننگ میں نوویدا سے مکمل طور پر الگ نہ ہو سکیں، لیکن استدلال اور تجویز کے نظاموں میں اپنے چپس کا استعمال کرکے وہ باہری جنرل پریس جی پی یو پر مکمل انحصار کو کم کر سکتی ہیں، جس سے خریداری کے مذاکرات میں ان کے پاس زیادہ دباؤ ہوگا۔

چینی کمپنیوں کے لیے، خود کی گئی چپس بنانا ایک ناگزیر ضرورت ہے۔ امریکی تجارتی محکمہ کے BIS برآمد پابندیوں کی وجہ سے، مقامی کمپنیاں سب سے زیادہ کمپوٹیشنل ڈینسٹی اور انٹرکنیکشن بینڈ ویتھ والی کامرسیل چپس تک رسائی نہیں رکھتیں۔ خود کی گئی چپس کے ساتھ مقامی یا غیر امریکی سیمی کنڈکٹر کنٹریکٹ مینوفیکچرنگ سسٹم کو جوڑ کر، خود مختار اور قابو پانے والی کمپوٹیشنل بنیاد بنانا، قومی AI س sovereignty اور کمپنی کے ڈیٹا سنٹر کے کاروبار کو جاری رکھنے کا واحد راستہ ہے۔

سافٹ ویئر اور ہارڈ ویئر کا مل کر بہترین استعمال اور فرقی مقابلہ کی رکاوٹیں

آج، جب مور کا قانون آہستہ ہو رہا ہے، صرف چپ کے پروسیس ٹیکنالوجی (جیسے 5nm سے 3nm اور پھر 2nm تک) پر انحصار کرکے حاصل ہونے والی کارکردگی میں اضافہ کا فائدہ کم ہوتا جا رہا ہے۔ مستقبل کی کمپوٹنگ طاقت میں بڑھوتے کے لیے، "سافٹ ویئر ڈیفائنڈ ہارڈ ویئر" اور "سافٹ ویئر-ہارڈ ویئر کو ڈیزائن (Hardware-Software Co-design)" پر زیادہ انحصار ہو رہا ہے۔

عام GPU کو لاکھوں مختلف ایپلیکیشنز اور الگورتھمز کے ساتھ مطابقت رکھنی ہوتی ہے، اس لیے اس کی ساخت معتدل ہونی چاہیے۔ جبکہ بڑی کمپنیاں اپنے خود کے ترقی یافتہ چپس کو اپنے مرکزی بڑے ماڈلز کے ڈیٹا کے قسم، کمیابی کے خصوصیات، اور مواصلات کے نمونوں کے مطابق مخصوص طور پر بہتر بناسکتی ہیں۔

مثلاً، اگر بڑی کمپنی کا توجہ مرکز طویل سیاق و سباق (Long-context) والے بڑے زبانی ماڈلز کے استدلال پر ہے، تو اس کی خود ساختہ چپ کو ڈیزائن کرتے وقت سیکنڈری SRAM کی صلاحیت یا HBM میموری بینڈ ویتھ کو زیادہ سے زیادہ بڑھایا جا سکتا ہے، نہ کہ صرف کمپیوٹیشنل پیک (FLOPS) کی تلاش میں۔ اس قسم کی صلاحیت جس میں اپنے AI الگورتھمز کو بنیادی سلیکون چپ میں "کھینچا" جاتا ہے، مقابلہ کرنے والوں کے لیے آسانی سے نقل کرنے سے قابلِ تقلید پرفارمنس کا تجربہ تخلیق کرتی ہے، جس سے گہرا تحفظ بن جاتا ہے۔

خود کی گئی AI چپ کے سامنے کے حقیقی چیلنجز اور ان کا حل

اگرچہ اپنے خود کی گئی AI چپ کی حکمت عملی کی قیمت واضح ہے، لیکن یہ راستہ کبھی بھی آسان نہیں ہے۔ بے سوچے سمجھے چپ بنانے سے نہ صرف بڑی رقم ضائع ہو سکتی ہے، بلکہ اپنی AI سروسز کی ترقی کی رفتار بھی متاثر ہو سکتی ہے۔

ایک ecosystem کی دیوار کو عبور کرنا: CUDA کا دفاعی خندق کتنے گہرا ہے؟

نیوڈیا کا سب سے خوفناک باریئر صرف ہارڈویئر کی پرفارمنس نہیں، بلکہ اس کا تقریباً بیس سال کا CUDA سافٹ ویئر ایکوسسٹم ہے۔ ابھی، دنیا بھر کے زیادہ تر AI ڈویلپرز اور ٹاپ AI الگورتھم لائبریریز (جیسے PyTorch کے لائیر الگورتھمز) CUDA پر گہرائی سے منسلک ہیں۔

بڑی کمپنیوں کے خود ساختہ چپس کا سب سے بڑا مسئلہ "اچھا بنانا لیکن استعمال نہ کرنا" ہے۔ یہاں تک کہ اگر چپ کامیابی سے تیار ہو جائے، لیکن ڈویلپرز کو نئی چپ کے کمپائلر کے لیے نیچے کی سطح کے کوڈ کو دوبارہ لکھنے میں کئی ماہ لگ جائیں، تو یہ چپ اندر کی طرف سے ترقی نہیں پا سکتی۔

ایک ٹوٹ کے لیے، صنعت CUDA کے لیے احاطہ کر رہی ہے۔ ایک طرف، بڑی کمپنیاں اپنے اپنے کمپائلرز (جیسے گوگل کا XLA) تیار کرنے میں مصروف ہیں؛ دوسری طرف، OpenAI نے Triton نامی ایک اوپن سورس پروگرامنگ زبان جاری کی ہے جس پر بہت امیدیں ہیں۔ Triton کا مقصد CUDA سے زیادہ ابسترکٹ لیول کی زبان فراہم کرنا ہے، جس میں ڈویلپرز صرف ایک بار کوڈ لکھتے ہیں، اور Triton کمپائلر اسے مختلف بنیادی ہارڈویئر (جیسے Nvidia GPU، AMD GPU، یا کسی بھی کمپنی کے ASIC) کے لیے مشین کوڈ میں تبدیل کر دیتا ہے۔ اگر Triton یا اس جیسی درمیانی لیئر کی生态 مکمل ہو جائے، تو CUDA کا بندھن نکال دیا جائے گا اور بڑی کمپنیوں کے اپنے چپس پر منتقل ہونے کا خرچہ کافی کم ہو جائے گا۔

بڑے ریسرچ اور ڈویلپمنٹ اخراجات اور سکیل افیکٹس کے درمیان مقابلہ

چپ صنعت ایک انتہائی "مقیاس کا اثر" پر زور دینے والا فاتح لے جانے والا بازار ہے۔ نوڈیا اپنے وسیع ریسرچ اور ڈویلپمنٹ اخراجات کو عالمی سطح پر لاکھوں یونٹس کے GPU کی فروخت پر تقسیم کر سکتا ہے۔ جبکہ بڑی کمپنیوں کی خود ساختہ چپیں عام طور پر صرف ان کے اندر یا اپنے کلاؤڈ گاہکوں کے لیے استعمال ہوتی ہیں، جن کی فروخت کی مقدار صرف لاکھ یا دس لاکھ کے سطح پر ہوتی ہے۔

اگر کافی سکیل حاصل نہ ہو سکے، تو خود کی گئی چپ کی فی یونٹ تقسیم شدہ لاگت عام GPU خریدنے کی نسبت بہت زیادہ ہوگی۔ اس لیے، خود کی گئی AI چپ صرف "کچھ بڑے ٹیکنالوجی گینٹس کے لیے ایک بہادرانہ کھیل" بن جائے گی۔ درمیانی اور لمبے پوچھ کے ٹیکنالوجی کمپنیوں کے لیے، بنیادی AI چپس کو خود تیار کرنے کی کوشش نہ صرف مالی طور پر قابلِ برداشت نہیں، بلکہ ٹیکنالوجی کے ترقی کے رفتار میں بھی نVIDIA جیسے ماہر چپ فراہم کنندگان کے ساتھ قدم برابر نہیں رکھ سکتی، اور زیادہ عقلمند انتخاب موجودہ کمپوٹنگ کلب سروسز کو اپنانا ہے۔

جدول 2: تجارتی جنرل پرپوز GPU اور بڑی کمپنیوں کے خود ساختہ ASIC چپس کے فوائد اور نقصانات کا موازنہ

تجزیہ: مستقبل کی کمپوٹیشنل طاقت کے ڈھانچے کا آخری ترقی

اوپر کے تجزیہ کو مدنظر رکھتے ہوئے، "ME News ٹینک" مستقبل کے 3-5 سالوں کے لیے عالمی AI کمپوٹنگ طاقت کے منظر نامے کا درج ذیل جائزہ پیش کرتا ہے:

ایک اہم طاقت اور کئی مضبوط طاقتوں سے عمودی تقسیم کی طرف: GPU ٹریننگ کو چلاتا ہے، ASIC استدلال پر قبضہ کرتا ہے

نیوڈیا مستقبل کے کافی طویل عرصے تک، فرانتیئر ماڈلز کی سرحدوں کو ٹیسٹ کرنے کے لیے ایک غیر قابل تبدیل بادشاہ رہے گا، کیونکہ انتہائی پیچیدہ بڑے پیمانے پر پیرامیٹر تربیت میں الگورتھم میں ابھی بھی انتہائی عدم یقینیت موجود ہے، اور اس مرحلے کے لیے GPU کی عام صلاحیت اور CUDA ایکوسسٹم کی درستگی اور لچک کی بہت ضرورت ہوتی ہے۔

تاہم، ماڈل کی بالغت کے بعد انفرینس (Inference) کے مرحلے اور بڑے پیمانے پر انٹرنیٹ اطلاقات (جیسے شارٹ ویڈیو تجاویز، سرچ انجن ری ورائٹ) کے روزمرہ ڈیپلومنٹ میں، جنرل پرپوز GPU کی اونچی لاگت کی وجہ سے کمپنیاں مکمل طور پر اپنی خود ساختہ ASICs کی طرف رجوع کریں گی۔ مستقبل کے ڈیٹا سینٹر ہمگن ہوں گے: کچھ بہت مہنگے GPU کلسٹرز "ڈین" (نئی نسل کے بڑے ماڈلز کی تربیت) کے لیے استعمال ہوں گے، جبکہ لاکھوں خود ساختہ ASICs کے کلسٹرز روزانہ اربوں C-کنڈکٹر کالز کو سنبھالیں گے۔

کسٹم سلیکون کلاؤڈ سروسز کا معیاری حصہ بن گیا ہے

جیسے آج کے بڑے ڈیٹا سینٹر اپنے سرور مادر بورڈ اور کولنگ سسٹم خود ڈیزائن کرتے ہیں، ویسے ہی چپ کی بنیادی سطح پر کسٹمائزیشن کرنا بڑے کلاؤڈ فراہم کنندگان (CSP) کے لیے معیاری عمل بن جائے گا۔ خود سے چپ تیار کرنے کی صلاحیت کلاؤڈ فراہم کنندگان کے لیے AI سروسز بیچنے کے وقت مرکزی مقابلہ کی حیثیت رکھے گی۔ بنیادی ہارڈویئر خود تیار نہ کرنے والے کلاؤڈ سروس فراہم کنندگان مستقبل کی قیمت کی جنگ میں مکمل طور پر منافع کی جگہ کھو دیں گے اور صرف "ڈیٹا سینٹر کے دوسرے کرایہ دار" بن جائیں گے۔

خلاصہ یہ ہے کہ بڑی کمپنیوں کی طرف سے خود ساختہ AI چپس کا مقصد نکیڈیا کو مکمل طور پر "ختم" کرنا نہیں، بلکہ AI کے دور میں بنیادی منافع کے تقسیم کے لیے جنگ ہے۔ استدلال اور داخلی مرکزی سرگرمیوں میں کمپوٹنگ کی خود مختاری حاصل کرکے، ٹیکنالوجی کے بڑے کھلاڑی اپنی ٹیکنالوجی اور تجارتی منافع پر دوبارہ کنٹرول حاصل کر رہے ہیں۔ اس نرم اور سخت ملٹی کے گہرے تبدیلی میں، کمپوٹنگ صرف خریدی جانے والی ایک مصنوعات نہیں رہ گئی، بلکہ اب کمپنیوں کا سب سے اہم ج战略资产 ہے۔

حوالہ جات:

Semianalysis. (2024). AI Inference Economics: GPUs vs Custom Silicon.
اسٹنفورڈ یونیورسٹی HAI. (2024). آرٹیفیشل انٹیلی جنس انڈیکس رپورٹ 2024.
Bloomberg Technology. (2023). مایکروسافٹ AI چپ متعارف کرائے گا جس سے نوڈیا پر انحصار کم ہوگا.
Patterson, D., et al. (2021). کاربن امیشنز اور بڑے نیورل نیٹ ورک تربیت. arXiv پری پرینٹ.
AWS افسرانا بلاگ۔ (2023)۔ Amazon EC2 Inf2 Instances for Low-Cost, High-Performance Generative AI.