جب مانگ جی پی یو فوکس سے زیادہ ہو جائے تو سی پی یو ای آئی دور میں نیا بٹل نیک ہو جاتا ہے

AI کے ان دنوں کے دوران، صنعت تقریباً ایک منطق سے چل رہی تھی: کمپوٹیشنل پاور حد کا تعین کرتی ہے، اور GPU کمپوٹیشنل پاور کا مرکز ہے۔

تاہم، 2026 میں داخل ہونے پر، یہ منطق تبدیل ہونا شروع ہو گیا: مدل کا استدلال اب واحد رکاوٹ نہیں رہا، سسٹم کی کارکردگی اب انجام اور شیڈولنگ کی صلاحیتوں پر زیادہ منحصر ہے۔ GPU اب بھی اہم ہے، لیکن AI کو "چلانے" کی کلیدی بات آہستہ آہستہ طویل عرصے سے نظرانداز کیے جانے والے CPU کی طرف منتقل ہو رہی ہے۔

امریکی وقت کے مطابق 9 اپریل، گوگل اور انٹیل نے کئی سالوں کے معاہدے پر دستخط کیے، جس کے تحت انٹیل کے "زیون پروسیسرز" کو عالمی سطح پر AI ڈیٹا سینٹر میں بڑے پیمانے پر استعمال کیا جائے گا، تاکہ اس پابندی کو دور کیا جا سکے۔ انٹیل کے سی ای او چین لی وو نے صاف طور پر کہا کہ AI پورے سسٹم پر چلتا ہے، اور CPU اور IPU صرف اور صرف پرفارمنس، کارکردگی اور لچک کے لیے اہم ہیں۔ دوسرے الفاظ میں، پچھلے دو سالوں تک "مددگار" کے طور پر دیکھا جانے والا CPU، AI کے وسعت کو "گلا گھونٹ رہا" ہے۔

گوگل

اینٹیل کے سی ای او چین لی وو نے سوشل میڈیا پر کہا کہ اینٹیل گوگل کے ساتھ تعاون کو مزید گہرا کر رہا ہے، جس میں روایتی CPU سے لے کر AI انفراسٹرکچر (جیسے IPU) تک کا احاطہ ہے، اور AI اور کلاؤڈ کمپیوٹنگ کی صلاحیتوں کو آگے بڑھانے پر مشتمل ہے۔

سی پی یو صرف ایک پاسیو کمپوننٹ نہیں رہا، بلکہ ای آئی انفراسٹرکچر کا ایک اہم متغیر بن رہا ہے۔

01 ایک "چپکے سے" آپریشن کی کمی

جب سب GPU کی ڈیلیوری سائکل پر نظر ڈال رہے ہیں، تو CPU مارکیٹ میں تنش پہلے ہی پوری طرح بڑھ چکی ہے۔

کئی آئی ٹی ڈسٹریبیوٹرز کی حالیہ رپورٹس کے مطابق، 2025 کے چوتھے تریمینے میں سرور سی پی یو کی اوسط فروخت کی قیمت میں تقریباً 30 فیصد اضافہ ہوا۔ اس قسم کا اضافہ نسبتاً بالغ سی پی یو مارکیٹ میں بہت نایاب ہے۔

ایم ڈی کے ڈیٹا سینٹر کے ہیڈ فورسٹ نارود نے بتایا کہ گزشتہ تین تریمہ میں سی پی یو کی مانگ کا رخ توقع سے زیادہ تھا۔ اب، ایم ڈی کے ڈیلیوری دورانیے آٹھ ہفتوں سے بڑھ کر دس ہفتوں سے زیادہ ہو گئے ہیں، اور کچھ ماڈلز کو تو ستھرے ماہ تک کی تاخیر کا سامنا ہے۔

یہ کمی بنیادی طور پر "ثانوی اثرات" کی وجہ سے وسائل کی بھاڑ ہے۔ کچھ صنعت کے ماہرین کا کہنا ہے کہ تائیوان سیمیکنڈکٹر کی 3nm لائن کی صلاحیت بہت زیادہ مصروف ہے، جس کی وجہ سے CPU کے لیے مختص وافل کی صلاحیت، زیادہ منافع بخش GPU آرڈرز کے ذریعے تبدیل ہوتی جا رہی ہے۔ اس سے ایک بہت ہی مزاحیہ صورتحال پیدا ہوئی ہے: AI لیبز کے پاس کافی GPU ہیں، لیکن ان کو "چلانے" کے لیے بازار میں کافی ٹاپ CPU دستیاب نہیں ہیں۔

اس سیل کے دوران ایلون مسک بھی شامل ہیں۔

اینٹیل کے سی ای او چین لی وو نے سوشل میڈیا پر تصدیق کی ہے کہ ماسک نے اپنے ٹیکساس میں "ٹیرافیب" منصوبے کے لیے کسٹم چپس ڈیزائن اور تیار کرنے کے لیے اینٹیل کو منظور کیا ہے۔ یہ وسیع منصوبہ xAI، SpaceX اور ٹیسلا کے لیے ایک یکسانہ کمپوٹنگ بنیاد فراہم کرنے کا مقصد رکھتا ہے۔

ماسک کی انٹیل پر بھروسہ، زیادہ تر اس لیے ہے کہ انٹیل زمینی ڈیٹا سینٹر سے لے کر خلائی ککھٹ تک ہر سطح پر اپنے آپ کو شامل کرنے کی کوشش کر رہا ہے۔

گوگل

اینٹیل کے لیے یہ بے شک ایک طاقتور تحریک ہے۔ کچھ صنعتی تجزیہ کاروں کا خیال ہے کہ 2026 تک ایم ڈی اے سرور CPU مارکیٹ میں اینٹیل کا آمدنی کا حصہ پار کر جائے گا، لیکن اینٹیل کی x86 ایکوسسٹم میں گہری عادت اور تیاری کی صلاحیت، ماسک جیسے بڑے کلائنٹس کے لیے نظر انداز نہیں کی جانے والی اہمیت رکھتی ہے۔

اس صنعتوں کے درمیان گہرے بندھن کی وجہ سے CPU بازار کی مقابلہ کاری صرف پیرامیٹرز کے مقابلے سے بڑھ کر ایکوسسٹم اور سپلائی چین کی استحکام کے معرکے میں تبدیل ہو رہی ہے۔

02 کیوں سی پی یو "کمزور لنک" بن جاتا ہے؟

سی پی یو اچانک ایک بنیادی رکاوٹ بن گیا ہے، کیونکہ اس کے ذمہ داریوں میں ایجینٹ دور میں بنیادی تبدیلی آ گئی ہے۔

روایتی چیٹ بوٹ ماڈل میں، سی پی یو کو مینجمنٹ اور ڈیٹا پروسیسنگ کے لیے استعمال کیا جاتا ہے، جبکہ جی پی یو مرکزی استنتاج کے حسابات کو انجام دیتی ہے۔ چونکہ کمپیوٹیشنل طور پر زیادہ بھاری عمل جی پی یو پر مرکوز ہوتے ہیں، اس لیے کل تاخیر عام طور پر جی پی یو کے ذریعہ تعین کی جاتی ہے، اور سی پی یو کبھی بھی پرفارمنس کا باعث نہیں بنتا۔

لیکن اسٹیج ورک لود بالکل مختلف ہے۔ ایک اسٹیج کو متعدد مراحل کا استدلال کرنا، API کال کرنا، ڈیٹا بیس پڑھنا اور لکھنا، پیچیدہ بزنس فلو کو آرڈر کرنا، اور درمیانی نتائج کو آخری آؤٹ پٹ میں ضم کرنا ہوتا ہے۔ تلاش، API کال، کوڈ ایکزیکیشن، فائل I/O اور نتائج کا آرڈر کرنا جیسے کام زیادہ تر CPU اور ہوسٹ سسٹم پر منحصر ہوتے ہیں۔ GPU ٹوکن جنریشن (یعنی “سوچنا”) کے لیے ذمہ دار ہے، جبکہ CPU “سوچ” کے نتائج کو عملی اقدامات میں تبدیل کرنے کے لیے ذمہ دار ہے۔

جیورجیا ٹیک کے اسکالرز نے نومبر 2025 میں ایک تحقیقی مقالہ "ای سی پی یو-سینٹرک پرسپیکٹیو آن ایجینٹک اے آئی" میں ایجینٹ ورک لوڈ میں تاخیر کے تقسیم کا تجزیہ کیا۔ تحقیق میں پایا گیا کہ سی پی یو کے طرف سے ٹولز کے معالجہ میں لگنے والا وقت کل تاخیر کا 50 فیصد سے لے کر 90.6 فیصد تک ہے۔ کچھ صورتوں میں، جب جی پی یو اگلے سریز کے لیے تیار ہو جاتا ہے، تو سی پی یو ابھی تک ٹول کال کے جواب کا انتظار کر رہا ہوتا ہے۔

ایک اور اہم عامل کنٹیکس ونڈو کا تیزی سے وسعت پانا ہے۔ 2024 میں، اکثر ماڈلز 128K سے 200K ٹوکن تک کی حمایت کرتے تھے۔ 2025 میں، Gemini 2.5 Pro، GPT-4.1، Llama 4 Maverick جیسے ماڈلز 1 ملین ٹوکن سے زیادہ کی حمایت کرنے لگے ہیں۔ KV کیش (Key-Value Cache، جو Transformers ماڈلز کے انفرینس عمل کو تیز کرنے کے لیے استعمال ہوتا ہے) ٹوکن کی تعداد کے ساتھ لینیئر طور پر بڑھتا ہے، اور 1 ملین ٹوکن پر یہ تقریباً 200GB ہوتا ہے، جو ایک H100 کی 80GB GPU میموری سے کہیں زیادہ ہے۔

اس قسم کے مسائل کا ایک حل KV کیش کا حصہ CPU میموری پر ڈاؤنلوڈ کرنا ہے۔ اس کا مطلب ہے کہ CPU کو صرف اورکیسٹنگ اور ٹول کالز کا انتظام نہیں بلکہ گرافکس میموری میں جگہ نہ ہونے والے ڈیٹا کو بھی سہارا دینا ہوگا۔ اس لیے CPU میموری کی صلاحیت، میموری بینڈ ویتھ، اور CPU اور GPU کے درمیان کنکشن کی رفتار نظام کی پرفارمنس کے لیے اہم ہو جاتی ہیں۔

اس لیے، ایجینٹ کے دور کے لیے مناسب CPU کو کم تاخیر، مسلسل میموری تک رسائی، اور زیادہ طاقتور سسٹم لیول کوآرڈینیشن کی ضرورت ہوتی ہے، صرف ایکل کور سائز میں اضافہ نہیں۔

03 فروشندہ کیا کر رہے ہیں؟ کچھ لوگ علاقہ قبضہ کر رہے ہیں، کچھ ڈیزائن تبدیل کر رہے ہیں

اس اچانک برپا ہونے والی CPU کی مانگ کے سامنے، کچھ بڑی کمپنیوں کے طریقہ کار مکمل طور پر الگ الگ ہیں۔

انٹیل قدیمی سرور CPU کے بازار میں لیڈر ہے۔ مرسوری ریسرچ کے اعداد و شمار کے مطابق، 2025 کے چوتھے تہائی میں، انٹیل کا سرور CPU بازار میں 60 فیصد حصہ ہے، جبکہ AMD کا 24.3 فیصد اور نوڈیا کا 6.2 فیصد ہے۔ لیکن انٹیل نے پچھلے کچھ سالوں سے نئی ٹیکنالوجی کے ساتھ قدم رکھنے کی کوشش کی ہے، اور اب CPU کی مانگ میں اچانک اضافہ ان کے لیے ایک موقع بھی ہے اور ایک چیلنج بھی۔

ابھی ایکسیل کی حکمت عملی دو پاؤں پر چل رہی ہے۔ ایک طرف وہ ایٹن پروسیسرز کی فروخت جاری رکھ رہی ہے اور گوگل جیسے بڑے صارفین کے ساتھ گہرا تعاون کر رہی ہے؛ دوسری طرف وہ سامبا نووا کے ساتھ تعاون کر رہی ہے اور ایٹن پروسیسرز اور اپنے خود ساختہ RDU ایکسلریٹرز کے مجموعی حل پیش کر رہی ہے، جس کا دعویٰ ہے کہ "GPU کے بغیر بھی اسٹریم رینسنگ چل سکتی ہے"۔ ایٹن 6 گرینائٹ ریپڈس اور 18A پروسیس کا راستہ، ایکسیل کی واپسی کا جائزہ لینے کا اہم معیار ہوگا۔

AMD اس CPU کی مانگ کے بھرپور اضافے میں سب سے بڑے فائدہ پانے والوں میں سے ایک ہے۔ 2025 کے چوتھے ترکیبی میں، AMD کی ڈیٹا سینٹر آمدنی 54 ارب ڈالر تھی، جو 39 فیصد بڑھ کر ہوئی۔ پانچویں نسل کا EPYC Turin سرور CPU کی آمدنی کا نصف سے زیادہ تھا، اور EPYC چلنے والے کلاؤڈ انستنس کی تنصیب میں 50 فیصد سے زیادہ کا اضافہ ہوا۔ AMD کی سرور CPU کی آمدنی کا حصہ پہلی بار 40 فیصد سے آگے نکل گیا۔

AMD کے سی ای او لیسا سو نے اضافے کا سبب براہ راست "ایجینٹس" کی ترقی میں ڈالا ہے — ایجینٹس کے ورک لوڈز نے کام کو روایتی سی پی یو کاموں پر واپس منتقل کر دیا ہے۔

فروری 2026 میں، AMD نے میٹا کے ساتھ MI450 GPU اور Venice EPYC CPU کی فراہمی کے لیے 1000 ارب ڈالر سے زائد کی ممکنہ ٹریڈ کا اعلان کیا۔

تاہم، AMD کے پاس سسٹم لیول کوآرڈینیشن کے لیے اب بھی بہتری کی گنجائش ہے، اور ایسی بالغ تیز CPU-GPU انٹرکنیکٹیو صلاحیت جیسے NVLink C2C کی کمی ہے۔ جیسے جیسے ایجنٹ (Agent) سسٹمز کی ڈیٹا انٹرایکشن اور کوآرڈینیشن کی کارکردگی کی ضرورتیں بڑھ رہی ہیں، اس ربط کا اہمیت بھی لگاتار بڑھ رہا ہے۔

نVIDIA کا سی پی یو ڈیزائن کرنے کا انداز انٹیل اور ایم ڈی کے مکمل طور پر الگ ہے۔

نیوڈیا کے گریس سی پی یو میں صرف 72 کور ہیں، جبکہ اے ایم ڈی ایپی سی اور انٹیل کے زیکس عام طور پر 128 ہوتے ہیں۔ نیوڈیا کے اے آئی انفراسٹرکچر کے ہیڈ ڈائون ہیرس نے وضاحت کی: "اگر آپ ایک سپر سکیل کمپنی ہیں، تو آپ ہر سی پی یو کے کورز کی تعداد کو زیادہ سے زیادہ کرنا چاہیں گے، جس سے لاگت میں کمی آتی ہے، یعنی ہر کور کی ڈالر لاگت۔ تو یہ ایک بزنس ماڈل ہے۔"

دوسرے الفاظ میں، AI کی کمپوٹنگ سسٹم میں، CPU کا کردار عام کمپوٹیشن کا مرکزی ذریعہ نہیں رہا، بلکہ یہ GPU کے لیے ایک "سکیولنگ سنٹر" بن گیا ہے۔ اگر CPU کے ساتھ تھوڑا بھی تاخیر ہو جائے، تو مہنگے GPU کو انتظار کرنا پڑے گا، جس سے کلی فیسیں کم ہو جاتی ہیں۔

اس لیے، نوڈیا نے ڈیزائن میں CPU اور GPU کے درمیان موثر تعاون کو ترجیح دیا ہے۔ مثال کے طور پر، NVLink C2C انٹرکنیکشن کے ذریعے CPU اور GPU کے درمیان بینڈ ویتھ کو تقریباً 1.8TB/s تک بڑھایا گیا ہے، جو روایتی PCIe سے کہیں زیادہ ہے، جس سے CPU براہ راست GPU میموری تک رسائی حاصل کر سکتا ہے، اور KV کیش مینجمنٹ اچانک بہت آسان ہو گئی۔

اب، نوڈیا نے ویرا سی پی یو کو الگ مصنوع کے طور پر فروخت کرنا شروع کر دیا ہے۔ کورویو پہلا客户 ہے۔ میٹا کے ساتھ معاہدہ اور زیادہ بڑا ہے، جو ان کا پہلا بڑا “صاف گریس ڈیپلومنٹ” ہے، یعنی سی پی یو کو GPU کے بغیر بڑے پیمانے پر الگ طور پر ڈیپلو کیا جا رہا ہے۔

تحقیقی ادارہ کریٹیو اسٹریٹیجیز کے سربراہ تجزیہ کار بن بجارین نے کہا کہ انتہائی زور دار سسٹم کولابوریشن میں، سی پی یو کی پروسیسنگ صلاحیت اکسلریٹرز کی تکرار کی رفتار کے مطابق ہونی چاہئے۔ اگر ڈیٹا چینل میں صرف ایک فیصد کی تاخیر ہوئی، تو پورے AI کلسٹر کی مالی کارکردگی میں بڑی کمی آ جائے گی۔ اس انتہائی سسٹم کی کارکردگی کی تلاش نے تمام بڑے کمپنیوں کو سی پی یو کے پرفارمنس معايروں کو دوبارہ جانچنے پر مجبور کر دیا ہے۔

کنسٹیلیشن ریسرچ کے وائس پریزیڈنٹ اور چیف اینالسٹ ہولگر مولر کا کہنا ہے کہ جب AI ورک لودز ایجنٹ ڈرائیون ڈھانچوں کی طرف منتقل ہو رہے ہیں، تو CPU کا کردار اب زیادہ مرکزی بن رہا ہے۔ وہ کہتے ہیں: "ایجنٹ دنیا میں، ایجنٹس کو API اور مختلف بزنس ایپلیکیشنز کو کال کرنے کی ضرورت ہوتی ہے، جن کے لیے CPU سب سے زیادہ مناسب ہے۔"

اس نے مزید کہا: "ابھی تک، GPU اور CPU میں سے کون سا انفرینس کے کاموں کے لیے زیادہ مناسب ہے، اس بارے میں کوئی فیصلہ نہیں ہوا۔ GPU ماڈل ٹریننگ میں برتری رکھتا ہے، جبکہ TPU جیسے کسٹم ASICs کی اپنی خصوصیات ہیں۔ لیکن ایک بات واضح ہے: گوگل کو مixed processor architecture اپنانا ہوگا۔ اس لیے، گوگل کا انٹیل کے ساتھ تعاون کرنے کا فیصلہ مناسب ہے۔"

04 اختتام: ذکائی عصر میں، کمپوٹیشنل طاقت کا ترازو واپس اپنی جگہ پر آ گیا ہے

نئی صنعتی نگاہ میں، ایک ڈیٹا ہماری توجہ کا مرکز ہے۔ ایمیزون AWS اور OpenAI کے 380 ارب ڈالر کے معاہدے میں، اس کے افسران نے واضح طور پر "کئی کروڑ CPU" کے توسیعی پیمانے کا ذکر کیا ہے۔

گزشتہ کچھ سالوں میں، عام طور پر صنعت کی توجہ ہمیشہ "لاکھوں GPU" پر مرکوز رہی۔ تاہم، OpenAI جیسے اگرے ہوئے لیبارٹریز نے CPU کے سائز کو ایک اہم منصوبہ بندی کا متغیر بنایا ہے، جس سے واضح سگنل بھیجا گیا ہے کہ ایجنٹ ورک لوڈ کی توسیع کے لیے بڑے CPU انفراسٹرکچر پر بنیاد رکھی جانی چاہیے۔

ایمریکن بینک نے پیش گوئی کی ہے کہ 2030 تک عالمی CPU مارکیٹ کا سائز موجودہ 27 ارب امریکی ڈالر سے بڑھ کر 60 ارب امریکی ڈالر ہو جائے گا۔ یہ اضافہ تقریباً مکمل طور پر AI کے ذریعے ہوگا۔

ہم ایک مکمل طور پر نئی بنیادی ڈھانچے کے پھیلاؤ کا مشاہدہ کر رہے ہیں: بڑی کمپنیاں صرف GPU جمع نہیں کر رہیں، بلکہ AI ایجینٹس کے لیے عملی سہولت فراہم کرنے کے لیے ایک مکمل "CPU شیڈولنگ بنیادی ڈھانچہ" بھی توسع دے رہی ہیں۔

اینٹیل اور گوگل کی شراکت، اور مسک کی کسٹم چپس میں بڑی سرمایہ کاری، ایک حقیقت کو ثابت کر رہی ہیں: AI کے مقابلے کی جیتنے والی جگہ آگے بڑھ رہی ہے۔ جب کمپوٹنگ پاور نایاب نہیں رہی، تو جو سسٹم لیول کے "بٹل نیک" کو سب سے پہلے حل کرے گا، وہی اس تریلین ڈالر کے کھیل میں آخر تک مسکراتا رہے گا۔

خصوصی ترجمہ کنندہ گیلک نے اس مضمون میں بھی اپنا کردار ادا کیا۔

یہ مضمون ویچن گروپ "ٹینسینٹ ٹیکنالوجی" سے ہے، مصنف: لی ہیلین، ایڈیٹر: شو چنگیانگ