جب سب لوگ مدل لیئر پر لڑ رہے ہوں، تو ایک ٹیم جس کے پاس اوپن سورس انفرنس کا معیار ہے، اور جس کے سیڈ راؤنڈ کے سب سے بڑے سرمایہ کار硅谷 ہیں، نے بالآخر نئے دور کی AI بنیادی ڈھانچہ کی طرف اپنا توجہ مرکوز کر دیا ہے۔

مضمون کے مصنف، ذریعہ: ماشین کا دل

5 مئی، 2026 کو، AI انفراسٹرکچر اسٹارٹ اپ ریڈکس آرک نے 1 ارب ڈالر کی بیج فنڈنگ مکمل کرنے کا اعلان کیا، جس کے بعد اس کی تخمینہ قیمت 4 ارب ڈالر ہو گئی۔ رقم، تخمینہ قیمت اور سرمایہ کاروں کے گروپ کے لحاظ سے، یہ 2026 میں AI Infra شعبے میں اب تک کی سب سے بڑی ابتدائی سرمایہ کاری ہے۔

اس دور کی قیادت Accel نے کی، جبکہ Spark Capital نے مشترکہ قیادت کی۔ ادارہ جاتی سرمایہ کاروں میں NVIDIA کے NVentures، AMD، MediaTek، Databricks، اور Salience Capital، HOF Capital، Walden Catalyst، A&E Investment، LDVP، WTT Fubon Family جیسے اول درجہ ادارے شامل ہیں۔ GPU سے لے کر CPU تک، اور ایج چپس سے لے کر ڈیٹا پلیٹ فارم تک، مرکزی ہارڈویئر اور سسٹم لیول کے تمام اہم کھلاڑی تقریباً موجود ہیں۔

ٹاپ انسٹی ٹیوشنل گروپ کے باہر، انٹیل، براڈکام، اوپن اے آئی، ایکس اے آئی، پائی ٹورچ جیسے پس منظر والے کئی عالمی تکنیکی لیڈرز بھی اس سرمایہ کاری میں فرشتہ سرمایہ کار کے طور پر شامل ہوئے۔

"ہارڈویئر کے تین بڑے سی ای اوز + ٹاپ ماڈل لیب کے بانی + PyTorch کے قائم کنندہ" — AI Infra کی تاریخ میں اس قسم کا کمبو ایک سیڈ راؤنڈ میں اکٹھا کرنا بہت نایاب ہے۔ اس شعبے کو جاننے والے سرمایہ کار کہتے ہیں: یہ "نیکسٹ جنریشن انفراسٹرکچر کے فیکٹ اسٹینڈرڈ" پر ڈالا گیا شدید جواز ہے۔

دنیا کا بہترین استدلال انجن، ان کے ہاتھوں

ریڈکس آرک کی کہانی، ایک ایسے ایم اوپن سورس پراجیکٹ سے شروع ہوتی ہے جس کا نام SGLang ہے۔

2023 میں وجود میں آنے کے بعد، SGLang نے دو سال میں ایک غیر معمولی ترقی کی رفتار سے اوپن سورس بڑے ماڈل انفرینس کا ایک عملی معیار بن گیا، جس نے GitHub پر 27K+ ستارے حاصل کیے اور 400K+ GPU پر ڈیپلوی کیا گیا۔ روزانہ SGLang پر تریلینوں ٹوکن کا پروڈکشن ٹریفک چل رہا ہے، جس کے صارفین میں Google، Microsoft، NVIDIA، Oracle، AMD، LinkedIn، xAI، Thinking Machines Lab شamil ہیں۔

گزشتہ دو سالوں میں، ماڈل آرکیٹیکچر نے MoE، لمبے کنٹیکس، ریزننگ ماڈلز، اور متعدد ماڈلٹی فیوژن جیسی کئی بڑی تبدیلیوں سے گزری ہے۔ ہر آرکیٹیکچر کے دوبارہ ڈیزائن کے ساتھ، SGLang نے Day-0 کمپیٹیبلٹی حاصل کی — ایک ایسا پہلا اور منفرد کھلا ماڈل جو جاری ہوتے ہی سپورٹ کرتا ہے، جس کی کارکردگی مشین کی فزیکل حد تک پہنچ جاتی ہے۔ انویسٹرز کا بار بار ذکر کیا جانے والا جائزہ یہ ہے کہ SGLang کی ترقی کی رفتار اور انجینئرنگ کی ڈسپلن کا امتزاج، اوپن سورس پروجیکٹس میں بے مثال ہے۔

بنیادی ڈسپلن کے پیچھے، سسٹم اور الگورتھمز کے شعبے میں گہری تجربہ رکھنے والی ایک بنیادی ٹیم ہے۔

سی او ای ینگ شینگ نے شنگھائی جیاوتونگ یونیورسٹی سے ای سی ایم کلاس میں اپنا بیچلر کیا اور اسٹینفورڈ یونیورسٹی سے اپنا ڈاکٹریٹ کیا، وہ ایل ایم ایس آئی آرگ کی بانی اور ایس جی لینگ کی اہم بنیاد گذار میں سے ایک ہیں۔ ان کے ڈاکٹریٹ کے دوران انہوں نے یو سی بیرکلے سکائی لیب میں مہمان ماہر کے طور پر تحقیق کی، اور انہوں نے ڈیٹا براکس اور ایکس اے آئی میں کام کیا، جہاں انہوں نے ایکس اے آئی کے استنتاج ٹیم کا سربراہ عہدہ سنبھالا۔ ینگ شینگ کا توجہ کو کم کرنے، کے وی کیش کے دوبارہ استعمال جیسے شعبوں میں کام صنعت کے اندر زبردست توجہ حاصل کر رہا ہے، اور ایس جی لینگ کے ابتدائی دور کا ریڈکس اٹینشن مکانزم ان کا ایک نمایاں کام ہے۔

CTO 朱邦华 (Banghua Zhu) نے چنگہوا یونیورسٹی سے الیکٹرانک انجینئرنگ میں اپنا بیچلر کیا، اور یو سی بیرکلی سے ڈاکٹریٹ کی، جہاں ان کے استاد ماشین لرننگ کے ماہر مائیکل آئی جارڈن اور جینتاو جیاو تھے۔ ڈاکٹریٹ کے دوران انہوں نے نیکسس فلو کا تعاون سے قیام کیا، جسے بعد میں نوڈیا نے خرید لیا، اور وہ نوڈیا کے پرنسپل ریسرچ سائنٹسٹ بن گئے۔ ان کے ذمہ دار منصوبوں میں صنعتی سطح کے ٹریننگ سسٹمز کی مکمل تعمیر اور نوڈیا کے اندر لائو لیول سسٹم کی بہتری اور بڑے پیمانے پر ٹریننگ پر لمبے عرصے تک کا تجربہ شامل ہے۔

ایک اہم ہارڈویئر فرنٹ کے ٹیکنیکل لیڈر کے مطابق، یہ 2026 کے AI Infra اسٹارٹ اپ میں سب سے زیادہ قیمتی فاؤنڈر ٹیم ہے: ایک طرف خودکار استدلال کے معاہدے کو تھامے ہوئے تحقیقی اسٹارٹ اپر، دوسری طرف GPU فرنٹ کے سب سے اہم تحقیقی لیول سے تعلق رکھنے والے بڑے ماڈل الگورتھم ماہر۔

ہر روز تریلینوں ٹوکن کے ٹریفک کو مانیٹر کرنے والے انفراسٹرکچر SGLang کے ساتھ — یہ خود AI انفراسٹرکچر کے لیے ایک خواب کی شروعات ہے۔ اور اس ٹیم کے پاس اس سے زیادہ بھی کارڈ ہیں۔

دِن-0: DeepSeek V4 کو تربیت دینا

ریڈکس آرک نے تربیت کے پہلو میں بھی ایک اہم کامیابی حاصل کی ہے۔

نومبر 2025 میں، ٹیم نے تقویتی سیکھنے کا فریم ورک Miles کو اوپن سورس کیا، جو بڑے پیمانے پر RL ٹریننگ کی استحکام اور کارکردگی پر مرکوز ہے، جسے اب تک 20 سے زائد ٹیمیں MoE ماڈلز کے لیے تقویتی سیکھنے کے تربیت میں استعمال کر چکی ہیں۔

2025–2026 میں، استدلال، ٹول استعمال، اور ایجنٹک صلاحیتوں کی مقابلہ کاری مکمل طور پر بڑھ جائے گی، اور ہر ایک ترقی کے پیچھے ایک ایسا نظام درکار ہوگا جو超大规模分布式 RL کو برداشت کر سکے۔ صنعت کے مشاہدہ کرنے والوں نے ایک ایسا مسئلہ اٹھایا ہے جس کا بار بار ذکر تو ہوتا ہے لیکن طویل عرصے تک حل نہیں ہو سکا: آج کے بڑے ماڈل ٹیموں کے لیے سب سے زیادہ تکلیف دہ چیز کوئی ایک نقطہ بہتر بنانے سے زیادہ ہے۔ تربیت سے لے کر RL اور پھر لائیو انفرنس تک کی مکمل سلسلہ میں حدود کا تصادم، ہر ایک الگ الگ دیکھنے پر تقریباً بہترین ہے، لیکن جب انہیں ایک ساتھ جوڑا جاتا ہے تو ہر جگہ کارکردگی کم ہو جاتی ہے۔

مائلز اور ایس جی لینگ کا ترکیب، موجودہ بڑے ماڈل ٹیم کو "ٹریننگ-آر ایل-انفرنس" مکمل لائن پر سامنے آنے والی کارکردگی کے فرق کو پُر کرنے کی کوشش کر رہا ہے۔

نئے ماڈل Day-0 کی حمایت کی صلاحیت Infra ٹیم کی انجینئرنگ کی صلاحیت کا واضح اظہار ہے۔

25 اپریل کو، جٹل ڈیپ سیک-وی 4 جاری کیا گیا۔ اسی دن، ایس جی لینگ اور مائلز نے ڈیپ سیک-وی 4 کے انفرنس اور RL ٹریننگ دونوں کا ساتھ دینا شروع کر دیا۔ اس کا سبب ٹیم کی بنیادی سسٹم لیول آپٹیمائزیشن ہے، جس میں مکسڈ توجہ کے لیے شیڈو ریڈکس پریفکس کیش، ایک ہی چپ پر کمپریشن مکمل کرنے والا فلش کمپریسر، اور ٹاپ-کے لیٹنسی کو 15 مائکرو سیکنڈ تک کم کرنے والا لائٹننگ ٹاپ-کے شامل ہے، جس نے FP8 انفرنس سے BF16 ٹریننگ تک کی مکمل RL پائپ لائن کو جوڑ دیا۔

فُل اسٹیک کنسینس سپورٹ:

بڑے کھلاڑی ایک ساتھ داخل ہو رہے ہیں، وہ کس چیز سے پریشان ہیں؟

NVIDIA، AMD، MediaTek، Broadcom، Intel — ہارڈویئر لیول کی سب سے اہم کمپنیاں، جو سیڈ راؤنڈ میں ایک ساتھ موجود ہیں، صنعت میں تقریباً ناممکن ہے۔ درحقیقت، ہارڈویئر فرنٹس کو سب سے زیادہ معلوم ہے کہ ابھی کمپوٹیشن کی طاقت مہنگی اور نایاب ہے، اور صرف ہارڈویئر کا تعداد بڑھانا مستقل نہیں رہے گا۔ ایک ایسا اوپن سورس انفرنس سسٹم جو حقیقی طور پر ہارڈویئر کو الگ کرے اور ہیٹرو جینک پلیٹ فارمز پر چپ کی صلاحیت کو حد تک دبائے، ان کی سب سے بڑی اور فوری ضرورت ہے۔

ڈیٹابرکس، پائٹورچ کے موجد، اور OpenAI / Thinking Machines / xAI کے اہم افراد کے اشتراک سے ماڈل اور سسٹم لیول پر "ٹریننگ-انفرنس ایکیسی فراہم کرنے والی بنیادی ڈھانچہ" کی مضبوط توقع ظاہر ہوتی ہے۔ فہرست میں ہر نام ایک بہت ہی درست سرمایہ کاری کے نقطہ نظر کو ظاہر کرتا ہے:

چن لی وو، اینٹل کے سی ای او، جو سیمی کنڈکٹر صنعت میں کئی دہائیوں سے مہارت رکھتے ہیں۔
جان شولمان OpenAI کے سابق ملکی ملکیت دار، Thinking Machines Lab کے ملکی ملکیت دار، اور تقویتی سیکھنے کے ایک بنیادی قائم کنندہ ہیں۔
سومیت چنٹلا — پائٹورچ کے ملکہ موجد، عالمی گہری سیکھنے کے فریم ورک کا گیٹ کیپر۔
ایگور بابوشکن، ایکس اے آئی کے سابق ملکی مشارکہ کنندہ، نے صنعت کے سب سے پیچیدہ تربیتی نظام اور ہارڈویئر پلیٹ فارم کو خود تعمیر کیا ہے۔
لیلیان وینگ، تھنکنگ ماشینز لیب کے ماسہل، AI سسٹمز کے صنعتی سطح پر عملی اطلاق کے بارے میں سب سے ابتدائی نظریہ رکھتی ہیں۔

جب یہ لوگ جو کسی بھی موقع پر اکیلے فنڈنگ کا اہتمام کر سکتے ہیں، ایک ہی کیپ ٹیبل پر اکٹھے ظاہر ہوتے ہیں، تو یہ مستقبل کی دلچسپی کی نشاندہی ہے۔

ہر کسی کے لیے بنیادی ڈھانچہ: AI کی تعمیر کا حق اب صرف کچھ لوگوں کے ہاتھ میں نہیں

ریڈکس آرک کا خواب، ایک جملے میں بیان کیا جا سکتا ہے: AI انفراسٹرکچر کو ایک ایسی عوامی سہولت بنانا جو بجلی کی طرح عام، قابل اعتماد اور کسی کے بھی اکیلے کنٹرول میں نہ ہو۔ یہ سننے میں ایک مثالی اعلان جیسا لگتا ہے، لیکن عملی طور پر، وہ اس جملے کو حقیقت میں تبدیل کر رہے ہیں:

اکیڈمک دنیا

تین سال پہلے، ایک ایسے ڈاکٹری طالب علم کے سامنے جو LLM انفرنس آپٹیمائزیشن کر رہا تھا، عام طور پر صرف دو اختیارات ہوتے: ایک تو OpenAI کا API تھا جو ٹوکن کے حساب سے چارج ہوتا تھا اور جس کی کوئی اندر کی ساخت نہیں دیکھی جا سکتی تھی؛ دوسرا پرانا اوپن سورس کوڈ تھا جس کے README میں لکھا ہوا تھا کہ "ایک ہی GPU پر کام کرتا ہے"، جو کہ تحقیقی مقالے میں درج حقیقی ڈسٹریبیوٹڈ صورتحال سے سالوں کے انجینئرنگ کے فرق پر مشتمل تھا۔

SGLang نے اس دو میں سے ایک کو توڑ دیا — صنعتی سطح کی روزانہ ٹریفک، مکمل طور پر کوڈ کھلا ہوا، اسٹنفورڈ، برکلی، CMU، UW کے سسٹم ریسرچ گروپس اسے ڈیفالٹ بیس لائن کے طور پر سیٹ کرتے ہیں۔ ایجنٹس کے لیے ریسرچر کے لیے، RadixAttention کا پریفکس کیش مشترکہ پریفکس کو درخت کی شکل میں منظم کرتا ہے، جس سے ایک جیسے KV صرف ایک بار گنتے جاتے ہیں، جس کی وجہ سے وہ تجربہ جو پہلے دو دن لگتا تھا وہ اب صرف آدھے دن میں مکمل ہو جاتا ہے، مقامی طور پر پیپرز کے حوالہ جات میں SGLang کا ذکر تقریباً ڈیفالٹ اقدام بن چکا ہے۔

اسٹارٹ اپ کمپنی

ایک گروہ جو بڑی کمپنیوں سے چلے گئے، ایک خاص سینے کی گہری سمجھ کے ساتھ کاروبار شروع کرنے آئے۔ ان کے پاس ملین ڈالر کی کمپیوٹنگ بجٹ نہیں تھی، نہ ہی کوئی مخصوص انفرااسٹرکچر ٹیم، صرف ایک پروڈکٹ کے لیے ان کی جذبہ بھری احساس تھا۔

گزشتہ زمانے میں، پروڈکشن لیول کی انفرنس پائپ لائن کو تیار کرنا اور ہارڈ ویئر کے درمیان مطابقت کو برقرار رکھنا، سیڈ راؤنڈ کمپنیوں کے لیے زیادہ بوجھ تھا، اور انہیں بار بار گاڑیاں دوبارہ بنانے میں بہت زیادہ وقت ضائع ہوتا تھا۔ اب، وہ SGLang کے اوپر بیٹھ کر سامنے والی پرفارمنس کے قریب انفرنس سروسز شروع کر سکتے ہیں، اور Miles کے ذریعے شعبہ خاص ماڈلز تربیت دے سکتے ہیں—بنیادی ڈھانچہ اب رکاوٹ نہیں رہا، اور بچا ہوا وقت اور پیسہ ان کے اصل میں بنانا چاہنے والی چیزوں میں لگایا جا سکتا ہے۔

ٹیکنالوجی کا بڑا کھیل

کیوں Google، Microsoft، NVIDIA جیسی دنیا کی سب سے طاقتور اندر ہنگامی انفراسٹرکچر والی کمپنیاں SGLang کے صارفین کی فہرست میں شامل ہیں؟ جواب اس دور کے سرمایہ کاروں کی ساخت میں چھپا ہوا ہے — NVIDIA، AMD، MediaTek، Broadcom، Intel پانچ اہم ہارڈویئر فرنٹس ایک ساتھ داخل ہو گئے ہیں۔ وہ کسی بھی دوسرے سے زیادہ جانتے ہیں کہ ایک ہارڈویئر سے آزاد، کسی بھی مقابلہ کرنے والے سے بندھن مکین نہ رکھنے والا اوپن سورس رینشنگ سسٹم پورے ایکوسسٹم کے لیے کیا سمجھتا ہے۔ ایک ایسے اوپن سورس سسٹم کا استعمال جسے کمیونٹی کے مشترکہ طور پر برقرار رکھا جاتا ہے اور متعدد ہارڈویئر فرنٹس کے ذریعہ سپورٹ کیا جاتا ہے، خود ایک اعلیٰ ترین سطح کی انفراسٹرکچر کی حکمت عملی ہے۔

رادکس آرک کا افسانوی بیان جذباتی نہیں ہے، لیکن کافی تیز ہے:

اگلی نسل کے AI کو ذاتی بنیادوں تک رسائی کے حق سے منع نہیں کیا جانا چاہیے۔ زیادہ ٹیمیں اپنے مدلز، اپنے سسٹمز، اپنے مستقبل کو ملکیت دے سکتی ہیں۔

اس 100 ملین ڈالر کی بیج فنڈنگ کا مقصد صرف اس جملے کو انجینئرنگ کے عمل میں تبدیل کرنا ہے: SGLang کو کسی بھی نئے ماڈل کا دن-0 پروڈکشن معیار بنانا؛ Miles کو بڑے پیمانے پر تربیت اور RL کے لیے انسٹرافکچر لیول فریم ورک بنانا؛ اور اس کے بعد، اوپن سورس کور پر ایک ایسا مینجڈ پلیٹ فارم تعمیر کرنا جو ماڈلز کو لاک نہ کرے، کسٹمرز کو باندھ نہ کرے، لیکن بہترین انسٹرافکچر کی صلاحیتیں فراہم کرے۔

ریڈکس آرک کا خواب کبھی کسی کو بدلنا نہیں تھا۔ بلکہ اس کا مقصد یہ تھا کہ ایک اکادمیک لیب، ایک تین افراد کا ٹیم، ایک نئی سیڈ فنڈنگ حاصل کرنے والی اسٹارٹ اپ، اور ایک ٹریلین ڈالر کی قیمت والی بڑی کمپنی — سب کو ایک ہی بنیادی ڈھانچے کی شروعاتی لائن پر کھڑا کیا جائے۔

اگر 2023 میں Anthropic، 2024 میں Mistral، اور 2025 میں Thinking Machines Lab نے AI ماڈل لیئر پر ہر ایک ایک سمت کی پیشگوئی کی تھی، تو 2026 میں RadixArk نے ایک زیادہ بنیادی اور لمبے عرصے تک کا اندازہ لگایا ہے: آگے کے AI کے تعمیر کا حق واقعی کافی لوگوں کے ہاتھوں میں واپس لانا۔

فینانسنگ مکمل ہونے کے بعد، ٹیم نے اوپن سورس کمیونٹی کے لیے ایک واپسی کی شروعات کی: پلیٹ فارم پر رجسٹر ہو کر ٹویٹ فوروارڈ کرنے والوں کو RadixArk ہوسٹنگ پلیٹ فارم کے آفیشل لانچ کے بعد مفت استعمال کے اسکور ملیں گے۔ اس ٹیم کے لیے جو اوپن سورس کمیونٹی سے نکلی ہے، یہ اصل سونے کی طرح کی کمپوٹنگ پاور کے ذریعے SGLang کو آج تک پہنچانے والوں کا شکریہ ادا کرنا ہے۔

لنک: platform.radixark.com

ریڈکس آرک نے اگلی نسل کی کھلی AI بنیادی ڈھانچہ تعمیر کے لیے 100 ملین ڈالر کا بیج فنڈنگ حاصل کیا

دنیا کا بہترین استدلال انجن، ان کے ہاتھوں

دِن-0: DeepSeek V4 کو تربیت دینا

ہر کسی کے لیے بنیادی ڈھانچہ: AI کی تعمیر کا حق اب صرف کچھ لوگوں کے ہاتھ میں نہیں