ڈیپسیک نے API لاگتیں 100 گنا کم کر دیں، AI انفراسٹرکچر کی مرکزیت پر بحث شروع

icon MarsBit
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
26 اپریل، 2026 کے آن-چین خبروں کے مطابق، DeepSeek نے اپنے V4 لانچ کے ساتھ API لاگت کو 100 گنا کم کر دیا ہے۔ ان پٹ کیش ہٹ فیسز ایک دہائی تک کم ہو گئے، اور اسکیم کے ساتھ، اب ایک ملین ٹوکن کی قیمت صرف 0.025 RMB ہے۔ AI + کرپٹو خبروں میں اس کے اثرات پر زور دیا گیا، جس سے چین کے A-شیئر کمپیوٹنگ سیکٹر میں اضافہ ہوا۔ تاہم، بڑے کلاؤڈ فرمز کے طرف سے راسخہ خرچ میں اضافے کے باعث AI انفراسٹرکچر کے مرکزیکرن کے بارے میں فکر بڑھ رہی ہے۔ اس رجحان کے خلاف، گونکا پروٹوکول جیسے ڈی سینٹرلائزڈ حل GPU نیٹ ورکس کا آزمائش کر رہے ہیں۔

—— گونکا کے LA Hacks 2026 میں تقریر سے شروع کرتے ہیں

26 اپریل، دیپسیک نے V4 سیریز API کا نیا دام جاری کیا: تمام ان پٹ کی کیش میچنگ کی قیمت شروعاتی قیمت کی دسواں حصہ ہو گئی، اور پرو ورژن پر محدود وقت کی چھوٹ کے ساتھ، ایک ملین ٹوکن کی تعمیر کی لاگت صرف 0.025 یوان ہو گئی — جو ایک سال پہلے کے مقابلے میں تقریباً سو گنا سستا ہے۔ اے شیئرز کے کمپوٹنگ سیکٹر نے اس دن سب مل کر پرائس لِمٹ اوپر کاٹ دیا، اور مارکیٹ کا جذبہ جوش سے بھر گیا۔

لیکن خوشی کے پیچھے، ایک سوال ہے جس پر کوئی بھی سیدھے طور پر بات نہیں کر رہا: جب ماڈلز مزید سستے ہوتے جا رہے ہیں، تو ماڈلز چلانے کے لیے درکار کمپوٹیشنل پاور مزید مرکزیت حاصل کر رہی ہے۔

ڈیٹا جھوٹ نہیں بولتا۔ 2025 کے چوتھے تریمینے میں، مائیکروسافٹ، ایمیزون، میٹا اور گوگل کے چار کلاؤڈ فرنڈز نے مل کر سرمایہ کاری میں 64% کا اضافہ کیا، جو 1186 ارب ڈالر تک پہنچ گیا؛ 2026 کے پورے سال کے لیے مجموعی سرمایہ کاری میں مزید 53% کا اضافہ ہونے کا تخمنا ہے، جو 5708 ارب ڈالر تک پہنچ جائے گا۔ گوگل نے اسی دوران 2026 کے لیے TPU چپس کی برآمد کا مقصد 50% بڑھا کر 6 ملین یونٹ کر دیا۔ نیوڈیا کے H100 سیریز کے ڈلیوری کا دورانیہ کچھ مارکیٹس میں کئی ماہ تک ہو چکا ہے۔

ماڈل لیور کی قیمت ڈیٹرمنیشن کا اختیار ڈویلپرز کی طرف جا رہا ہے، لیکن کمپوٹیشنل پاور لیور کا کنٹرول کم تعداد کے چند بڑوں کی طرف زیادہ تیزی سے مرکوز ہو رہا ہے۔ یہ AI دور کا ایک پوشیدہ مگر گہرا تنازعہ ہے۔

گونکا

اس سیاق میں، 24 اپریل 2026 کو، گونکا پروٹوکول کے ملکی معاون ڈینیل اور ڈیوڈ لیبرمن نے LA Hacks 2026 کے بنیادی تقریر کے منبر پر قدم رکھا۔ یہ UCLA کا سالانہ سب سے بڑا یونیورسٹی ہیکتھون تھا، جس کے بنیادی تقریر کنندگان اس سال لیبرمن بھائی تھے، جن کے سامنے صنعت میں داخل ہونے والے سینکڑوں عظیم انجینئرز تھے۔ انہوں نے جو سوال پیش کیا، وہ اس لمحے خاص طور پر واضح تھا: ڈی سینٹرلائزڈ کمپوٹنگ، اب بھی وقت ہے؟

ایک، کم قیمت کے موج کا دوسرا پہلو

ڈیپ سیک V4 کی قیمت میں کمی کا منطق، ظاہری طور پر تکنیکی ترقی کے نتیجے میں آنے والی کارکردگی کا فائدہ ہے — نئے توجہ کے طریقہ کار نے ٹوکن کے ابعاد کو کم کر دیا ہے، جو DSA کے اسپارس توجہ کے ساتھ مل کر حساب کتاب اور گرافک میموری کی ضرورت کو بڑھا دیتا ہے۔ لیکن قیمت میں مستقل کمی کا ہونا اس بات پر منحصر ہے کہ کسی جگہ پر کمپوٹنگ کی طاقت کافی حد تک دستیاب اور سستی ہو۔

حقیقت یہ ہے کہ یہ "کافی" طاقت کا ذریعہ عالمی سطح پر تیزی سے کچھ نوڈس پر مرکوز ہو رہا ہے۔ فوٹونکس کے لیڈر Lumentum کے سی ای او مائیکل ہرلسٹن نے حال ہی میں کہا کہ موجودہ رجحان کے مطابق، کمپنی کی 2028 تک کی پیداوار تقریباً پوری بک ہو چکی ہے۔ یہ صرف ایک کمپنی کی پریشانی نہیں بلکہ AI بنیادی ڈھانچے کی سپلائی چین کا ایک جمع مسائل ہے جو تیز رفتار تقاضوں کے سامنے تنگ ہو رہا ہے۔

ڈانیل نے LA Hacks کے ایک تقریر میں ایک سادہ لیکن طاقتور موازنہ پیش کیا: بٹ کوائن نیٹ ورک کی کمپوٹنگ طاقت، گوگل، مائیکروسافٹ اور ایمزون کی تینوں کلاؤڈ ڈیٹا سینٹرز کی کل طاقت سے زیادہ ہے — لیکن یہ طاقت کیا کر رہی ہے؟ ایک ایسے ہیش پہیلی کو حل کر رہی ہے جس کا جواب کسی کو ضرورت نہیں۔ عالمی سطح پر بے کار GPU کمپوٹنگ بھی اسی طرح ہے: گیمرز کے مachines میں گرافکس کارڈ، یونیورسٹی لیبز میں سرورز، اور چھوٹے اور درمیانے کلاؤڈ فراہم کنندگان کے پاس موجود زائد صلاحیت — مجموعی طور پر بہت بڑی مقدار میں ہے، لیکن تنظیم کے فقدان کی وجہ سے AI ریزننگ کے لیے استعمال نہیں ہو سکتی۔

گونکا کا مقصد یہی ہے کہ وہ اس تنظیم کے مسئلے کو حل کرے — عالمی سطح پر بکھرے ہوئے غیر مستعمل GPU کو کام کے ثبوت کے انعامی نظام کے ذریعے جوڑ کر ایک� ایسی نیٹ ورک بنائے جو حقیقی AI انفرنس کے کاموں کو سنبھال سکے۔

دوسری، استدلال نیا میدان جنگ ہے

ڈیپسیک کی قیمت میں کمی نے چینی انٹرنیٹ پر "AI پلیٹ فارم" کے بارے میں وسیع بحث کو جنم دیا۔ لیکن ایک نظرانداز کیا گیا تفصیل یہ ہے کہ قیمت میں کمی "کال کی قیمت" پر ہوئی ہے، "کمپوٹیشنل کوسٹ" پر نہیں۔ جب AI اطلاقات کا پیمانہ بڑھتا ہے، تو استدلال کالوں کی تعداد کا اضافہ اسی طرح ہوتا ہے — صنعت کے تخمنوں کے مطابق، 2026 تک، استدلال عالمی AI کمپوٹیشنل استعمال کا تقریباً دو تہائی حصہ بن جائے گا۔

اس کا کیا مطلب ہے؟ ہر سطح پر کال کی قیمت کم ہونے پر، درکار کل کمپوٹیشنل پاور زیادہ ہی ہوگی، کم نہیں۔ بڑے ماڈلز کی “لोک دیو”، کچھ حد تک کمپوٹیشنل پاور لیئر کے مرکزیکرن کو تیز کر رہی ہے — کیونکہ صرف وہی کھلاڑی جن کے پاس بڑے پیمانے پر کمپوٹیشنل پاور ہے، وہی انتہائی کم مارجن پر انفرنس سروسز چلانے میں کامیاب ہو سکتے ہیں۔

یہ ایک تشکیل پذیر ساختی بندش ہے: جو بھی استدلال کے پہلو پر فزیکل کمپوٹنگ طاقت کو کنٹرول کرتا ہے، وہ AI کے دور کی اصل انفراسٹرکچر کے دروازے کو کنٹرول کرتا ہے۔ اس نقطہ نظر سے، غیر مرکزی کمپوٹنگ نیٹ ورک کا معنی صرف "50% سستا" لاگت میں کمی نہیں، بلکہ مرکزیت کی بندش پوری ہونے سے پہلے ایک ساختی متبادل راستہ فراہم کرنا ہے۔

تین: نوجوان تعمیر کاروں کے لیے حقیقی سوال

LA Hacks کے شرکاء — کیلیفورنیا کے بہترین یونیورسٹیوں کے انجینئرز اور پروڈکٹ ماہرین — جلد ہی ایک غیر رومانوی انجینئرنگ کا انتخاب کرنے کا سامنا کریں گے: اپنا پروڈکٹ کس کمپوٹنگ لیول پر بنائیں۔

آپ کے AI پروڈکٹ کا انفرینس کون سے سرورز پر چل رہا ہے؟

جب وہ پلیٹ فارم قیمت کی پالیسی یا رسائی کی پالیسی تبدیل کرتا ہے، تو کیا آپ کے پاس منتقل ہونے کی صلاحیت ہے؟

آپ کی طرف سے بنائے گئے صارفین کا احجام، کیا آپ کو اپنی قیمت بڑھا رہا ہے یا پلیٹ فارم کو چیپس فراہم کر رہا ہے؟

ویب2 کے دور میں ڈیولپرز نے پہلے ہی ان مسائل کا تجربہ کر چکے ہیں: جب ایپ کی کہانی پلیٹ فارم کے الگورتھم یا تقسیم کے قوانین سے گہرائی سے جڑ جائے، تو "آزادی" ایک ایسا لفظ بن جاتا ہے جسے مستقل طور پر دوبارہ تعریف کیا جانا چاہیے۔ AI کے دور میں کمپوٹنگ پاور کی انحصار، اسی منطق کو بنیادی طور پر دوبارہ تکرار کرے گا، اور کیونکہ تبدیلی کا اخراج زیادہ ہوگا، لکھنے کا اثر صرف زیادہ مضبوط ہوگا۔

گونکا

ہیکتھون، ایک فارم کے طور پر، اپنے اندر ایک مزاحیہ تضاد رکھتا ہے: 36 گھنٹوں میں، کم سے کم وسائل اور سب سے تیز رفتاری کے ساتھ قابل عمل چیز بنانا — جو کہ ڈی سینٹرلائزڈ نیٹ ورک کے انگیجمنٹ میکنزم کا مقصد ہے۔ دانیل نے LA Hacks پر اسٹیج پر کھڑے ہو کر صرف گونکا کے بارے میں بات نہیں کی، بلکہ اس نے اس گروہ سے یہ سوال کیا: آپ کا مستقبل کا کام، اس مرکزیت کے رجحان کو تیز کرنے میں مدد کر رہا ہے، یا نئے امکانات پیدا کر رہا ہے؟

چار: PoW 2.0: ایک انجینئرنگ مسئلہ

گونکا نے عمل کے ثبوت کے انعامی ڈھانچے کو ہیش کمپیوٹیشن سے AI استدلال کی طرف دوبارہ ہدایت کر دیا، جس سے نیٹ ورک میں تقریباً 100% کمپوٹیشنل طاقت کا حصہ حقیقی کاموں سے منسلک ہوتا ہے۔ اس نظام کا ایک انجینئرنگ کے لحاظ سے اہم تقاضا یہ ہے کہ AI استدلال کے کام قابل تصدیق اور قابل دہرائی ہونے چاہئیں — جب نفس مدل وزن، نفس رینڈم سیڈ اور ان پٹ دیا جائے، تو کوئی بھی نوڈ حساب کتاب کا نتیجہ دوبارہ بناسکے اور اس کی درستگی کی تصدیق کرسکے۔ یہی گونکا کے لیے اکیڈمک پروٹو ٹائپ سے قابل عمل نیٹ ورک تک جانے کا مرکزی انجینئرنگ چیلنج ہے۔

اقتصادی نقطہ نظر سے، اس نظام کا مقصد یہ ہے کہ ٹوکن کی قیمت فزیکل کمپوٹیشنل طاقت کے اخراجات سے گہرائی سے جڑی ہو، نہ کہ لیکویڈٹی کے جذبات سے۔ کمپوٹیشنل طاقت فراہم کرنے والے مائنز کو انعام ملتا ہے، جبکہ طاقت استعمال کرنے والے ڈویلپرز فیس ادا کرتے ہیں، اور پورے نظام کا انسپائریشن سائکل کسی بھی درمیانی طرف کی بخشنے والی نیت پر منحصر نہیں ہوتا۔

بے شک، ٹیکنیکل ممکنہ ہونا صرف ایک پہلو ہے۔ مشکل تر سوال یہ ہے کہ: حسابی طاقت کی ضرورتیں تیزی سے بڑھ رہی ہیں اور بڑے کھلاڑیوں کی سرمایہ کاری صدیوں ارب ڈالر کے تقاضوں پر مبنی ہے، ایک برادری کے خودبخود کنtributions پر مبنی ڈسٹریبیوٹڈ کمپوٹنگ نیٹ ورک کیا سائز کے لحاظ سے حقیقی مقابلہ بن سکتا ہے؟

گونکا کے ابتدائی ڈیٹا سے ایک حوالہ نقطہ ملتا ہے: مین نیٹ ورک لانچ کے ایک سال سے کم عرصے میں، نیٹ ورک کی مجموعی کمپوٹنگ طاقت 60 H100 کے برابر سے بڑھ کر 10,000 سے زائد ہو گئی، جس کا رخ عالمی سطح پر سو سے زائد مستقل نوڈس کے خودبخود شامل ہونے سے آیا، مرکزی طور پر ترتیب دینے کے بجائے۔ یہ ثابت نہیں کرتا کہ پیمانے کا مسئلہ حل ہو چکا ہے، لیکن یہ ظاہر کرتا ہے کہ انعامات کا نظام ابتدائی نمو کو مؤثر طریقے سے چلا رہا ہے۔

پانچویں: ونڈو پیریڈ کے مسائل

تاریخی طور پر، بنیادی ڈھانچے کی قیادت اکثر ابتدائی مراحل میں جلد ہی ایک ہی راستے پر مرکوز ہو جاتی ہے — ریلوے کے دور میں ایسا ہوا، انٹرنیٹ کے دور میں ایسا ہوا، اور موبائل انٹرنیٹ کے دور میں بھی ایسا ہوا۔ ہر بار، کچھ لوگوں نے معیار کے مستحکم ہونے سے پہلے ہی اپنا جگہ تلاش کر لیا، جبکہ کچھ لوگوں نے مرکزیت مکمل ہونے کے بعد ہی احساس کیا کہ شرکت کے مواقع بڑھ چکے ہیں۔

AI کیلکولیشن انسٹالیشن اب کس مرحلے پر ہے؟ چار بڑے کلاؤڈ فراہم کنندگان کے 2026 کے 5708 ارب ڈالر کے توقعی سرمایہ کاری خرچ کے حوالے سے، مرکزیت تیزی سے بڑھ رہی ہے؛ لیکن ڈویلپرز کے عملی استعمال کے انداز کے حوالے سے، سپلائی سائیڈ پر اب بھی بہت سے ایسے وسائل موجود ہیں جن کا مؤثر طریقے سے ادغام نہیں ہوا ہے۔ یہ خلا، غیر مرکزی نیٹ ورک کے لیے ساختی طور پر موجود رہنے کا موقع ہے۔

ڈانیل نے اپنے تقریر میں ایک تقابل پیش کیا: 2000 کے انٹرنیٹ فوم کے ٹوٹنے کے بعد، جو باقی نہیں رہا وہ تباہی تھی، بلکہ پوری دنیا میں بچھا ہوا فائبر آپٹک نیٹ ورک تھا جس نے اگلے بیس سالوں تک ڈیجیٹل اقتصاد کو چلایا۔ AI انفراسٹرکچر کے سرمایہ کاری کے جوش کے ٹھنڈا ہونے کے بعد، جو کمپوٹنگ پروٹوکول اور انعامات کے نظام باقی رہ جائیں گے، وہ اگلے سائکل کی انفراسٹرکچر بن جائیں گے — صرف یہ سوال ہے کہ کون سے پروٹوکول کا بنیادی منطق اتنا مضبوط ہوگا کہ دباؤ کے باوجود بھی کام کرتا رہے۔

یہ کسی خاص پروجیکٹ کے بارے میں سوال نہیں ہے، بلکہ پورے ڈی سینٹرلائزڈ AI سیکٹر کو سامنا کرنا ہوگا: حکومتی ڈیزائن کیا واقعی ایک مرکزی کنٹرول کے زوال کا مقابلہ کر سکتا ہے؟ انعامات کا نظام جب سائز بڑھ جائے تو کیا اب بھی موثر رہے گا؟ کمپوٹنگ نیٹ ورک کی ڈی سینٹرلائزیشن، کیا ٹیکنالوجی کے عمل، ٹوکن جاری کرنے، اور اپ گریڈ فیصلہ سازی کے تین ابعاد میں ایک ساتھ قائم ہے؟

اختتام

ڈیپسیک کی قیمت میں کمی نے "AI کی عوامیت" کے نریٹیو کو دوبارہ گرم کر دیا ہے۔ لیکن عوامی استدلال کالز اور عوامی کمپوٹیشن انفراسٹرکچر، دو الگ باتیں ہیں۔ پہلی چیز ابھی ہو رہی ہے؛ دوسری چیز کب ہوگی، اس کا فیصلہ اگلے کچھ سالوں میں یہ ہوگا کہ کتنے لوگ اسے ایک قابل حل انجینئرنگ مسئلہ سمجھتے ہیں، نہ کہ صرف ایک اچھا سننے والا نریٹیو۔

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔