ای آئی ٹوکن بلز میں دھماکہ: ایک رات میں 500 ملین، 1.3 ملین اور 18 ہزار

icon MarsBit
بانٹیں
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconخلاصہ

expand icon
AI اور کرپٹو خبروں نے حالیہ واقعات میں ٹوکن کی قیمتیں بڑھ جانے کے ساتھ نیا ریکارڈ حاصل کیا۔ ایک کمپنی نے ایک غیر مانیٹرڈ کلاؤڈ اکاؤنٹ کی وجہ سے ایک ماہ میں 500 ملین ڈالر کا بل دیا۔ ایک گوگل کلاؤڈ صارف کا 7 ڈالر کا بجٹ ایک API کی کے لیک ہونے کے بعد 18,000 ڈالر تک پہنچ گیا۔ OpenClaw کے پیٹر اسٹینبرگر نے 30 دنوں میں 1.3 ملین ڈالر کا OpenAI API چارج رپورٹ کیا۔ نئے ٹوکن لسٹنگز بڑھ رہی ہیں، لیکن پلیٹ فارمز کے ٹوکن-بنیادی بلنگ پر منتقل ہونے کے ساتھ غیر منضبط خرچ کے خطرات بھی بڑھ رہے ہیں۔

ایک ماہ میں 5 ارب ڈالر کا بل جلایا گیا!

ہالیا دنوں، ٹیک صنعت میں ایک بڑا غلط فہمی کا واقعہ سامنے آیا۔ ایکسیوس کے مطابق، ایک کمپنی نے صرف ایک ماہ میں کلاڈ پر 5 ارب ڈالر کا اخراج کر دیا!

وجہ حیران کن ہے: مینجمنٹ نے ملازمین کو کلاڈ اکاؤنٹ کی دسترسی فراہم کرتے وقت استعمال کی حد کا تعین نہیں کیا۔

گٹہب

اصل میں، AI بلز کے بارے میں صرف ایک ہی کمپنی نہیں ہے جو بار ہو گئی ہے۔

اس سال اپریل میں، ایک گوگل کلاؤڈ صارف کو ایک عام سروس میں چھوڑے گئے API کی کی وجہ سے غلط استعمال کا سامنا کرنا پڑا، جس کا اصل بجٹ صرف 7 ڈالر تھا، لیکن اس کو ایک رات میں 18,000 ڈالر کا بل ملا۔

گٹہب

یہ بدقسمت صارف نام Jesse Davies ہے، جو ایک آسٹریلوی AI مشیر اور Agentic Labs کا بانی ہے۔ اس نے اپنے Google Cloud اکاؤنٹ کے لیے دو تحفظات رکھے ہیں: ایک 10 آسٹریلوی ڈالر (تقریباً 7 ڈالر) کا بجٹ ایلرٹ، اور ایک 1400 ڈالر کا سخت خرچ کی حد۔

ٹومز ہارڈویئر کے مطابق، حملہ آور نے کچھ ماہ پہلے AI Studio سے جاری کیا گیا ایک Cloud Run سروس دریافت کیا، جس پر 60,000 سے زیادہ درخواستیں بھیجیں، اور دونوں محفوظ نظاموں نے روک نہیں پایا: بل کی گنتی میں تاخیر تھی، جب تک سسٹم نے رد عمل نہیں کیا، رقم 18,000 امریکی ڈالر تک پہنچ چکی تھی۔

مئی کے وسط میں، اوپن سورس پروجیکٹ OpenClaw کے بانی پیٹر اسٹینبرگر نے ایک اسکرین شاٹ X پر شیئر کیا: 30 دن، OpenAI API کا بل 1.3 ملین امریکی ڈالر۔

گٹہب

اس کی ٹیم میں صرف تین افراد تھے، لیکن ان کے زیر انتظام 100 کوڈیکس ایجنٹز متوازی طور پر چل رہے تھے: 30 دن میں 6030 ارب ٹوکن استعمال ہوئے اور 76 لاکھ درخواستیں جاری ہوئیں۔ خوش قسمتی سے، یہ 1.3 ملین امریکی ڈالر اس کی اپنی جيب سے نہیں نکلے تھے۔

اسٹائنبرگر نے 2024ء کے فروری میں OpenAI میں شمولیت اختیار کی، اور یہ 1.3 ملین امریکی ڈالر ایک اندر کے تجربے کے طور پر دیا گیا:

اگر ٹوکن لاگت کو نظرانداز کیا جائے تو AI پروگرامنگ کس حد تک جا سکتی ہے۔ اس نے مزید کہا کہ یہ Codex کی «Fast Mode» (تیز رفتار بکنگ) کا نتیجہ ہے، جسے بند کرنے کے بعد تقریباً 300,000 امریکی ڈالر ہوتا ہے۔

پہلے، یوبر کے سیٹیو پراوین نیپالی ناگا نے The Information کو تسلیم کیا کہ کمپنی نے اپریل میں پورے سال کا Claude Code بجٹ ختم کر دیا تھا، اور ان کے COO نے بھی علنی طور پر کہا کہ AI کے اخراجات آہستہ آہستہ "منطقی طور پر برقرار رکھنا مشکل" ہوتے جا رہے ہیں۔

5 ارب، 130 لاکھ، 1.8 ہزار، رقمیں کئی درجہ بندیوں کے فرق کے ساتھ، لیکن ایک ہی حقیقت کی طرف اشارہ کرتی ہیں:

ذكاءِ مصنوعی کے دور میں، بے قابو کلیدیں، رات دن بے ترتیب ذكاءِ مصنوعی فوج، اور حدود کی ترتیب نہ کرنے والے اکاؤنٹس: ان میں سے کوئی بھی آپ کے ٹوکن کا بیلنس ایک رات میں ختم کر سکتا ہے۔

AI بِل کیوں بور ہو جاتا ہے؟

جواب بنیادی طور پر فیس کی ساخت میں تبدیلیوں میں چھپا ہوا ہے۔

اپریل 2024 سے، OpenAI کی ماہانہ سبسکرپشن ٹریفک کے مطابق ٹوکن استعمال پر منتقل ہو گئی۔

2 اپریل کو، Codex کے بلنگ کا طریقہ میسج کے مطابق اندازہ لگانے سے بدل کر Token استعمال کے مطابق کر دیا گیا: ان پٹ، کیش ان پٹ، اور آؤٹ پٹ کو الگ الگ Token کے طور پر گنتا جائے گا۔ 23 اپریل کو، یہ قاعدہ تمام Enterprise، Edu، Health، اور Gov منصوبوں تک وسعت دی گئی: ماہانہ فیس میں وہ ناپید خرچ کو ختم کر دیا گیا۔

گیٹھب بھی اس کے بعد آ گیا، اور ابھی تازہ ترین اعلان کیا ہے: تمام کوپائلٹ پیکجز 1 جون 2026 سے استعمال کے مطابق بلنگ پر منتقل ہو جائیں گے۔ پرانا اعلیٰ درخواست منطق منسوخ، اور AI کے امتیازات کے ساتھ تبدیل ہو جائے گا، جہاں داخلی ٹوکن، باہری ٹوکن، اور کیش ٹوکن کے حقیقی استعمال کے مطابق، ہر ماڈل کی API شرح کے مطابق بل کیا جائے گا۔

گٹہب

گٹہب نے اس کی وجوہات کی وضاحت کی:

اب ایک تیز چیٹ سوال اور کئی گھنٹوں تک خودکار کوڈنگ کا کام کرنے والے صارفین کا خرچہ ایک جیسا ہے۔ گٹھبب نے ہمیشہ ان صارفین کے لیے ادائیگی کی ہے جو بھاری کام چلاتے ہیں، لیکن یہ ماڈل قابلِ استمرار نہیں رہا۔

AI ایجینٹس کے طلوع سے پہلے، چیٹ اور مکمل کرنے کی لاگت تقریباً ایک جیسی تھی، ماہانہ فیس کے اندر آ جاتی تھی۔

ذکاﺅ کے ظہور کے بعد، ایک ٹاسک کئی گھنٹوں تک لگاتار چل سکتا ہے اور پورے کوڈ بیس میں تبدیلی کر سکتا ہے، جس سے شدید استعمال کرنے والوں اور ہلکے استعمال کرنے والوں کے درمیان لاگت کا فرق کئی درجہ بڑھ جاتا ہے۔ اس فرق کے سامنے ماہانہ فیس کا نظام بالکل ختم ہو جاتا ہے۔

خبر کے ساتھ، ریڈیٹ اور ایکس پر بہت ساری گنجائش ہو گئی۔

ایک ڈیولپر جس کا ID JBusu ہے، نے بِل کی ایک اسکرین شاٹ شیئر کی اور کہا کہ نئی قیمت "بس مزاح ہے"۔ جبکہ پہلے ماہانہ خرچ 28.12 امریکی ڈالر تھا، نئے نظام کے تحت اسے 746.01 امریکی ڈالر ادا کرنے ہوں گے، اس لیے وہ سبسکرپشن منسوخ کرنے کا فیصلہ کر چکا ہے: "اس قیمت پر، میں اپنا کلاؤڈ سرور کرایہ پر لے لوں گا تو وہ سستا ہو جائے گا۔"

گٹہب

گٹہب

ایک اور صارف نے ایک زیادہ بڑھ چڑھ کر اسکرین شاٹ شیئر کیا، جس میں فیس 50 ڈالر سے بڑھ کر 3000 ڈالر ہو گئی، اس نے کہا کہ اس نے قیمت کو اتنی غیر منطقی سمجھا، "کیا اب بھی کوئی سبسکرائب کر رہا ہے؟"

گٹہب

تاہم کچھ کوپائلٹ کے پرانے صارفین نے رد عمل دیا: یہ انتہائی بلز زیادہ تر vibe-coder (جذباتی طور پر کوڈنگ کرنے والے) کی وجہ سے ہیں جو ٹوکن جلانے کو اہمیت نہیں دیتے، اور عام استعمال کی نمائندگی نہیں کرتے۔

ایک پرانے صارف نے کمنٹس سیکشن میں لکھا: "میں پورا دن استعمال کرتا ہوں، ماہ کے آخر میں زیادہ خرچ نہیں کرتا، یہ سمجھنا مشکل ہے کہ یہ کام کی پیچیدگی کا فرق ہے۔" دوسرے نے زیادہ براہ راست کہا: "بس کسی کو مکمل طور پر آٹومیٹڈ YOLO موڈ چاہیے، جس میں AI جس طرح چاہے دوڑے۔ اس قسم کا ضائع ہونا ختم ہونا باقی لوگوں کے لیے بہتر ہے۔"

ایک بات واضح ہے: گیٹھب نے ماہانہ فیس ختم نہیں کی ہے، بنیادی سبسکرپشن کی قیمت میں کوئی تبدیلی نہیں ہوئی ہے۔ اصل میں تبدیلی اضافی استعمال، ایجنٹ ٹاسکس، اور مہنگے ماڈل کالز میں ہوئی ہے، جس کے ساتھ اب استعمال کے لحاظ سے بلنگ شروع ہو گیا ہے۔

سب سے زیادہ متاثرہ، وہ زیادہ استعمال کرنے والے ایجینٹ صارفین ہیں جو کوپائلٹ کے ذریعے لمبی چین کے کام چلا رہے ہیں۔

اپنے ہی لوگوں کے کارناموں سے خراب ہونے والا رینکنگ

ماہانہ فیس کھو گئی، ایک طرف پلیٹ فارم نے فیس کے قواعد تبدیل کر دیے، دوسری طرف AI استعمال کرنے والے خود بھی زور سے خرچ کر رہے ہیں۔

مئی میں، بزنس انسرٹر نے رپورٹ کیا کہ ایمیزون نے ایک اندر کا AI استعمال کا رینکنگ لسٹ، کائرو رینک، بند کر دیا۔

یہ رپورٹ عہدہ داروں کے حوالے سے کہتی ہے کہ اس فہرست نے ایک عجیب کام کا انداز پیدا کر دیا ہے: کچھ ملازمین فہرست میں اپنی پوزیشن بہتر بنانے کے لیے ایسے ٹوکن استعمال کرتے ہیں جو عملی مسائل کا حل نہیں کرتے، صرف رینکنگ کے لیے۔

گٹہب

بعد اس کے کہ یہ خبر سامنے آئی، ایمیزون کے سینئر وائس پریزیڈنٹ ڈیو ٹریڈول نے تمام ملازمین کو براہ راست متوجہ کیا: "AI کا استعمال اس لیے نہ کریں کہ آپ اسے استعمال کرنا چاہتے ہیں۔ اسے صارفین کے مسائل، کاروباری مسائل اور نوآوری کے لیے حل کرنے کے لیے استعمال کریں۔"

یہ بات تھوڑی بیوقوفانہ لگتی ہے، لیکن حیرانی کی بات نہیں۔ جب "ٹوکن جلانا" فہرست میں آ جائے، تو ملازمین خود بخود ٹوکن جلانے لگیں گے۔

سیلیکون ویلی نے اس ظاہر کے لیے ایک خاص نام دیا: ٹوکن میکسنگ، جہاں استعمال کو پیداوار کے طور پر دیکھا جاتا ہے۔

ایکسیوس کی رپورٹ میں بھی ذکر کیا گیا ہے کہ ایک سی ٹی او نے پایا کہ ملازمین AI ماڈلز کا استعمال موسم کی جانچ، روزمرہ کے ای میلز لکھنے کے لیے کر رہے ہیں، جو بہت آسان کام ہیں، لیکن سب سے مہنگے جدید ماڈلز کا استعمال کرنے سے بل بے خبری سے بڑھ جاتے ہیں۔

کیرو رینک ایمیزون کا افسرانہ ارزیابی نظام نہیں ہے، بلکہ ملازمین کی طرف سے بنائی گئی ایک غیر رسمی ٹول ہے۔ لیکن یہ ایک مشہور مینجمنٹ کا قانون واضح طور پر ظاہر کرتا ہے: جب KPI غلط طریقے سے طے کیا جائے، تو لوگ سب سے ذکاوت سے خلا کا فائدہ اٹھاتے ہیں۔

"کتنا استعمال کیا گیا" کو "کتنا اچھا کیا گیا" کے برابر سمجھنا — یہی اس AI کی لہر میں بربادی کا نظام گت جڑ ہے۔

ٹوکن کا حساب لینے والا، پہلے سے کمائی کر رہا ہے

ٹوکن بل کی پریشانی کے دوسرے پہلو میں، کچھ لوگ اسے ایک کاروبار بنانے لگے ہیں۔

پہلا راستہ: AI کو متن کے ساتھ بھر دیں۔

Glean اروند کی اپنی کمپنی ہے۔ یہ کمپنی کے لیے AI ورک اسٹیکس بناتی ہے: کمپنی کے مختلف حصوں میں بکھرے ہوئے معلومات کو ایک ساتھ جوڑ دیتی ہے، تاکہ ملازمین کے AI کو فوری طور پر متعلقہ سیاق و سباق مل سکے اور انہیں اپنی فائلیں ڈھونڈنے کی ضرورت نہ پڑے۔ AI کم راستے طے کرتا ہے، اس لیے اس کا Token استعمال بھی کم ہوتا ہے۔

اس نظام کی وجہ سے گلین کی سالانہ آمدنی 15 ماہ میں تین گناہ ہو گئی، 3 ارب ڈالر کا عبور کر گئی، اور اس کے صارفین میں ڈیٹابرکس، ریڈٹ، سیم سانگ شامل ہیں۔

دوسرا راستہ: کام کو صحیح ماڈل کو سونپنا۔

ماڈل راؤٹنگ اسٹارٹ اپ Factory AI یہی کام کرتی ہے: ہر ٹاسک کو خودکار طور پر سب سے مناسب ماڈل کو منتقل کر دیتا ہے، آسان ٹاسکس کو سستے ورژن پر اور پیچیدہ ٹاسکس کو ٹاپ آف دی لائن پر۔ اروند نے بھی کہا تھا: اگر راؤٹنگ صحیح طریقے سے کی جائے، تو آپ 10 گنا بچا سکتے ہیں۔

یہ دو راستے ایک ہی مقصد تک پہنچتے ہیں: AI کو کام کروائیں، لیکن اسے بے جا خرچہ نہ کرنے دیں۔

学术界的研究也在为这种转变奠定基础。

گٹہب

https://arxiv.org/pdf/2604.22750

2026ء کے اپریل کی ایک arXiv کی تحریر، جس نے پہلی بار سمارٹ ایجینٹ کوڈنگ کے کام کو کیسے پیسہ خرچ کرتا ہے، نظام طور پر ٹوٹا۔

نتیجہ ایک: ایجنٹ کے کام کے لیے ٹوکن کا استعمال عام کوڈ ریزننگ اور کوڈ ڈائیلاگ کے مقابلے میں ہزاروں گنا زیادہ ہو سکتا ہے، جس کا اصل سبب ان پٹ ٹوکن ہے۔

نتیجہ دو: ایک ہی کام کو多次 چلانے سے ٹوکن کی استعمالی مقدار میں 30 گنا فرق آ سکتا ہے۔

نتیجہ تین: زیادہ ٹوکن کا استعمال ضروری طور پر زیادہ درستگی کا مطلب نہیں۔ درستگی عام طور پر متوسط لاگت پر اپنی اعلیٰ سطح تک پہنچتی ہے — اس کے بعد زیادہ خرچ کرنے سے پیسہ برباد ہوتا ہے اور اثرات متاثر ہوتے ہیں۔

مطالعہ میں یہ بھی پایا گیا کہ سرحدی ماڈل اپنے خود کو کتنے ٹوکنز کی ضرورت ہوگی اس کا تخمہ لگانے میں بھی ناکام رہتے ہیں، اور وہ عام طور پر حقیقی لاگت کو کم اندازہ لگاتے ہیں۔

آپ سوچتے ہیں کہ زیادہ پیسہ خرچ کرنے سے زیادہ کام ہو جائے گا۔ اصل میں، پیسہ خرچ ہو جاتا ہے، لیکن کام بہتر نہیں ہوتا، اور بجٹ بھی درست نہیں ہوتا۔

جب AI بِلز انسانی لاگت کو پیچھے چھوڑنے لگیں

یہ میری یادداشت میں پہلی بار ہے کہ ٹیکنالوجی کی لاگت اور انسانی وسائل کی لاگت برابر ہو گئی۔

29 مئی، گلین کے سی ای او اروند جین نے سی این بی سی کے رپورٹر ڈیئرڈر بوسا کے ساتھ انٹرویو میں کہا۔

گٹہب

نیوڈیا کے ڈیپ لرننگ کے وائس پریزیڈنٹ برائن کیٹانزارو کی مشاہدات بھی اس بات کی تصدیق کرتی ہیں۔

اس نے ایکسیوس انٹرویو میں کہا کہ اس کی ٹیم کے لیے، حسابی طاقت کی لاگت پہلے ہی ملازمین کی تنخواہوں سے کہیں زیادہ ہو چکی ہے۔

ایسے ظاہر ہونے والے ظاہریات کئی کمپنیوں میں دیکھے جا رہے ہیں: کاروباری AI کے لیے Glean سے لے کر AI کی کمپوٹنگ پاور بیچنے والی NVIDIA تک، اور AI کا استعمال کرنے والی Uber تک، سب نے اس حساب کو دوبارہ جانچا ہے۔

اروند کے خیال میں، تاریخی طور پر ٹیکنالوجی صرف کمپنی کے کل اخراجات کا ایک چھوٹا سا حصہ تھی، لیکن اب AI کے اخراجات تنخواہوں کے برابر ہو گئے ہیں، اور بہت سی کمپنیوں کے سالانہ AI بجٹ عام طور پر صرف ایک سے دو ماہ میں ختم ہو جاتے ہیں۔

گٹہب

گزشتہ سال، AI کے استعمال کو عبادت کیا جانے والا ایک اشارہ تھا: زیادہ استعمال کرنا ترقی ہے، ٹوکن جلانا مستقبل کو اپنانا ہے۔ اب، بہت سی کمپنیاں اس سادہ بات پر دوبارہ غور کر رہی ہیں: ان جلائے گئے ٹوکنز نے بالآخر کیا حاصل کیا؟

مفت ماہانہ استعمال کا دور اب اسی وقت بند ہو رہا ہے۔

اگلے مرحلے میں، تمام ڈیولپرز کے سامنے یہ سوال ہے کہ وہ ہر ٹوکن کی قیمت کو کیسے بہتر بنائیں اور اس کی زیادہ سے زیادہ قیمت حاصل کریں۔

مستقبل کا حقیقی فاتح، بے شک وہی ہوگا جو پہلے ٹوکن کا حساب لگانا سیکھ لے گا۔

حوالہ جات:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

یہ مضمون ویچن گروپ "نیوزی ایوان" سے ہے، مصنف: ASI کا وحی

اعلان دستبرداری: اس صفحہ پر معلومات تیسرے فریق سے حاصل کی گئی ہوں گی اور یہ ضروری نہیں کہ KuCoin کے خیالات یا خیالات کی عکاسی کرے۔ یہ مواد کسی بھی قسم کی نمائندگی یا وارنٹی کے بغیر صرف عام معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور نہ ہی اسے مالی یا سرمایہ کاری کے مشورے کے طور پر سمجھا جائے گا۔ KuCoin کسی غلطی یا کوتاہی کے لیے، یا اس معلومات کے استعمال کے نتیجے میں کسی بھی نتائج کے لیے ذمہ دار نہیں ہوگا۔ ڈیجیٹل اثاثوں میں سرمایہ کاری خطرناک ہو سکتی ہے۔ براہ کرم اپنے مالی حالات کی بنیاد پر کسی پروڈکٹ کے خطرات اور اپنے خطرے کی برداشت کا بغور جائزہ لیں۔ مزید معلومات کے لیے، براہ کرم ہماری استعمال کی شرائط اور خطرے کا انکشاف دیکھیں۔