جب کمپنیاں بڑے پیمانے پر AI ٹولز کو شامل کرتی ہیں، تو نئے مسائل سامنے آنے لگتے ہیں: مسئلہ یہ نہیں کہ ماڈل کافی طاقتور نہیں ہیں، بلکہ یہ ہے کہ بِلز بہت جلد بڑھ رہے ہیں۔ کئی ٹیک اور انٹرنیٹ کمپنیوں نے پایا کہ اگرچہ منفرد ٹوکن کی قیمتیں کم ہو رہی ہیں، لیکن AI کوڈنگ، آٹومیٹڈ اسسٹنٹس اور اسینٹ ٹولز کے عام ہونے کے باوجود، کل استعمال میں تیزی سے اضافہ ہو رہا ہے۔
کئی کمپنیوں کے بجٹ پہلے ہی ختم ہو چکے ہیں
ٹیککرانچ کے مطابق، کچھ کمپنیاں 2026 کے AI بجٹ میں جلد ہی بجٹ کا استعمال ختم کر چکی ہیں۔ یوبر نے اپریل تک اپنا پورا سالانہ AI کوڈنگ بجٹ ختم کر دیا؛ مائیکروسافٹ نے کئی ماہ بعد کچھ ڈویلپرز کے لیے کلاؤڈ کوڈ کا استعمال منسوخ کر دیا؛ پرائس لائن کے ایک ملازم نے کہا کہ کرسر کی معمولی تجدید کی پیشکش پہلے سے 4 سے 5 گنا زیادہ ہے۔
یہ تبدیلی پچھلے کچھ ماہوں میں زیادہ طاقتور ماڈلز کے اطلاق سے متعلق ہے۔ Anthropic، OpenAI اور Google نے نومبر 2023 کے بعد ایجنٹ سیناریوز کے لیے موزوں نئے ماڈلز جاری کیے، جس سے استعمال کی مقدار مزید بڑھی۔ ایک کمپنی نے اپنے ملازمین کے استعمال کے لیے کوئی حد مقرر نہیں کی، جس کی وجہ سے Claude کا 5 ارب ڈالر کا بل آ گیا۔
بڑھی ہوئی پیداواری صلاحیت ضرورتاً اخراجات کو کور نہیں کرتی
اوپن اے آئی کے کاروباری کاروبار کے سربراہ الیکسنڈر ایمبر نے کہا کہ چھ ماہ پہلے صارفین زیادہ توجہ اس بات پر دے رہے تھے کہ ماڈل کی صلاحیت کافی ہے یا نہیں، لیکن اب بحث کا مرکز خرچ کی شفافیت، آڈٹ کی صلاحیت، ٹوکن کنٹرول اور ماڈل کی کارکردگی پر ہے۔ کاروباری سطح پر AI خریدنے کا مسئلہ اب “یہ کیا کر سکتا ہے” سے “کتنا خرچ ہوا، کیا یہ قابل قدر ہے” کی طرف منتقل ہو چکا ہے۔
AI کوڈنگ ٹولز کے ریٹرن آن انویسٹمنٹ کے حوالے سے صنعت کے اندر دوبارہ حساب لگایا جا رہا ہے۔ فاروس AI نے مارچ میں 20,000 ڈیولپرز پر ایک سروے کیا، جس میں پایا گیا کہ ڈیولپمنٹ کی پیداوار بڑھ رہی ہے، لیکن بگ اور دوبارہ کام بھی بڑھ رہا ہے۔ انجینئرنگ مینجمنٹ پلیٹ فارم جیلی فش کے مطالعے کے مطابق، AI کا زیادہ استعمال کرنے والے انجینئرز کی پیداواری صلاحیت، کم استعمال کرنے والوں کے مقابلے میں تقریباً دوگنی ہے، لیکن ٹوکن کا استعمال دس گنا زیادہ ہے۔
- AI کے زیادہ استعمال کرنے والوں کی پیداواریت کم استعمال کرنے والوں کی تقریباً دو گناہ ہے
- متعلقہ ٹوکن کی استعمال کی فیس تقریباً 10 گنا زیادہ ہے
- ایک منفرد ڈیولپر نے 9 ماہ میں استعمال میں لگभग 18.6 گنا اضافہ کیا
لاگت کنٹرول ٹولز کا تیار ہونا تیز ہو رہا ہے
بلیک مسائل کے وسعت پذیر ہونے کے ساتھ، AI لاگت کے انتظام کے لیے ٹولز کے مارکیٹ میں بھی تیزی آ رہی ہے۔ لینکس فنڈیشن نے اس ہفتے Tokenomics Foundation کے قیام کا اعلان کیا ہے، جس کا مقصد FinOps جیسا ہی AI Token خرچوں کے لیے ایک متحدہ زبان اور انتظامی معیار تیار کرنا ہے۔
یہ تنظیم ٹوکن کے استعمال اور بلنگ کے لیے ایک کھلا معیار، ایک یکساں اشاریہ، اور نئے میٹرکس جیسے "ہر اکائی ذہنی لاگت" یا "ہر واٹ ٹوکن" کے لیے منصوبہ بندی کر رہی ہے۔ آفیشل لانچ جولائی میں ہوگا، اور اگلے ہفتے کے FinOps X کانفرنس میں مزید اراکین کا اعلان کیا جائے گا۔
اسی دوران، کاروباری شروعاتی اور بالغ فرماں دونوں تیزی سے اپنی موجودگی بڑھا رہے ہیں۔ Pay-i، Paid جیسی کمپنیاں AI لاگت ٹریکنگ، پیمانہ اور بہتری پر زور دیتی ہیں؛ Jellyfish، Waydev، Faros AI AI ایجنٹ مانیٹرنگ سروسز فراہم کرتی ہیں؛ Ramp، Datadog اور New Relic بھی AI اخراجات کے انتظام، ٹوکن لیول کی قابلیت نگہداشت اور GPU مانیٹرنگ کے فنکشنز شامل کر رہے ہیں۔
ماڈل راؤٹنگ لاگت کم کرنے کی طرف جا رہا ہے
کچھ سرمایہ کار اور کاروباری ایگزیکٹس کا خیال ہے کہ مستقبل میں یہ صلاحیتیں زیادہ تر ایپلیکیشن لیول یا ماڈل راؤٹنگ لیول پر ظاہر ہوں گی۔ مثال کے طور پر، کاروباری AI اسٹارٹ اپ فیکٹری نے اس ہفتے ایک ماڈل راؤٹر متعارف کرایا، جو کام کے مطابق خودکار طور پر زیادہ مناسب ماڈل منتخب کرتا ہے تاکہ کال کے اخراجات کم ہو سکیں۔ کچھ کاروباروں کے بلز میں بھی اس طرح کا عمل شامل ہو چکا ہے، جہاں چاہے اعلیٰ ماڈل کو کال کیا جائے، سسٹم کچھ درخواستوں کو سستے ماڈلز پر منتقل کر دیتا ہے۔
مکمل معلومات: گولڈمن سیکس کا تخمینہ ہے کہ 2030 تک عالمی ٹوکن استعمال 24 گنا بڑھ جائے گا۔ جو کمپنیاں ابھی اعلیٰ سرمایہ کاری کے مراحل میں ہیں، ان کے لیے AI کے استعمال کو وسعت دیتے ہوئے لاگت کو کنٹرول کرنا اگلے مرحلے کی ایک عملی چیلنج بن گئی ہے۔
