چینی AI ماڈل کی قیمتیں گر گئیں، جس سے امریکی مقابلہ کنندگان کے ساتھ لاگت کا فرق بڑھ گیا

CoinDesk کی رپورٹ:

ایک خارجی ذریعہ کے مطابق، چینی ایڈوانسڈ ماڈل فراہم کنندگان نے حالیہ وقت میں API قیمتیں مزید کم کر دی ہیں، جس میں DeepSeek اور Xiaomi نے نئی قیمت ڈالنے کا اعلان کیا، جبکہ امریکی ٹاپ لیبز کے نئے ماڈلز مہنگے ہوتے جا رہے ہیں۔ اس سے چین اور امریکہ کے ایڈوانسڈ ماڈلز کے درمیان استدلال کی لاگت میں فرق مزید بڑھ گیا ہے۔

کاروباری صارفین کے لیے، ماڈل کی قیمت بنیادی طور پر ٹوکن کے لحاظ سے چارج ہونے والے API اخراجات میں ظاہر ہوتی ہے۔ جب ایپلیکیشن ماڈل سے جُڑ جاتی ہے، تو ان پٹ، آؤٹ پٹ اور کیش میچنگ سبھی فیس بن جاتے ہیں، اس لیے ایک یونٹ قیمت میں تبدیلی AI مصنوعات کی تجارتی قابلیت کو ب без تاثیر کرتی ہے۔

ڈیپسیک اور میائو میں ایک ساتھ قیمتیں کم ہو گئیں

دیپسیک نے 22 مئی کو V4-Pro کے لیے 75% کی ڈسکاؤنٹ کو مستقل قیمت میں تبدیل کر دیا۔ اس تبدیلی کے بعد، اس ماڈل کی ان پٹ قیمت 0.435 امریکی ڈالر فی ملین ٹوکن اور آؤٹ پٹ قیمت 0.87 امریکی ڈالر ہو گئی۔

小米 نے 26 مئی کو MiMo-V2.5 API کی قیمتیں کم کر دیں، جس میں Pro ورژن کے کیش ہٹنگ ان پٹ کی قیمت گھٹا کر 0.0036 امریکی ڈالر فی ملین ٹوکن کر دی گئی، جبکہ کچھ پروجیکٹس میں قیمت میں 99% تک کمی آئی۔ نئے پیکجز کے مطابق، اسی قیمت پر 5 سے 8 گنا زیادہ ٹوکن حاصل کیے جا سکتے ہیں۔

کمی کے پیچھے استدلال کا بہترین بنانا ہے

آرٹیکل کے مطابق، یہ کمی صرف ایک مارکیٹنگ اقدام نہیں ہے۔ میکس MiMo ٹیم کے ہیڈ اور سابق DeepSeek کے مرکزی ڈویلپر لو فولی کے مطابق، اہم بچت کی وجہ کیش اور انفرینس فریم ورک کے بہترین طریقے ہیں۔ سسٹم زیادہ سے زیادہ پہلے سے پروسیس شدہ معلومات کو دوبارہ استعمال کر سکتا ہے، جس سے دوبارہ کمپوٹیشن کم ہوتی ہے اور اس طرح اسٹوریج اور انفرینس کے اخراجات میں کمی آتی ہے۔

ان کے مطابق، متعلقہ بہتریوں نے کیش ٹوکن کے معالجہ کی صلاحیت میں واضح اضافہ کیا ہے، جس سے کل محفوظ کرنے اور معالجہ کا خرچ تقریباً 80% کم ہو گیا۔ نئے API کی قیمت پر، جب پیداواری ماحول میں استدلال انجن تقریباً پوری صلاحیت سے کام کر رہا ہو، تو اب بھی تقریباً برابری کا احساس رکھا جا سکتا ہے۔

ڈیپسیک کا طریقہ مدل آرکیٹیکچر کے ذریعے کنٹیکس کی کمپوٹیشن لاگت کو کم کرنا ہے۔ مضمون میں بتایا گیا ہے کہ V4 دو قسم کے متناوب توجہ مکانیزمز استعمال کرتا ہے، جو لمبے کنٹیکس کے مناظر میں KV کیش کے سائز کو نمایاں طور پر کم کرتا ہے اور ایک ٹوکن کی انفرینس لاگت کو کم کرتا ہے۔ لاکھوں ٹوکن کنٹیکس کی کمپوٹیشن کے لیے، V4-Pro کا KV کیش صرف پچھلے ورژن کا تقریباً ایک دہائی ہے، اور ایک ٹوکن کی انفرینس لاگت تقریباً پچھلے ورژن کا 27% ہے۔

امریکی ماڈل کی قیمت کا رجحان بالکل الٹا ہے

آرٹیکل میں کہا گیا ہے کہ امریکی ٹاپ ماڈلز نے حالیہ وقت میں قیمتیں کم نہیں کی ہیں۔ OpenAI نے اپریل کے آخر میں GPT-5.5 جاری کیا، جس نے آؤٹ پٹ کی قیمت بڑھا کر 30 امریکی ڈالر فی ملین ٹوکن کر دی، جو پچھلے ورژن کے تقریباً دگنا ہے۔ Anthropic کا Claude Opus 4.7 اسی قیمت پر برقرار رکھا گیا ہے، لیکن اس کے ٹوکنائزیر میں اپڈیٹ کے باعث، ایک جیسے متن سے زیادہ ٹوکنز بن سکتے ہیں، جس کی وجہ سے اصل بل میں تقریباً 35% تک اضافہ ہو سکتا ہے۔

مقابلہ کے طور پر، DeepSeek V4-Pro نے کوڈ بینچ مارک SWE-Verified پر 80.6% اسکور حاصل کیا، جو Claude Opus 4.6 کے 80.8% کے قریب ہے، لیکن آؤٹ پٹ کی قیمت میں دہائیوں کا فرق ہے۔ نئی قیمت میں تبدیلی کے بعد، میئو MiMo-V2.5-Pro بھی DeepSeek V4-Pro کے ساتھ ایک جیسی ان پٹ اور آؤٹ پٹ قیمتیں حاصل کر چکا ہے۔

مضمون میں یہ بھی کہا گیا ہے کہ DeepSeek اور Xiaomi کے علاوہ MiniMax، Moonshot AI، Z.AI جیسے چینی ماڈل فرنٹس بھی کم قیمتیں برقرار رکھ رہے ہیں۔ مضمون کے مطابق، 2026 کے دوسرے تریمیستر میں، چین اور امریکہ کے سب سے آگے کے ماڈلز کے درمیان قیمت کا فرق تقریباً 15 سے 30 گنا تک ہوگا؛ اگر کیش کی چھوٹ کو شامل کیا جائے تو یہ فرق مزید بڑھ جائے گا۔