مصنف: حروف AI
گوگل واقعی بیچارہ ہو گیا۔
ایک لمحہ پہلے ہی خبر آئی کہ گوگل کے ماسس بنانے والے شیرگے برین نے "فاؤنڈر مود" دوبارہ شروع کر دیا ہے، جس میں وہ خود نگرانی کر رہے ہیں اور ایک ایلیٹ "سپیشل ٹیم" تشکیل دے رہے ہیں تاکہ جیمنی کو AI پروگرامنگ اور خودمختار ایجنٹ جیسے اہم صلاحیتوں میں اینتھروپک جیسے مقابلہ کنندگان کے ساتھ برابری کرائی جا سکے۔
اور گوگل نے رات کو گہری تحقیق اور گہری تحقیق میکس کے نام سے جیمنی 3.1 پرو ماڈل پر مبنی دو نئی خودمختار تحقیقی ایجینٹس متعارف کرائے۔
نہ صرف ماڈل کی بنیادی سطح پر استدلال کی صلاحیت کو مضبوط کیا گیا ہے، بلکہ خود مختار تحقیقی ایجینٹس کو کاروباری اور ڈویلپر پلیٹ فارم کی طرف آگے بڑھانے پر زور دیا گیا ہے، جس میں API کے ذریعے کھولنا، نجی ڈیٹا کی حمایت، اور بیک گراؤنڈ ای سینکرونس ٹاسکس جیسے طریقوں کے ذریعے "AI تحقیق/تحلیل ٹولز" جیسے اعلیٰ قدر والے سیناریو میں فائدہ اٹھانے کی کوشش کی جا رہی ہے، جس میں OpenAI (Hermes)، Perplexity جیسے مقابلہ کرنے والوں کا مقابلہ کیا جا رہا ہے۔

یہ دو ایجنٹس پہلی بار ڈیولپرز کو ایک منفرد API کال کے ذریعے کھلے نیٹ ورک کے ڈیٹا اور کاروباری مخصوص معلومات کو ادغام کرنے، رپورٹس میں نیٹیو چارٹس اور انفوگرافکس بنانے، اور Model Context Protocol (MCP) کے ذریعے کسی بھی تیسرے پارٹی ڈیٹا سورس سے جڑنے کی اجازت دیتے ہیں۔
دونوں ایجنٹس اب سے Gemini API کے ادائیگی والے پیکجز کے ذریعے عوامی پری ویو کے طور پر دستیاب ہیں، جن تک 2025ء کے دسمبر میں گوگل نے شروع کیے گئے Interactions API کے ذریعے رسائی حاصل کی جا سکتی ہے۔
ہاں، یہ نئے ایجینٹ ابھی صرف API کے ذریعے استعمال کیے جا سکتے ہیں، عام صارفین Gemini کی ایپ میں ان کا فائدہ نہیں اٹھا سکتے، چاہے وہ پریمیم سبسکرپشن لے چکے ہوں۔ اپڈیٹس کی خبر دیکھ کر جب صارفین کو محسوس ہوا کہ وہ ان کا استعمال نہیں کر سکتے، تو کچھ صارفین نے شکایت کی: “گوگل کسی ناگزیر وجوہات کی بناء پر ہمیں، Gemini App کے Pro سبسکرپشن والوں کو، لگاتار سزا دے رہا ہے…”

گوگل کے سی ای او سندر پچائی نے X پر ذاتی طور پر کہا: "jab aap ko speed aur efficiency ki zaroorat ho, to Deep Research ka istemal karein; jab aap ko sab se behtar quality ka context collection aur synthesis chahiye, to Max version ka istemal karein — yeh extended testing ke dauran DeepSearchQA 93.3% aur HLE 54.6% ka score hasil karta hai۔"

18 ماہ پہلے، گوگل ڈیپ ریسرچ کا مقصد گریجویٹ طلباء کو براؤزر ٹیبز کی بہت بڑی تعداد سے بچانے میں مدد کرنا تھا۔ اب، گوگل چاہتا ہے کہ یہ انویسٹمنٹ بینک کے جونیئر اینالسٹس کے بنیادی تحقیقی کام کو مکمل طور پر مکمل کر دے۔
ان دو مقاصد کے درمیان کا فرق — اور یہ کہ یہ ٹیکنالوجی حقیقت میں اس فرق کو کیسے پُر کر سکتی ہے — فیصلہ کرے گی کہ خودمختار تحقیقی ایجنسز صرف ایک اور ایسی AI ڈیمو بن جائیں گی جو بینچ مارکس میں چمکدار ہو لیکن کانفرنسز میں ناکام ثابت ہو، یا کاروباری سافٹ ویئر کے شعبے میں ایک تبدیل کرنے والی مصنوعات بن جائیں۔
دو ورژن، مختلف ورک لودس کے لیے موزوں
اسٹینڈرڈ ورژن ڈیپ ریسرچ میں کم تر لیٹنسی اور کم تر لاگت ہے، جو رفتار کی ضرورت والے مناظر کے لیے موزوں ہے۔
Deep Research Max گہرائی کو تیزی کے بجائے ترجیح دیتا ہے۔ یہ ایجنٹ توسیع یافتہ ٹیسٹ-ٹائم کمپیوٹ (extended test-time compute) کے ذریعے گہرا تجزیہ، تلاش اور دہرائی کرتا ہے اور آخرکار رپورٹ تیار کرتا ہے۔
گوگل کا کہنا ہے کہ ایسینکرون بیک گراؤنڈ ورک فلو اس کا مثالی استعمال ہے، جیسے کہ رات کو ٹائمڈ جاب (cron job) کے ذریعے چلانا، جس سے اگلی صبح اینالسٹ ٹیم کو مکمل ڈیوٹی ڈیلیوری رپورٹ مل جائے۔
گوگل کے اپنے بنچ مارک میں، Deep Research Max نے ریٹریول اور ریزننگ ٹاسکس پر نمایاں پیش رفت حاصل کی ہے۔ یہ ایجنٹ پہلے کے ورژن کے مقابلے میں زیادہ ذرائع سے معلومات حاصل کرنے اور پرانے ماڈلز کو غفلت سے چھوٹ جانے والے نکات کو سمجھنے میں کامیاب ہوا ہے۔

گوگل نے مقابلہ کرنے والوں کے ساتھ موازنہ بھی فراہم کیا ہے۔
تاہم، OpenAI کے GPT-5.4 اور Anthropic کے Opus 4.6 کے ساتھ تقابل بالکل منصفانہ نہیں ہے۔ GPT-5.4 خودکار ویب سرچ کے لیے بہترین ہے، لیکن گہری تحقیق کے لیے خاص طور پر بہتر نہیں بنایا گیا ہے۔ اس لیے، OpenAI نے اپنا DR ایجنٹ فراہم کیا ہے، جو فروری کے اپڈیٹ کے بعد GPT-5.4 کے بجائے GPT-5.2 پر منتقل ہو گیا۔ OpenAI کا سب سے طاقتور سرچ ماڈل دراصل GPT-5.4 Pro ہے، لیکن گوگل نے اسے مقابلے میں شامل نہیں کیا ہے۔

OpenAI کے ڈیٹا کے مطابق، GPT-5.4 Pro نے ایجینٹ سرچ بینچ مارک BrowseComp پر 89.3% تک کا اسکور حاصل کیا، جبکہ GPT-5.4 کا اسکور 82.7% تھا۔
انٹروپک کی اپنی رپورٹ کے مطابق، Opus 4.6 نے BrowseComp پر 84% کا اسکور حاصل کیا، جو گوگل نے دکھایا گیا اسکور سے زیادہ ہے۔ یہ اسکور ریزننگ فنکشن بند کرنے کے بعد حاصل کیا گیا، جس میں ماڈل کی کارکردگی گوگل کے API بینچ مارک میں استعمال کیے جانے والے انٹنسیو ریزننگ سیٹنگ سے بہتر تھی۔
یہ فرق زیادہ تر ٹیسٹنگ طریقہ کار کے فرق کی وجہ سے ہو سکتا ہے — کیا ماڈل کو اصل API کے ذریعے جانچا گیا ہے یا انہیں مختلف لیبز کے اپنے ٹول چین میں پیک کیا گیا ہے۔ گوگل کا ڈیٹا ضروری طور پر غلط نہیں ہے، لیکن اسے سامانے کے ساتھ تشریح کیا جانا چاہیے۔ تاہم، اس کی پیشکش میں کافی شفافیت نہیں ہے۔
MCP کی حمایت
اس اپڈیٹ میں سب سے زیادہ اثرانگیز خصوصیت، ممکنہ طور پر مدل کنٹیکس پروٹوکول (MCP) کی حمایت کا اضافہ ہے۔ یہ خصوصیت Deep Research کو صرف ایک طاقتور ویب ریسرچ ٹول سے آگے بڑھا کر، زیادہ "جنرل ڈیٹا اینالسٹ" کی حیثیت سے کام کرنے لگتی ہے۔
MCP ایک نئی کھلی معیار ہے جو AI ماڈلز کو باہری ڈیٹا ذرائع سے جوڑنے کے لیے استعمال ہوتی ہے۔ یہ Deep Research کو محفوظ طریقے سے نجی ڈیٹا بیسز، اندر کے دستاویزات کے مجموعوں، اور ماہرانہ تیسری پارٹی ڈیٹا سروسز کو دریافت کرنے کی اجازت دیتی ہے — پورے عمل کے دوران، حساس معلومات اپنے اصل ماحول سے باہر نہیں جاتیں۔
عملی استعمال میں، اس کا مطلب ہے کہ ایک ہیج فنڈ اپنے اندر کے ٹریڈنگ فلو ڈیٹا بیس اور فنانشل ڈیٹا ٹرمینل دونوں کو ڈیپ ریسرچ کی طرف اشارہ کر سکتا ہے، اور پھر اس سمارٹ ایجنٹ سے مطالبہ کر سکتا ہے کہ وہ دونوں کو ویب سے حاصل ہونے والی عوامی معلومات کے ساتھ ملا کر جامع خیالات تیار کرے۔
گوگل نے یہ ظاہر کیا ہے کہ وہ FactSet، ایس اینڈ پی اور پچ بک جیسی کمپنیوں کے ساتھ فعال طور پر تعاون کر رہی ہے تاکہ اپنے MCP سرور کو ڈیزائن کر سکے، جو یہ واضح طور پر ظاہر کرتا ہے کہ گوگل وال سٹریٹ اور مزید وسیع فنانشل سروسز صنعت کے روزمرہ کے استعمال کیے جانے والے ڈیٹا فراہم کنندگان کے ساتھ گہری اندماج کی تلاش میں ہے۔
گوگل ڈیپ مائنڈ کے پروڈکٹ مینیجر لکاس ہاس اور سرینیواس تادیپلی کی لکھی ہوئی بلاگ پوسٹ کے مطابق، ان کا مقصد "مشترکہ صارفین کو فنانشل ڈیٹا پروڈکٹس کو ڈیپ ریسرچ سے چلنے والے ورک فلو میں اندراج کرنے اور اپنے وسیع ڈیٹا کائنات کا استعمال کرتے ہوئے فوری طور پر حوالہ جات حاصل کرنے کے ذریعہ پیداواری میں کھچڑی لانے کا ہے۔"
یہ فیچر AI کے استعمال کے دوران کاروباروں کے لیے سب سے زیادہ پریشان کن مسائل میں سے ایک کو براہ راست حل کرتا ہے: مدلز کو کھلے انٹرنیٹ پر دستیاب معلومات اور تنظیم کی حقیقی فیصلہ سازی کے لیے درکار معلومات کے درمیان بڑا فرق۔ اس سے پہلے، اس فرق کو پُر کرنے کے لیے بہت زیادہ کسٹمائزڈ انجینئرنگ کا کام درکار تھا۔
MCP، جو Deep Research کی خودمختار براوزنگ اور استدلال کی صلاحیتوں کو جوڑتا ہے، زیادہ تر پیچیدگی کو صرف ایک بار کنفیگر کرنے سے سادہ کر دیتا ہے۔ ڈویلپرز اب Deep Research کو گوگل سرچ، ریموٹ MCP سرور، URL Context، کوڈ ایکزیکیشن اور فائل سرچ کے ساتھ ایک ساتھ استعمال کر سکتے ہیں—یا پوری طرح نیٹ ورک ایکسیس بند کر کے صرف کسٹم ڈیٹا پر سرچ کر سکتے ہیں۔
سسٹم متعدد ماڈل ان پٹس، جیسے PDF، CSV، تصاویر، آڈیو اور ویڈیو، کو گراؤنڈنگ (گراؤنڈنگ کانٹیکسٹ) کے طور پر بھی سپورٹ کرتا ہے۔
نیٹیو گراف
دوسرا بڑا فیچر نیٹیو گرافکس اور انفوگرافکس جنریٹر ہے۔
پچھلے Deep Research ورژن صرف ٹیکسٹ رپورٹس جنریٹ کر سکتے تھے۔ اگر صارف کو ویژولائزیشن کی ضرورت ہوتی تو اسے ڈیٹا نکال کر اپنے آپ گراف بنانا پڑتا تھا۔ یہ کمی "انڈ تو انڈ آٹومیشن" کے موقف کو بہت کمزور کرتی ہے۔
اب، نئی نسل کے ایجینٹس رپورٹس میں HTML یا گوگل کے نینو بانانا فارمیٹ میں جٹھے ڈیٹا سیٹس کو ڈائنامک طور پر رینڈر کرتے ہوئے اعلیٰ معیار کے گرافکس اور انفوگرافکس کو اپنے اندر شامل کر سکتے ہیں، جس سے وہ تجزیاتی کہانی کا براہ راست حصہ بن جاتے ہیں۔
کاروباری صارفین کے لیے — خاص طور پر مالیاتی اور مشاورتی صنعتوں میں جہاں متعلقہ افراد کو فوری طور پر پیش کیے جانے والے نتائج درکار ہوتے ہیں — یہ فیچر Deep Research کو صرف "تحقیق کے مرحلے کو تیز کرنے والا" ٹول نہیں بلکہ تقریباً حتمی تجزیاتی پیداوار تیار کرنے والا ٹول بناتا ہے۔

اس کے علاوہ، نئی سسٹم میں نئے تعاونی منصوبہ بندی کے فنکشنز (جس سے صارفین ایجنٹس کے تحقیقی منصوبوں کا جائزہ لے سکتے ہیں، انہیں ہدایات دے سکتے ہیں اور ان کو بہتر بناسکتے ہیں) اور درحقیقت میڈیا ریزننگ اسٹیپس کے اسٹریمنگ کو شامل کیا گیا ہے، جس سے ڈویلپرز تحقیق کے دائرہ کار پر باریک بینی سے کنٹرول رکھ سکتے ہیں اور ریگولیٹری صنعت کی درخواستوں کے مطابق اعلیٰ شفافیت برقرار رکھ سکتے ہیں۔
Deep Research اب گوگل کی طرف سے کاروباروں کے لیے فراہم کی جانے والی "بنیادی ڈھانچہ" کا حصہ بن رہا ہے
گوگل کی سرکاری بلاگ پوسٹ میں واضح طور پر بتایا گیا ہے کہ جب ڈیولپرز Deep Research ایجنٹس کا استعمال کرتے ہوئے تعمیر کرتے ہیں، تو وہ "گوگل کے متعدد مقبول پروڈکٹس جیسے Gemini App، NotebookLM، Google Search اور Google Finance کے لیے تحقیقی صلاحیت فراہم کرنے والی ایک ہی خودمختار تحقیقی بنیادی ڈھانچے" کو بلاتے ہیں۔ اس سے ظاہر ہوتا ہے کہ API کے ذریعے فراہم کیے جانے والے ایجنٹس گوگل کے اندر کے ورژن کا سادہ شدہ نسخہ نہیں ہیں، بلکہ وہی نظام ہے جو پلیٹ فارم کے سائز پر باہر کے صارفین کے لیے دستیاب ہے۔
یہ ترقی بہت تیزی سے ہو رہی ہے۔
گوگل نے 2024ء کے دسمبر میں Gemini ایپ میں Deep Research کو C-end فنکشن کے طور پر متعارف کرایا، جو Gemini 1.5 Pro سے چلتا تھا۔ گوگل نے اسے ایک ذاتی AI تحقیقی مددگار کے طور پر بیان کیا، جو ویب کی معلومات کو کچھ منٹوں میں مجموعی طور پر پیش کر سکتا ہے اور صارفین کو گھنٹوں کے کام سے بچا سکتا ہے۔
مارچ 2025 میں، گوگل نے ڈیپ ریسرچ کو Gemini 2.0 Flash Thinking Experimental کے ساتھ اپ گریڈ کیا اور اسے سب کے لیے ٹرائل کے لیے کھول دیا۔ اس کے بعد اسے Gemini 2.5 Pro Experimental پر اپ گریڈ کیا گیا، اور گوگل نے رپورٹ کیا کہ جائزہ دینے والوں نے اس کی رپورٹس کو مقابلہ کرنے والوں کی رپورٹس کے مقابلے میں 2:1 کے تناسب سے ترجیح دی۔
دسمبر 2025 ایک اہم موڑ ہے، جہاں گوگل نے Interactions API متعارف کرایا، جس نے پہلی بار Gemini 3 Pro کے ذریعے Deep Research کو پروگرامی طور پر فراہم کیا، اور ساتھ ہی开源 DeepSearchQA بینچ مارک بھی جاری کیا۔
اس بہتری کے پیچھے کا بنیادی ماڈل Gemini 3.1 Pro ہے، جو 19 فروری، 2026 کو جاری کیا گیا۔ اس ماڈل میں بنیادی استدلال کے معاملے میں اہم ترقی ہوئی ہے: ARC-AGI-2 بینچ مارک میں، جو ماڈل کی نئے منطقی پیٹرنز کو حل کرنے کی صلاحیت کا جائزہ لیتا ہے، 3.1 Pro نے 77.1% اسکور حاصل کیا، جو Gemini 3 Pro سے دوگنا سے زیادہ ہے۔
