গুগল ডিপ রিসার্চ এবং ডিপ রিসার্চ ম্যাক্স ঘোষণা করেছে, যার সাথে MCP সমর্থন এবং নেটিভ চার্ট রয়েছে

লেখক: অক্ষর AI

গুগল সত্যিই উত্তেজিত।

গুগলের সহ-প্রতিষ্ঠাতা সার্গেই ব্রিন এখন পুনরায় "ফাউন্ডার মোড" চালু করেছেন, যেখানে তিনি সরাসরি পরিচালনা করছেন এবং একটি শীর্ষস্থানীয় "আক্রমণকারী দল" গঠন করেছেন, যাতে Gemini-কে Anthropic-এর মতো প্রতিদ্বন্দ্বীদের বিরুদ্ধে AI প্রোগ্রামিং এবং স্বায়ত্তশাসিত এজেন্টসহ মূল ক্ষমতাগুলিতে অনুসরণ করা যায়।

গুগল রাতের বেলায় একটি বড় আপডেট ঘোষণা করে যে দুটি নতুন স্বায়ত্তশাসিত গবেষণা বুদ্ধিমত্তা চালু করেছে: ডিপ রিসার্চ এবং ডিপ রিসার্চ ম্যাক্স, যেগুলি Gemini 3.1 Pro মডেলের উপর ভিত্তি করে তৈরি।

শুধু মডেলের নিচের স্তরে যুক্তিসংগঠনের ক্ষমতা বাড়ানো হয়নি, বরং স্বাধীন গবেষণা এজেন্টগুলিকে এন্টারপ্রাইজ-লেভেল এবং ডেভেলপার প্ল্যাটফর্মের দিকে নিয়ে যাওয়ার জন্য প্রচুর প্রচেষ্টা করা হচ্ছে, API মাধ্যমে উন্মুক্তি, ব্যক্তিগত ডেটা সমর্থন, ব্যাকগ্রাউন্ড অ্যাসিঙক্রোনাস টাস্ক ইত্যাদির মাধ্যমে, “AI গবেষণা/বিশ্লেষণ টুল” এই উচ্চমূল্যের স্কেনারিওতে প্রথম সুযোগ নেওয়ার চেষ্টা করা হচ্ছে, OpenAI (Hermes), Perplexity ইত্যাদি প্রতিদ্বন্দ্বীদের প্রতিযোগিতার মুখোমুখি হওয়ার জন্য।

জেমিনি ৩.১ প্রো

এই দুটি এজেন্ট প্রথমবারের মতো ডেভেলপারদের একক API কলের মাধ্যমে ওপেন ওয়েব ডেটা এবং এন্টারপ্রাইজ-স্পেসিফিক তথ্যকে একীভূত করতে দেয়, এবং রিপোর্টগুলিতে ন্যাটিভভাবে গ্রাফ এবং ইনফোগ্রাফিক্স তৈরি করে, যখন Model Context Protocol (MCP) ব্যবহার করে যেকোনো থার্ড-পার্টি ডেটা সোর্সের সাথে কানেক্ট করা যায়।

দুটি স্মার্ট এজেন্ট আজ থেকে Gemini API-এর পেইড প্যাকেজের মাধ্যমে পাবলিক প্রিভিউ হিসাবে উপলব্ধ, যা 2025 সালের ডিসেম্বরে গুগল প্রথম চালু করা Interactions API-এর মাধ্যমে অ্যাক্সেস করা যাবে।

হ্যাঁ, এই নতুন এজেন্টগুলি বর্তমানে শুধুমাত্র API এর মাধ্যমে ব্যবহারযোগ্য, সাধারণ ব্যবহারকারীরা Gemini অ্যাপে এগুলি ব্যবহার করতে পারবেন না, যদিও আপনি পেইড সাবস্ক্রিপশন করেন। আপডেটের খবর দেখেও নিজের জন্য এটি ব্যবহারযোগ্য নয় বলে কিছু ব্যবহারকারী অভিযোগ করছেন: “গুগল কিছু কারণে আমাদের Gemini App-এর Pro সাবস্ক্রিপশন ব্যবহারকারীদের ধারাবাহিকভাবে শাস্তি দিচ্ছে…”

জেমিনি ৩.১ প্রো

গুগলের সিইও সুন্দর পিচাই নিজেই X-এ পোস্ট করেছেন: "যখন আপনার গতি এবং দক্ষতার প্রয়োজন হয়, তখন Deep Research ব্যবহার করুন; যখন আপনি সর্বোচ্চ মানের প্রেক্ষাপট সংগ্রহ এবং সমন্বয়ের দিকে ঝুঁকেন, তখন Max ভার্সনটি ব্যবহার করুন—এটি পরীক্ষার সময় গণনা বাড়িয়ে DeepSearchQA 93.3% এবং HLE 54.6% স্কোর অর্জন করেছে।"

জেমিনি ৩.১ প্রো

১৮ মাস আগে, গুগল ডিপ রিসার্চের লক্ষ্য ছিল গবেষক শিক্ষার্থীদের ব্রাউজার ট্যাবের প্রচুর পরিমাণ থেকে বাঁচানো। আজকে, গুগল চায় যে এটি বিনিয়োগ ব্যাংকের জুনিয়র বিশ্লেষকদের মৌলিক গবেষণার কাজ প্রতিস্থাপন করুক।

এই দুটি লক্ষ্যের মধ্যে ব্যবধান—এবং এই প্রযুক্তিটি কি সত্যিই এই ব্যবধান পূরণ করতে পারবে—নির্ধারণ করবে যে স্বয়ংক্রিয় গবেষণা এজেন্টগুলি কি এন্টারপ্রাইজ সফটওয়্যার ক্ষেত্রে একটি বিপ্লবী পণ্য হয়ে উঠবে, নাকি শুধুমাত্র আরেকটি বেঞ্চমার্কে উজ্জ্বল কিন্তু মিটিংয়ে ব্যর্থ হওয়া কৃত্রিম বুদ্ধিমত্তার প্রদর্শনী।

দুটি সংস্করণ, বিভিন্ন কাজের লোডের জন্য অপ্টিমাইজড

স্ট্যান্ডার্ড ভার্সন ডিপ রিসার্চের কম ল্যাটেন্সি এবং কম খরচ রয়েছে, যা গতির প্রয়োজনীয়তা বিশিষ্ট পরিস্থিতিতে উপযুক্ত।

Deep Research Max গভীরতাকে গতির চেয়ে প্রাধান্য দেয়। এই স্মার্ট এজেন্টটি পরীক্ষার সময় গণনা বাড়িয়ে (extended test-time compute) গভীর যুক্তিবিদ্যা, অনুসন্ধান এবং পুনরাবৃত্তি করে চূড়ান্ত রিপোর্ট তৈরি করে।

গুগল উল্লেখ করেছে যে অ্যাসিঙ্ক্রোনাস ব্যাকগ্রাউন্ড ওয়ার্কফ্লো এর আদর্শ ব্যবহারের ক্ষেত্র, যেমন রাতে টাইমড জব (cron job) এর মাধ্যমে চালানো হয় এবং পরের দিন সকালে বিশ্লেষকদের জন্য একটি সম্পূর্ণ ডিলিজেন্স রিপোর্ট প্রদান করা হয়।

গুগলের নিজস্ব বেঞ্চমার্কে, ডিপ রিসার্চ ম্যাক্স রিট্রিভাল এবং রিজনিং টাস্কে উল্লেখযোগ্য উন্নতি অর্জন করেছে। এই এজেন্টটি আগের সংস্করণের চেয়ে বেশি সোর্স থেকে তথ্য পায় এবং পুরানো মডেলগুলি উপেক্ষা করে যাওয়া সূক্ষ্ম পার্থক্যগুলি ধরতে পারে।

জেমিনি ৩.১ প্রো

গুগল প্রতিদ্বন্দ্বীদের সাথে তুলনামূলক বিশ্লেষণও প্রদান করেছে।

তবে, OpenAI-এর GPT-5.4 এবং Anthropic-এর Opus 4.6-এর সাথে তুলনা করা সম্পূর্ণরূপে ন্যায্য নয়। GPT-5.4 স্বাধীন ওয়েব অনুসন্ধানে ভালো পারফর্ম করে, তবে গভীর গবেষণার জন্য বিশেষভাবে অপ্টিমাইজ করা হয়নি। এর জন্য, OpenAI নিজস্ব DR এজেন্ট প্রদান করে, যা ফেব্রুয়ারিতে আপডেটের পর GPT-5.4-এর বদলে GPT-5.2-এ স্যুইচ করে। OpenAI-এর সবচেয়ে শক্তিশালী অনুসন্ধান মডেল আসলে GPT-5.4 Pro, কিন্তু Google প্রকাশ্যে এটিকে তুলনার মধ্যে অন্তর্ভুক্ত করেনি।

জেমিনি ৩.১ প্রো

OpenAI-এর ডেটা অনুযায়ী, GPT-5.4 Pro ব্রাউজকম্প বেঞ্চমার্কে 89.3% পয়েন্ট অর্জন করেছে, যেখানে GPT-5.4 পেয়েছে 82.7%।

অ্যানথ্রোপিকের নিজস্ব রিপোর্টের ভিত্তিতে, ব্রাউজকম্প-এ ওপাস 4.6 এর স্কোর 84%, যা গুগল দ্বারা প্রদর্শিত মানের চেয়ে বেশি। এই স্কোরটি রিজনিং ফাংশন বন্ধ করে অর্জন করা হয়েছিল, এবং মডেলটি গুগলের API বেঞ্চমার্ক টেস্টে ব্যবহৃত হাই-ইনটেনসিটি রিজনিং সেটিংসের চেয়েও ভালো পারফরম্যান্স দেখিয়েছে।

এই ব্যবধানগুলি সম্ভবত পরীক্ষার পদ্ধতির পার্থক্যের কারণে ঘটেছে—মডেলটি মূল API এর মাধ্যমে মূল্যায়ন করা হয়েছে নাকি এটি প্রতিটি পরীক্ষাগারের নিজস্ব টুলচেইনে প্যাকেজ করা হয়েছে। গুগলের ডেটা অবশ্যই ভুল নয়, তবে এটিকে সতর্কতার সাথে ব্যাখ্যা করা উচিত। যাইহোক, এর উপস্থাপনা যথেষ্ট স্বচ্ছতা বহন করে না।

MCP সমর্থন

এই প্রকাশের সবচেয়ে প্রভাবশালী ফিচারটি হল মডেল কনটেক্সট প্রোটোকল (MCP) সমর্থন যোগ করা। এই ফিচারটি ডিপ রিসার্চকে শুধুমাত্র একটি শক্তিশালী ওয়েব গবেষণা টুল থেকে আরও বেশি “জেনারিক ডেটা অ্যানালিস্ট”-এর মতো একটি অস্তিত্বে পরিণত করবে।

MCP হল একটি নতুন খোলা মানক যা AI মডেলকে বাহ্যিক ডেটা সোর্সের সাথে সংযুক্ত করে। এটি Deep Research-কে নিরাপদে ব্যক্তিগত ডেটাবেস, অভ্যন্তরীণ দলিল লাইব্রেরি এবং পেশাদার তৃতীয় পক্ষের ডেটা সার্ভিসগুলির সাথে প্রশ্ন করতে সক্ষম করে—সম্পূর্ণ প্রক্রিয়ায়, সংবেদনশীল তথ্য তার মূল পরিবেশ ছাড়ানো হয় না।

ব্যবহারিকভাবে, এর অর্থ একটি হেজ ফান্ড একসাথে তাদের অভ্যন্তরীণ ট্রেডিং ফ্লো ডাটাবেস এবং আর্থিক ডাটা টার্মিনালের দিকে Deep Research নির্দেশ করতে পারে, এবং স্মার্ট এজেন্টকে এই দুটি ডাটা সোর্সকে ওয়েব থেকে পাওয়া পাবলিক তথ্যের সাথে মিশিয়ে একটি সমন্বিত অন্তর্দৃষ্টি তৈরি করতে বলতে পারে।

গুগল প্রকাশ করেছে যে এখন এটি FactSet, S&P এবং PitchBook এর মতো কোম্পানিগুলির সাথে সক্রিয়ভাবে কাজ করছে, যারা তাদের MCP সার্ভার ডিজাইন করছে, যা পরিষ্কারভাবে নির্দেশ করে যে গুগল ওয়ালস্ট্রিট এবং ব্যাপক ফিনান্সিয়াল সার্ভিসেস শিল্পের দৈনিক নির্ভরশীল ডেটা প্রোভাইডারদের সাথে গভীরভাবে একীভূত হওয়ার চেষ্টা করছে।

গুগল ডিপমাইনের পণ্য পরিচালক লুকাস হাস এবং শ্রীনিবাস তাদেপল্লি দ্বারা লিখিত ব্লগ পোস্ট অনুযায়ী, এর লক্ষ্য হল “সাধারণ গ্রাহকদের ডিপ রিসার্চ দ্বারা চালিত কাজের প্রবাহে ফাইন্যানশিয়াল ডেটা পণ্যগুলি একীভূত করতে এবং এর বিশাল ডেটা বিশ্বকে ব্যবহার করে প্রতিক্রিয়ার সময়কে আলোকবর্ষের মতো দ্রুত করে উৎপাদনশীলতার বিপ্লব ঘটানো।”

এই ফিচারটি এআই গ্রহণের সময় প্রতিষ্ঠানগুলির সবচেয়ে দৃঢ়ভাবে অবস্থিত সমস্যাগুলির মধ্যে একটি—যেমন মডেলগুলি খোলা ইন্টারনেটে পাওয়া তথ্য এবং সংগঠনের প্রকৃত সিদ্ধান্ত গ্রহণের জন্য প্রয়োজনীয় তথ্যের মধ্যে বিশাল ব্যবধান—কে সরাসরি সমাধান করে। আগে, এই ব্যবধান পূরণের জন্য ব্যাপক কাস্টমাইজড ইঞ্জিনিয়ারিংয়ের প্রয়োজন হত।

এবং MCP ডিপ রিসার্চের স্বয়ংক্রিয় ব্রাউজিং এবং যুক্তি ক্ষমতার সাথে একীভূত হয়, যা বেশিরভাগ জটিলতাকে একবার কনফিগার করেই সরল করে দেয়। ডেভেলপাররা এখন ডিপ রিসার্চকে একসাথে গুগল সার্চ, রিমোট MCP সার্ভার, URL Context, কোড এক্সিকিউশন এবং ফাইল সার্চ—অথবা পুরোপুরি নেটওয়ার্ক অ্যাক্সেস বন্ধ করে শুধুমাত্র কাস্টম ডেটাতে সার্চ করতে দিতে পারেন।

সিস্টেমটি পিডিএফ, সিএসভি, ইমেজ, অডিও এবং ভিডিও সহ মাল্টিমোডাল ইনপুটকেও গ্রাউন্ডিং (গ্রাউন্ডিং কনটেক্সট) হিসাবে সমর্থন করে।

ন্যাটিভ চার্ট

দ্বিতীয় গুরুত্বপূর্ণ ফিচারটি হল নেটিভ গ্রাফ এবং ইনফোগ্রাফিক জেনারেশন।

পূর্ববর্তী Deep Research সংস্করণটি শুধুমাত্র পাঠ্য প্রতিবেদন তৈরি করতে পারত। যদি ব্যবহারকারীদের ভিজুয়ালাইজেশনের প্রয়োজন হত, তাহলে তাদেরকে ডেটা রপ্তানি করে নিজেদের চার্ট তৈরি করতে হত। এই সীমাবদ্ধতা “এন্ড-টু-এন্ড অটোমেশন”-এর অবস্থানকে ব্যাপকভাবে দুর্বল করে দিয়েছিল।

এখন, নতুন প্রজন্মের এজেন্টগুলি রিপোর্টের মধ্যে এইচটিএমএল বা গুগলের ন্যানো বানানা ফরম্যাটে ডাইনামিকভাবে জটিল ডেটাসেটগুলি রেন্ডার করে উচ্চ মানের গ্রাফিক্স এবং ইনফোগ্রাফিক্স সহজেই অন্তর্ভুক্ত করতে পারে, যাতে এগুলি সরাসরি বিশ্লেষণের গল্পের অংশ হয়ে ওঠে।

ব্যবসায়িক ব্যবহারকারীদের জন্য—বিশেষ করে অর্থনীতি এবং পরামর্শ শিল্পের যারা সরাসরি স্টেকহোল্ডারদের কাছে প্রেরণযোগ্য ফলাফল তৈরি করে—এই ফিচারটি Deep Researchকে একটি “গবেষণা প্রক্রিয়া ত্বরান্বিতকারী” টুল থেকে প্রায় চূড়ান্ত বিশ্লেষণ পণ্য তৈরি করতে পারে এমন একটি টুলে রূপান্তরিত করে।

জেমিনি ৩.১ প্রো

এছাড়াও, নতুন সিস্টেমটি বিকাশকারীদের গবেষণা পরিকল্পনা পর্যালোচনা, নির্দেশনা এবং অপ্টিমাইজ করার জন্য সহযোগিতামূলক পরিকল্পনা ফাংশন এবং মধ্যবর্তী যুক্তির ধাপগুলির রিয়েল-টাইম স্ট্রিমিং আউটপুটের সাথে সংযুক্ত করে, যার ফলে তারা গবেষণার পরিসরের জন্য সূক্ষ্ম নিয়ন্ত্রণ রাখতে পারে এবং নিয়ন্ত্রণকারী শিল্পের প্রয়োজনীয়তা অনুযায়ী উচ্চ স্বচ্ছতা বজায় রাখে।

Deep Research এখন গুগল দ্বারা ব্যবসাগুলির জন্য প্রদানকৃত "অবকাঠামো"এর একটি অংশ হয়ে উঠছে

গুগলের অফিসিয়াল ব্লগ পোস্টটিতে স্পষ্টভাবে উল্লেখ করা হয়েছে যে ডেভেলপাররা ডিপ রিসার্চ এজেন্ট ব্যবহার করে বিল্ড করার সময়, তারা “জেমিনি অ্যাপ, নোটবুকএলএম, গুগল সার্চ এবং গুগল ফাইন্যান্সের মতো গুগলের অনেক জনপ্রিয় পণ্যকে গবেষণার ক্ষমতা প্রদান করে এমন একই স্বায়ত্তশাসিত গবেষণা অবকাঠামোকে” কল করছে। এটি নির্দেশ করে যে API-এর মাধ্যমে প্রদানকৃত এজেন্টগুলি গুগলের অভ্যন্তরীণ সংস্করণের সরলীকৃত সংস্করণ নয়, বরং একই সিস্টেম, যা প্ল্যাটফর্ম-স্কেলে বাইরের জন্য প্রদান করা হচ্ছে।

এই উন্নয়ন প্রক্রিয়াটি অত্যন্ত দ্রুত এগিয়েছে।

গুগল ২০২৪ সালের ডিসেম্বরে জেমিনি অ্যাপে ডিপ রিসার্চ চালু করে, যা তখন জেমিনি ১.৫ প্রো দ্বারা চালিত হয়েছিল। গুগল এটিকে ব্যক্তিগত এআই গবেষণা সহায়ক হিসাবে বর্ণনা করেছে, যা ওয়েবের তথ্যকে কয়েক মিনিটের মধ্যে সংকলন করে ব্যবহারকারীদের ঘন্টার পর ঘন্টা কাজ বাঁচিয়ে দেয়।

2025 সালের মার্চে, গুগল Gemini 2.0 Flash Thinking Experimental ব্যবহার করে Deep Research কে আপগ্রেড করে এবং সকলের জন্য ট্রায়াল চালু করে। এরপর এটি Gemini 2.5 Pro Experimental-এ আপগ্রেড করা হয়, যেখানে গুগল জানায় যে মূল্যায়নকারীরা এর রিপোর্টকে প্রতিদ্বন্দ্বীদের তুলনায় 2:1 অনুপাতে বেশি পছন্দ করেছেন।

2025 সালের ডিসেম্বর একটি গুরুত্বপূর্ণ মোড় ছিল, যখন গুগল Interactions API চালু করে প্রথমবারের মতো Gemini 3 Pro দ্বারা চালিত Deep Research-কে প্রোগ্রামম্যাটিকভাবে প্রদান করে এবং সমসাময়িকভাবে ওপেন-সোর্স DeepSearchQA বেঞ্চমার্ক প্রকাশ করে।

এই উন্নতির ভিত্তি হলো Gemini 3.1 Pro মডেল, যা ২০২৬ সালের ১৯ ফেব্রুয়ারি প্রকাশিত হয়েছিল। এটি মূল যুক্তিসঙ্গত ক্ষমতায় একটি বড় প্রগতি অর্জন করেছে: ARC-AGI-2 বেঞ্চমার্কে, যা মডেলের নতুন যুক্তিগত প্যাটার্ন সমাধানের ক্ষমতা মূল্যায়ন করে, 3.1 Pro স্কোর পেয়েছে 77.1%, যা Gemini 3 Pro-এর দ্বিগুণেরও বেশি।