ওয়েইচ্যাট এজেন্ট আসছে।
ওয়েইচ ওপেন প্ল্যাটফর্ম ওয়েইচ এআই ডেভেলপার গাইড সম্পর্কে একটি বিষয় প্রকাশ করেছে।
নির্দেশিকা অনুসারে, ব্যবহারকারীদের জন্য একটি বুদ্ধিমান ইন্টারেক্টিভ অভিজ্ঞতা প্রদান এবং ব্যবহারকারীদের ছোট প্রোগ্রাম সেবাগুলি আরও দ্রুত খুঁজে পেতে এবং ব্যবহার করতে সহায়তা করার জন্য, উইচ্যাট ওপেন প্ল্যাটফর্ম ডেভেলপারদের অধিকার এবং স্বাধীন পছন্দকে সম্পূর্ণভাবে সম্মান করে, ডেভেলপারদের উইচ্যাট AI ইকোসিস্টেমে সহজে যোগাযোগের ক্ষমতা প্রদান করে।
যোগাযোগের পর, মাইক্রোপ্রোগ্রামটি ওয়েইক্স এআই দ্বারা প্রস্তাবিত এবং কল করার সুযোগ পাবে। যোগাযোগ সম্পন্ন না করা মাইক্রোপ্রোগ্রামগুলি ওয়েইক্স এআই দ্বারা কল করা যাবে না।
প্ল্যাটফর্মটি দুটি অ্যাক্সেস মোড প্রদান করে। অটোমেটিক মোডে, প্ল্যাটফর্মটি ছোট প্রোগ্রামের সোর্স কোড পড়তে অনুমতি পায়, যার জন্য অতিরিক্ত ডেভেলপমেন্টের প্রয়োজন হয় না। ডেভেলপমেন্ট মোডে, ডেভেলপাররা ছোট প্রোগ্রামের ব্যবসায়িক বৈশিষ্ট্যের ভিত্তিতে নিজস্বভাবে কাস্টমাইজড ডেভেলপমেন্ট করতে পারেন।
একই দিনে, মেিনতুয়ান ঘোষণা করে যে এটি প্রথম প্রাথমিকভাবে উইচ্যাটের এআই ইকোসিস্টেমে যুক্ত হয়েছে। প্রাথমিক অন্তর্ভুক্তি দলগুলির মধ্যে একটি হিসাবে, মেিনতুয়ান আগে থেকেই উইচ্যাট দলের সাথে যৌথভাবে উন্নয়ন ও পরীক্ষা করেছে। ভবিষ্যতে, ব্যবহারকারীরা উইচ্যাটের এআই ব্যবহার করে মেিনতুয়ান ফুড এবং অন্যান্য স্থানীয় জীবনযাপন সেবাগুলি ব্যবহার করতে পারবেন।
সিজিই, টংচেং ইত্যাদি জীবনসেবা প্ল্যাটফর্মগুলি ক্রমাগত উইচ্যাটে যুক্ত হওয়ার ঘোষণা করেছে।
কয়েক দিন আগেই টেনসেন্ট কাস্টমার সার্ভিস জানিয়েছিল যে উইক্স হুয়াওয়ে, মিনি, হোনোর, ওপিপি, ভিভো ইত্যাদি মোবাইল ফোন প্রস্তুতকারকদের সাথে একসাথে A2A অ্যাসিস্ট্যান্ট ক্ষমতা চালু করছে, এবং এখন পর্যন্ত অনেকগুলি প্রস্তুতকারক এটির সাথে যুক্ত হয়েছে।
ব্যবহারকারীরা তাদের মোবাইল সিস্টেমের এআই সহায়কের মাধ্যমে উইচ্যাট অডিও বা ভিডিও কল শুরু করতে বা নির্দিষ্ট বন্ধুদের মেসেজ পাঠাতে পারেন।
এটি বিশেষ করে ওয়েচ্যাট এআই সম্পর্কে প্রথম খবর নয়। এই বছরের মার্চেই বিদেশি মিডিয়া জানিয়েছিল যে, টেনসেন্ট ওয়েচ্যাটের ভিতরে একটি অত্যন্ত গোপনীয় এআই এজেন্ট প্রকল্প চালু করেছে।
জুন ২ তারিখে, বিদেশি মিডিয়া জানিয়েছে যে টেনসেন্ট ওয়েচ্যাটের মধ্যে এআই এজেন্টের প্রোটোটাইপ পরীক্ষা করছে এবং এই মাসের মধ্যেই সংগঠিত অনুমোদন প্রক্রিয়া শুরু হতে পারে। প্রতিবেদনটি প্রকাশের দিনটিতে, টেনসেন্টের শেয়ার বন্ধ হওয়ার সময় ১০.৫% বৃদ্ধি পায়, একদিনে বাজেট ৩০০০ বিলিয়ন হংকং ডলারেরও বেশি বৃদ্ধি পায়, যা ২০২১ সালের জানুয়ারির পর থেকে সবচেয়ে বড় একদিনের বৃদ্ধি।
WeChat AI হয়তো টেনসেন্ট AI-এর দ্বিতীয় অর্ধের চূড়ান্ত উত্তর।
01
ওয়েইচ্যাট এআইয়ের কনটার
প্রারম্ভিক ডেমো দেখেছেন এমন ব্যক্তিদের মতে, ব্যবহারকারীরা ওয়েচ্যাটের মূল ইন্টারফেসে ডানদিকে স্লাইড করে এআই এজেন্টের চ্যাট উইন্ডো খুলতে পারবেন। ব্যবহারকারী নির্দেশ দেওয়ার পর, এজেন্টটি ওয়েচ্যাট ইকোসিস্টেমের মধ্যে মিনি-প্রোগ্রামগুলি স্বয়ংক্রিয়ভাবে কল করবে এবং ফিল্টারিং, অর্ডার প্লেসমেন্ট, বুকিং এর মতো কাজগুলি সম্পন্ন করবে।
উদাহরণস্বরূপ, আপনি যদি বলেন “আমার জন্য ৩০ টাকার কম দামের, খুব মিষ্টি নয়, এবং আসতে পারে এমন একটি কফি অর্ডার করে দাও”, তাহলে এজেন্ট স্বয়ংক্রিয়ভাবে ওয়েইক্সিনের মাইক্রোপ্রোগ্রামটি কল করবে, আপনার জন্য কফি দোকানগুলি ফিল্টার করবে, স্বাদ এবং মূল্যের সাথে মেলানোর চেষ্টা করবে, এমনকি অর্ডার সম্পন্নও করবে।

শুধু বর্ণনা শুনে, এটি ডোবাও, কুয়েন এই এআই চ্যাটবটগুলির সাথে কোনও পার্থক্য নেই।
কিন্তু এখানে বিশেষ বিষয় হলো, উইচ্যাট এআই পুরো উইচ্যাট ইকোসিস্টেমের সমন্বয় ক্ষমতা রাখে।
টিসিএন এর ২০২৫ সালের বার্ষিক প্রতিবেদনে স্পষ্টভাবে উল্লেখ করা হয়েছে যে, লক্ষ্য হল উইচ্যাট ইকোসিস্টেমের ভিতরে নেক্সট-জেনারেশন Agentic সার্ভিস তৈরি করা, যা মাইক্রোপ্রোগ্রাম, কন্টেন্ট, সোশ্যাল এবং পেমেন্ট ক্ষমতা সংযুক্ত করবে। ২০২৬ সালের ৩১ মার্চ পর্যন্ত, উইচ্যাট এবং WeChat-এর মিলিত মাসিক সক্রিয় ব্যবহারকারী সংখ্যা ১.৪৩২ বিলিয়ন।
অর্থাৎ, উইচ্যাট এআই যখন চালু হবে, তখন এটি ভালো হোক বা খারাপ, এটি একটি সুপার অ্যাপ হয়ে উঠবে।
ওয়েশিনে লক্ষ লক্ষ প্রোগ্রাম রয়েছে, যা ট্যাক্সি বুকিং, ফুড ডেলিভারি, টিকিট বুকিং, সবজি কেনা ইত্যাদি দৈনন্দিন জীবনের পরিস্থিতি কভার করে। দেশের শীর্ষস্থানীয় ইন্টারনেট সেবাগুলির মধ্যে প্রায় সবগুলিরই এই ইকোসিস্টেমে একটি প্রোগ্রামের প্রবেশদ্বার রয়েছে।
ওয়েইচ্যাটের এআইয়ের মূল ক্ষমতা হল এআইকে এই মাইক্রোপ্রোগ্রামগুলিতে সেবা এবং লেনদেনের ক্ষমতা ব্যবহার করে চিন্তা থেকে সিদ্ধান্ত নেওয়া এবং তারপর বাস্তবায়ন পর্যন্ত পূর্ণাঙ্গ বন্ধ চক্র সম্পন্ন করা।
তাহলে এটি কীভাবে করবে?
প্রথমে ব্যবহারকারীর ইচ্ছা বুঝতে হবে। ব্যবহারকারী “আমাকে একটি রেস্তোঁরা বুকিং করে দাও” বললে, পরিবারের গ্রুপে এবং কাজের গ্রুপে এর অর্থ সম্পূর্ণ ভিন্ন।
যে সব ব্যক্তি অংশগ্রহণ করছে, কে সিদ্ধান্ত নিতে পারে, বাজেট কত, কোন পছন্দ বা প্রতিকূলতা আছে, এবং কাজটি কোন পর্যায়ে আছে—এগুলোই হল Agent-এর জন্য প্রয়োজনীয় প্রেক্ষাপট। চ্যালেঞ্জটি হল যে ওয়েইচ্যাটের কাজগুলি স্বাভাবিকভাবেই সময়ের মধ্যে বিস্তৃত, যেমন গ্রীষ্মকালীন ছুটির বিষয়ে পরিবারের গ্রুপের আলোচনা কয়েকদিন ধরে বিচ্ছিন্নভাবে চলতে পারে।
এরপর টুল কল করুন।
এজেন্টকে হাতে কাজ করতে হবে, সার্চ করে তথ্য খুঁজতে হবে, একটি ছোট প্রোগ্রাম ব্যবহার করে জিনিসের তুলনা এবং পরীক্ষা করতে হবে, উইচ্যাট পেমেন্ট ব্যবহার করে লেনদেন সম্পন্ন করতে হবে, এবং ফলাফলটি ব্যবহারকারীকে সার্ভিস নোটিফিকেশনের মাধ্যমে ফিরিয়ে দিতে হবে।
QuestMobile-এর প্রতিবেদন অনুযায়ী, "2026 প্যানোরামিক ইকোসিস্টেম ট্রাফিক স্প্রিং রিপোর্ট", মিনি প্রোগ্রামের দৈনিক সক্রিয় ব্যবহারকারী 9 বিলিয়নের বেশি এবং শত শত সূক্ষ্ম ক্ষেত্রকে কভার করে।
এখন টুলবক্সটি যথেষ্ট বড়, কিন্তু উইচ্যাট এআই কি বুঝতে পারছে?
মার্চ ১৮ তারিখে টেনসেন্ট প্রকাশিত একটি পেপারে কিছু প্রযুক্তিগত বিবরণ উন্মোচিত করেছে। উইচ্যাট দল UI-Oceanus তৈরি করেছে, যা একটি সুপার প্রোগ্রাম ইকোসিস্টেমের জন্য বিশেষভাবে ডিজাইন করা একটি বিশ্ব মডেল। এর কাজ হলো অপারেশনের ফলাফল পূর্বানুমান করা। এজেন্টটি বোতামটি খুঁজে পেয়েছে, কিন্তু এটি ক্লিক করলে কী ঘটবে? পৃষ্ঠাটি কোথায় রিডাইরেক্ট হবে? কোন উইন্ডোটি পপ-আপ হবে? পেমেন্ট প্রক্রিয়াটি শুরু হবে কি?
মানুষ যখন অ্যাপ ব্যবহার করে, তখন এগুলির প্রতি স্বাভাবিক বোধ থাকে, কিন্তু এজেন্টের এই ধরনের স্বাভাবিক বোধ নেই, তাই এটিকে ডেটা থেকে শিখতে হবে।
গেম এআই শেখে “এই বোতামটি চাপলে চরিত্রটি কীভাবে চলবে”, ছোট প্রোগ্রামের বিশ্ব মডেল শেখে “এই বোতামটি ক্লিক করলে পৃষ্ঠাটি কীভাবে পরিবর্তিত হবে”।
প্রকৃত মিনি প্রোগ্রাম পরিবেশে প্রশিক্ষণ দেওয়া খুব ধীর এবং অস্থিতিশীল, তাই UI-Oceanus স্বয়ংক্রিয়ভাবে অপারেশন এবং পৃষ্ঠার পরিবর্তনগুলি সিমুলেট করে 50 লক্ষ নমুনা তৈরি করেছে। এটি Agent-কে ভার্চুয়াল পরিবেশে মিনি প্রোগ্রাম অপারেট করা শেখায়, এবং তারপর এটি প্রকৃত পরিস্থিতিতে স্থানান্তরিত হয়।
খরচের সমস্যাও আছে। 1.4 বিলিয়ন মাসিক সক্রিয় ব্যবহারকারীর জন্য প্রতিটি স্কেনারিওতে ইনফারেন্স ট্রিগার করলে খরচ অসংখ্য। টেনসেন্টকে মৌলিক কাজের জন্য ছোট মডেল এবং জটিল কাজের জন্য শক্তিশালী মডেল কল করার মধ্যে ভারসাম্য বজায় রাখতে হবে। এই মাল্টি-মডেল স্কিডিউলিং ক্ষমতা প্রভাব নিশ্চিত করতে হবে, একইসাথে খরচও নিয়ন্ত্রণ করতে হবে।
শেষ হল ইকোসিস্টেম সমন্বয়।
ওয়েশিনে অত্যন্ত বেশি প্রোগ্রাম রয়েছে, সেবার গুণমান, ইন্টারফেসের স্থিতিশীলতা, ব্যবসায়ীদের সহযোগিতা, পেমেন্ট প্রক্রিয়া, সুপারিশের ক্রম এবং লাভ বণ্টন—প্রতিটি বিষয়কে আলাদাভাবে নিয়ে দীর্ঘক্ষণ আলোচনা করা যায়।
একটি এআই এজেন্ট ব্যবহারকারীর জন্য কাজ করতে পারে শুধু তখনই যখন সে প্রকৃতপক্ষে কাজটি সম্পন্ন করে, শুধু মুখে খুব স্মুথভাবে সম্মতি দিয়ে শেষ পর্যন্ত অর্ডার দেওয়ার মধ্যেই পথ হারিয়ে ফেলবে না।
সুতরাং উইচ্যাট এআই একটি অত্যন্ত জটিল প্রকল্প, যা বিভিন্ন জটিল পরিস্থিতির সম্মুখীন হয়। এটি প্রাকৃতিক ভাষা বুঝতে পারতে হবে, মাইক্রোপ্রোগ্রাম কল করতে হবে, পেমেন্ট প্রক্রিয়াকরণ করতে হবে, কনটেক্সট পরিচালনা করতে হবে এবং ইকোসিস্টেম সমন্বয় করতে হবে।
WeChat AI-এর কনটার স্পষ্ট, শুধু এই পণ্যটি আমাদের কল্পনার চেয়ে অনেক বড় হবে।
02
কেন উইচ্যাট এই এজেন্টটি পরিচালনা করার জন্য সবচেয়ে উপযুক্ত
যত বেশি প্রেক্ষাপট থাকবে, এআই তত ভালোভাবে আপনার প্রকৃত উদ্দেশ্য বুঝতে পারবে এবং তত সঠিক সিদ্ধান্ত নিতে পারবে।
এবং উইচ্যাট হল টেনসেন্টের সবচেয়ে বড় কনটেক্সট কন্টেইনার।
WeChat-এ সামাজিক সম্পর্ক রয়েছে, 14 বিলিয়ন ব্যবহারকারীর WeChat-এর সামাজিক সম্পর্ক, চ্যাট রেকর্ড, গ্রুপ কথোপকথন—all এগুলোই প্রেক্ষাপট। WeChat-এ ছোট প্রোগ্রাম রয়েছে, লক্ষ লক্ষ ছোট প্রোগ্রাম যা সেবা প্রদানের পরিসর কভার করে, এগুলোও প্রেক্ষাপট।
WeChat-এ পেমেন্ট রয়েছে, ব্যবহারকারীর খরচের অভ্যাস, পেমেন্ট রেকর্ড, ট্রানজেকশন পছন্দ—এগুলোও কনটেক্সট।
ওয়েইচ্যাটে কনটেন্ট রয়েছে, গুগুল পাবলিক অ্যাকাউন্ট, ভিডিও পাবলিক অ্যাকাউন্ট, এবং মোমেন্টসের ইনফোস্ট্রিম এগুলোও কনটেক্সট।

কিছুদিন আগে, টেনসেন্ট বহু এআই পণ্য চালু করেছে, যেমন ইয়াওয়ান, ima, WorkBuddy, Marvis, যারা পরস্পরের সাথে স্বতন্ত্র মনে হয়। বাস্তবে, এগুলি সবই ওয়েচ্যাট এআই-এর জন্য ক্ষমতা সঞ্চয় করছে।
এর পিছনে টেনসেন্টের একটি কো-ডিজাইন নামক প্রক্রিয়া রয়েছে।
সহজ ভাষায়, কো-ডিজাইন মানে পণ্য টিম এবং মডেল টিম একসাথে ডিজাইন করা এবং অপ্টিমাইজ করা।
প্রচলিত পদ্ধতি হলো, মডেল টিম প্রথমে মডেলটি প্রশিক্ষণ দেয়, তারপর এটি পণ্য টিমের হাতে ছেড়ে দেয়। পণ্য টিম যদি কোনো সমস্যা খুঁজে পায়, তাহলে সেটি ফিরিয়ে দেয়, এবং মডেল টিম তখন সামঞ্জস্য করে।
এই প্রক্রিয়াটি ধীর এবং প্রায়শই "মডেলটি শক্তিশালী কিন্তু পণ্যটি ব্যবহার করতে অসুবিধাজনক" হয়ে থাকে।
Co-Design এর পদ্ধতি ভিন্ন। ইয়ুনবাও টিম হুনয়ুন টিমকে বলবে যে ব্যবহারকারীরা বাস্তব পরিস্থিতিতে কীভাবে প্রশ্ন করে এবং কী ধরনের সমস্যার সম্মুখীন হয়। হুনয়ুন টিম এই বাস্তব ফিডব্যাকের ভিত্তিতে মডেলের কিছু ক্ষমতা বিশেষভাবে অপ্টিমাইজ করবে।
অপ্টিমাইজেশন শেষ হয়ে গেছে, ইয়ুনবাও টিম এখন এটি টেস্ট করবে, নতুন সমস্যা পেলে আবার সামঞ্জস্য করবে।
এই প্রক্রিয়াটি দ্বিদিকীয় এবং সম্পূর্ণ সিঙ্ক্রোনাইজড। পণ্যটি মডেলকে বাস্তব ডেটা এবং ফিডব্যাক প্রদান করে, আর মডেলটি পণ্যকে শক্তিশালী ক্ষমতা প্রদান করে।
এটি কেন কাজ করে? কারণ LLM যুগ এবং অতীতের এআইয়ের মৌলিক পার্থক্য হল সাধারণীকরণ।
LLM-এর আগে, অনুবাদ পণ্য তৈরি করতে শুধু অনুবাদ ডেটা ভালোভাবে প্রস্তুত করতে হত, আর গো প্রোগ্রাম তৈরি করতে শুধু গো ডেটা প্রস্তুত করতে হত।
কিন্তু আজকের পরিস্থিতি ভিন্ন, আপনি যদি শুধুমাত্র একটি কোডিং এজেন্ট তৈরি করতে চান, তবেও আপনার মডেলের চ্যাট করার, অনুসন্ধান করার, নির্দেশ পালন করার এবং যুক্তি প্রয়োগ করার ক্ষমতা থাকতে হবে। ফলে, এটি শেষপর্যন্ত একটি অত্যন্ত জটিল বহুবিষয়ক সমস্যায় পরিণত হয়।
টেনসেন্ট এবং ইয়ুয়ানের সহ-ডিজাইন মিশ্রণ মডেলকে শক্তিশালী চ্যাট এবং অনুসন্ধান ক্ষমতা দিতে উদ্দেশ্য। এই ক্ষমতাগুলি আইমা, ওয়ার্কবাডি ইত্যাদি অন্যান্য পণ্যে স্থানান্তরিত করা যেতে পারে। একটি পণ্যে প্রশিক্ষিত ক্ষমতা অন্যান্য পণ্যগুলিকেও আরও বেশি ব্যবহারযোগ্য করে তুলতে পারে।
বিশেষভাবে, ইয়ুয়ান বাস্তব বিশ্বের প্রম্পট বন্টনকে প্রক্রিয়া করে। ব্যবহারকারীরা ইয়ুয়ানে যে প্রশ্নগুলি করে, তা প্রায়শই অস্পষ্ট হয়, সম্ভবত শুধু এক বা দুটি বাক্য, এবং তারা নিরন্তর প্রশ্ন করে।
এই স্কেনারিওগুলির মাধ্যমে প্রশিক্ষিত মাল্টি-রাউন্ড কথোপকথন ক্ষমতা এবং উদ্দেশ্য বোঝার ক্ষমতা সরাসরি উইচ্যাটের AI-এর গ্রুপ চ্যাট টাস্ক পরিচালনার সময় কনটেক্সট বুঝতে ব্যবহার করা যেতে পারে।
ওয়ার্কবাডি অফিস সহযোগিতার পরিস্থিতির ডেটা সংগ্রহ করে।
এটি ডকুমেন্ট স্ট্রাকচার, মিটিং মিনিট এবং কাজের বণ্টন এই কর্পোরেট সিনেরিওগুলির অর্থ বুঝতে পারে। এই ক্ষমতাগুলি ওয়েইচ্যাট এআইকে কাজ পরিচালনা করার সময় কীভাবে মূল তথ্য বের করবে এবং সিদ্ধান্ত নির্ধারণের পয়েন্টগুলি চিহ্নিত করবে তা জানতে সাহায্য করে।
আইএমএ অনুসন্ধান ক্ষমতা সঞ্চয় করে। এটি মডেলকে অস্পষ্ট কুয়েরি ইচ্ছাকে স্পষ্ট অনুসন্ধান কৌশলে রূপান্তরিত করতে, এবং বিপুল পরিমাণের ফলাফলের মধ্যে থেকে কার্যকরী তথ্য বাছাই করতে প্রশিক্ষণ দেয়। এই ক্ষমতাগুলি ওয়েইচ্যাট AI-কে মিনি-প্রোগ্রাম কল করার আগে একবার তথ্য বাছাই এবং ইচ্ছা পরিষ্কার করতে সক্ষম করে, যার ফলে ওয়েইচ্যাট AI কল করার সময় সম্ভাব্য সমস্ত মিনি-প্রোগ্রামকেই কল করে সময় এবং token-এর অপচয় করবে না, বরং শুধুমাত্র কয়েকটি প্রয়োজনীয় মিনি-প্রোগ্রামকেই কল করবে।
মারভিস কাজ বিভাজন এবং টুল স্কিডিউলিং দক্ষতা প্রশিক্ষণ করে।
মারভিস ব্যবহারকারীর নির্দেশগুলিকে কয়েকটি উপ-কাজে বিভক্ত করে, ফাইল, সিস্টেম এবং অ্যাপ্লিকেশন নিয়ন্ত্রণের জন্য বিভিন্ন এজেন্টকে সমন্বয় করে। এই কাজ বিন্যাস এবং বহু-এজেন্ট সহযোগিতার ক্ষমতা দিয়ে ওয়েইচ্যাট AI-এর জন্য “আমার জন্য কফি বুক করুন এবং সহকর্মীদের জানান” এর মতো ক্রস-সিনারিও কাজের জন্য ছোট প্রোগ্রাম কল, পেমেন্ট প্রক্রিয়া এবং মেসেজ নোটিফিকেশনকে কীভাবে সংযুক্ত করতে হবে, তা জানা যায়।
এই পণ্যগুলি বিভিন্ন ডেটা প্রদান করে, কিন্তু এই ডেটাগুলি পরস্পরের মধ্যে ছড়িয়ে পড়তে পারে এবং একটি নেটওয়ার্কের মতো ব্যবস্থা গঠন করে। একটি পণ্যের দ্বারা প্রশিক্ষিত ডেটা, প্রি-ট্রেনিং এবং পোস্ট-ট্রেনিং জেনারালাইজেশন মেকানিজমের মাধ্যমে অন্য একটি পণ্যের পারফরম্যান্স উন্নত করতে পারে।
ওয়েইচ্যাট এআই এখন একটি এআই নেটওয়ার্ক সেন্টারে রয়েছে।
এটি শূন্য থেকে শুরু করার প্রয়োজন নেই, এটি ইতিমধ্যে যাচাইকৃত ক্ষমতাগুলি সরাসরি কল করতে পারে।
আরও গুরুত্বপূর্ণ বিষয় হলো, উইচ্যাট নিজেই একটি সম্পূর্ণ পরিবেশ। এতে সম্পর্কের লিঙ্ক, মাইক্রো-প্রোগ্রাম, উইচ্যাট পেমেন্টের ট্রানজেকশন সাইকেল এবং গিফট এবং ভিডিও চ্যানেলের কনটেন্ট ইকোসিস্টেম রয়েছে। এগুলি অন্যান্য এজেন্ট পণ্যের কাছে নেই।
03
WeChat AI-এর পরিধি কতটা?
এই সবকিছুই এখন A2A দ্বারা বাস্তবায়িত হচ্ছে।
A2A-এর পূর্ণরূপ হল Agent-to-Agent, যার চীনা নাম "বুদ্ধিমান এজেন্ট থেকে বুদ্ধিমান এজেন্ট"।
এটি একটি খোলা প্রোটোকল যা বিভিন্ন প্রস্তুতকারকের এআই এজেন্টগুলির মধ্যে কীভাবে যোগাযোগ করা হবে, কীভাবে ক্ষমতা কল করা হবে এবং কীভাবে নিরাপত্তা নিশ্চিত করা হবে তা নির্ধারণ করে। এর বিপরীতে GUIAgent পথ, যা এআইকে মানুষের মতো "স্ক্রিন পড়ে" ইন্টারফেস চিনতে এবং "সিমুলেটেড ক্লিক" দিয়ে উইচ্যাট চালানোর মাধ্যমে কাজ করে।
টিএনসি জিইউআইয়ের পরিবর্তে এ-টু-এ বেছে নেওয়ার পিছনে আসলে গভীর বিবেচনা রয়েছে।
মে মাসের টেনসেন্ট Q1 আয় ফোন কনফারেন্সে, একজন বিশ্লেষক টেনসেন্টের প্রেসিডেন্ট লিউ চিপিংকে জিজ্ঞাসা করেছিলেন, "iOS, Android বা মোবাইল প্রস্তুতকারকদের দ্বারা পরিচালিত অপারেটিং সিস্টেম লেভেলের এজেন্টগুলির দীর্ঘমেয়াদী সম্ভাবনা বা সম্ভাব্য বিপ্লবকে আপনি কীভাবে দেখেন?"
লিউ চিপিং উত্তর দিয়েছেন, "অপারেটিং সিস্টেমের দৃষ্টিকোণ থেকে, এখানে কয়েকটি ভিন্ন জিনিস মিশে আছে। আসল অপারেটিং সিস্টেম রয়েছে, যেমন iOS এবং Android, এবং তারপর আছে যারা নিজেদের অপারেটিং সিস্টেমের মতো মনিয়ে চলছে অ্যাপ্লিকেশনগুলি। যদি আপনি iOS বা Android-এর মতো অপারেটিং সিস্টেম হন, তাহলে আপনি চান যে ইকোসিস্টেমটি ভালভাবে সুরক্ষিত এবং সুসংগঠিত থাকুক, এবং অ্যাপ্লিকেশনগুলিকে যথাযথ অনুমতি দেওয়া হোক, আপনি একটি স্মার্ট এজেন্টকে অনুমতি দিতে পারেন যা ব্যবহারকারীদের জন্য সেবা প্রদানের চেষ্টা করছে, কিন্তু আপনাকে বিভিন্ন অ্যাপ্লিকেশনগুলির অনুমতি নিতে হবে। অন্যথায়, অপারেটিং সিস্টেম হিসাবে, আপনি本质上ভাবে বিভিন্ন অ্যাপ্লিকেশনগুলির উপর আক্রমণ করছেন, যা অপারেটিং সিস্টেমকে পরিচালনা করার সর্বোত্তম উপায় নয়।"
লিউ চিপিংয়ের মতে, অপারেটিং সিস্টেমের এজেন্ট দ্বারা অ্যাপ্লিকেশন নিয়ন্ত্রণ করা ঠিক, কিন্তু অ্যাপ্লিকেশনের অনুমতি ছাড়া এটি করা যাবে না, অন্যথায় এটি অ্যাপ্লিকেশনের উপর অত্যাচার হবে।
সহজ ভাষায় বললে, টেনসেন্ট GUI এজেন্ট গ্রহণ করে না, শুধুমাত্র A2A গ্রহণ করে।

গত দুই বছরে, মোবাইল ফোন নির্মাতারা বাইরে থেকে উইচ্যাটের সাথে GUI ব্যবহার করে সংযোগ স্থাপনের চেষ্টা করেছিল।
গ্লোরি ইয়োইয়ো প্রচার করেছে "একটি বাক্যে উইচ্যাট রেড এনভেলপ পাঠান", এবং মিই স্মার্ট হোম পণ্যগুলির বিক্রয় বিশেষত্ব হল "ছোট আই স্বয়ংক্রিয়ভাবে উইচ্যাট কল সংযুক্ত করে।" যখন আপনি আপনার ফোনে বলেন "XX-কে ১০ টাকার রেড এনভেলপ পাঠান", তখন AI সহায়কটি ব্যাকগ্রাউন্ডে নিম্নলিখিতটি করে: লক আনলক করা, উইচ্যাট আইকনে ক্লিক করা, XX খোঁজা, প্লাস আইকনে ক্লিক করা, রেড এনভেলপে ক্লিক করা, ১০ টাইপ করা, এবং পেমেন্ট শুরু করা।
এই কার্যক্রম শীঘ্রই উইচ্যাট দ্বারা বন্ধ করে দেওয়া হয়।
এপ্রিল 2025-এ, উইচ্যাট সিকিউরিটি সেন্টার ঘোষণা করেছে যে তৃতীয় পক্ষের টুলগুলি উইচ্যাটের নিরাপত্তা প্রযুক্তি এড়িয়ে যাওয়া, অবৈধভাবে উইচ্যাট টার্মিনাল ব্যবহারকারীদের ডেটা প্রাপ্তি বা ব্যবহার করা নিষিদ্ধ।
বাইটডান্সের ডোবাও মোবাইলও একই ভাগ্যের সম্মুখীন হয়েছে।
2025 সালের ডিসেম্বরে, ডোবাও মোবাইল অ্যাসিস্ট্যান্টের টেকনিক্যাল প্রিভিউ প্রকাশিত হয়, যার মূল বৈশিষ্ট্য হল "AI সরাসরি অ্যাপের মধ্যে অপারেশন"। দ্রুত, অসংখ্য ব্যবহারকারী জানায় যে তাদের ওয়েইক্স অ্যাকাউন্ট বাধ্যতামূলকভাবে লগ আউট করা হয়েছে এবং সিস্টেমটি লগইন পরিবেশের অস্বাভাবিকতা নির্দেশ করেছে। টেনসেন্ট বলেছে, এটি ওয়েইক্সের পূর্বনির্ধারিত নিরাপত্তা ঝুঁকি নিয়ন্ত্রণ নীতির সাথে মিলে গেছে।
ওয়েইচ্যাট এআই-এ, হোয়াওয়ে প্রথম ব্র্যান্ড যে ওয়েইচ্যাট A2A সামঞ্জস্যতা সম্পন্ন করেছে। বর্তমানে হোয়াওয়ের কিছু মডেল এই ফিচারটি সমর্থন করে, ব্যবহারকারীরা ইয়োইওকে সক্রিয় করে ভয়েস কমান্ড দিতে পারেন, যেমন ওয়েইচ্যাটে বার্তা পাঠানো, ওয়েইচ্যাট ভয়েস বা ভিডিও কল করা।
একজন টেনসেন্টের অভ্যন্তরীণ ব্যক্তি মন্তব্য করেছেন যে, যেকোনো মোবাইল এজেন্ট যদি উইচ্যাট অ্যাক্সেস করতে না পারে, তাহলে তা একটি সত্যিকারের সিস্টেম-লেভেল এজেন্ট হতে পারে না। টেনসেন্ট অবশ্যই এই পথ খুলবে, শুধু সময়ের বিষয়।
ওয়েচ্যাট একটি নিয়ন্ত্রিত প্রোটোকল যেমন A2A-এর মাধ্যমে মোবাইল ফোন প্রস্তুতকারকদের Agent-কে ওয়েচ্যাটের ক্ষমতা সীমিতভাবে ব্যবহারের অনুমতি দেয়, কিন্তু বাহ্যিক Agent-দের পর্দা পড়া এবং ক্লিক অনুকরণের মাধ্যমে ওয়েচ্যাটে প্রবেশের অনুমতি দেয় না।
এটি বোঝায় যে, শেষ পর্যন্ত, টেনসেন্টকে উইচ্যাট ইকোসিস্টেমের কল অধিকার এবং নিয়ম প্রণয়নের ক্ষমতা নিয়ন্ত্রণ করতে হবে।
ডোবাও নিয়ে কথা বলতে গিয়ে, এখানে আরেকটি প্রশ্ন উঠে আসে, উইচ্যাট এআই-এর জন্য কি শুল্ক প্রযোজ্য হবে?
ডোবাওয়ের মাসিক সক্রিয় ব্যবহারকারী 345 মিলিয়ন, সাম্প্রতিক সময়ে কিছু ফিচারের জন্য চার্জ শুরুর খবর প্রচারিত হচ্ছে, যেখানে উইচ্যাটের মাসিক সক্রিয় ব্যবহারকারী 14 বিলিয়ন, চাপ আরও বেশি হবে।
আরও বলা যায়, উইচ্যাট এআইকে এত বেশি মানুষের সাথে মোকাবিলা করতে হবে, প্রতিটি পরিস্থিতিতে ইনফারেন্স ট্রিগার করলে খরচ অবশ্যই আকাশছোঁয়া হবে।
এই 10 বিলিয়ন টাকা যা পূর্বে টেনসেন্ট DeepSeek-এ বিনিয়োগ করার পরিকল্পনা করছিল, তা মডেলের সরবরাহ এবং খরচের ভিত্তি হিসাবে ব্যাখ্যা করা যেতে পারে।
টিএনসি দ্বারা স্ব-উন্নয়ন করা হুন মডেলের জন্য প্রযুক্তিগত অংশীদার প্রয়োজন, এবং উইচ্যাট ইকোসিস্টেমের জন্য কম খরচে উপস্থাপনা ক্ষমতা আরও প্রয়োজন। ডিপসিকের কম খরচে প্রশিক্ষণের পথটি ঠিক উইচ্যাট AI-এর এই বিশাল ব্যবহারকারী স্কেলের প্রয়োজনীয়তার সাথে মেলে।
২ জুন, টেনসেন্ট ঘোষণা করেছে যে টেনসেন্ট ক্লাউড প্ল্যাটফর্মে DeepSeek-V4 সিরিজের কলিং মূল্য পুরোপুরি DeepSeek-এর অফিসিয়াল মূল্যের সমান, ব্যবহারকারীদের কোনও ক্লাউড প্ল্যাটফর্ম প্রিমিয়াম পরিশোধ করতে হবে না।
এই সমস্ত ইঙ্গিতগুলি এটি ইঙ্গিত করছে যে টেনসেন্ট DeepSeek-এর সাথে গভীরভাবে বাঁধা হবে, এবং উইক্স এজেন্ট সম্ভবত এই বাঁধনের প্রথম উত্তর হবে।
সহজ কাজের জন্য ছোট মডেল ব্যবহার করুন, যার খরচ কম এবং গতি দ্রুত। জটিল কাজের জন্য শক্তিশালী মডেল কল করুন, যার ফলাফল ভালো এবং সঠিকতা বেশি। এই মাল্টি-মডেল স্কেডিউলিং ক্ষমতা ফলাফল নিশ্চিত করতে হবে এবং খরচ নিয়ন্ত্রণ করতে হবে।
ওয়েইচ্যাট ব্যবহারকারী হিসাবে, যদি ওয়েইচ্যাট এআই একবারেই কাজটি সম্পন্ন করতে পারে, তাহলে আমি এই ক্ষমতার জন্য পেমেন্ট করতে প্রস্তুত।
যেমন আমার জন্য একটি বিমান টিকিট বুকিং করুন, আমার জন্য একটি রেস্তোঁরা খুঁজে দিন, এবং আমার ফ্রেন্ডস লিস্টে দীর্ঘদিন ধরে শুয়ে থাকা এবং আমার সাথে কোনো চ্যাট রেকর্ড নেই এমন ব্যক্তিটির পরিচয় মনে করিয়ে দিন। আমি মনে করি এই ফিচারগুলির সবগুলিরই মূল্য রয়েছে।
এর চেয়ে বেশি গুরুত্বপূর্ণ হলো, উইচ্যাট এআই শুধু ব্যক্তিগত ব্যবহারকারীদের সাথেই মোকাবিলা করছে না, বরং প্রতিষ্ঠানগত ব্যবহারকারীদেরও। প্রতিষ্ঠানগত স্বয়ংক্রিয়করণ, বুদ্ধিমান গ্রাহক সেবা, বুদ্ধিমান বিপণন—এই সিনেরিওগুলির জন্য এআই-এর চাহিদা বেশি এবং পেমেন্টের ইচ্ছা বেশি।
ওয়েইচিন এআই-এর মঞ্চ প্রকৃতপক্ষে খুব বড়। এটি কতটা বড়? উত্তরটি হলো, যতটা ওয়েইচিন ইকোসিস্টেম বড়, ততটাই ওয়েইচিন এআই-এর মঞ্চ বড়।
৬ মে তারিখে টেনসেন্ট ক্লাউড এআই শিল্প প্রয়োগ সম্মেলনে, টেনসেন্টের প্রধান এআই বিজ্ঞানী এবং হুনয়ান বড় মডেলের প্রধান যাও শুনই একটি দীর্ঘমেয়াদী মূল্যায়ন প্রদান করেন।
তিনি মনে করেন যে এআই হল একটি দীর্ঘমেয়াদী খেলা, সংক্ষিপ্ত জানালা নয়। তিনি সিলিকন ভ্যালির কিছু পেশাদারদের “দুই বছরের মধ্যে টাকা উপার্জন করে অবসর নেওয়া” এর মানসিকতাকে সমালোচনা করেন এবং বর্তমানটিকে “৭০-এর দশকের পিসি”-এর মতো বলে জোর দেন, যেখানে ভবিষ্যতে নতুন পণ্যের সুযোগগুলি ধারাবাহিকভাবে প্রকাশিত হবে।
এই বিচারটিই ব্যাখ্যা করে যে কেন টেনসেন্ট ওয়েচ্যাট AI-এ এত বড় খরচ করতে চায়। যাও শুনই বিশেষভাবে জোর দিয়ে বলেন, “ব্যবহারিক মূল্য র্যাঙ্কিং মূল্যের চেয়ে বেশি।” তিনি মনে করেন, AI-এর পদ্ধতি এখন অত্যন্ত পরিপক্ক, আসল চ্যালেঞ্জটি হলো “ভালো প্রশ্ন” খুঁজে পাওয়া, যা সমাধান করা যায়, র্যাঙ্কিংয়ের সংখ্যার পিছনে ছোটা।
ওয়েইচ্যাট এআই যে সমস্যাগুলি সমাধান করতে চায়, সেগুলি ঠিক এই ধরনের “ভালো প্রশ্ন”।
কিভাবে এই 14 বিলিয়ন ব্যবহারকারীকে তাদের দৈনন্দিন জীবনে এআই-এর মূল্য অনুভব করানো যায়?
এখানে কোনো দেখানোর চালাকি বা তালিকায় উঠার চেষ্টা নেই, শুধু এই ভালো সমস্যাটি সমাধান করতে পারলে টেনসেন্ট সত্যিকার অর্থে AI-এর দ্বিতীয় অধ্যায়ে প্রবেশ করেছে।
এই লেখাটি ওয়েইচ্যাট গ্রুপ "সিধে এআই" (ID: faceaibang) থেকে এসেছে, লেখক: মিয়াও জেং, সম্পাদক: ওয়াং জিং
