লেখক: ইয়ুন ইয়ং এআই, লেখক: হুয়াং ইউনহাও
১. Google I/O 2026-এর পর: চারটি এজেন্ট যুগে প্রবেশ করেছে ডিভাইস-সাইড OS
২০২৬ সালের ১২ মে, গুগল এন্ড্রয়েড শো | I/O এডিশন প্রকাশ করে, যা ১৯ মে আইও কনফারেন্সের আগে এন্ড্রয়েড-ভিত্তিক একটি বিশেষ ইভেন্ট ছিল। এন্ড্রয়েড ইকোসিস্টেমের প্রেসিডেন্ট সমির সামাট এই প্রকাশকে একটি দিশা দেন: এন্ড্রয়েডকে একটি অপারেটিং সিস্টেম থেকে একটি স্মার্ট সিস্টেমে রূপান্তরিত করা। এই মূল রেখাকে ধরে রাখা হয়েছে Gemini Intelligence—এন্ড্রয়েড সিস্টেম লেয়ারের একটি সক্রিয় AI ক্ষমতা।

2026 সালের Android শো | I/O এডিশন প্রকাশনা পোস্টার
সূত্র: Android Heaadlines
গুগল এবার গত বছরের জেমিনি ন্যানো+এআইকোর কম্বিনেশনের তুলনায় এজেন্টের অ্যাপের মধ্যে এবং কনটেক্সটের সাথে কাজ করার ক্ষমতাকে আরও গভীরভাবে ওএস লেয়ারে এম্বেড করেছে: অ্যাপের মধ্যে টাস্ক অটোমেশন (খাবার অর্ডার, ক্রয়, অর্ডার দেওয়া), ফর্ম অটো-পূরণ, ওয়েবসাইট সারাংশ, কাস্টম উইজেট—এগুলোকে ক্রমানুসারে সিস্টেম-লেভেল ক্ষমতার তালিকায় যোগ করা হয়েছে। গুগল একইসাথে ব্যবহারকারীর স্পষ্ট নিয়ন্ত্রণ (explicit user control), সম্পূর্ণ ডেটা সুরক্ষা (comprehensive data protection) এবং অপারেশনাল ট্রান্সপ্যারেন্সি (operational transparency)কে পণ্যের তিনটি মূলনীতি হিসেবে তালিকাভুক্ত করেছে।
মে এর ১৯ তারিখে, এক সপ্তাহ পরে, I/O থিম স্পিচে, গুগলের সিইও সুন্দার পিচাই এই রেখাটি দিয়ে শুরু করেন:
Agent-এর সময়ে জেমিনি-এ আপনাকে স্বাগতম(欢迎进入Agent化的Gemini时代)
গুগল এন্ড-সাইড OS এজেন্টাইজেশনের ঢেউয়ে শুরু করেনি।
মাইক্রোসফট ২০২৪ সালের মে মাসের Build 2024-এ Copilot+PC (৪০+ TOPS NPU সহ নতুন জেনারেশনের Windows 11 ডিভাইস) চালু করে, যা এন্ড-সাইড ছোট মডেল Phi Silica, স্ক্রিন Agent ক্ষমতা Click to Do, এবং সিস্টেম-লেভেল এক্টিভিটি মেমোরি Recall-এর উপর ভিত্তি করে Agent ক্ষমতা OS-এ এমবেড করে।
2024 সালের জুনে WWDC24-এ, Apple প্রাতিষ্ঠানিকভাবে "Apple Intelligence" ঘোষণা করেছিল, এবং তখন এটিকে "পার্সোনাল ইন্টেলিজেন্স সিস্টেম" (ব্যক্তিগত বুদ্ধিমত্তা সিস্টেম) হিসাবে চিহ্নিত করেছিল, পরবর্তীতে কিছু AI-সহায়ক ফাংশন চালু করা হয়েছিল, তবে নিজস্ব বড় মডেলের দেরি এবং Siri-এর "অজ্ঞতা"র সমস্যার কারণে Apple Intelligence-এর কোর Agent ক্ষমতা এখনও প্রকাশিত হয়নি।
হুয়াওয়ে 2025 সালের জুনে HDC 2025-এ HarmonyOS 6 এবং হোংমেং ইন্টেলিজেন্ট ফ্রেমওয়ার্ক (HMAF) প্রকাশ করে, এরপর শিয়াওই ইন্টেলিজেন্ট প্লাজা এ 80-এরও বেশি ইন্টেলিজেন্ট অ্যাজেন্ট চালু করে।
Android, iOS, HarmonyOS, Windows এর মতো প্রধান অপারেটিং সিস্টেমগুলিতে এন্ড-সাইড OS এজেন্টাইজেশনের বড় প্রবণতা একসাথে দেখা যাচ্ছে।
প্রদর্শনীতে শুধুমাত্র ফাংশনগুলি দেখানো হয়েছে, বাস্তবিক অপারেটিং সিস্টেম ফ্যাব্রিক্যান্টদের যা প্রতিযোগিতা করতে হবে, তা হল অপারেটিং সিস্টেম এজেন্টের নির্ভরযোগ্য চলন, বাস্তব সমস্যা সমাধানের জন্য তিনটি স্তরের ক্ষমতা: সিস্টেম-লেভেল AI Runtime, নিয়ন্ত্রণযোগ্য চিপ, এবং এন্ড-ক্লাউড মডেল ম্যাট্রিক্স।
দ্বিতীয়। প্রেস কনফারেন্সের নিচে: OS Agent-এর তিনটি ভিত্তি
সিস্টেম লেভেল এআই রানটাইম: এন্ড-সাইড ইন্টেলিজেন্সের স্কিডিউলিং সেন্টার
রানটাইম হল অপারেটিং সিস্টেমের মধ্যে রান করা এজেন্ট মডেলের ইনফারেন্স ইঞ্জিন এবং সিস্টেম সার্ভিস। এটি নিচে NPU এবং সিস্টেম রিসোর্স স্কিডিউলিংয়ের সাথে সরাসরি যুক্ত হয়; উপরে, এটি স্থিতিশীল API এর মাধ্যমে সমস্ত অ্যাপগুলিকে ইনফারেন্স ক্ষমতা প্রদান করে। এটি এজেন্ট মডেলকে “OS-স্তরের শেয়ার্ড ইনটেলিজেন্স” হিসাবে পরিণত করে: অ্যাপগুলির মধ্যে মডেল ওয়েটস শেয়ার করা, ক্যালকুলেশন এবং মেমোরি এককভাবে স্কিডিউল করা, Agent-এর জন্য টুল কল বহন করা, জেনারেশন, কনটেক্সট এবং পারমিশন ইন্টারফেসকে গাইড করা। এটি OS Agent-এর মধ্যে পার্থক্যটি নির্ধারণ করে—এটি কি শুধুমাত্র একটি অ্যাপ-ভিত্তিক চ্যাট বোতাম, নাকি OS-এর উপরে সিস্টেম-লেভেলেরঅপারেশনগুলি বাস্তবায়নকারী একটি বহুমুখী সার্ভিস?
অ্যান্ড্রয়েড প্ল্যাটফর্মের সবচেয়ে সম্পূর্ণ নমুনা হল Google AICore। 2023 সালের ডিসেম্বরে, AICore Android 14-এর সিস্টেম সার্ভিস হিসেবে চালু হয়; 2025 সালের আগস্টে, Gemini Nano ML Kit GenAI APIs-এর মাধ্যমে ডেভেলপারদের জন্য উন্মুক্ত হয়। সিস্টেম সার্ভিসের ভিত্তি থেকে অ্যাপ-অরিয়েন্টেড স্থিতিশীল API-এর দিকে, AICore প্রায় দুই বছর ধরে নিরন্তর উন্নতি করেছে।
অন্যান্য ওএস প্রস্তুতকারকরা একই পথ অনুসরণ করছে, শুধু গতি ভিন্ন। Apple WWDC25-এ Foundation Models ফ্রেমওয়ার্কটি ডেভেলপারদের জন্য খুলে দিয়েছে, যার মধ্যে ডিফল্টভাবে @Generable ডেকোরেটর, টুল কল, গাইডেড জেনারেশন এবং স্টেটফুল সেশন অন্তর্ভুক্ত রয়েছে, যার পিছনে 3B প্যারামিটারের এন্ড-সাইড ফাউন্ডেশন মডেল এবং প্রাইভেট ক্লাউড কম্পিউটিংয়ের মাধ্যমে ক্লাউড-ভিত্তিক সমর্থন রয়েছে। Microsoft Windows 11-এ Foundry on Windows এবং Phi Silica এন্ড-সাইড AI ফ্রেমওয়ার্কগুলি এমবেড করেছে, যার নিচে Windows ML রিজনিং ব্যাকএন্ড হিসাবে কাজ করে। Huawei HDC 2025-এ Agent Framework Kit (HarmonyOS Agent Framework, HMAF) প্রকাশ করেছে, যা ইনটেন্ট সিস্টেম এবং Agent কোঅপারেশন প্রোটোকলকে একসাথে খুলে দিয়েছে।

Android AICore সিস্টেম সার্ভিস হিসাবে, হার্ডওয়্যার অ্যাক্সেলারেটরে জেমিনি ন্যানোকে ইনফারেন্সের জন্য স্কেডিউল করে
উৎস: Android Developers
নিয়ন্ত্রিত চিপ: সফটওয়্যার ও হার্ডওয়্যারের সমন্বয়ের মূল বিন্দু
গুগল Android Show|I/O Edition-এ Gemini Intelligence-এর জন্য স্পষ্ট হার্ডওয়্যার প্রয়োজনীয়তা নির্ধারণ করেছে: সম্পূর্ণ ফিচার সেটটি শুধুমাত্র Pixel 10 সিরিজ এবং Galaxy S26 সিরিজের মতো কয়েকটি সর্বশেষ ফ্ল্যাগশিপে প্রথম প্রকাশিত হবে, গতবছরের মডেলগুলি এই তালিকায় অন্তর্ভুক্ত নয়। এটি একটি সহজ তথ্যকে নির্দেশ করে: AI মডেলগুলি এখনও দ্রুত বিকাশের মধ্যে রয়েছে, এবং সফটওয়্যার হার্ডওয়্যারের জন্য নতুন প্রয়োজনীয়তা তৈরি করছে। নিয়ন্ত্রণযোগ্য চিপ হল এই প্রয়োজনীয়তাগুলির জন্য ভিত্তি, এবং নিয়ন্ত্রণের মাত্রা OS-এর পক্ষে এন্ড-সাইড OS Agent-এর জন্য সফটওয়্যার-হার্ডওয়্যার অ্যাডাপটেশনের জায়গা নির্ধারণ করে।
অ্যাপল হল সফটওয়্যার এবং হার্ডওয়্যারের একীভূত পথের একটি উদাহরণ। iOS এবং macOS শুরু থেকেই A সিরিজ এবং M সিরিজ চিপগুলির সাথে একই প্রজন্মে উন্নতি লাভ করেছে, এবং Core ML সিপিইউ, জিপিইউ, ANE-এর স্কেডিউলিংকে ফ্রেমওয়ার্ক স্তরে একীভূত করেছে। এই পথটি LLM যুগেও বিস্তৃত হয়েছে। Apple Machine Learning Research একটি বাস্তব পরীক্ষা প্রদান করেছে: Llama 3.1 8B Instruct-কে M1 Max-এ Core ML-এর অপ্টিমাইজেশন পথে বাস্তবায়ন করলে, স্থানীয় ডিকোডিং গতি প্রায় 33টি টোকেন/সেকেন্ড হতে পারে। Apple Intelligence Foundation Language Models টেকনিক্যাল রিপোর্টটিও প্রকাশ করেছে যে, Apple তাদের নিজস্ব চিপগুলির জন্য KV cache-এর শেয়ারিং এবং 2-বিট কোয়ান্টাইজেশন-সচেতন ট্রেনিংয়ের মতো আর্কিটেকচার-লেভেলের অপ্টিমাইজেশন করেছে, যার ফলে প্রায় 3B-এর এন্ড-সাইড বেসিক মডেলটিকে Foundation Models ফ্রেমওয়ার্কের মাধ্যমে ডেভেলপারদের জন্য উন্মুক্ত করা সম্ভব হয়েছে। এই গভীরতা, শুধুমাত্র চিপটি নিজস্বভাবে নিয়ন্ত্রণের মাধ্যমেই সম্ভব—এটিই চিপ-নিয়ন্ত্রণের OS-ফ্যাব্রিক্যান্টদের জন্য মূল্য: এটি সফটওয়্যার-হার্ডওয়্যার সমন্বয়ের গভীরতা নির্ধারণ করে, এবং এন্ড-সাইড OS Agent-এর用户体验-এর上限কেও বৃদ্ধি করে।
এআই যুগে প্রবেশ করেছে গুগলও — পিক্সেল 6 থেকে শুরু করে নিজস্ব টেনসর SoC পথে এগিয়েছে, সর্বশেষ টেনসর G5-এ TPU পারফরম্যান্স সর্বোচ্চ 60% বৃদ্ধি পেয়েছে, CPU গড়ে 34% বৃদ্ধি পেয়েছে, এবং পিক্সেল 10-এ প্রথমবারের মতো সর্বশেষ জেমিনি ন্যানো চালানোর জন্য ডিজাইন করা SoC হিসেবে চালু হয়েছে। তবে, টেনসর G5-এরও কিছু দুর্বলতা আছে: Android Central-এর পরীক্ষায় দেখা গেছে যে এর মেমোরি কনফিগারেশন (RAM ক্ষমতা) এখনও AI পারফরম্যান্সের জন্য বাধা, Geekbench AI-এর স্কোর Snapdragon 8 Elite-এর চেয়ে কম; Macworld-এর Geekbench 6-এর পরীক্ষায়, G5-এর সিঙ্গল-কোর এবং মাল্টি-কোর স্কোর উভয়ই A18 Pro-এর চেয়ে কম। গুগল এখনও অনুসরণ করছে, তবে নিজস্ব টেনসর এবং এন্ড-সাইড Gemini-এর সমন্বিত পথটি এখন প্রতিষ্ঠিত।
হুয়াওয়ে কিরিন, ডাফেনচি এনপিই এবং প্যানগু এন্ড-সাইড মডেলের সংমিশ্রণ হল Apple এবং Google-এর সাথে সমান্তরালে নিয়ন্ত্রিত চিপের আরেকটি পথ। মিই এক্সুয়ানজিয়ে O1 চালু করেছে, যা নিয়ন্ত্রিত চিপের দিকে একটি নতুন পদক্ষেপ।
এন্ড-ক্লাউড মডেল ম্যাট্রিক্স: এজেন্টের বুদ্ধিমত্তার উৎস
এন্ড-ক্লাউড মডেল ম্যাট্রিক্স হল এন্ড-ডিভাইসের "বুদ্ধি"র উৎস: ক্লাউড মডেলগুলি জটিল কাজের ক্ষমতার সীমানা নির্ধারণ করে, এন্ড-সাইড মডেলগুলি দৈনন্দিন চলাচলের নিম্নতম সীমা সমর্থন করে—ল্যাটেন্সি, ব্যাটারি লাইফ, গোপনীয়তা, স্থিতিশীলতা সবই এন্ড-সাইডের উপর নির্ভর করে। দুটি পক্ষই অপরিহার্য, পার্থক্যটি OS-এর সাথে সংযোগের গভীরতায়। এন্ড-সাইড মডেলগুলিকে প্রতিটি এন্ড-ডিভাইসের OS-এ এমবেড করতে হবে, এবং স্থানীয় NPU-এর সাথে গভীরভাবে সংযুক্ত হতে হবে, OS-এর মধ্যে দ্বিগুণ পরিচয় বহন করতে হবে: নিচের দিকে, এটি Runtime-এর লোকাল ইনফারেন্স ব্যাকএন্ড; উপরের দিকে, এটি Runtime-এর ফ্রেমওয়ার্ক এবং SDK-এর মাধ্যমে সিস্টেম-লেভেল API হিসাবে App-এর জন্য উন্মুক্ত।
ক্লাউড এবং এন্ড-সাইড উভয়ের জন্যই নিজস্ব ডেভেলপমেন্টের অর্থ আছে, তবে এন্ড-সাইডের ফলাফল আরও পরিষ্কারভাবে প্রকাশ পায়। ক্লাউড মডেলগুলি বাইরে থেকে ক্রয় করেও ক্ষমতার সীমানা পূরণ করা যায়, কিন্তু নিজস্ব ডেভেলপমেন্টের সুবিধা মূলত রাউটিং নিয়ন্ত্রণ, ব্যবসায়িক শর্তাবলী এবং মডেল আপডেটের গতির মধ্যে প্রকাশ পায়। এন্ড-সাইডের ক্ষেত্রে এটি ভিন্ন। এন্ড-সাইড মডেলগুলি প্রতিটি ডিভাইসের OS এবং NPU-এর সাথে এমবেডড হয়, এবং নিজস্ব ডেভেলপমেন্টের ফলাফল সরাসরি পণ্যের পারফরম্যান্সে প্রকাশ পায়: KV cache-এর শেয়ারিং, কোনো একটি জেনারেশনের চিপের জন্য বিশেষভাবে ডিজাইনকৃত 2-বিট কোয়ান্টাইজেশন-অনুভূত ট্রেইনিং, Per-Layer Embedding (Gemma 3n-এর উৎস, স্তরভিত্তিকভাবে দ্রুত স্টোরেজ থেকে এমবেডিং প্যারামিটারগুলির ইনক্রিমেন্টাল লোডিং) —এগুলির সম্পাদনা সহজতর হয় যখন মডেল এবং হার্ডওয়্যারকে সমন্বিতভাবে ডিজাইন করা হয়; এছাড়াও, সহযোগিতা-এর গতি আরও ৩য়-পক্ষের হার্ডওয়্যার ফ্যাব্রিকেন্টদের উপর নির্ভরশীল হওয়ার প্রয়োজন নেই।
টেনসর G5-এর TPU ক্ষমতা আগের জেনারেশন G4-এর তুলনায় সর্বোচ্চ 60% বৃদ্ধি পেয়েছে, কিন্তু Gemini Nano-এর G5-এ এই উন্নতি এই সীমার বাইরেও যায়—Google-এর অফিসিয়াল ডেটা এবং Jon Peddie Research-এর তথ্য অনুযায়ী, স্থানীয় প্রসেসিং স্পিড আগের জেনারেশনের 2.6 গুণ, শক্তি খরচ আগের অর্ধেক, এবং token উইন্ডো 12,000 থেকে 32,000-এ বাড়িয়েছে (যা প্রায় শতাধিক স্ক্রিনশট একসাথে প্রসেস করার সমতুল্য)। এই উল্লেখযোগ্যভাবে অতিক্রমকৃত পারফরম্যান্সগুলি Gemini Nano v3-এর Matryoshka Transformer এলাস্টিক ইনফারেন্স আর্কিটেকচারের উপর ভিত্তি করে, যা Tensor G5 TPU-এর সাথে সমন্বিতভাবে অপ্টিমাইজড।

টেনসর G5-এ জেমিনি ন্যানোর পূর্বপুরুষের তুলনায় পারফরম্যান্সের বিপ্লব
উৎস: Google/Jon Peddie Research, ক্লাউড সোয়ার্ম AI চিত্রণ
এই স্তরে, প্রতিটি প্রধান ওএস প্রস্তুতকারকের নিজস্ব কার্ড রয়েছে: গুগলের জেমিনি ন্যানো, অ্যাপলের প্রায় 3B প্যারামিটারের এন্ড-সাইড বেস মডেল, মাইক্রোসফটের ফাই সিলিকা, হুয়াওয়ের প্যানগু এন্ড-সাইড মডেল। নিজস্ব উন্নয়ন হল এই স্তরের ডিফল্ট বিকল্প।
তিন। তিনটি স্তরের মধ্যে: সমন্বয় যত গভীর, পার্থক্যের স্থান তত বেশি
নিচ থেকে উপরের দিকে সংযুক্ত তিনটি ক্ষমতা চ্যাসিস: নিয়ন্ত্রণযোগ্য চিপ → এন্ড-সাইড/ক্লাউড মডেল → Runtime → Agent। নিয়ন্ত্রণযোগ্য চিপ এন্ড-সাইড মডেলের অনুমান দক্ষতা এবং শক্তি খরচ নির্ধারণ করে, এন্ড-সাইড মডেল Runtime-এর দ্বারা স্থানীয় বুদ্ধিমত্তা স্কেডিউল করার ক্ষমতা নির্ধারণ করে, এবং Runtime Agent-কে অ্যাপের মধ্যে সিস্টেম সার্ভিস হিসেবে চালানোর বিশ্বস্ততা নির্ধারণ করে। এই তিনটির সমন্বয় যতটা গভীর, OS ফ্যাক্টরির এন্ড-সাইড Agent-এর পণ্যের অভিজ্ঞতায় ততটাই বৈপরীত্য বাড়ে, এবং প্রতিরক্ষা প্রাচীরও ততটাই পুরু।
যত বেশি তিনটি স্তর একই সফটওয়্যার এবং হার্ডওয়্যার সেটের মধ্যে জড়িয়ে পড়ে, OS Agent-এর পণ্যের ক্ষমতা একটি একক স্তর দ্বারা অসম্ভব হওয়া পার্থক্যগুলি প্রকাশ পায়।
- প্রতিক্রিয়া বিলম্ব এবং শক্তি খরচ। জেমিনি ন্যানো টেনসর G5-এ 2.6 গুণ প্রসেসিং গতি এবং অর্ধেক শক্তি খরচ অর্জন করেছে, যা মডেল আর্কিটেকচার, চিপ ডিজাইন এবং Runtime স্কেডিউলিং-এর তিনটি স্তরের একই প্রজন্মের সফটওয়্যার-হার্ডওয়্যার ডিজাইনের মধ্যে পারস্পরিক সামঞ্জস্যের ফলে ঘটেছে।
- গোপনীয়তা এবং বিশ্বস্ততা। গোপনীয় ডেটা সংক্রান্ত সাধারণ কাজগুলি স্থানীয়ভাবে এন্ড-সাইড মডেল দ্বারা সম্পন্ন হয়, এবং জটিল অনুরোধগুলি কেবলমাত্র ক্লাউডে পাঠানো হয়—এটিই বর্তমানে OS Agent-এর ব্যবহারকারীর ডেটার প্রতি যুক্তিসঙ্গত ডিফল্ট অবস্থান। এই “এন্ড-সাইড প্রাধান্য, ক্লাউড-ভিত্তিক ব্যাকআপ” বাস্তবায়নের জন্য তিনটি সংযোগ নির্ভরশীল: NPU এবং এন্ড-সাইড মডেলের গভীর সামঞ্জস্যতা, যা দৈনিক উচ্চ ফ্রিকোয়েন্সির যুক্তিপূর্ণ কাজগুলির জন্য এখনও বিকাশাধীন এন্ড-সাইড মডেলগুলিকে দায়িত্ব দেয়; মডেল NPU-এর জন্য কোয়ান্টাইজেশন, কম্প্রেশন এবং KV cache-এর শেয়ারিং; Runtime-এর দ্বারা কাজের জটিলতা অনুযায়ী এন্ড-সাইড এবং ক্লাউডের মধ্যে রুটিং। এই তিনটির যেকোনো একটি অপর্যাপ্ত হলে, “এন্ড-সাইড প্রাধান্য” শুধুমাত্র মার্কেটিংয়ের কথা হয়েই থাকবে।
- সিস্টেম লেভেলের কনটেক্সট। ওএস ফ্যাব্রিক্যান্ট অ্যাপ এবং ওএস লেয়ারের মধ্যে ব্যবহারকারীর ডেটা (সেমান্টিক ইনডেক্স, স্ক্রিন পারসেপশন, দীর্ঘমেয়াদী মেমোরি) পুনরায় গঠন করে এজেন্টকে সিস্টেম-লেভেলের পারসোনাল কনটেক্সট প্রদান করে, যা এজেন্টকে বাস্তবিকভাবে “ব্যবহারকারীকে বুঝতে” সক্ষম করে, এবং এটিই ওএস এজেন্টকে একক অ্যাপ-লেভেলের এজেন্ট থেকে আলাদা করে। বাস্তবায়নের জন্য তিনটি স্তরের সংযোগ প্রয়োজন: Runtime অ্যাপ-পারিপার্শ্বিক ইনডেক্স এবং অনুমতি ধারণ করে, এন্ড-পয়েন্ট মডেলটি স্থায়ীভাবে বুঝতে এবং যুক্তি প্রয়োগ করে, NPU স্থানীয়ভাবে দক্ষ কম্পিউটিং পাওয়ার প্রদান করে। Apple-এর Core Spotlight এন্ড-টার্মিনালে সেমান্টিক ইনডেক্স তৈরি করে, App Intents-এর মাধ্যমে App-গুলি অপারেশন এবং ডেটা সিস্টেমের সাথে যুক্ত করে, Agent Personal Context-এর মাধ্যমে কনটেক্সট পাবে (Apple-এর ঘোষণা: এই ক্ষমতা ভবিষ্যতের সফটওয়্যার আপডেটের মাধ্যমে চালু হবে); Android-এ AppFunctions-এরও একই পথ।
- সিস্টেম সার্ভিসের বিশ্বস্ততার জন্য। OS এজেন্টকে সিস্টেম-লেভেল সার্ভিস হিসাবে কল করা হবে, এটি অন্তর্বর্তী ইন্টারনেট সংযোগ, কম ব্যাটারি, হিট ডাউন-ক্লকিং ইত্যাদি বাস্তব পরিস্থিতিতেও উপলব্ধ থাকতে হবে। এজেন্টটি ডিভাইসে স্থায়ীভাবে চলমান থাকে, যাতে নেটওয়ার্ক ছাড়াও এটি কাজ করতে পারে; অত্যন্ত সফটওয়্যার-হার্ডওয়্যার অপ্টিমাইজড NPU নিম্ন শক্তি ব্যবহারের সাথে ইনফারেন্স পরিচালনা করে; Runtime ডিভাইসের সংস্থান সীমিত হলে উপলব্ধতা অনুযায়ী স্কেডিউলিংয়ের জন্য ফলো-ব্যাক (হালকা মডেলের দিকে স্যুইচ করা, অথবা অনুরোধগুলি ক্লাউডের দিকে রাউট করা)। এই তিনটির যেকোনো একটি অনুপস্থিতি, OS Agent সিস্টেম সার্ভিসের আকারের জন্য পর্যাপ্ত হবে না, এবং এটি App-লেভেলের চ্যাট বোতামেই পরিণত হবে।
Apple Intelligence পূর্ণাঙ্গ সহযোগিতামূলক প্যারাডাইম উপস্থাপন করে: Apple Silicon, প্রায় 3B এন্ড-সাইড ফাউন্ডেশন মডেল, ফাউন্ডেশন মডেলস ফ্রেমওয়ার্ক নিচ থেকে উপরের দিকে সংযুক্ত, এন্ড-সাইডে সাধারণ স্কেনারিওগুলি প্রক্রিয়াকরণ করে, জটিল অনুরোধগুলি গোপনীয় ক্লাউড কম্পিউটিংয়ে স্থানান্তরিত হয়। Google অন্যরকম একটি আকৃতি। Tensor G5 হল প্রথম SoC যা Pixel 10-এ নতুনতম প্রজন্মের Gemini Nano পূর্ণাঙ্গভাবে চালায়, AICore দ্বারা এককভাবে সমন্বয়কৃত, যাতে Magic Cue, Pixel Screenshots ইত্যাদি সিস্টেম-লেভেল Agent ফিচারগুলি ক্লাউডের উপর নির্ভর না করেই ডিফল্টভাবে সক্ষম হয়। Huawei হল দেশীয়ভাবে তিনটি স্তরের সহযোগিতা গঠনের একটি উদাহরণ: Kirin, Da Vinci NPU, Pangu এন্ড-সাইড, HMAF—চারটি সম্পূর্ণরূপে স্ব-উন্নয়নকৃত, নিচ থেকে উপরের দিকে সংযুক্তির মাধ্যমে একটি পূর্ণাঙ্গ তিন-স্তরের চ্যাসিস গঠন করে।

এন্ড-সাইড ওএস এজেন্ট তিনটি চ্যাসিস ক্ল্যাম্প মেকানিজম
উৎস: ইয়ুনয়ং এআই
চতুর্থ। চেসিসের উপর: দীর্ঘমেয়াদী প্রতিরক্ষামূলক সুবিধার অন্যান্য কী পরিবর্তনশীল বিষয়
তিনটি স্তরের সমন্বয় হল প্রতিদ্বন্দ্বিতা বাধা গড়ে তোলার মূল কারণ। চেসিসের উপর অনেকগুলি পরিবর্তনশীল বিষয় OS Agent যুগের পণ্যের প্রতিযোগিতামূলক ক্ষমতাকে প্রভাবিত করে, যার মধ্যে রয়েছে Agent এবং App-এর ইন্টারঅ্যাকশন ক্ষমতা, গোপনীয়তা সুরক্ষা ইত্যাদি।
OS এজেন্ট এবং অ্যাপের মধ্যে ইন্টারঅ্যাকশন, OS ফ্যাব্রিক্যান্ট এবং অ্যাপ ফ্যাব্রিক্যান্টের মধ্যে প্রতিদ্বন্দ্বিতার সবচেয়ে সামনের স্থানে অবস্থিত। বর্তমানে দুটি পথ একসাথে চলছে। একটি হলো স্ক্রিন পড়া এবং অটোমেশন, যার মধ্যে রয়েছে Gemini Live স্ক্রিন শেয়ারিং, Apple Visual Intelligence, Circle to Search ইত্যাদি। OS এজেন্ট স্ক্রিন পড়ে এবং বাটনে ক্লিক করে অ্যাপে হস্তক্ষেপ করে, যা একক কাজের জন্য কাজ করে, কিন্তু প্রতিবার কলের জন্য সংগঠিত তথ্যের অভাব থাকে, এবং একাধিক ধাপের কাজগুলির স্থিতিশীল ওয়ার্কফ্লো গঠন করা কঠিন। অন্যটি হলো API-এর গভীর একীভূতকরণ, যার মধ্যে রয়েছে Google AppFunctions, Apple App Intents, Huawei Intents Kit ইত্যাদি। অ্যাপটি তার মূল কাজগুলিকে সংগঠিত ইন্টারফেসের মাধ্যমে সিস্টেমকে প্রকাশ করে, যাতে OS-এজেন্টটি স্থিতিশীলভাবে কল করতে পারে এবং একাধিক-ধাপেরওয়ার্কফ্লোও গঠন করতে পারে। API-এর পথটি কতটা বিস্তৃত হবে, তা OS-ফ্যাব্রিক্যান্টদের উপর নির্ভরশীল নয়, বরং অ্যাপ-ফ্যাব্রিক্যান্টদেরউপর।মূলকাজগুলিকেOS-এজেন্টকেদেওয়ামানেঅনুসন্ধানকারীদেরসম্ভবতঅবশ্যইঅ্যাপটিরসরাসরখোলবেনা,যা-ব্র্যান্ডএক্সপোজার,বিজ্ঞাপনস্থান,আচরণগতডেটা,এবংপেমেন্টএনট্রি-সহসমস্তকিছুOS-দ্বারাঅপহরণযোগ্যহতেপারে।এটিইশেষপর্যন্তইউজার-পক্ষীয়টারমিনালট্রাফিকবণটিরমূলপ্রতিদ্বন্দ্বিতা।
গোপনীয়তা সুরক্ষা হল এন্ড-সাইড সিস্টেমের মূল মূল্য এবং সীমানা। ওএস প্রস্তুতকারকরা এন্ড-সাইডে সবচেয়ে গভীর সিস্টেম-লেভেল অ্যাক্সেস এবং সবচেয়ে সংবেদনশীল ব্যবহারকারীর ডেটা নিয়ন্ত্রণ করে, গোপনীয়তা হল এটির মূল অবস্থান এবং পূর্ববর্তী দুটি বিষয়কে দীর্ঘমেয়াদে এগিয়ে নিয়ে যাওয়ার পূর্বশর্ত। Apple এন্ড-সাইড Secure Enclave স্বতন্ত্র সিকিউর চিপ এবং প্রাইভেট ক্লাউড কম্পিউটিং (PCC) নোডগুলির মধ্যে একই হার্ডওয়্যার-লেভেল সিকিউরিটি ডিজাইনটি শেয়ার করে, যা এন্ড-টু-এন্ড গোপনীয়তা সুরক্ষা ব্যবস্থা গড়ে তোলে। এই পণ্য কৌশলটি “Privacy. That’s Apple.”-কে Apple-এর বিশ্বব্যাপী হাই-এন্ড মার্কেটের কেন্দ্রীয় ব্র্যান্ড লেবেল হিসাবে গড়ে তোলে, ফলে ব্যবহারকারীদের বিশ্বাস অর্জন করে।

অ্যাপলের “গোপনীয়তা। এটি অ্যাপল।” লেবেল
উৎস: Apple অফিসিয়াল ওয়েবসাইট
তিনটি স্তরের সমন্বয় হল প্রতিরক্ষামূলক প্রাচীরের মূল কেন্দ্র, এবং এই দীর্ঘমেয়াদি পরিবর্তনশীল উপাদানগুলি এটিকে কতটা গভীর করা যায় তা প্রভাবিত করে।
পাঁচ। শুধুমাত্র OS পুনর্নির্মাণ করা নয়
ডিভাইস-সাইড OS এজেন্টাইজেশনের প্রবণতার অধীনে, সিস্টেম-লেভেল AI Runtime, নিয়ন্ত্রণযোগ্য চিপ, এবং ডিভাইস-ক্লাউড মডেল ম্যাট্রিক্স—এই তিনটি ভিত্তি যতটা শক্তিশালী হবে, OS ফ্যাব্রিক্যাটরদের পণ্যের নিম্নতম মান ততটাই বেশি হবে এবং পার্থক্য করার সুযোগও বেশি হবে। এই প্রবণতাকে ধরে রাখা OS ফ্যাব্রিক্যাটরদেরই ডিভাইস-সাইড এন্ট্রি ট্রাফিক বণ্টনের অধিকার পুনরায় নির্ধারণের সুযোগ এবং শক্তিশালী প্রতিযোগিতামূলক অবস্থান অর্জনের সুযোগ থাকবে।
এই প্রবণতা শুধু মোবাইল এবং পিসি পর্যন্ত সীমাবদ্ধ নয়। OS Agent-এর অধীনস্থ ক্ষমতা বিভিন্ন প্রতিষ্ঠান দ্বারা ইতিমধ্যে গড়ে তোলা মাল্টি-ডিভাইস ইকোসিস্টেমের মাধ্যমে আরও বেশি টার্মিনালে ছড়িয়ে পড়ছে, বিশেষ করে IoT-এ। নিয়ন্ত্রণযোগ্য চিপগুলি অটোমোবাইল SoC-এর মতো সিনারিওতে নেমে আসছে, Huawei ইতিমধ্যে কার-গ্রেড Kirin চিপস বিকাশ করেছে, Xiaomi-এর澎湃OS তাদের নিজস্ব গাড়িতে প্রবেশ করেছে; এন্ড-সাইড মডেলগুলি চশমা ইত্যাদি নতুন ফর্ম-ফ্যাক্টর হার্ডওয়্যারে হালকা করে স্থানান্তরিত হচ্ছে, Google এবং Samsung, Gentle Monster, Warby Parker-এর সাথে মিলে Android XR স্মার্ট গগলস বিকাশ করছে, যা 2026-এর শরৎকালে বাজারে আসবে; Runtime এবং Agent-এর সমন্বয়টি বিভিন্ন প্রতিষ্ঠান দ্বারা ইতিমধ্যে স্থাপিত “সুপার টার্মিনাল/ডিস্ট্রিবিউটেড” ফ্রেমওয়ার্কের মাধ্যমে ডিভাইসগুলির গোষ্ঠীতে প্রসারিত হচ্ছে, যেমন Huawei-এর 1+8+N এবং HarmonyOS ডিস্ট্রিবিউটেড সফটওয়্যার বাস, Xiaomi-এর “ম্যান, কার,হোম” ফুল-ইকোসিস্টেম এবং HyperConnect, Apple-এর Continuity, Google-এর Cross-device SDK এবংক্রস-ডিভাইস সার্ভিস। OS Agent-এর এই যুদ্ধটি শুধুমাত্র মোবাইল এবং PC-এর বিজয়-পরাজয়ের চেয়েও অনেক বেশি।
AICore দুই বছরেরও বেশি সময় ধরে পরিশোধিত হয়েছে; Apple-এর OS এবং Apple Silicon সিরিজ চিপগুলি দশকের পর দশক ধরে একসাথে কাজ করেছে; Tensor এর প্রতিটি সংস্করণ G5 পর্যন্ত উন্নত হয়েছে, যাতে Pixel 10 Gemini Nano v3-এর ভার বহন করতে পারে। এই যুদ্ধের বিজয়-পরাজয় কখনও প্রকাশনার এক-দুই ঘন্টার মধ্যে নির্ধারিত হয় না, বরং এটি প্রতিটি প্রজন্মের চিপ, মডেল এবং Runtime-এর মধ্যে পরিশোধিত হয়।
উৎস উল্লেখ:
- জেমিনি ইন্টেলিজেন্স অ্যান্ড্রয়েডে প্রোঅ্যাকটিভ এআই নিয়ে আসে|গুগল ব্লগ
- I/O 2026: এজেন্টিক জেমিনি যুগে আপনাকে স্বাগতম|Google ব্লগ
- ফাই সিলিকা, ছোট কিন্তু শক্তিশালী ডিভাইস-ভিত্তিক এসএলএম|উইন্ডোজ এক্সপেরিয়েন্স ব্লগ
- অ্যাপল সিরি আপগ্রেড অনির্দিষ্টকালের জন্য স্থগিত করেছে|ব্লুমবার্গ
- হারমোনি ওএস 6 ডেভেলপার বিটা চালু প্রেস বিজ্ঞপ্তি (HDC 2025) | হুয়াওয়ে
- সর্বশেষ Gemini Nano যা ডিভাইসে ML Kit GenAI API সহ|Android ডেভেলপার্স ব্লগ
- ফাউন্ডেশন মডেলস ফ্রেমওয়ার্ক ডকুমেন্টেশন|Apple Developer
- হারুন স্মার্ট ফ্রেমওয়ার্ক সাদাপুস্তিকা | হুয়াওয়ে ডেভেলপার
- ডিভাইসে Llama 3.1 Core ML-এর সাথে|Apple মেশিন লার্নিং গবেষণা
- অ্যাপল ইন্টেলিজেন্স ফাউন্ডেশন ল্যাঙ্গুয়েজ মডেলস টেক রিপোর্ট 2025|অ্যাপল মেশিন লার্নিং রিসার্চ
- Google Tensor G5: বেঞ্চমার্ক এবং আপনার যা জানা দরকার|Android Central
- গুগলের নতুন M5 SoC (Tensor G5 বিস্তারিত · Matryoshka Transformer) | Jon Peddie Research
- প্রাইভেট ক্লাউড কম্পিউট: ক্লাউডে এআই গোপনীয়তার জন্য একটি নতুন সীমান্ত|Apple Security Engineering
- অ্যাপফাংশনের পরিচিতি|অ্যান্ড্রয়েড ডেভেলপার্স
- অ্যাপ ইন্টেন্টস|Apple Developer
- ইনটেন্টস কিট পরিচিতি (HarmonyOS) | হুয়াওয়ে ডেভেলপার
- গুগল পিক্সেল ১০ প্রো-এর টেনসর G5 চিপটি অসাধারণ—যদি আপনি এটিকে আইফোন ১৪-এর সাথে তুলনা করেন|Macworld
- Gemma 3n মডেল পরিচিতি|Google AI for Developers
