লেখক: স্লিপি, থিংকিং ওয়াইর্ড
2025 সালের ডিসেম্বরে, দীর্ঘদিন ধরে প্রচলিত “ডোবাও মোবাইল” চূড়ান্তভাবে চালু হয়। এটি ডোবাও মোবাইল অ্যাসিস্ট্যান্ট টেকনোলজি প্রিভিউ সংস্করণটি নুবিয়া M153 প্রোটোটাইপে স্থাপন করে 3,499 ইউয়ানে বিক্রি শুরু করে, এবং প্রথম ব্যাচের প্রায় 30,000টি ডিভাইস বিক্রির দিনই শেষ হয়ে যায়।
এটি প্রথম বিক্রির কয়েক দিনের মধ্যে সাগর বাজারে এর দাম কয়েকগুণ বেড়ে যায়। ডংচা বিটিং এডিটোরিয়াল দল দুটি কিনেছিল।

এটি কারণে নয় যে এটি একটি অত্যন্ত ব্যবহারযোগ্য ফোন, বরং ঠিক তার বিপরীতে, প্রথম প্রজন্মের ডোবাও ফোনটি একটি "টেকনিক্যাল প্রিভিউ" হিসাবে, অভিজ্ঞতা ভালো ছিল না। কিন্তু আমাদের বিশেষভাবে উত্তেজিত করে তোলে এটির প্রথমবারের মতো AI-কে চ্যাট বক্স থেকে বের করে আনা, একটি Chat bot-কে AI Agent-এ পরিণত করা, এবং একটি ফোনকে নিয়ন্ত্রণ করা।
ডোবাও মোবাইলে, এআই স্ক্রিন দেখতে পায়, আপনি যা ব্রাউজ করছেন তা বুঝতে পারে, আপনার কথা শুনতে পায়, বিভিন্ন অ্যাপের মধ্যে স্যুইচ করতে পারে, এবং টিকিট চেক করা, দাম তুলনা করা, কুপন পাওয়া এবং অর্ডার দেওয়া, ছবি সম্পাদনা করা—এইসব অনেকগুলি কাজ সরাসরি আপনার জন্য করতে পারে। যদিও, পেমেন্টের মতো সংবেদনশীল ধাপগুলির জন্য এখনও ব্যবহারকারীকে নিজেরা নিশ্চিত করতে হয়, তবুও, এটি এখন অতীতে আমাদের একটি একটি করে ক্লিক করেই সম্পন্ন করতে হতো—এইসব অনেকগুলি কাজকে স্বাধীনভাবেই সম্পন্ন করতে পারছে।
এটি এখনও কিছুটা অসুস্থ, কখনও কখনও ধীরে প্রতিক্রিয়া করে, কখনও কখনও আটকে যায়, যেন স্মার্টফোন ব্যবহার শিখছে, তবুও এটি আমাদের প্রথমবারের মতো অনুভব করিয়েছে যে AI দৈনন্দিন জীবনে কতটা সুবিধাজনক হতে পারে।
পরে লবঙ্গ জন্ম নেয় এবং বিশ্বব্যাপী জনপ্রিয় হয়ে ওঠে, AI Agent হল ChatGPT-এর প্রকাশের পরে AI ক্ষেত্রের আরেকটি iPhone মুহূর্ত, অসংখ্য প্রতিষ্ঠান ও উদ্যোক্তা OpenClaw-এর সাথে পূর্বনির্ধারিত কম্পিউটার এবং মোবাইল বিক্রি শুরু করে। ডোবাও মোবাইল তাদের অন্তত একটি ভার্সন এগিয়ে ছিল, এমনকি বলা যেতে পারে যে ডোবাও মোবাইল এই Agent-এর তরঙ্গের আগেদৌড়ানো ছিল।
কিন্তু দুঃখের বিষয় হলো ডোবাওয়া মোবাইল শীঘ্রই বড় কোম্পানিগুলির প্রতিরোধের সম্মুখীন হয়। উইচ্যাট, তাওবাও, আলিপে, ব্যাংকের অ্যাপসহ বিভিন্ন স্কেনারিওতে অ্যাক্সেস বা অপারেশনের সমস্যা দেখা দেয়। কেউ কেউ এটিকে 'ব্লক' বলছেন, আবার কেউ কেউ বলছেন শুধুমাত্র রিস্ক কন্ট্রোল ট্রিগার হয়েছে, কিন্তু ব্যবহারকারীদের জন্য এটির কোনও পার্থক্য নেই—এটি ব্যবহারযোগ্য নয়।

আমরা খুব দুঃখিত। ডোবাও মোবাইল এখনও একটি পরিপক্ক বিনোদনমূলক ইলেকট্রনিক পণ্য নয়, কিন্তু এটি পুরো শিল্পকে পরবর্তী প্রজন্মের প্রবেশদ্বারের একটি রূপ দেখিয়েছে।
সুতরাং যদিও ডোবাও মোবাইলের সেই তরঙ্গ শেষ হয়ে গেছে, তবুও আমরা এই বিষয়টি সম্পূর্ণভাবে ত্যাগ করিনি। সাম্প্রতিক সময়ে, আমাদের দৈনিক তথ্য সংগ্রহ হাজার হাজার চাকরির বিজ্ঞপ্তি ধরেছে, যা বিশ্লেষণ করে দেখা গেছে যে, ByteDance মনে হচ্ছে মোবাইল গবেষণা-উন্নয়ন পুনরায় শুরু করতে চলেছে।
তিনটি ক্যালিবার, একটি সূত্র
আমরা বাই트ダンスের অফিসিয়াল চাকরির পৃষ্ঠা থেকে তিনটি ক্ষেত্র সংগ্রহ করেছি: এআই ইনোভেশন বিজনেস, মোবাইল ওএস এবং ডোবাও মোবাইল অ্যাসিস্ট্যান্ট।
পদ আইডি অনুসারে ডুপ্লিকেট সরিয়ে ফেলার পর, আমরা বিস্তারিত পৃষ্ঠার তথ্য আবৃত্তি করি এবং পদের নাম, পদের বর্ণনা এবং যোগ্যতার কীওয়ার্ডগুলির উপর ভিত্তি করে ক্রস-ট্রান্সপোজ করি।

সাধারণ AI অ্যাপ দলের ভর্তির সাথে তুলনা করলে, বাইটডান্সের এই সোশ্যাল রিক্রুটমেন্ট পদগুলিতে মোবাইল সিস্টেম, ক্যামেরা, টাচ, নেটওয়ার্কিং, ব্যাটারি লাইফ, তাপ, চিপসেট অ্যাডাপ্টেশন, স্ট্রাকচার ডিজাইন, ফুল ডিভাইস প্রসেসিং, প্রোডাকশন লাইন টেস্টিং ইত্যাদি পদও অন্তর্ভুক্ত রয়েছে।
এই শব্দগুলি ইন্টারনেট কোম্পানিগুলিতে প্রায় দেখা যায় না, এগুলি মোবাইল ফোন প্রস্তুতকারকদের, সরবরাহ শৃঙ্খল কোম্পানিগুলির এবং ইঞ্জিনিয়ারিং টিমগুলির দিনপ্রতি সম্মুখীন হওয়া জিনিস।
বাইটডান্স ফ্যাক্টরিতে চাকরির জন্য মানুষ নিচ্ছে।
তবে এটি নিশ্চিত করে না যে বাইটডান্স নিজস্ব মোবাইল ব্র্যান্ড তৈরি করবে, তবে অন্তত এটি নিশ্চিত যে তারা মোবাইল-লেভেল টার্মিনালের গবেষণা ও উন্নয়ন পুনরায় শুরু করছে।
এখন আসুন দেখি এই পদগুলি নিজেদের কী বলছে।
ডোবাও মোবাইল অ্যাসিস্ট্যান্ট: প্রশ্নের উত্তর দেওয়া থেকে মানুষের জন্য কাজ করা পর্যন্ত
প্রথমে ডোবাও মোবাইল অ্যাসিস্ট্যান্টটি দেখুন।
আমরা আরও ফোকাসড ফিল্টারিং করেছি এবং মূল ডেটার মধ্যে নাম, বর্ণনা এবং প্রয়োজনীয়তায় «ডোবাও মোবাইল অ্যাসিস্ট্যান্ট» শব্দটি পাওয়া গেছে, যা মোট ৮৩টি চাকরির সাথে সম্পর্কিত। এই ৮৩টি চাকরি তিনটি প্রধান শ্রেণিতে বিভক্ত করা যায়, যা একটি সিস্টেম-লেভেল AI এজেন্টের আকৃতি গঠন করে।

প্রথম শ্রেণীর পদ, যা AI-কে এজেন্ট হিসাবে ক্ষমতা প্রদানের দায়িত্ব বহন করে।
যেমন "Agent ডেভেলপমেন্ট ইঞ্জিনিয়ার - ডোবাও মোবাইল হেল্পার" পদটির জন্য লেখা হয়েছে, যেখানে AI-কে টাস্ক ডিকমপোজিশন, কনটেক্সট অর্গানাইজেশন, টুল কল, মেমোরি রিট্রিভাল, স্টেট ম্যানেজমেন্ট, রিজাল্ট ভেরিফিকেশন এবং এক্সেপশন রিকভারি করতে হবে। এটি আমরা বর্তমানে ব্যবহার করা সমস্ত AI Agent-এর মৌলিক ক্ষমতা।
দ্বিতীয় ধরনের পদ, যা AI Agent-এর ভালো মনে রাখার ক্ষমতা নিশ্চিত করে।
এই পদগুলিতে পরিপ্রেক্ষিত এবং স্মৃতি, ব্যবহারকারীর স্মৃতি, ব্যক্তিগত জ্ঞান গ্রাফ এবং দীর্ঘমেয়াদী পছন্দের দিকগুলি অন্তর্ভুক্ত রয়েছে। যদি AI এজেন্টকে আমাদের জীবনে সত্যিকারের মতো একীভূত করতে চাই, তাহলে এটিকে প্রতিদিন আমাদের সম্পর্কে প্রথমবারের মতো চিনতে হবে না, এটির একটি নির্ভরযোগ্য, স্থিতিশীল দীর্ঘমেয়াদী স্মৃতি থাকা প্রয়োজন।
এটি অবশ্যই গোপনীয়তা এবং সীমানা নিয়ে সংঘর্ষের সম্ভাবনা রাখে, তবে নিয়োগের তথ্য অনুযায়ী, বাইটডান্স কমপক্ষে «মেমোরি»-কে ডোবাও মোবাইল অ্যাসিস্ট্যান্টের সবচেয়ে গুরুত্বপূর্ণ ক্ষমতাগুলির মধ্যে একটি হিসাবে গড়ে তুলতে শুরু করেছে।
তৃতীয় শ্রেণীর চাকরি, যা এআই এজেন্টকে মোবাইলে সেই ক্ষমতাগুলি প্রকাশ করতে সহায়তা করে।
ডোবাও মোবাইল অ্যাসিস্ট্যান্ট যদি ব্যবহারকারীর জন্য মোবাইল অপারেশন করে, তবে এটিকে শুধুমাত্র ক্লাউডে বাস করতে হবে না, আরও বেশি কিছু শুধুমাত্র একটি অ্যাপও হতে পারে না। এটির মডেল, মেমোরি, টাস্ক এক্সিকিউশন, এন্ড-সাইড ডিপ্লয়মেন্ট, সিস্টেম অ্যাপ, অডিও-ভিডিও, কমিউনিকেশন, টেস্টিং এবং কোয়ালিটি অ্যাসুরেন্সের মতো একটি সম্পূর্ণ ক্ষমতা সেট প্রয়োজন, যাতে এটি ব্যবহারকারীর কথা বুঝতে পারে, পরিবেশকে বুঝতে পারে, ডিভাইসগুলির মধ্যে সহযোগিতা করতে পারে, সবসময় প্রস্তুত থাকতে পারে এবং কোনও বিশৃঙ্খলা ছাড়াই কাজ করতে পারে।
মোবাইল ওএস: ফোনের বেসমেন্টই এজেন্টের চ্যালেঞ্জ
মোবাইল ওএস দেখুন।
মোবাইল ওএস-সংক্রান্ত পদে ২৩৬টি রিক্তি রয়েছে, যার প্রধান কার্যালয় বেইজিং, শাংহাই এবং শেনজেনে কেন্দ্রীভূত। পদের বর্ণনায় পুনরাবৃত্তি হওয়া শব্দগুলি হলো কার্নেল, চিপ, ড্রাইভার, ক্যামেরা, ডিসপ্লে, অডিও, নেটওয়ার্ক, শক্তি খরচ, তাপ ব্যবস্থাপনা এবং বড় পরিমাণে উৎপাদন এবং ডেলিভারি। এগুলি প্রায়শই হার্ডওয়্যার এবং মোবাইলের নিম্নস্তরের সিস্টেমের সাথে সম্পর্কিত।

উদাহরণস্বরূপ, «কোর লিডার-মোবাইল ওএস» পদটির দায়িত্বে বলা হয়েছে যে মেমোরি এবং স্টোরেজ টিমকে নিয়ে নতুন কোয়ালকম প্ল্যাটফর্মের জন্য কোর অ্যাডাপ্টেশন এবং ডেভেলপমেন্ট করতে হবে, যাতে সিস্টেমটি প্রধান মোবাইল চিপসের সাথে সামঞ্জস্যপূর্ণভাবে কাজ করতে পারে এবং মোবাইলের মেমোরি এবং স্টোরেজ ভালভাবে ম্যানেজ করা যায়। এই দক্ষতাগুলি একটি AI এজেন্টের জন্য বাস্তবসময়ে প্রতিক্রিয়া দেওয়া এবং ব্যাকগ্রাউন্ডে টাস্ক প্রসেস করার জন্য অপরিহার্য।
আবার, পদটিতে SoC, BSP, RTOS শব্দগুলি ও দেখা যায়। SoC কে আপনি মোবাইলের কোর চিপ হিসাবে ধরতে পারেন, BSP হল একটি নিম্নস্তরের সফটওয়্যার যা সিস্টেম এবং হার্ডওয়্যারকে পরস্পরের সাথে চিনতে এবং সমন্বয় করতে সাহায্য করে, আর RTOS প্রায়শই প্রতিক্রিয়া এবং শক্তি খরচের জন্য অত্যন্ত উচ্চ প্রয়োজনীয়তা সহ পরিস্থিতিতে ব্যবহৃত হয়।
সুতরাং মোবাইল ওএস পদের মাধ্যমে প্রেরিত সংকেত হলো যে, বাইটডান্স সেই ব্যক্তিদের নিয়োগ করছে যারা মোবাইল-লেভেল টার্মিনাল সিস্টেম বুঝে, তাদের কমপক্ষে জানা দরকার যে AI Agent মোবাইলে চলার পর কোথায় পারমিশন সমস্যা, কোথায় পাওয়ার খরচের সমস্যা, কোথায় সিস্টেমের স্থিতিশীলতার সমস্যা দেখা দেবে, এবং কোন সমস্যাগুলো চিপ, ফ্যাব্রিকেটর এবং টেস্টিং টিমের সাথে মিলে সমাধান করা দরকার।
এই চাকরির যোগ্যতাগুলির ভিত্তিতে, বাইটডান্স ইতিমধ্যেই মোবাইলের গভীর অংশে প্রবেশ করেছে।
শেনজেনের অবস্থান: হার্ডওয়্যার এবং বড় পরিমাণে উৎপাদনের সংকেত
অন্যদিকে, শেনজেনে অবস্থিত পদগুলি আলাদাভাবে পর্যালোচনা করা প্রয়োজন।
যদি বেইজিংয়ের পদগুলি মডেল, অ্যালগরিদম এবং প্ল্যাটফর্মের দিকে বেশি মনোযোগ দেয়, শাংহাইয়ের পদগুলি পণ্য এবং ইঞ্জিনিয়ারিংয়ের দিকে বেশি মনোযোগ দেয়, তবে শেনজেনের পদগুলি প্রায়শই হার্ডওয়্যার, সাপ্লাই চেইন, টেস্টিং এবং বড় পরিমাণে উৎপাদনের সাথে সম্পর্কিত।

যদি কোনো প্রকল্প শুধুমাত্র ক্লাউড সার্ভিস হয়, তাহলে শেনজেন এতটা গুরুত্বপূর্ণ নয়; যদি এটি বাস্তব পণ্যের সাথে সংশ্লিষ্ট হয়, তাহলে শেনজেন খুবই গুরুত্বপূর্ণ হয়ে ওঠে।
আমরা শেনজেনের সংশ্লিষ্ট চাকরির বিষয়ে এই জিনিসগুলি দেখেছি।
কিছু পদের বর্ণনায় মানব-কম্পিউটার ইন্টারঅ্যাকশন ডিজাইন উল্লেখ করা হয়েছে, যা হার্ডওয়্যার পদার্থগত ইন্টারঅ্যাকশন, সফটওয়্যার ইন্টারফেস ইন্টারঅ্যাকশন এবং একাধিক ডিভাইসের সমন্বিত অভিজ্ঞতা কভার করে। এই পদগুলি শুধুমাত্র স্ক্রিনের ভিতরের ইন্টারফেসগুলি কীভাবে ডিজাইন করা হবে তা বিবেচনা করে না, বরং পদার্থগত ডিভাইসের হস্তগত অনুভূতি, বোতাম, কীভাবে সক্রিয় করা হবে এবং অন্যান্য ডিভাইসগুলির সাথে কীভাবে সমন্বয় করা হবে তা বিবেচনা করে।
অন্যান্য কিছু পদ প্রকৌশল সাইটের কাছাকাছি, যেমন ইন্টারকানেকশন, পাওয়ার কনজুমপশন, শর্ট-রেঞ্জ কমিউনিকেশন, বেসব্যান্ড, ফুল মেশিন প্রসেস, স্ট্রাকচার এবং টেস্টিং প্রসেস।
এই শব্দগুলি «স্মার্ট এজেন্ট», «মাল্টিমোডাল», «ওয়ার্ল্ড মডেল»-এর তুলনায় এতটা সুন্দর নয়। কিন্তু কনজুমার ইলেকট্রনিক্সের জন্য শেষ পর্যন্ত এই জিনিসগুলিই জীবন ও মৃত্যু নির্ধারণ করে।
যদি বাইটডান্স শুধুমাত্র ডোবাওকে একটি ভালো মোবাইল অ্যাপে পরিণত করতে চায়, তাহলে এতগুলো কঠিন কাজ করার দরকার হতো না। যখন সে এই পদগুলোর জন্য চাকরির ঘোষণা শুরু করে, তখন এটি ইতিমধ্যেই এই জাহাজে উঠে যাওয়ার প্রস্তুতি নিয়েছে।
বাইটডান্স শুধু অ্যাপ হতে পারে না
আগে, মোবাইল ফোন ছিল অ্যাপের কন্টেইনার; এআই যুগে, মোবাইল ফোন হতে পারে এজেন্টের শরীর।
যদি মোবাইল শুধু অ্যাপের কন্টেইনার হয়, তাহলে বাইটডান্সের মতো কোম্পানিগুলি কন্টেন্ট, অ্যালগরিদম এবং পণ্যের শক্তির মাধ্যমে একের পর এক অ্যাপ দিয়ে নিজেদের রাজ্য গড়ে তুলতে পারে। কিন্তু যদি মোবাইল এজেন্টের শরীরে পরিণত হয়, তাহলে ব্যবহারকারীরা প্রথমে টাস্ক দেয়, যে টাস্কটি গ্রহণ করে, সেইটিই পরবর্তী পথ নির্ধারণের সুযোগ পায়।
এই পথে, অ্যাপটিকে একটি কলযোগ্য টুল হিসাবে ডাউনগ্রেড করা হবে। এটি সমস্ত সুপার অ্যাপকে অস্বস্তিজনক করে তুলবে। কারণ এজেন্ট স্বাভাবিকভাবেই মধ্যবর্তী স্তরকে অতিক্রম করে।
সুতরাং, প্রকৃত চ্যালেঞ্জটি হয়তো ডোবাও কোনো অ্যাপ খুলতে পারে কিনা তা নয়, বরং অন্যরা তাকে খুলতে দিতে চায় কিনা তা। এবং একটি ব্যবহারকারীর জন্য সিদ্ধান্ত নেওয়ার ক্ষমতা রাখা AI-এর সহজেই অনুমতি দেওয়া যাবে না, যেমনটি সাধারণ অ্যাপের ক্ষেত্রে হয়।

এজেন্টকে চ্যাট বক্স থেকে অপারেশন লেয়ারে যেতে হলে, অতীতে এআই টিমের দায়িত্ব না হওয়া অসংখ্য কঠিন ও অসুবিধাজনক কাজ প্রক্রিয়াকরণ করতে হবে। তাদের জানতে হবে সিস্টেম কখন ব্যাকগ্রাউন্ড বন্ধ করবে, অপারেশন কখন রিস্ক কন্ট্রোল ট্রিগার করবে, মোবাইল কেন গরম হয়, এবং ফ্যাক্টরির উৎপাদন হার কেন বাড়ছে না। অতীতে এইসব কাজ এআই টিমের দায়িত্ব ছিল না, কিন্তু এখন এগুলোকে এড়ানো যাচ্ছে না।
সুতরাং বাই트ダンスকে এই পদগুলি নিয়োগ করতে হবে। এটি অবশ্যই একটি স্মার্টফোন চালু করবে এমন নয়, কিন্তু বাইটড্যান্সকে অবশ্যই আর অন্যদের ফোনের মধ্যে অ্যাপ হিসেবেই সীমাবদ্ধ থাকতে হবে না।
বড় মডেল কোম্পানিগুলি পরবর্তী প্রজন্মের ব্যবহারকারী এন্ট্রি হতে চায়, তাই তাদের সবসময় অন্যের অপারেটিং সিস্টেমের ভিতরে বাস করতে হবে না।
