পূর্বের OpenAI-এর প্রধান প্রযুক্তি অফিসার মিরা মুরাটি দ্বারা প্রতিষ্ঠিত Thinking Machines Lab একটি “ইন্টারেক্টিভ মডেল” নামক গবেষণার প্রাথমিক সংস্করণ প্রকাশ করেছে, যা বর্তমান ভয়েস AI-এর একটি প্রশ্নের উত্তর দেওয়ার কাজের পদ্ধতিকে পরিবর্তনের চেষ্টা করছে। কোম্পানিটি বলছে, এই ধরনের মডেলগুলি ব্যবহারকারীর ইনপুট গ্রহণের সাথে সাথে উত্তর তৈরি করতে পারে, যার ফলে কথোপকথনটি বার্তা পাল্টানোর পরিবর্তে ফোনের কথোপকথনের মতো হয়ে ওঠে।
প্রতিক্রিয়া পদ্ধতি সিঙ্ক্রোনাইজড করুন
বর্তমানে বেশিরভাগ এআই মডেলের ইন্টারঅ্যাকশন পদ্ধতি খুব নির্দিষ্ট: ব্যবহারকারী কথা শেষ করলে মডেল শুধুমাত্র তখনই প্রক্রিয়াকরণ শুরু করে এবং উত্তর দেয়। Thinking Machines চায় “শোনা” এবং “বলা” একই প্রক্রিয়ায় সম্পন্ন করা, যাতে মডেলটি কথোপকথন শেষ না হওয়া পর্যন্ত ধারাবাহিকভাবে প্রসঙ্গ বুঝতে পারে এবং প্রতিক্রিয়া প্রস্তুত করতে পারে।
কোম্পানিটি এই প্রযুক্তিকে "ফুল-ডুপ্লেক্স" হিসাবে বর্ণনা করে। তাদের মতে, প্রথম গবেষণা মডেল TML-Interaction-Small-এর প্রতিক্রিয়া সময় প্রায় 0.40 সেকেন্ড, যা প্রাকৃতিক মানব কথোপকথনের গতির কাছাকাছি এবং নিবন্ধে উল্লিখিত কিছু OpenAI এবং Google-এর সদৃশ মডেলের চেয়ে দ্রুত।
এখনও গবেষণা প্রিভিউ
তবে, এই ক্ষমতাটি এখনও জনসাধারণের জন্য প্রকাশ্যে উপলব্ধ একটি আনুষ্ঠানিক পণ্য নয়। Thinking Machines বলেছে যে বর্তমান পর্যায়ে এটি একটি গবেষণা প্রিভিউ সংস্করণ হিসাবে প্রকাশ করা হয়েছে, এবং এটি প্রকাশ্যে ব্যবহারের জন্য উপলব্ধ নয়।
কোম্পানির প্রকাশিত সময়সূচি অনুযায়ী, আগামী মাসগুলিতে সীমিত পরিসরে গবেষণা প্রিভিউ চালু হবে, এরপর এই বছরের শেষের দিকে এটি আরও ব্যাপকভাবে খোলা হওয়ার লক্ষ্যে।
বাস্তব অভিজ্ঞতা এখনও যাচাইয়ের প্রতীক্ষায়
প্রকাশিত তথ্য অনুযায়ী, এই দিকটির ফোকাস শুধু ল্যাটেন্সি কমানো নয়, বরং ইন্টারঅ্যাকশন ক্ষমতাকে মডেলের ভিতরেই একীভূত করা, যাতে মডেলের বাইরে ভয়েস প্রসেসিং প্রক্রিয়া যোগ করার প্রয়োজন না হয়। যদি এই ধারণা সফল হয়, তবে ভয়েস অ্যাসিস্ট্যান্ট, রিয়েল-টাইম কো-অপারেশন এবং ডায়ালগিক AI পণ্যগুলির ব্যবহারের পদ্ধতি পরিবর্তিত হতে পারে।
তবে, বর্তমান পর্যায়ে বাহ্যিক পক্ষ যা দেখতে পাচ্ছে তা মূলত কোম্পানির প্রদান করা প্রযুক্তিগত বর্ণনা এবং বেঞ্চমার্ক ফলাফল। যেহেতু পণ্যটি এখনও উন্মুক্ত নয়, তাই বাস্তব পরিস্থিতিতে স্থিতিশীলতা, বিচ্ছিন্নতা পরিচালনার কার্যকারিতা এবং সামগ্রিক কথোপকথনের অভিজ্ঞতা ব্যবহারকারীদের বাস্তব পরীক্ষার পরেই আরও ভালভাবে মূল্যায়ন করা যাবে।
