أعلنت Thinking Machines Lab، التي أسسها ميرا موراتي، الرئيسة السابقة للتقنية في OpenAI، عن معاينة بحثية تُسمى "النماذج التفاعلية" تهدف إلى تغيير طريقة عمل الذكاء الاصطناعي الصوتي الحالية القائمة على السؤال والجواب. وتقول الشركة إن هذه النماذج يمكنها توليد ردود أثناء تلقي مدخلات المستخدم، مما يجعل المحادثة أقرب إلى مكالمة هاتفية بدلاً من إرسال الرسائل بالتناوب.
غير طريقة الاستجابة إلى التنفيذ المتزامن
طريقة التفاعل مع معظم النماذج الحالية للذكاء الاصطناعي تكون ثابتة إلى حد كبير: ينتهي المستخدم من الكلام، ثم يبدأ النموذج في المعالجة والإجابة. ترغب Thinking Machines في دمج "الاستماع" و"التحدث" في عملية واحدة، بحيث يمكن للنموذج فهم السياق والاستعداد للرد أثناء استمرار المحادثة.
تُوصف الشركة هذه التقنية بأنها "ثنائي الاتجاه الكامل". وفقًا لها، فإن وقت استجابة النموذج الأولي TML-Interaction-Small هو حوالي 0.40 ثانية، وهو ما يقارب سرعة المحادثة البشرية الطبيعية، وأسرع من بعض نماذج OpenAI وGoogle المماثلة المذكورة في النص.
لا يزال قيد المراجعة البحثية
ومع ذلك، هذه الميزة ليست منتجًا رسميًا مفتوحًا للجمهور حاليًا. أفادت Thinking Machines أن الإصدار الحالي هو نسخة تجريبية بحثية، ولا يُتاح استخدامه للجمهور حاليًا.
وفقًا لجدول الإفصاح الخاص بالشركة، سيتم إطلاق نسخة تجريبية محدودة للبحث في الأشهر القادمة، تليها محاولة توسيع نطاق الوصول في وقت لاحق من هذا العام.
التجربة العملية لا تزال بحاجة إلى التحقق
من المعلومات المُعلنة، فإن تركيز هذا الاتجاه لا يقتصر فقط على تقليل التأخير، بل يشمل دمج القدرة التفاعلية مباشرة داخل النموذج نفسه، وليس إضافة عمليات معالجة الصوت خارج النموذج. إذا تحقق هذا المفهوم، فقد تتغير طريقة استخدام مساعدين صوتيين، والتعاون في الوقت الفعلي، ومنتجات الذكاء الاصطناعي الحوارية.
ومع ذلك، فإن ما يمكن للجمهور رؤيته في هذه المرحلة لا يزال يركز بشكل أساسي على الوصف التقني والنتائج المرجعية التي قدمتها الشركة. نظرًا لأن المنتج لم يُفتح بعد، فإن الاستقرار في السيناريوهات الواقعية، وفعالية التعامل مع المقاطعات، وتجربة المحادثة العامة، تحتاج إلى تقييم أعمق بعد اختبار المستخدمين الفعلي.
