थिंकिंग मशीन्स लैब रियल-टाइम इंटरैक्टिव एआई मॉडल प्रीव्यू का अनावरण करती है

CoinDesk द्वारा रिपोर्ट किया गया:

पूर्व OpenAI के मुख्य प्रौद्योगिकी अधिकारी Mira Murati द्वारा स्थापित Thinking Machines Lab ने "इंटरैक्टिव मॉडल" नामक एक अनुसंधान प्रीव्यू जारी किया है, जो वर्तमान वॉइस AI के एक-एक करके प्रश्न-उत्तर के कार्यप्रणाली को बदलने का प्रयास कर रहा है। कंपनी का कहना है कि इस प्रकार के मॉडल उपयोगकर्ता के इनपुट को स्वीकार करते समय प्रतिक्रिया उत्पन्न कर सकते हैं, जिससे संवाद बारी-बारी से संदेश भेजने के बजाय फोन कॉल के समान हो जाता है।

प्रतिक्रिया विधि को समानांतर बनाएं

वर्तमान में अधिकांश AI मॉडल का इंटरैक्शन बहुत निश्चित होता है: उपयोगकर्ता बात पूरी करता है, फिर मॉडल प्रोसेस करना शुरू करता है और जवाब देता है। Thinking Machines "सुनना" और "बोलना" को एक ही प्रक्रिया में पूरा करना चाहता है, ताकि मॉडल बातचीत समाप्त होने से पहले ही संदर्भ को लगातार समझ सके और प्रतिक्रिया तैयार कर सके।

कंपनी इस तकनीक को "फुल-डुप्लेक्स" के रूप में वर्णित करती है। उनके अनुसार, पहला अनुसंधान मॉडल TML-Interaction-Small का प्रतिक्रिया समय लगभग 0.40 सेकंड है, जो प्राकृतिक मानव संवाद की गति के करीब है और लेख में उल्लिखित कुछ OpenAI और Google समान मॉडल्स से तेज़ है।

अभी भी अध्ययन पूर्वावलोकन है

हालांकि, यह क्षमता अभी तक सार्वजनिक के लिए एक प्रामाणिक उत्पाद नहीं है। Thinking Machines ने बताया कि वर्तमान चरण में शोध पूर्वावलोकन संस्करण जारी किया गया है, जिसे सार्वजनिक उपयोग के लिए उपलब्ध नहीं किया गया है।

कंपनी के उद्घोषित समयसूची के अनुसार, अगले कुछ महीनों में सीमित श्रेणी के अध्ययन पूर्वावलोकन को लॉन्च किया जाएगा, और फिर इसे इस वर्ष के अंत तक विस्तारित करने का प्रयास किया जाएगा।

वास्तविक अनुभव अभी तक सत्यापित नहीं हुआ है

प्रकाशित जानकारी के अनुसार, इस दिशा का फोकस केवल लेटेंसी कम करना ही नहीं है, बल्कि इंटरैक्टिविटी क्षमता को सीधे मॉडल में एकीकृत करना है, न कि मॉडल के बाहर वॉइस प्रोसेसिंग प्रक्रिया जोड़ना। यदि यह दृष्टिकोण सफल होता है, तो वॉइस असिस्टेंट, रियल-टाइम सहयोग और डायलॉग-आधारित AI उत्पादों के उपयोग के तरीके में परिवर्तन हो सकता है।

हालांकि, वर्तमान चरण में बाहरी दुनिया केवल कंपनी द्वारा प्रदान की गई तकनीकी विवरण और बेंचमार्क परिणाम ही देख सकती है। चूंकि उत्पाद अभी उपलब्ध नहीं है, इसलिए वास्तविक परिदृश्य में स्थिरता, ब्रेक की स्थिति का प्रबंधन और समग्र संवाद अनुभव का मूल्यांकन उपयोगकर्ताओं द्वारा वास्तविक परीक्षण के बाद ही किया जा सकता है।