टेथर एआई टर्बोक्वांट को ओपन-सोर्स करता है, LLM KV कैश मेमोरी उपयोग को 5 गुना कम करता है

iconCryptoBriefing
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
टेथर AI ने टर्बोक्वांट को ओपन-सोर्स कर दिया है, जो LLM KV कैश मेमोरी के उपयोग को 5 गुना कम करता है। यह तकनीक ट्रांसफॉर्मर मॉडल में एक प्रमुख बॉटलनेक को लक्षित करती है और 24 मार्च, 2026 के गूगल शोध पर आधारित है। टेथर ने इसे पूर्ण क्वांटाइजेशन समर्थन के साथ उत्पादन-तैयार समाधान में अनुकूलित किया है। यह रिलीज QVAC SDK 0.12.0 का हिस्सा है, जिसमें टेक्स्ट-टू-वीडियो और रोबोट नियंत्रण शामिल है। टेथर के सीईओ पाओलो आर्डोइनो ने कहा कि यह टूल उपभोक्ता उपकरणों पर स्थानीय रूप से उच्च गुणवत्ता वाले LLMs चलाने में मदद करता है। ओपन-सोर्स कदम QVAC परितंत्र को बढ़ावा देने और टेथर को एक डिसेंट्रलाइज्ड AI प्लेटफॉर्म के रूप में स्थापित करने का लक्ष्य रखता है। यह AI + क्रिप्टो समाचार और ऑन-चेन समाचार में एक प्रमुख अपडेट है।

टेथर एआई ने टर्बोक्वांट को ओपन-सोर्स सॉफ्टवेयर के रूप में जारी किया है, जो बड़े भाषा मॉडल निष्पादन की मेमोरी फुटप्रिंट को अधिकतम पांच गुना तक संपीड़ित करता है। यह प्रौद्योगिकी कीवी (KV) कैश नामक एक विशिष्ट बॉटलनेक पर केंद्रित है, जो मूलतः ट्रांसफॉर्मर मॉडल द्वारा संवाद के दौरान संदर्भ को ट्रैक रखने के लिए उपयोग की जाने वाली कार्यस्मृति है।

टर्बोक्वांट वास्तव में क्या करता है

टर्बोक्वांट के पीछे का एल्गोरिथ्म गूगल रिसर्च से उत्पन्न हुआ, जिसने 24 मार्च, 2026 को प्रारंभिक विवरण प्रकाशित किए। टेथर एआई ने इस शोध पत्र को लेकर इसे ऐसा कुछ बनाया है जिसे डेवलपर्स वास्तविक उत्पादन में स्थापित कर सकते हैं। टेथर के रिलीज में एक पूर्ण क्वांटाइजेशन पाइपलाइन, फ्रेमवर्क एडेप्टर्स और व्यापक दस्तावेज़ीकरण शामिल है।

क्वांटाइजेशन एक तकनीक है जो न्यूरल नेटवर्क की गणनाओं में उपयोग किए जाने वाली संख्याओं की सटीकता को कम करती है। मानों को 16-बिट या 32-बिट फ्लोटिंग पॉइंट संख्याओं के रूप में संग्रहीत करने के बजाय, आप उन्हें 4-बिट या यहां तक कि 2-बिट प्रतिनिधित्व में संपीड़ित कर देते हैं। टर्बोक्वांट इसे विशेष रूप से KV कैश के लिए संभालता है।

किसी भी मॉडल के पुनः प्रशिक्षण या सूक्ष्म समायोजन की आवश्यकता नहीं है। विकासक बिना शून्य से शुरू किए अपने मौजूदा मॉडल और मौजूदा निष्कर्ष ढांचों में टर्बोक्वांट लागू कर सकते हैं।

विज्ञापन

यह रिलीज QVAC SDK संस्करण 0.12.0 के हिस्से के रूप में आई, जिसमें टेक्स्ट-टू-वीडियो जनरेशन और रोबोट नियंत्रण जैसी नई क्षमताएँ भी शामिल हैं। QVAC Tether का व्यापक प्लेटफॉर्म है जो उपभोक्ता हार्डवेयर पर डिसेंट्रलाइज्ड AI को समर्थन करने के लिए बनाया गया है।

एक स्टेबलकॉइन कंपनी एआई इंफ्रास्ट्रक्चर क्यों बना रही है

टेथर ने अपने USDT स्टेबलकॉइन के बाहर आगे बढ़ने के लिए एग्रेसिव रूप से विस्तार किया है, और AI इसकी सबसे बड़ी बेटिंग में से एक है। सीईओ पाओलो आर्डोइनो ने कंपनी के AI प्रयासों को एक विशिष्ट थीसिस के चारों ओर स्थित किया है: कि उच्च गुणवत्ता वाले भाषा मॉडल्स उपभोक्ता उपकरणों जैसे फोन और लैपटॉप पर स्थानीय रूप से चलने चाहिए, बजाय केंद्रीकृत क्लाउड सेवाओं पर निर्भर होने के।

स्मृति समस्या उस दृष्टि के लिए मूल बाधा है। एक मॉडल जिसे अपने KV कैश के लिए अकेले 16 GB स्मृति की आवश्यकता है, वह अधिकांश उपभोक्ता उपकरणों पर फिट नहीं होगा। इसे 3.2 GB तक कम करें और अचानक गणित काम करने लगता है।

अर्दोइनो ने जोर देकर कहा है कि टर्बोक्वांट, ट्रांसफॉर्मर मॉडल्स के उपभोक्ता हार्डवेयर पर सामना किए जा रहे मेमोरी सीमाओं को हल करके कुशल स्थानीय AI को वास्तविकता के करीब लाता है।

QVAC प्लेटफॉर्म कई पिछली क्वांटाइजेशन तकनीकों, जिनमें PolarQuant और Quantized Johnson-Lindenstrauss शामिल हैं, पर आधारित है। Tether की AI टीम ने कई संपीड़न विधियों को एक साथ जोड़ा है, जिनमें से प्रत्येक दक्षता समस्या के अलग-अलग हिस्सों को लक्षित करती है, और TurboQuant उस स्टैक में सबसे हालिया परत है।

इसका निवेशकों के लिए क्या अर्थ है

रिलीज की ओपन-सोर्स प्रकृति के कारण कोई भी डेवलपर कोड प्राप्त कर सकता है, इसे अपने इन्फरेंस पाइपलाइन में एकीकृत कर सकता है, और तुरंत मेमोरी बचत का लाभ उठा सकता है। यह QVAC के चारों ओर परितंत्र को बढ़ाने और Tether के प्लेटफॉर्म को डिसेंट्रलाइज्ड AI एप्लिकेशन के लिए डिफ़ॉल्ट टूलकिट के रूप में पोज़ीशन करने की एक रणनीतिक गतिविधि है।

गूगल रिसर्च ने आधारभूत एल्गोरिथम प्रकाशित किया। गूगल खुद या कोई भी अच्छी तरह से संसाधित प्रयोगशाला अपना उत्पादन कार्यान्वयन जारी करने से कुछ नहीं रोकता। एक ही SDK अपडेट में टेक्स्ट-टू-वीडियो और रोबोट नियंत्रण सुविधाओं के शामिल होने से लगता है कि टीम तेजी से अपडेट कर रही है।

देखें कि स्वतंत्र बेंचमार्क यह पुष्टि करते हैं कि 5x संपीड़न दावा विभिन्न मॉडल आर्किटेक्चर और संदर्भ लंबाइयों के लिए भी लागू होता है, क्योंकि क्वांटाइजेशन तकनीकें कभी-कभी लंबी बातचीत या अधिक जटिल तर्क कार्यों के साथ वास्तविक उपयोग में कमजोर पड़ जाती हैं।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।