Aliyun ने Qwen3.7-Max के लिए इम्प्लिसिट कैशिंग लॉन्च की, जिससे इनपुट लागत में अधिकतम 80% की कमी हुई

icon MarsBit
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
Aliyun ने Qwen3.7-Max के लिए निहित कैशिंग पेश की है, जिससे इनपुट लागत में अधिकतम 80% की कमी हुई है। यह अपडेट BaiLian पर लाइव है, और कोई कोड बदलाव की आवश्यकता नहीं है। अब कैश हिट्स की लागत इनपुट टोकन का 20% है, जो लंबे पाठ और एजेंट वर्कफ्लो के लिए आदर्श है। नए टोकन सूचीबद्ध होने पर इस कुशलता में वृद्धि से लाभ हो सकता है। मॉडल 10% पर स्पष्ट कैशिंग का भी समर्थन करता है, लेकिन इसके लिए मैनुअल सेटअप की आवश्यकता होती है। क्रिप्टो मूल्य समाचार अक्सर ऐसी लागत-आधारित नवाचारों पर प्रकाश डालते हैं।

Beating मॉनिटरिंग के अनुसार, अलीबाबा Qwen टीम ने अपने प्रमुख मॉडल Qwen3.7-Max के लिए अलीबाबा क्लाउड बायलियान प्लेटफॉर्म पर ऑटोमैटिक इम्प्लिसिट कैशिंग को डिफ़ॉल्ट रूप से सक्षम करने की घोषणा की है। डेवलपर्स को कोड में कोई बदलाव नहीं करना होगा और न ही कोई अतिरिक्त पैरामीटर सेट करना होगा—वे सीधे कैशिंग के माध्यम से लागत कम कर सकते हैं। नए बिलिंग मॉडल के तहत, सिस्टम स्वचालित रूप से अनुरोध में दोहराए गए कॉन्टेक्स्ट प्रीफिक्स की पहचान करेगा और उन्हें निकाल देगा। जब कैश हिट होता है, तो हिट हुए इनपुट टोकन की लागत केवल मूल इकाई मूल्य का 20% होगी, जिससे इनपुट लागत का 80% सीधे समाप्त हो जाता है। इम्प्लिसिट कैशिंग सीधे लंबे टेक्स्ट और एजेंट स्मार्ट एजेंट स्थितियों में होने वाली विशाल लागत पर केंद्रित है। Qwen3.7-Max, जिसका 100 लाख टोकन का कॉन्टेक्स्ट विंडो है, स्वयं-कोडिंग जैसे उन्नत कार्यों के दौरान बड़े कोडबेस या ज्ञान-दस्तावेज़ों को बार-बार पढ़ने की आवश्यकता होती है। एक डेवलपर ने Qwen3.7 का परीक्षण करने के बाद प्रतिक्रिया दी कि केवल एक घंटे से कम समय में "टैंक वॉर" वेब डेमो बनाने में 100 लाख टोकन से अधिक का उपयोग हुआ। यदि स्मार्ट एजेंट को पीछे से कोड समीक्षा और साइकिल-इटरेशन के लिए स्वतंत्र रूप से संचालित किया जाए, तो एकल-दिन का प्रयोग आसानी से कई सौ मिलियन टोकन पर पहुँच सकता है। कैशिंग मूल्य पर प्रतिस्पर्धा, अलीबाबा के मूल्य में कमी का एक प्रत्यक्ष कारण है। पहले, DeepSeek V4-Pro, जिसने अत्यंत कम कैश हिट मूल्य के साथ कई डेवलपर्स को आकर्षित किया, 5 मई को स्थायी मूल्य में कमी की घोषणा करने के बाद, उसकी कैश हिट प्रति मिलियन टोकन 0.003625 USD (लगभग 0.025 CNY) पर सीमित हो गई, जो मानक इनपुट मूल्य पर 99.17% की मुआवज़ा मुक्ति है। कई डेवलपर्स Reasonix जैसे स्पेशलाइज़्ड टूल्स का प्रयोग करके, प्रति सत्र कैश हिट दर को 99%—अधिकतम सीमा—तक पहुँचा सकते हैं, जिससे लंबी सत्रों में स्मार्ट एजेंट का प्रयोग मुआवज़ा-शून्य हो सकता है। प्रतिस्पर्धीदबाव के संदर्भ में, Qwen3.7-Max ने सभी कॉन्फ़िगरेशन के बिना सक्रिय होने वाली इम्प्लिसिट कैशिंग प्रदान की है, साथ ही cache_control पहचानकर्ता को मैनुअली प्रकट करने पर आधारित स्पष्ट कैशिंग मोड को भी संजोया है। स्पष्ट कैशिंग, स्वचालित कैशिंग की तुलना में, हिट सुनिश्चितता में प्रभावशाली है, हिट प्रति-टोकन मूल्य मानक इनपुट मूल्य का 10% (एक-दशमांश) है, हालाँकि, पहली प्रति-कैश-ब्लॉक संभवन पर 125% प्रीमियम (अधिभार) प्रदान करना होता है, साथ ही, प्रति-कैश-ब्लॉक 5 मिनट (हर हिट पर पुनः-टाइमर) के समय-सीमा (लाइफ़साइकल) से सीमित है।

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।