Beating मॉनिटरिंग के अनुसार, अलीबाबा Qwen टीम ने अपने प्रमुख मॉडल Qwen3.7-Max के लिए अलीबाबा क्लाउड बायलियान प्लेटफॉर्म पर ऑटोमैटिक इम्प्लिसिट कैशिंग को डिफ़ॉल्ट रूप से सक्षम करने की घोषणा की है। डेवलपर्स को कोड में कोई बदलाव नहीं करना होगा और न ही कोई अतिरिक्त पैरामीटर सेट करना होगा—वे सीधे कैशिंग के माध्यम से लागत कम कर सकते हैं। नए बिलिंग मॉडल के तहत, सिस्टम स्वचालित रूप से अनुरोध में दोहराए गए कॉन्टेक्स्ट प्रीफिक्स की पहचान करेगा और उन्हें निकाल देगा। जब कैश हिट होता है, तो हिट हुए इनपुट टोकन की लागत केवल मूल इकाई मूल्य का 20% होगी, जिससे इनपुट लागत का 80% सीधे समाप्त हो जाता है। इम्प्लिसिट कैशिंग सीधे लंबे टेक्स्ट और एजेंट स्मार्ट एजेंट स्थितियों में होने वाली विशाल लागत पर केंद्रित है। Qwen3.7-Max, जिसका 100 लाख टोकन का कॉन्टेक्स्ट विंडो है, स्वयं-कोडिंग जैसे उन्नत कार्यों के दौरान बड़े कोडबेस या ज्ञान-दस्तावेज़ों को बार-बार पढ़ने की आवश्यकता होती है। एक डेवलपर ने Qwen3.7 का परीक्षण करने के बाद प्रतिक्रिया दी कि केवल एक घंटे से कम समय में "टैंक वॉर" वेब डेमो बनाने में 100 लाख टोकन से अधिक का उपयोग हुआ। यदि स्मार्ट एजेंट को पीछे से कोड समीक्षा और साइकिल-इटरेशन के लिए स्वतंत्र रूप से संचालित किया जाए, तो एकल-दिन का प्रयोग आसानी से कई सौ मिलियन टोकन पर पहुँच सकता है। कैशिंग मूल्य पर प्रतिस्पर्धा, अलीबाबा के मूल्य में कमी का एक प्रत्यक्ष कारण है। पहले, DeepSeek V4-Pro, जिसने अत्यंत कम कैश हिट मूल्य के साथ कई डेवलपर्स को आकर्षित किया, 5 मई को स्थायी मूल्य में कमी की घोषणा करने के बाद, उसकी कैश हिट प्रति मिलियन टोकन 0.003625 USD (लगभग 0.025 CNY) पर सीमित हो गई, जो मानक इनपुट मूल्य पर 99.17% की मुआवज़ा मुक्ति है। कई डेवलपर्स Reasonix जैसे स्पेशलाइज़्ड टूल्स का प्रयोग करके, प्रति सत्र कैश हिट दर को 99%—अधिकतम सीमा—तक पहुँचा सकते हैं, जिससे लंबी सत्रों में स्मार्ट एजेंट का प्रयोग मुआवज़ा-शून्य हो सकता है। प्रतिस्पर्धीदबाव के संदर्भ में, Qwen3.7-Max ने सभी कॉन्फ़िगरेशन के बिना सक्रिय होने वाली इम्प्लिसिट कैशिंग प्रदान की है, साथ ही cache_control पहचानकर्ता को मैनुअली प्रकट करने पर आधारित स्पष्ट कैशिंग मोड को भी संजोया है। स्पष्ट कैशिंग, स्वचालित कैशिंग की तुलना में, हिट सुनिश्चितता में प्रभावशाली है, हिट प्रति-टोकन मूल्य मानक इनपुट मूल्य का 10% (एक-दशमांश) है, हालाँकि, पहली प्रति-कैश-ब्लॉक संभवन पर 125% प्रीमियम (अधिभार) प्रदान करना होता है, साथ ही, प्रति-कैश-ब्लॉक 5 मिनट (हर हिट पर पुनः-टाइमर) के समय-सीमा (लाइफ़साइकल) से सीमित है।
Aliyun ने Qwen3.7-Max के लिए इम्प्लिसिट कैशिंग लॉन्च की, जिससे इनपुट लागत में अधिकतम 80% की कमी हुई
MarsBitसाझा करें






Aliyun ने Qwen3.7-Max के लिए निहित कैशिंग पेश की है, जिससे इनपुट लागत में अधिकतम 80% की कमी हुई है। यह अपडेट BaiLian पर लाइव है, और कोई कोड बदलाव की आवश्यकता नहीं है। अब कैश हिट्स की लागत इनपुट टोकन का 20% है, जो लंबे पाठ और एजेंट वर्कफ्लो के लिए आदर्श है। नए टोकन सूचीबद्ध होने पर इस कुशलता में वृद्धि से लाभ हो सकता है। मॉडल 10% पर स्पष्ट कैशिंग का भी समर्थन करता है, लेकिन इसके लिए मैनुअल सेटअप की आवश्यकता होती है। क्रिप्टो मूल्य समाचार अक्सर ऐसी लागत-आधारित नवाचारों पर प्रकाश डालते हैं।
स्रोत:मूल दिखाएं
डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा।
डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।