Beating İzleme'ye göre, Alibaba Qwen ekibi, Qwen3.7-Max ana modeli için Alibaba Cloud Bailian platformunda varsayılan olarak otomatik gizli önbelleği etkinleştirdi. Geliştiriciler, kodu değiştirmek veya ekstra parametre belirtmek zorunda kalmadan önbellek sayesinde maliyet azaltımından faydalanabilecek. Yeni faturalandırma mekanizmasına göre, sistem isteklerdeki tekrarlayan bağlam öneklerini otomatik olarak tanımlayacak ve çıkaracak. Önbellek vuruşu gerçekleştiğinde, vuruş kısmının giriş token maliyeti yalnızca orijinal birim fiyatın %20'si olarak hesaplanacak, bu da giriş maliyetinin %80'ini doğrudan ortadan kaldırıyor. Gizli önbellek, uzun metinler ve Agent akıllı ajan senaryolarındaki büyük maliyetleri hedef alıyor. 1 milyon token uzunluğunda bağlam penceresine sahip Qwen3.7-Max, otonom kodlama gibi ileri düzey görevleri çalıştırırken, büyük kod kütüphanelerini veya bilgi belgelerini sık sık ve tekrarlı şekilde okumak zorunda kalıyor. Bir geliştirici, Qwen3.7'yi test ettikten sonra, sadece bir saatten az bir sürede bir tank savaşları web demo'su oluşturmak için yaklaşık 1 milyon token tüketti. Eğer akıllı ajanlar arka planda kod incelemesi ve döngüsel yinelemeleri kendi başlarına yürütürse, günlük kullanım kolayca yüz milyonlarca tokena ulaşabilir. Rakiplerin önbellek fiyatlandırma alanında yaşanan rekabet, Alibaba'nın fiyatı düşürmesinin başka bir doğrudan nedeni. Daha önce, DeepSeek V4-Pro, çok düşük önbellek vuruş fiyatı sayesinde birçok geliştiriciyi çekmişti. Mayıs sonunda kalıcı fiyat indirimi ilan ettikten sonra, DeepSeek V4-Pro'nun önbellek vuruş ücreti, her milyon token başına yalnızca 0,003625 ABD dolarına (yaklaşık 0,025 Çin yuanı) düşürüldü; bu, standart giriş fiyatına kıyasla maliyetin %99,17'sini doğrudan ortadan kaldırıyor. Birçok geliştirici, Reasonix gibi özel araçlarla tek bir oturumda önbellek vuruş oranını %99'a kadar çıkarttı ve uzun oturumlu akıllı ajanların çalışma faturaları neredeyse sıfıra indi. Rekabet baskısı karşısında, Qwen3.7-Max sadece herhangi bir yapılandırma gerektirmeyen gizli önbelleği değil, aynı zamanda cache_control etiketini manuel olarak bildirmeyi gerektiren açık önbellek modunu da korudu. Otomatik önbelleğe kıyasla, açık önbelleğin vuruş kesinliği daha yüksek ve vuruş maliyeti standart giriş birim fiyatının %10'una (yüzde on) kadar düşebiliyor; ancak ilk önbellek oluşturulduğunda %125 ekstra ücret ödenmeli ve önbellek bloğunun yaşam süresi yalnızca 5 dakikadır (her vuruşta yeniden zamanlanır).
Aliyun, Qwen3.7-Max için örtük önbellekleme başlatıyor ve girdi maliyetlerini %80'e kadar azaltıyor
MarsBitPaylaş






Aliyun, Qwen3.7-Max için örtük önbellekleme özelliği tanıttı ve girdi maliyetlerini %80'e kadar azalttı. Güncelleme, herhangi bir kod değişikliği gerekmeden BaiLian'da hayata geçirildi. Önbellek vuruşları artık girdi tokenlarının %20'si maliyetinde. Uzun metin ve ajan iş akışları için idealdir. Yeni token listelemeleri bu verimlilik artışından faydalanabilir. Model, manuel ayar gerektiren %10'luk açık önbellekleme özelliğini de destekliyor. Kripto fiyat haberleri sıklıkla böyle maliyet odaklı yenilikleri vurgular.
Kaynak:Orijinalini göster
Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir.
Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.