За даними Beating Monitoring, команда Qwen від Alibaba оголосила про автоматичне включення неявного кешування за замовчуванням для свого флагманського моделі Qwen3.7-Max на платформі Alibaba Cloud Bailian. Розробникам не потрібно змінювати код або вказувати додаткові параметри — вони можуть одразу скористатися кешуванням для зниження витрат. За новою системою оплати система автоматично виявляє та вилучає повторювані префікси контексту в запитах. При збігу кешу вартість вхідних токенів, що потрапили в кеш, становить лише 20% від звичайної ціни, що дозволяє економити до 80% витрат на вхідні дані. Неявне кешування спеціально спрямоване на зменшення величезних витрат у сценаріях з довгими текстами та агентами. Qwen3.7-Max з вікном контексту до 1 мільйона токенів під час виконання складних завдань, таких як автономне кодування, повинен часто та повторно читати великі кодові бази або документи з знаннями. Один із розробників, що протестував Qwen3.7, зазначив, що на створення веб-демо гри «Танковий бій» за менше ніж годину було витрачено майже 1 мільйон токенів. Якщо дозволити агенту автономно виконувати перевірку коду та циклічні ітерації на тлі, щоденне споживання легко може досягти сотень мільйонів токенів. Конкуренція у ціноутворенні на кешування з боку конкурентів стала ще одним прямим стимулом для зниження цін Alibaba. Раніше DeepSeek V4-Pro привернув велику кількість розробників завдяки надзвичайно низьким цінам на збіги кешу. Після оголошення про постійне зниження цін наприкінці травня, вартість збігів кешу DeepSeek V4-Pro була знижена до 0,003625 долара США за мільйон токенів (приблизно 0,025 юаня), що відповідає зменшенню витрат на 99,17% порівняно зі стандартною ціною вводу. Багато розробників, використовуючи спеціалізовані інструменти, такі як Reasonix, досягли максимальної частоти збігів кешу до 99%, що зробило рахунки за роботу довгих сесій агентів майже нульовими. У відповідь на конкуренцію Qwen3.7-Max не лише запустив неявне кешування без будь-якої конфігурації, але й зберег режим явного кешування, який вимагає ручного вказування позначки cache_control. У порівнянні з автоматичним кешуванням, явне кешування має вищу точність збігів, а вартість збігів становить лише 10% (один десятий) від стандартної ціни вводу. Однак при першому створенні кешу необхідно сплатити надбавку 125%, а тривалість життєвого циклу кеш-блоку становить лише 5 хвилин (кожен збіг перезапускає лічильник).
Aliyun запускає неявне кешування для Qwen3.7-Max, зменшуючи витрати на вхідні дані до 80%
MarsBitПоділитися






Aliyun вводить неявне кешування для Qwen3.7-Max, зменшуючи витрати на вхідні дані до 80%. Оновлення вже доступне на BaiLian, без необхідності змінювати код. Витрати на співпадіння кешу тепер становлять 20% від вхідних токенів, що ідеально підходить для довгих текстів та робочих процесів агентів. Нові токени можуть скористатися цим підвищенням ефективності. Модель також підтримує явне кешування з витратами 10%, але вимагає ручного налаштування. Новини про ціни на криптовалюти часто підкреслюють такі інновації, спрямовані на зниження витрат.
Джерело:Показати оригінал
Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації.
Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.