Aliyun запускає неявне кешування для Qwen3.7-Max, зменшуючи витрати на вхідні дані до 80%

icon MarsBit
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Aliyun вводить неявне кешування для Qwen3.7-Max, зменшуючи витрати на вхідні дані до 80%. Оновлення вже доступне на BaiLian, без необхідності змінювати код. Витрати на співпадіння кешу тепер становлять 20% від вхідних токенів, що ідеально підходить для довгих текстів та робочих процесів агентів. Нові токени можуть скористатися цим підвищенням ефективності. Модель також підтримує явне кешування з витратами 10%, але вимагає ручного налаштування. Новини про ціни на криптовалюти часто підкреслюють такі інновації, спрямовані на зниження витрат.

За даними Beating Monitoring, команда Qwen від Alibaba оголосила про автоматичне включення неявного кешування за замовчуванням для свого флагманського моделі Qwen3.7-Max на платформі Alibaba Cloud Bailian. Розробникам не потрібно змінювати код або вказувати додаткові параметри — вони можуть одразу скористатися кешуванням для зниження витрат. За новою системою оплати система автоматично виявляє та вилучає повторювані префікси контексту в запитах. При збігу кешу вартість вхідних токенів, що потрапили в кеш, становить лише 20% від звичайної ціни, що дозволяє економити до 80% витрат на вхідні дані. Неявне кешування спеціально спрямоване на зменшення величезних витрат у сценаріях з довгими текстами та агентами. Qwen3.7-Max з вікном контексту до 1 мільйона токенів під час виконання складних завдань, таких як автономне кодування, повинен часто та повторно читати великі кодові бази або документи з знаннями. Один із розробників, що протестував Qwen3.7, зазначив, що на створення веб-демо гри «Танковий бій» за менше ніж годину було витрачено майже 1 мільйон токенів. Якщо дозволити агенту автономно виконувати перевірку коду та циклічні ітерації на тлі, щоденне споживання легко може досягти сотень мільйонів токенів. Конкуренція у ціноутворенні на кешування з боку конкурентів стала ще одним прямим стимулом для зниження цін Alibaba. Раніше DeepSeek V4-Pro привернув велику кількість розробників завдяки надзвичайно низьким цінам на збіги кешу. Після оголошення про постійне зниження цін наприкінці травня, вартість збігів кешу DeepSeek V4-Pro була знижена до 0,003625 долара США за мільйон токенів (приблизно 0,025 юаня), що відповідає зменшенню витрат на 99,17% порівняно зі стандартною ціною вводу. Багато розробників, використовуючи спеціалізовані інструменти, такі як Reasonix, досягли максимальної частоти збігів кешу до 99%, що зробило рахунки за роботу довгих сесій агентів майже нульовими. У відповідь на конкуренцію Qwen3.7-Max не лише запустив неявне кешування без будь-якої конфігурації, але й зберег режим явного кешування, який вимагає ручного вказування позначки cache_control. У порівнянні з автоматичним кешуванням, явне кешування має вищу точність збігів, а вартість збігів становить лише 10% (один десятий) від стандартної ціни вводу. Однак при першому створенні кешу необхідно сплатити надбавку 125%, а тривалість життєвого циклу кеш-блоку становить лише 5 хвилин (кожен збіг перезапускає лічильник).

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.