Запуск API DeepSeek V4 з моделями Flash і Pro, зниження цін та розширення контексту в 8 разів

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
API DeepSeek V4 запустило моделі V4-Pro та V4-Flash 24 квітня (UTC+8) з оновленими цінами та розширеним контекстом. V4-Flash замінює V3.2 зі зниженням вартості введення на 50% та виведення на 33%. Довжина контексту зросла з 128K до 1M токенів. V4-Pro, нова найвища модель, дорожча за V3.2 у 8 разів за ціною виведення. DeepSeek очікує зниження цін у другій половині року за допомогою нод Ascend 950. Рухи цін на криптовалюти та настрій ринку, як відображає індекс страху та жадібності, можуть впливати на прийняття цих нових моделей.

ME News: 24 квітня (UTC+8), за даними моніторингу Beating, API DeepSeek V4 синхронізовано з запуском V4-Pro та V4-Flash. Офіційний канал у соціальних мережах опублікував ціни та план розподілу обчислювальних ресурсів. V4-Flash повністю замінює V3.2 (deepseek-chat) — ціни не підняли, а навпаки, знизили: вхідні дані з попаданням у кеш залишилися на рівні 0,2 юаня за мільйон токенів, вхідні дані без попадання у кеш знизилися з 2 до 1 юаня (на 50%), а вихідні дані — з 3 до 2 юанів (на 33%). Контекст розширено з 128K до 1M, що означає отримання в 8 разів більшого контексту за ту саму ціну. Старі назви моделей deepseek-chat і deepseek-reasoner будуть виведені з експлуатації 24 липня 2026 року; зараз вони вказують на нерозмірковуючий та розмірковуючий режими V4-Flash відповідно. V4-Pro — це новий преміум-рівень: вхідні дані з попаданням у кеш — 1 юань, без попадання — 12 юанів, вихідні дані — 24 юані за мільйон токенів; ціна виходу в 8 разів вища, ніж у V3.2. DeepSeek зазначає у ціновому списку, що через обмеження преміум-обчислювальних ресурсів пропускна здатність сервісу Pro зараз дуже обмежена, і очікується, що після масового запуску супервузлів Ascend 950 у другій половині року ціна Pro значно знизиться. Обидві моделі підтримують нерозмірковуючий та розмірковуючий режими; розмірковуючий режим підтримує параметр reasoning_effort з двома рівнями інтенсивності: high та max. DeepSeek заявляє у своєму оголошенні: «З цього моменту 1M контексту стане стандартною функцією всіх офіційних сервісів DeepSeek». (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.