Модель Qwen 3.6 27B Dense досягає 40 ток/с на RTX 3090

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Ончейн-новини від MetaEra показують, що модель Qwen 3.6 27B Dense досягла 40 токенів за секунду на одному GPU RTX 3090 24 ГБ. Користувач @sudoingX опублікував результати 24 квітня (UTC+8) за допомогою квантизації Q4_K_M в llama.cpp. Не застосовувалися жодні трюки чи злиті ядра. Також була розроблена власна бенчмаркова система на основі рою частинок. Криптовалютні новинні платформи уважно стежать за цими результатами.

Повідомлення AIMPACT, 24 квітня (UTC+8), 2026 року: користувач @sudoingX опублікував попередні результати тестування: модель Qwen 3.6 27B Dense пройшла 10/10 тестів зі швидкістю 40 tok/s на одній карті RTX 3090 24 ГБ. Цей результат отримано без використання квантування або фузійних ядер, лише за допомогою прямого квантування Q4_K_M з llama.cpp. Користувач також розробив бенчмарк на основі рою частинок для оцінки моделі. (Джерело: InFoQ)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.