Система Cursor Multi-Agent оптимізувала 235 операторів NVIDIA GPU за три тижні, наближаючись до меж апаратних можливостей

iconKuCoinFlash
Поділитися
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconКороткий зміст

expand icon
Ончейн-новини: 15 квітня (UTC+8) інструмент AI-програмування Cursor оголосив про співпрацю з NVIDIA за допомогою своєї багатоагентної системи. Протягом трьох тижнів система оптимізувала 235 реальних GPU-операторів з 124 відкритих моделей на 27 GPU Blackwell B200, досягнувши геометричного середнього прискорення на 38%. Новини про реальні активи (RWA): 149 операторів (63%) перевищили базові показники, з яких 45 (19%) продемонстрували прискорення більше ніж у 2 рази. Ключові покращення включали на 84% швидшу групову увагу BF16 та на 39% швидші операції шару NVFP4 MoE. Cursor зазначив обмеження ресурсів GPU та плани інтегрувати цю багатоагентну технологію в свої основний продукт.

ME News: 15 квітня (UTC+8), за даними моніторингу Beating, інструмент AI-програмування Cursor розкрив експеримент зі співпрацею з NVIDIA. Ця багатоагентна система протягом трьох тижнів автономно працювала на 27 GPU Blackwell B200, вирішуючи 235 реальних завдань оптимізації операторів, витягнутих з понад 124 продакшн-рівневих відкритих моделей, таких як DeepSeek, Qwen, Gemma. Система написала та оптимізувала код GPU-операторів з нуля, досягнувши загального геометричного прискорення на 38%. Оптимізація GPU-операторів — це одна з найскладніших галузей програмної інженерії, що вимагає від інженерів глибокого розуміння архітектури чіпів, інструкцій на рівні асемблера та планування пам’яті; для створення високопродуктивного оператора часто потрібно місяці або навіть роки досвідчених експертів. Багатоагентна система Cursor обробила всі 235 завдань одночасно: планувальний агент розподіляв завдання та динамічно планував їх за показниками продуктивності, кілька робочих агентів оптимізували паралельно, а система самостійно використовувала базовий тестовий конвеєр NVIDIA SOL-ExecBench для створення автоматичного циклу «тестування — налагодження — оптимізація» без будь-якої людської участі. Система запустила два цикли: один на CUDA C (з інлайн-PTX-асемблером), щоб перевірити найнижчий рівень апаратного висновку, і інший на CuTe DSL, щоб перевірити здатність вивчати нові API, яких майже немає у відкритих навчальних даних. У 149 із 235 завдань (63%) система перевершила базовий результат, зокрема у 45 завданнях (19%) прискорення перевищило 2 рази. Три характерні результати: 1. BF16 групова увага (вилучена з сценарію інференсу Llama 3.1 8B): швидше за ручно оптимізований бібліотечний код FlashInfer на 84%, результат SOL — 0,9722, майже досягаючи теоретичної межі апаратних можливостей (максимум 1,0). 2. BF16 множення матриць: оператор, згенерований з нуля, досяг 86% продуктивності ручно оптимізованого cuBLAS від NVIDIA і перевершив базовий результат на до 9% у сценаріях малих M, типових для декодування LLM. 3. Лінійна операція NVFP4 у шарах мішаних експертів (вилучена з моделей Qwen3 тощо MoE): система самостійно виявила обмеження квантування з 4-бітною плаваючою комою та застосувала цільову фузію, досягнувши прискорення на 39%. Cursor визнає, що медіана SOL-результату становить лише 0,56, і є значний потенціал для покращення — головна причина — обмежена кількість GPU (27 GPU на всі 235 завдань). Cursor заявляє, що ці багатоагентні технології «дуже скоро будуть інтегровано в основний продукт». Те, що AI-агент IDE-компанії вже може наблизитися до рівня найкращих людських експертів у оптимізації GPU на рівні асемблера — це набагато більше, ніж історія про «допомогу у написанні коду додатків». (Джерело: BlockBeats)

Відмова від відповідальності: Інформація на цій сторінці може бути отримана від третіх осіб і не обов'язково відображає погляди або думки KuCoin. Цей контент надається лише для загального інформування, без будь-яких запевнень або гарантій, а також не може розглядатися як фінансова або інвестиційна порада. KuCoin не несе відповідальності за будь-які помилки або упущення, а також за будь-які результати, отримані в результаті використання цієї інформації. Інвестиції в цифрові активи можуть бути ризикованими. Будь ласка, ретельно оцініть ризики продукту та свою толерантність до ризику, виходячи з ваших власних фінансових обставин. Для отримання додаткової інформації, будь ласка, зверніться до наших Умов використання та Розкриття інформації про ризики.