Согласно новости ME, 15 апреля (UTC+8), по данным мониторинга Beating, инструмент AI-программирования Cursor раскрыл эксперимент по сотрудничеству со своей многопроцессной системой и NVIDIA. Эта система автономно работала в течение трех недель на 27 GPU Blackwell B200, решая 235 реальных задач оптимизации операторов, извлеченных из более чем 124 производственных открытых моделей, включая DeepSeek, Qwen и Gemma, — создавая и оптимизируя код GPU-операторов с нуля, в результате чего достигнуто геометрическое ускорение в среднем на 38%. Оптимизация GPU-операторов — одна из самых сложных областей в программной инженерии, требующая от инженеров глубокого понимания архитектуры чипов, инструкций на уровне ассемблера и управления памятью; высокопроизводительный оператор обычно требует месяцев или даже лет тонкой настройки опытными специалистами. Многопроцессная система Cursor обработала все 235 задач одновременно: один планирующий агент распределял задачи и динамически управлял расписанием на основе метрик производительности, несколько рабочих агентов оптимизировали параллельно, а система автоматически запускала тестовую конвейерную цепочку SOL-ExecBench от NVIDIA, формируя автоматический цикл «тестирование — отладка — оптимизация» без какого-либо вмешательства человека. Система выполнила два цикла: один на CUDA C (с встроенными PTX-ассемблерными инструкциями), чтобы протестировать базовые аппаратные возможности, и другой на CuTe DSL, чтобы проверить способность изучать новые API, практически не представленные в открытых обучающих данных. Из 235 задач система превзошла базовые показатели в 149 (63%), причем в 45 (19%) задачах ускорение превысило 2 раза. Три ключевых результата: 1. BF16 Grouped Query Attention (извлечено из сценария инференса Llama 3.1 8B): на 84% быстрее, чем оптимизированная вручную библиотека FlashInfer, результат SOL — 0,9722, почти достигнув теоретического предела аппаратных возможностей (максимум — 1,0). 2. BF16 матричное умножение: оператор, сгенерированный с нуля, достиг 86% производительности ручной оптимизации cuBLAS от NVIDIA и превзошел базовый показатель до 9% в сценариях с малым M, типичных для декодирования LLM. 3. Линейная операция NVFP4 Mixed Expert Layer (извлечена из моделей MoE, таких как Qwen3): система самостоятельно выявила узкое место квантования 4-битной плавающей запятой и провела целенаправленную оптимизацию путем слияния, обеспечив ускорение на 39%. Cursor признал, что медианный результат SOL составил всего 0,56, что означает значительный потенциал для дальнейшего улучшения — главным образом из-за ограниченного объема GPU-ресурсов (27 GPU делятся между 235 задачами). Cursor заявил, что эти многопроцессные технологии «будут вскоре интегрированы в основной продукт». То, что AI-агент от компании IDE уже способен приблизиться к уровню лучших человеческих экспертов в оптимизации GPU на уровне ассемблера — это гораздо более значимый прорыв, чем просто «помощь в написании кода приложений». (Источник: BlockBeats)
Многоагентная система Cursor оптимизировала 235 операторов NVIDIA GPU за три недели, приблизившись к пределам аппаратных возможностей
KuCoinFlashПоделиться






Новости на цепочке: 15 апреля (UTC+8) инструмент для программирования на основе ИИ Cursor объявил о сотрудничестве с NVIDIA с использованием своей многопагентной системы. За три недели система оптимизировала 235 реальных GPU-операторов из 124 открытых моделей на 27 GPU Blackwell B200, достигнув геометрического среднего ускорения на 38%. Новости о реальных активах (RWA): 149 операторов (63%) превзошли базовые показатели, причем 45 (19%) показали ускорение более чем в 2 раза. Ключевые улучшения включали ускорение группированного внимания BF16 на 84% и операций слоя NVFP4 MoE на 39%. Cursor отметил ограничения ресурсов GPU и планирует интегрировать многопагентную технологию в свою основную продукцию.
Источник:Показать оригинал
Отказ от ответственности: Информация на этой странице может быть получена от третьих лиц и не обязательно отражает взгляды или мнения KuCoin. Данный контент предоставляется исключительно в общих информационных целях, без каких-либо заверений или гарантий, а также не может быть истолкован как финансовый или инвестиционный совет. KuCoin не несет ответственности за ошибки или упущения, а также за любые результаты, полученные в результате использования этой информации.
Инвестиции в цифровые активы могут быть рискованными. Пожалуйста, тщательно оценивайте риски, связанные с продуктом, и свою устойчивость к риску, исходя из собственных финансовых обстоятельств. Для получения более подробной информации, пожалуйста, ознакомьтесь с нашими Условиями использования и Уведомлением о риске.