Notícia da ME, 15 de abril (UTC+8), segundo monitoramento da Beating, a ferramenta de programação de IA Cursor revelou sua experiência de colaboração com a NVIDIA em seu sistema multiagente. O sistema operou autonomamente por três semanas em 27 GPUs Blackwell B200, otimizando 235 problemas reais de operadores extraídos de mais de 124 modelos de código aberto de produção, como DeepSeek, Qwen e Gemma, gerando e otimizando código de operadores GPU do zero, alcançando uma aceleração geométrica média geral de 38%. A otimização de operadores GPU é um dos campos mais desafiadores da engenharia de software, exigindo que engenheiros dominem arquitetura de chip, instruções em nível de assembly e gerenciamento de memória; um operador de alto desempenho geralmente requer meses ou até anos de refinamento por especialistas sênior. O sistema multiagente da Cursor processou todas as 235 tarefas simultaneamente: um agente de planejamento atribui tarefas e ajusta dinamicamente o agendamento com base em métricas de desempenho, enquanto múltiplos agentes de trabalho otimizam em paralelo; o sistema chama automaticamente o pipeline de benchmark SOL-ExecBench da NVIDIA para formar um ciclo automático de “testar, depurar, otimizar”, sem intervenção humana. O sistema executou duas rodadas, uma em CUDA C (incluindo PTX assembly embutido) e outra em CuTe DSL: a primeira testa a capacidade de inferência de hardware mais profunda, enquanto a segunda testa a capacidade de aprender novas APIs quase inexistentes nos dados de treinamento públicos. Das 235 tarefas, o sistema superou a linha de base em 149 (63%), sendo que 45 (19%) alcançaram aceleração superior a 2 vezes. Três resultados representativos: 1. Atenção com consulta agrupada BF16 (extraída do cenário de inferência Llama 3.1 8B): 84% mais rápida que a biblioteca FlashInfer otimizada manualmente, pontuação SOL de 0,9722, próxima ao limite teórico do hardware (máximo 1,0). 2. Multiplicação de matriz BF16: o operador gerado do zero atingiu 86% do desempenho manualmente ajustado da cuBLAS da NVIDIA e superou a linha de base em até 9% em cenários com pequeno M, comuns na decodificação de inferência LLM. 3. Operação linear de camada mista NVFP4 (extraída de modelos MoE como Qwen3): o sistema identificou autonomamente o gargalo da quantização ponto flutuante de 4 bits e realizou otimizações específicas de fusão, alcançando aceleração de 39%. A Cursor admitiu que a pontuação SOL mediana geral foi apenas 0,56, indicando grande espaço para melhoria, principalmente devido à limitação de recursos GPU (27 GPUs compartilhadas entre as 235 tarefas). A Cursor afirmou que essas tecnologias multiagente “serão rapidamente integradas ao produto principal”. Uma agente de IA de uma empresa de IDE já consegue aproximar-se do nível dos melhores especialistas humanos na otimização GPU em nível de assembly — uma história muito maior do que “ajudar a escrever código de aplicativos”. (Fonte: BlockBeats)
O Sistema Multi-Agente Cursor otimiza 235 operadores de GPU NVIDIA em três semanas, aproximando-se dos limites de hardware
KuCoinFlashCompartilhar






Notícias on-chain: Em 15 de abril (UTC+8), a ferramenta de programação de IA Cursor anunciou uma colaboração com a NVIDIA utilizando seu sistema multiagente. Ao longo de três semanas, o sistema otimizou 235 operadores de GPU do mundo real provenientes de 124 modelos de código aberto em 27 GPUs Blackwell B200, alcançando uma aceleração média geométrica de 38%. Notícias sobre ativos do mundo real (RWA): 149 operadores (63%) superaram os níveis de referência, com 45 (19%) apresentando aceleração superior a 2x. As principais melhorias incluíram operações de atenção agrupada BF16 84% mais rápidas e operações da camada NVFP4 MoE 39% mais rápidas. A Cursor destacou restrições de recursos de GPU e planeja integrar a tecnologia multiagente em seu produto principal.
Fonte:Mostrar original
Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações.
Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.