Cursor Çoklu Ajan Sistemi, üç haftada 235 NVIDIA GPU operatörünü optimize ediyor ve donanım sınırlarına yaklaşıyor

iconKuCoinFlash
Paylaş
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconÖzet

expand icon
Blockchain üzerindeki haber: 15 Nisan'da (UTC+8), AI programlama aracı Cursor, çok ajanlı sistemiyle NVIDIA arasında bir iş birliği duyurdu. Üç hafta boyunca sistem, 27 Blackwell B200 GPU'da 124 açık kaynak modelinden 235 gerçek dünya GPU operatörünü optimize etti ve %38'lik geometrik ortalama hızlanma sağladı. Gerçek dünya varlıkları (RWA) haberleri: 149 operatör (%63), temel değerleri aştı; 45 operatör (%19), 2 katın üzerinde hızlanma gösterdi. Ana iyileştirmeler arasında BF16 gruplanmış sorgu dikkati %84 daha hızlı ve NVFP4 MoE katmanı operasyonları %39 daha hızlı oldu. Cursor, GPU kaynak kısıtlamalarına dikkat çekti ve çok ajanlı teknolojiyi temel ürününün içine entegre etmeyi planlıyor.

ME Haberleri'ne göre, 15 Nisan (UTC+8) tarihinde Beating tarafından izlendiğine göre, AI programlama aracı Cursor, çok akıllı sistemini NVIDIA ile yapılan bir deneyi açıkladı. Sistem, 27 adet Blackwell B200 GPU üzerinde üç hafta boyunca bağımsız olarak çalıştı ve DeepSeek, Qwen, Gemma gibi 124'ten fazla üretim seviyesindeki açık kaynak modelinden alınan 235 gerçek işlem optimizasyon sorusuna sıfırdan GPU işlem kodu yazdı ve optimize etti; toplamda %38'lik geometrik ortalama hızlanma sağladı. GPU işlem optimizasyonu, yazılım mühendisliğindeki en yüksek engellere sahip alanlardan biridir ve mühendislerin çip mimarisi, derleme seviyesindeki komutlar ve bellek planlamasında uzman olmalarını gerektirir; yüksek performanslı bir işlem genellikle deneyimli uzmanlarca aylar hatta yıllar süren çaba gerektirir. Cursor'un çok akıllı sistemi, tüm 235 soruyu aynı anda işledi: bir planlama akıllı sistemi görevleri atadı ve performans metriklerine göre dinamik olarak zamanlamayı yaptı; birçok çalışma akıllı sistemi paralel olarak optimizasyon yaptı; sistem, NVIDIA'nın SOL-ExecBench performans testi hattını kendi kendine çağırdı ve "test, hata ayıklama, optimizasyon" otomatik döngüsünü oluşturdu; tamamen insan müdahalesi olmadan. Sistem, CUDA C (inline PTX derleme kodu içeren) ve CuTe DSL olmak üzere iki farklı dilde her biri için bir tur çalıştı; ilki en alt seviye donanım çıkarım yeteneğini test etti, diğeri ise açık eğitim verilerinde neredeyse hiç bulunmayan yeni API'leri öğrenme yeteneğini test etti. 235 sorudan sistem, 149'u (%63) üzerinde temel performansı aştı; bunların 45'inde (%19) iki katın üzerinde hızlanma sağladı. Üç temsili sonuç: 1. BF16 gruplu sorgu dikkat (Llama 3.1 8B çıkarım senaryosundan alınmış): insan tarafından optimize edilmiş FlashInfer kütüphanesinden %84 daha hızlı, SOL puanı 0.9722, donanım teorik sınırına (maksimum 1.0) çok yakın. 2. BF16 matris çarpımı: sıfırdan üretilen işlem, NVIDIA'nın cuBLAS el ile optimize edilmiş performansının %86'sına ulaştı; LLM çıkarım çözme işlemlerinde sıkça kullanılan küçük M senaryolarında temel performansı en fazla %9 oranında geride bıraktı. 3. NVFP4 karışık uzman katman doğrusal işlemi (Qwen3 gibi MoE modellerinden alınmış): sistem, 4-bit kayan nokta kuantizasyonunun darboğazını kendi kendine tanımladı ve hedefe yönelik birleştirme optimizasyonu yaptı; %39 hızlanma sağladı. Cursor, toplam medyan SOL puanının sadece 0.56 olduğunu kabul etti ve bu değer büyük ölçüde artırılabilir; ana neden GPU kaynaklarının sınırlı olmasıdır (235 soru 27 GPU paylaşımı). Cursor, bu çok akıllı teknolojilerin "çok yakında temel ürüne entegre edileceğini" belirtti. Bir IDE şirketinin AI akıllı sistemi, derleme seviyesindeki GPU optimizasyonunda insanın en iyi uzmanlarına yaklaşabiliyor; bu, "sizin için uygulama kodu yazma" hikayesinden çok daha büyük bir gelişmedir. (Kaynak: BlockBeats)

Yasal Uyarı: Bu sayfadaki bilgiler üçüncü şahıslardan alınmış olabilir ve KuCoin'in görüşlerini veya fikirlerini yansıtmayabilir. Bu içerik, herhangi bir beyan veya garanti olmaksızın yalnızca genel bilgilendirme amacıyla sağlanmıştır ve finansal veya yatırım tavsiyesi olarak yorumlanamaz. KuCoin, herhangi bir hata veya eksiklikten veya bu bilgilerin kullanımından kaynaklanan sonuçtan sorumlu değildir. Dijital varlıklara yapılan yatırımlar riskli olabilir. Lütfen bir ürünün risklerini ve risk toleransınızı kendi finansal koşullarınıza göre dikkatlice değerlendirin. Daha fazla bilgi için lütfen Kullanım Koşullarımıza ve Risk Açıklamamıza bakınız.