Hệ thống Multi-Agent của Cursor tối ưu hóa 235 bộ xử lý NVIDIA GPU trong ba tuần, tiếp cận giới hạn phần cứng

iconKuCoinFlash
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Tin tức trên chuỗi: Vào ngày 15 tháng 4 (UTC+8), công cụ lập trình AI Cursor công bố hợp tác với NVIDIA sử dụng hệ thống đa tác nhân. Trong ba tuần, hệ thống đã tối ưu hóa 235 bộ xử lý GPU thực tế từ 124 mô hình mã nguồn mở trên 27 GPU Blackwell B200, đạt tốc độ tăng trung bình hình học 38%. Tin tức về tài sản thực tế (RWA): 149 bộ xử lý (63%) vượt trội hơn các chuẩn cơ sở, trong đó 45 bộ (19%) cho thấy tốc độ tăng hơn 2 lần. Các cải tiến chính bao gồm bộ chú ý truy vấn nhóm BF16 nhanh hơn 84% và hoạt động lớp NVFP4 MoE nhanh hơn 39%. Cursor nhấn mạnh sự hạn chế về tài nguyên GPU và kế hoạch tích hợp công nghệ đa tác nhân vào sản phẩm cốt lõi của mình.

Tin tức từ ME News, ngày 15 tháng 4 (UTC+8), theo giám sát của Dongcha Beating, công cụ lập trình AI Cursor đã tiết lộ thí nghiệm hợp tác với NVIDIA về hệ thống đa tác nhân. Hệ thống này đã tự vận hành trong ba tuần trên 27 GPU Blackwell B200, giải quyết 235 bài toán tối ưu hóa toán tử thực tế được trích xuất từ hơn 124 mô hình nguồn mở sản xuất như DeepSeek, Qwen, Gemma, tự viết và tối ưu mã toán tử GPU từ đầu, đạt tốc độ tăng trung bình hình học tổng thể 38%. Tối ưu hóa toán tử GPU là một trong những lĩnh vực có rào cản cao nhất trong kỹ thuật phần mềm, đòi hỏi kỹ sư phải thành thạo kiến trúc chip, lệnh cấp hợp ngữ và lập lịch bộ nhớ; một toán tử hiệu suất cao thường cần chuyên gia giàu kinh nghiệm vài tháng đến vài năm để tinh chỉnh. Hệ thống đa tác nhân của Cursor xử lý đồng thời toàn bộ 235 bài toán: một tác nhân lập kế hoạch phân bổ nhiệm vụ và lập lịch động dựa trên các chỉ số hiệu suất, nhiều tác nhân làm việc tối ưu song song, hệ thống tự động gọi đường ống kiểm tra chuẩn SOL-ExecBench của NVIDIA để tạo vòng lặp tự động “kiểm tra, gỡ lỗi, tối ưu” mà không cần can thiệp con người. Hệ thống chạy hai vòng, một bằng CUDA C (bao gồm PTX hợp ngữ nhúng) và một bằng CuTe DSL: vòng đầu tiên kiểm tra khả năng suy luận phần cứng cấp thấp nhất, vòng thứ hai kiểm tra khả năng học các API mới gần như không có trong dữ liệu huấn luyện công khai. Trong 235 bài toán, hệ thống vượt qua cơ sở trong 149 bài (63%), trong đó 45 bài (19%) tăng tốc hơn 2 lần. Ba kết quả tiêu biểu: 1. Nhóm chú ý truy vấn BF16 (trích xuất từ kịch bản suy luận Llama 3.1 8B): nhanh hơn 84% so với thư viện FlashInfer được tối ưu thủ công, điểm SOL là 0,9722, gần với giới hạn lý thuyết phần cứng (điểm tối đa 1,0). 2. Phép nhân ma trận BF16: toán tử được tạo từ đầu đạt 86% hiệu suất của cuBLAS do NVIDIA tinh chỉnh thủ công, trong các tình huống M nhỏ thường dùng trong giải mã LLM, vượt trội hơn cơ sở đến 9%. 3. Toán tử tuyến tính lớp chuyên gia hỗn hợp NVFP4 (trích xuất từ các mô hình MoE như Qwen3): hệ thống tự nhận diện điểm nghẽn lượng tử dấu phẩy động 4-bit và thực hiện tối ưu hợp nhất nhắm mục tiêu, tăng tốc 39%. Cursor thừa nhận điểm SOL trung vị tổng thể chỉ ở mức 0,56, vẫn còn không gian cải thiện đáng kể, nguyên nhân chính là tài nguyên GPU hạn chế (235 bài toán chia sẻ 27 GPU). Cursor cho biết các công nghệ đa tác nhân này “sẽ sớm được tích hợp vào sản phẩm cốt lõi”. Một tác nhân AI của công ty IDE đã có thể tiếp cận hiệu suất của chuyên gia hàng đầu con người trong tối ưu hóa GPU ở cấp độ hợp ngữ — điều này lớn lao hơn nhiều so với câu chuyện “giúp bạn viết mã ứng dụng”. (Nguồn: BlockBeats)

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.