ME সংবাদ, ১৫ এপ্রিল (UTC+8), অ্যানালিসিস বিটিং-এর মনিটরিং অনুযায়ী, AI প্রোগ্রামিং টুল Cursor তার মাল্টি-এজেন্ট সিস্টেম এবং NVIDIA-এর সহযোগিতায় পরীক্ষা প্রকাশ করেছে। এই সিস্টেমটি ২৭টি Blackwell B200 GPU-এ ৩ সপ্তাহ ধরে স্বয়ংক্রিয়ভাবে চলেছে, যা DeepSeek, Qwen, Gemma ইত্যাদি ১২৪টিরও বেশি প্রোডাকশন-লেভেল ওপেন-সোর্স মডেল থেকে প্রাপ্ত ২৩৫টি বাস্তব অপারেটর অপটিমাইজেশন সমস্যার জন্য GPU অপারেটর কোড শূন্য থেকে লিখেছে এবং অপটিমাইজ করেছে, যার মধ্যে মোট ৩৮% জ্যামিতিক গড় গতি বৃদ্ধি পেয়েছে। GPU অপারেটর অপটিমাইজেশন সফটওয়্যার ইঞ্জিনিয়ারিংয়ের মধ্যেই সবচেয়ে উচ্চতর প্রবেশদ্বারযুক্ত ক্ষেত্রগুলির মধ্যে একটি, যা ইঞ্জিনিয়ারদেরকে চিপ আর্কিটেকচার, অ্যাসেম্বলি-লেভেল নির্দেশনা এবং মেমোরি স্কিডিউলিংয়ের উপর দক্ষতা প্রয়োজন; একটি হাই-পারফরম্যান্স অপারেটরের জন্য প্রায়শই অভিজ্ঞ বিশেষজ্ঞদের ৩-৪ মাস, 甚至几年的时间来打磨。Cursor 的多智能体系统一次性处理全部 235 题:一个规划智能体分配任务并根据性能指标动态调度,多个工作智能体并行优化,系统自行调用英伟达的 SOL-ExecBench 基准测试管道形成「测试、调试、优化」自动循环,全程无人干预。系统分别用 CUDA C(含内联 PTX 汇编)和 CuTe DSL 两种语言各跑了一轮,前者测试最底层硬件推理能力,后者测试学习公开训练数据中几乎没有的新 API 的能力。 235 题中,系统在 149 题(63%)上超越基线,其中 45 题(19%)加速超过 2 倍。三个代表性结果: 1. BF16 分组查询注意力(提取自 Llama 3.1 8B 推理场景):较人工优化的 FlashInfer 库快 84%,SOL 得分 0.9722,接近硬件理论极限(满分 1.0) 2. BF16 矩阵乘法:从零生成的算子达到英伟达 cuBLAS 手工调优性能的 86%,在 LLM 推理解码常用的小 M 场景下反超基线最多 9% 3. NVFP4 混合专家层线性运算(提取自 Qwen3 等 MoE 模型):系统自主识别 4 位浮点量化瓶颈并做针对性融合优化,加速 39% Cursor 坦承整体中位 SOL 得分仅 0.56,仍有大幅提升空间,主因是 GPU 资源有限(235 题共用 27 块 GPU)。Cursor 称这些多智能体技术「将很快融入核心产品」。一家 IDE 公司的 AI 智能体已经能在汇编级别的 GPU 优化上逼近人类顶尖专家,这比「帮你写应用代码」的故事大得多。 (来源:BlockBeats)
কার্সর মাল্টি-এজেন্ট সিস্টেম তিন সপ্তাহে 235 NVIDIA GPU অপারেটরকে অপ্টিমাইজ করে, হার্ডওয়্যার সীমার কাছাকাছি যায়
KuCoinFlashশেয়ার






অন-চেইন সংবাদ: ১৫ এপ্রিল (UTC+8)-এ, এআই প্রোগ্রামিং টুল Cursor এর মাল্টি-এজেন্ট সিস্টেম ব্যবহার করে NVIDIA-এর সাথে একটি সহযোগিতার ঘোষণা করেছে। তিন সপ্তাহের মধ্যে, এই সিস্টেম ২৭টি Blackwell B200 GPU-এ ১২৪টি ওপেন-সোর্স মডেল থেকে ২৩৫টি বাস্তব-বিশ্ব GPU অপারেটরকে অপ্টিমাইজ করে ৩৮% জ্যামিতিক গড় গতি বৃদ্ধি অর্জন করেছে। বাস্তব-বিশ্ব সম্পদ (RWA) সংবাদ: ১৪৯টি অপারেটর (৬৩%) বেসলাইনকে ছাড়িয়েছে, যার ৪৫টি (১৯%) ২x-এর বেশি গতি বৃদ্ধি দেখিয়েছে। প্রধান উন্নতিগুলির মধ্যে রয়েছে ৮৪% দ্রুত BF16 গ্রুপড কোয়েরি অ্যাটেনশন এবং ৩৯% দ্রুত NVFP4 MoE লেয়ার অপারেশন। Cursor উল্লেখ করেছে যে GPU সম্পদের সীমাবদ্ধতা রয়েছে এবং মাল্টি-এজেন্ট প্রযুক্তিটিকে তাদের মূল পণ্যের সাথে একীভূত করার পরিকল্পনা করছে।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।