AIMPACT সংবাদ, ১৬ মে (UTC+8), Beating দ্বারা পর্যবেক্ষিত, Nous Research দীর্ঘ প্রেক্ষাপট প্রিট্রেনিং মেকানিজম Lighthouse Attention ওপেন-সোর্স করেছে। একটি B200 GPU-এ 512K দৈর্ঘ্যের টেক্সট প্রসেস করার সময়, এই পদ্ধতি পারফরম্যান্সকে প্রায় 17 গুণ বাড়িয়েছে, এবং 98K দৈর্ঘ্যে 1.4 থেকে 1.7 গুণ পর্যন্ত এন্ড-টু-এন্ড ট্রেনিং স্পিড বৃদ্ধি করেছে। পারম্পারিক অনুধাবন মেকানিজমগুলি সমস্ত শব্দের দ্বিগুণ সম্পর্ক গণনা করে, যা টেক্সট দীর্ঘ হলে কম্পিউটেশনাল খরচকে বর্গাকারে বৃদ্ধি করে। Lighthouse Attention একটি প্রথমে গ্রস, তারপর ফাইন-গ্রেনিউলার পদ্ধতির ব্যবহার করে। এটি প্রথমে টেক্সটের কম্প্রেসড সামারির বিভিন্ন লেভেলে দ্রুত ব্রাউজ করে, স্কোরিংয়ের মাধ্যমে কীভাবে মূল অংশগুলি চিহ্নিত করবে, তা নির্বাচন করে, এবং সংক্ষিপ্তকৃত টেক্সটটির জন্য FlashAttention-এর মতো ইতিমধ্যেই উপলব্ধ, দক্ষ অপারেটরগুলিতেই হস্তান্তরিত করে। চয়নের লজিকটি কোরের বাইরেই সম্পূর্ণভাবে আলাদা, তাই ডেভেলপারদেরকে লো-লেভেল কোডিংয়ের জন্যহস্ত-লিখিত কোডিংয়েরওপরিহার,এবংঅতিরিক্তট্রেনিংঅবজেকটিভসযোগকরারওপ্রয়োজনহয়না।গতকালকালপদ্ধতিরঅনুরূপঅনুসন্ধানগুলি,যা"জাম্প-রিডিং"এরঅভ্যাসকেউৎপন্নকরত,সাধারণত"বাই-বাই"অনুধাবনক্ষমতা"হারিয়েফেলত।এইফাঁদটিথেকেবাঁচত,ডিভেলপমেন্টটিমি"পদ্ধতি"এবংশুধুশেষপর্যন্তঅল্পসময়জন্যপুনরায়পারম্পারিকসম্পূর্ণঅনুধাবনগণনা-এবদলকরা।5.3বিলিয়নপ্যারামিটারসহএকটিমডেল,500বিলিয়নটোকেনট্রেইনিংডেটা-এরপরীক্ষা,এইপদ্ধতি-দিয়েশিখা"মডেল"শুধুমাত্রসময়কমইখরচহয়নি,বরংফলাফলওসমস্তদিকথেকেপুরোপুরি"পারম্পারিক"পদ্ধতি-দিয়েশিখা"বেসলাইন"ভারসমতা"অথবা"অতিক্রমকরছে।(উৎস: BlockBeats)
নাস রিসার্চ লাইটহাউস অ্যাটেনশন ওপেন সোর্স করেছে, B200-এ 17x গতি বৃদ্ধি অর্জন করেছে
KuCoinFlashশেয়ার






১৬ মে (ইউটিসি+৮) অন-চেইন সংবাদ মাধ্যম মেটা এরা জানিয়েছে যে, নুস রিসার্চ দীর্ঘ-সংদর্ভ প্রি-ট্রেনিংয়ের জন্য তাদের লাইটহাউস অ্যাটেনশন মেকানিজমকে ওপেন-সোর্স করেছে। এই পদ্ধতিটি ৫১২কে-দৈর্ঘ্যের টেক্সটের জন্য একটি একক B200 GPU-এ ১৭x দ্রুত গণনা এবং ৯৮কে-দৈর্ঘ্যে ১.৪–১.৭x ট্রেনিং গতি প্রদান করে। এটি নিম্ন-স্তরের কোডিং বা অতিরিক্ত ট্রেনিং অবজেকটিভস এড়াতে একটি দুই-ধাপের প্রক্রিয়া ব্যবহার করে। পরীক্ষায়, ৫০বিলিয়ন টোকেনে ট্রেনড ৫৩০মিলিয়ন-প্যারামিটার মডেলটি পারম্পরিক পদ্ধতির সমতুল্য বা তারও উত্তম পারফরম্যান্স দেখিয়েছে, যখন ট্রেনিংয়ের সময় কমিয়েছে। ক্রিপ্টো সংবাদ প্ল্যাটফর্মগুলি ডেভেলপারদের এবং গবেষকদের জন্য এই দক্ষতা বৃদ্ধির প্রশংসা করছে।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।