AIMPACT সংবাদ, ২৭ এপ্রিল (UTC+8), বিটিং মনিটরিংয়ের তথ্য অনুযায়ী, আলিবাবা PAI দল শিল্প-মানের টুল কলের জন্য ডিজাইন করা ছোট এজেন্ট ভাষা মডেল AgenticQwen (8B এবং 30B-A3B দুটি সংস্করণ সহ) প্রকাশ এবং ওপেন-সোর্স করেছে। এই মডেল সিরিজটি একটি নবাচারী "ডুয়াল ডেটা ফ্লাইওয়্হিল" রিইনফোর্সমেন্ট লার্নিং ফ্রেমওয়ার্কের মাধ্যমে প্রশিক্ষিত, যা উল্লেখযোগ্যভাবে ইনফারেন্স খরচ কমিয়েছে এবং 100 বিলিয়ন প্যারামিটারের বড় মডেলের সমতুল্য এজেন্ট (Agent) ক্ষমতা অর্জন করেছে। এর মূল কার্যপ্রণালীটি "ডুয়াল ডেটা ফ্লাইওয়্হিল" প্রশিক্ষণ পদ্ধতি। প্রচলিত সিনথেটিক ডেটা সহজেই হোমোজেনাইজড হয়ে মডেলের কার্যক্ষমতাকে সীমাবদ্ধ করে, AgenticQwen-এর জন্য দুটি ফ্লাইওয়্হিল চালু করা হয়েছে: ইনফারেন্স ফ্লাইওয়্হিলটি মডেলের ভুলগুলির থেকেই আরও কঠিনভাবে পরিবর্তিত উদাহরণগুলি স্বয়ংক্রিয়ভাবে তৈরি করে; এজেন্ট ফ্লাইওয়্হিলটি মডেলের একecution trace-এর ভিত্তিতে, সহজ রৈখিক ওয়ার্কফ্লো (যেমন, এককটি টিকিটবুকিং)কে,সীমাবদ্ধতা, অস্বীকার,এবংপ্রতিদ্বন্দ্বিতামূলকশর্তসহবহুশাখাবিশিষ্টবিহেবট্রিতেপ্রসারিতকরে,বাস্তবজটিলসিদ্ধান্তপ্রক্রিয়াগুলিঅনুকরণকরে। মূল্যায়নগুলির 8B-এর AgenticQwen-এর TAU-2এবংBFCL-V4-এরমতোবাস্তবটুলপরিবেশবেঞ্চমার্কগুলিতেগড়স্কোর47.4,যাQwen3-8B(23.8)কেঅনেকদূরপিছনেছেড়িয়েQwen3-235B(52.0)এরকাছাকাছি।AgenticQwen-30B-A3B(শুধুমাত্র3Bপ্যারামিটারসক্রিয়করা)স্কোর50.2।এখনপর্যন্ত,এইমডেলটিManus-এরসদৃশঅভ্যন্তরীণউৎপাদনসিস্টেমগুলিতেডিপloiকরাহয়েছে,235Bবড়মডেলগুলিরসঙ্গেফারক(এন্ড-টু-এন্ডইনফারেন্সসময়কম)অনেকদূরকমিয়েছে,তবেপত্রটিস্বীকারকরছেযে,মূল40Kকনটেক্সটদৈর্ঘ্যসীমাদ্বারাসীমাবদ্ধ,ছোটমডেলগুলিগভীরঅনুসন্ধানকাজগুলিতেঅপর্যাপ্ত। (উৎস: BlockBeats)
Aliyun PAI ডুয়াল ডেটা ফ্লাইউইল ট্রেনিং সহ AgenticQwen ছোট মডেলটি ওপেন সোর্স করেছে
KuCoinFlashশেয়ার






অ্যালিবাবার PAI টিম এপ্রিল ২৭ (UTC+৮) এ অন-চেইন খবর প্রকাশ করে যে তারা AgenticQwen নামক একটি শিল্প টুল কলিং-এর জন্য ছোট মডেল ওপেন-সোর্স করেছে। MetaEra-এর উপর তৈরি এই 8B এবং 30B-A3B ভার্সনগুলি একটি ডুয়াল ডেটা ফ্লাইউইল ফ্রেমওয়ার্ক ব্যবহার করে ইনফারেন্স খরচ কমায়। AgenticQwen-8B TAU-2 এবং BFCL-V4-এ 47.4 স্কোর করে, যা Qwen3-8B (23.8) কে পরাজিত করে এবং Qwen3-235B (52.0) এর কাছাকাছি। AgenticQwen-30B-A3B (3B সক্রিয় প্যারামিটার) 50.2 স্কোর করে। এই মডেলটি এখন প্রোডাকশন সিস্টেমে ব্যবহার হচ্ছে, 235B মডেলগুলির সমান ইনফারেন্স গতিতে। এই রিলিজের মাধ্যমে ইনফ্লেশন ডেটা ট্র্যাকিং এবং অন্যান্য বাস্তব-জগতের কাজগুলি এখন আরও দক্ষ।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।