Aliyun PAI ডুয়াল ডেটা ফ্লাইউইল ট্রেনিং সহ AgenticQwen ছোট মডেলটি ওপেন সোর্স করেছে

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
অ্যালিবাবার PAI টিম এপ্রিল ২৭ (UTC+৮) এ অন-চেইন খবর প্রকাশ করে যে তারা AgenticQwen নামক একটি শিল্প টুল কলিং-এর জন্য ছোট মডেল ওপেন-সোর্স করেছে। MetaEra-এর উপর তৈরি এই 8B এবং 30B-A3B ভার্সনগুলি একটি ডুয়াল ডেটা ফ্লাইউইল ফ্রেমওয়ার্ক ব্যবহার করে ইনফারেন্স খরচ কমায়। AgenticQwen-8B TAU-2 এবং BFCL-V4-এ 47.4 স্কোর করে, যা Qwen3-8B (23.8) কে পরাজিত করে এবং Qwen3-235B (52.0) এর কাছাকাছি। AgenticQwen-30B-A3B (3B সক্রিয় প্যারামিটার) 50.2 স্কোর করে। এই মডেলটি এখন প্রোডাকশন সিস্টেমে ব্যবহার হচ্ছে, 235B মডেলগুলির সমান ইনফারেন্স গতিতে। এই রিলিজের মাধ্যমে ইনফ্লেশন ডেটা ট্র্যাকিং এবং অন্যান্য বাস্তব-জগতের কাজগুলি এখন আরও দক্ষ।

AIMPACT সংবাদ, ২৭ এপ্রিল (UTC+8), বিটিং মনিটরিংয়ের তথ্য অনুযায়ী, আলিবাবা PAI দল শিল্প-মানের টুল কলের জন্য ডিজাইন করা ছোট এজেন্ট ভাষা মডেল AgenticQwen (8B এবং 30B-A3B দুটি সংস্করণ সহ) প্রকাশ এবং ওপেন-সোর্স করেছে। এই মডেল সিরিজটি একটি নবাচারী "ডুয়াল ডেটা ফ্লাইওয়্হিল" রিইনফোর্সমেন্ট লার্নিং ফ্রেমওয়ার্কের মাধ্যমে প্রশিক্ষিত, যা উল্লেখযোগ্যভাবে ইনফারেন্স খরচ কমিয়েছে এবং 100 বিলিয়ন প্যারামিটারের বড় মডেলের সমতুল্য এজেন্ট (Agent) ক্ষমতা অর্জন করেছে। এর মূল কার্যপ্রণালীটি "ডুয়াল ডেটা ফ্লাইওয়্হিল" প্রশিক্ষণ পদ্ধতি। প্রচলিত সিনথেটিক ডেটা সহজেই হোমোজেনাইজড হয়ে মডেলের কার্যক্ষমতাকে সীমাবদ্ধ করে, AgenticQwen-এর জন্য দুটি ফ্লাইওয়্হিল চালু করা হয়েছে: ইনফারেন্স ফ্লাইওয়্হিলটি মডেলের ভুলগুলির থেকেই আরও কঠিনভাবে পরিবর্তিত উদাহরণগুলি স্বয়ংক্রিয়ভাবে তৈরি করে; এজেন্ট ফ্লাইওয়্হিলটি মডেলের একecution trace-এর ভিত্তিতে, সহজ রৈখিক ওয়ার্কফ্লো (যেমন, এককটি টিকিটবুকিং)কে,সীমাবদ্ধতা, অস্বীকার,এবংপ্রতিদ্বন্দ্বিতামূলকশর্তসহবহুশাখা‌‌বিশিষ্টবিহেব‌‌ট্রি‌‌তে‌‌প্রসারিত‌‌করে,‌‌বাস্তব‌‌জটিল‌‌সিদ্ধান্ত‌‌প্রক্রিয়াগুলি‌‌অনুকরণ‌‌করে। মূল্যায়নগুলির 8B-এর AgenticQwen-এর TAU-2এবংBFCL-V4-এরমতোবাস্তবটুলপরিবেশবেঞ্চমার্কগুলিতেগড়স্কোর47.4,যাQwen3-8B(23.8)কেঅনেকদূরপিছনেছেড়িয়েQwen3-235B(52.0)এরকাছাকাছি।AgenticQwen-30B-A3B(শুধুমাত্র3Bপ্যারামিটারসক্রিয়করা)স্কোর50.2।এখনপর্যন্ত,এইমডেলটিManus-এরসদৃশঅভ্যন্তরীণউৎপাদনসিস্টেমগুলিতেডিপloiকরাহয়েছে,235Bবড়মডেলগুলিরসঙ্গেফারক(এন্ড-টু-এন্ডইনফারেন্সসময়কম)অনেকদূরকমিয়েছে,তবেপত্রটি‌‌স্বীকার‌‌করছে‌‌যে,‌‌মূল‌‌40K‌‌কনটেক্সট‌‌দৈর্ঘ্য‌‌সীমা‌‌দ্বারা‌‌সীমাবদ্ধ,‌‌ছোট‌‌মডেলগুলি‌‌গভীর‌‌অনুসন্ধান‌‌কাজগুলিতে‌‌অপর্যাপ্ত। (উৎস: BlockBeats)

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।