বাইটডান্স কোলা ডিএলএম খোলা সোর্স করেছে: টেক্সট জেনারেশনের জন্য একটি ডিফিউশন মডেল

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
মে ১৬ (UTC+8)-এ, ByteDance-এর সিড টিম মেটাEra-এর উপর ভিত্তি করে টেক্সট জেনারেশনের জন্য কোলা DLM নামক একটি ডিফিউশন মডেল ওপেন-সোর্স করেছে। এই মডেলটি একটি টেক্সট VAE এবং ব্লক-কৌশলগত DiT কে একত্রিত করে উচ্চ-স্তরের অর্থবোধকতা প্রথমে সংগঠিত করে টেক্সট জেনারেট করে। 2B-স্কেলের ওপেন-সোর্স সংস্করণটিতে 23 বিলিয়ন মোট প্যারামিটার রয়েছে এবং আটটি বেঞ্চমার্কে শক্তিশালী পারফরম্যান্স দেখায়। এটি এখনও একটি গবেষণা চেকপয়েন্ট, একটি ডায়ালগ মডেল নয়, কারণ এতে ইনস্ট্রাকশন ফাইন-টিউনিং বা RLHF-এর অভাব রয়েছে। তরলতা এবং ক্রিপ্টোমার্কেটগুলি যখন বিকশিত হচ্ছে, তখন এই মডেলগুলি উন্নত কনটেন্ট স্ক্রিনিং এবং প্রতারণা শনাক্তকরণের মাধ্যমে CFT (টারিস্টিক আর্থিকতা প্রতিরোধ)的努力কে প্রভাবিত করতে পারে।

ME সংবাদ অনুযায়ী, ১৬ মে (UTC+8), ডোংচা বিটিং-এর মনিটরিং অনুযায়ী, বাইটডান্স সিড টিম কোলা DLM-কে ওপেন সোর্স করেছে। এটি একটি কন্টিনিউয়াস লেটেন্ট ডিফিউশন ল্যাঙ্গুয়েজ মডেল, যা বড় ভাষা মডেলগুলির বাম থেকে ডানে টোকেনভিত্তিক নির্দিষ্ট পথকে পার্কিং করতে চায় এবং টেক্সট জেনারেশনকে প্রথমে উচ্চস্তরের অর্থবহ কাঠামো গঠনের মাধ্যমে, তারপর বিশদ শব্দে ফিরে আসার পদ্ধতিতে পরিবর্তন করে। কোলা DLM-এর কোরটি হল Text VAE + block-causal DiT। Text VAE প্রথমে ডিসক্রিট টেক্সটকে কন্টিনিউয়াস লেটেন্ট স্পেসে ম্যাপ করে, তারপর block-causal DiT Flow Matching-এর মাধ্যমে লেটেন্ট প্রায়রি শিখে, এবং শেষে কন্ডিশনাল ডিকোডার লেটেন্টভ্যারিয়েবলগুলিকে আবার টেক্সটে রূপান্তরিত করে। ডিফিউশন প্রক্রিয়াটি সরাসরি টোকেন-লেভেলে নয়, বরং লেটেন্ট সিম্বলিক রিপ্রেজেন্টেশনগুলির উপর কাজ করে। এই ওপেন-সোর্সড ভার্সনটি 2B-স্কেলের মডেল, অর্থাৎ 2300টি মোট প্যারামিটার, যার 1800টি DiT-এর, 500টি VAE-এর। LAMBADA, MMLU, OBQA, HellaSwag, RACE, SIQA, SQuAD, Story Cloze-এর 8টি পরীক্ষায়, পেপারটি 2B-স্কেল AR / LLaDA-এর সঙ্গে, একইজাতীয় JENARATIVE EVLUATION PROTOCOL-এর under, scaling-এরদিকগুলিরদিকথেকেপ্রতিদ্বন্দ্বিতা-যোগ্য,এবংফাইনালমধ্যমস্কোরএসবচেয়েভালোহয়েছে।তবেএখনওএটিএকটিrsearch-levelcheckpoint,সরাসরিব্যবহারযোগ্যডায়ালগমডেলনয়।অফিসিয়ালভাবেবলা,এইমডেলটিinstruct-tuningএবংRLHF-এরমধ্যদিয়েপাসকরেনি,এবংএটিরপ্রধানউদ্দেশ্যহলকন্টিনিউয়াসলেটেন্টডিফিউশনকেটেক্সটজেনারেশন-এব্যবহারকরা।পেপারটিটেক্সট-ইমেজইউনিফাইডমডেলিং-এরদিকেঅগ্রসরহওয়ারপ্রাথমিকপরীক্ষা-ওদেখিয়েছে,তবেএইওপেন-সোর্সডরিপোতেশুধুমাত্রটেক্সটপাইপলাইনঅন্তর্ভুক্তআছে।(উৎস: BlockBeats)

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।