ইন্টেল আলিবাবা ওয়ান2.2 ভিডিও মডেলের তিনটি INT4 কোয়ান্টাইজড সংস্করণ প্রকাশ করেছে

KuCoinFlash

রিলিজের সময়: ২১/০৪/২০২৬, ০৮:৫২:০২

সারাংশ

২১ এপ্রিল (UTC+8)-এ, ইন্টেলের প্রধান এআই ইঞ্জিনিয়ার হাইহাও শেন হাগিং ফেসে আলিবাবার ওয়ান2.2 ভিডিও মডেলের তিনটি INT4 কোয়ান্টাইজড ভার্সন প্রকাশের ঘোষণা দেন। মডেলগুলি হল T2V-A14B, I2V-A14B এবং TI2V-5B, যেগুলি সবই Intel-এর AutoRound টুল ব্যবহার করে W4A16-এ কম্প্রেস করা হয়েছে। INT4 কোয়ান্টাইজেশন প্রতিটি ওজনকে 2 বাইট (BF16) থেকে 0.5 বাইটে কমিয়ে আনে, যার ফলে ওজনের আকার মূলটির প্রায় এক-চতুর্থাংশ হয়ে যায়। A14B মডেলগুলি MoE আর্কিটেকচার ব্যবহার করে, যাতে 27B মোট প্যারামিটার এবং প্রতি ধাপে 14B সক্রিয়, 720P ভিডিওর জন্য একটি সিঙ্গেল কার্ডে কমপক্ষে 80GB GPU মেমোরির প্রয়োজন। TI2V-5B একটি ঘনমানযুক্ত মডেল, যা 4090-এ 720P@24fps-এ চলে। ইন্টেল এখনও কোয়ান্টাইজড মডেলগুলির মেমোরি এবং কোয়ালিটির পারফরম্যান্স প্রকাশ করেননি, যা তৃতীয়-পক্ষের পরীক্ষা প্রয়োজন। মডেলগুলি vLLM ইনফারেন্স পাইপলাইনটির মূলটির ব্যবহার করেনা, বরং Intel-এর内部 vllm-omni branch (feats/ar-w4a16-wan22)-এর দিকেই নির্দেশিত, যা সার্ভিসটি চালানোর জন্যইনস্টল করা প্রয়োজন। এই প্রকাশটি গণনা-দক্ষতার চলমান পরিবর্তনকে উজ্জ্বলভাবেই দেখায়, যা Proof of Work (PoW) এবং Proof of Stake (PoS) উভয় 시স্টেমেরই প্রভাবিত।

ME সংবাদের মতে, ২১ এপ্রিল (UTC+8), ডিনচা বিটিং-এর মনিটরিং অনুযায়ী, ইন্টেলের প্রধান এআই ইঞ্জিনিয়ার হাইহাও শেন ঘোষণা করেছেন যে ইন্টেল Hugging Face-এ আলিবাবার Wan 2.2 ভিডিও মডেলের তিনটি INT4 কোয়ান্টাইজড ভার্সন আপলোড করেছে: T2V-A14B (টেক্সট টু ভিডিও), I2V-A14B (ইমেজ টু ভিডিও) এবং TI2V-5B (টেক্সট-ইমেজ মিক্সড টু ভিডিও), যেগুলো সবই AutoRound ব্যবহার করে W4A16-এ প্রেস করা হয়েছে। শেনই AutoRound কোয়ান্টাইজেশন টুলসের প্রধান লেখক। INT4 প্রতিটিওয়েটকে BF16-এর 2 বাইট থেকে 0.5 বাইটে কমিয়েছে, যার ফলেওয়েটের আকার প্রায় মূল ভার্সনের চারভাগের একভাগ। A14B-এর দুটি মডেল মূলত MoE আর্কিটেকচার ব্যবহার করে, যার মোট প্যারামিটার 27B, প্রতিটি স্টেপে 14B একটিভেট হয়; অফিসিয়াল ডকুমেন্টে 720P-এর জন্য একটি GPU-তে 80GB VRAM-এর প্রয়োজনীয়তা উল্লেখ করা হয়েছে; TI2V-5B একটি ডেনসি মডেল, যা 4090-এ 720P@24fps-এইচলানোর জন্যই পর্যাপ্ত। INT4-কোয়ান্টাইজডভার্সনগুলির VRAM-এর বাস্তবিক ব্যবহারও কোয়ালিটির তুলনা Intel-এর দ্বারা প্রকাশিত হয়নি, এটি 3rd-party-দ্বারা re-implement-এর অপেক্ষায়। তিনটি মডেলেরই ইনফারেন্স পাইপলাইন vLLM-এর মূলশাখা (mainline) ব্যবহার করছেনা, README-তে Intel-এর vllm-omni branch (feats/ar-w4a16-wan22)-এরদিকেই nudge-করা হয়েছে, service-শুরুরজন্যএইব্রাঞ্চটিinstallকরতেহবে। (উৎস: BlockBeats)

উৎস:আসল দেখান

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।