इंटेल ने अलीबाबा वान2.2 वीडियो मॉडल्स के तीन INT4 क्वांटाइज्ड संस्करण जारी किए

iconKuCoinFlash
साझा करें
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconसारांश

expand icon
21 अप्रैल (UTC+8) को, इंटेल के प्रमुख AI इंजीनियर हाईहाओ शेन ने हगिंग फेस पर अलीबाबा के वान2.2 वीडियो मॉडल के तीन INT4 क्वांटाइज्ड संस्करणों की घोषणा की। ये मॉडल T2V-A14B, I2V-A14B और TI2V-5B हैं, जिन्हें सभी Intel के AutoRound टूल का उपयोग करके W4A16 पर संपीड़ित किया गया है। INT4 क्वांटाइजेशन प्रत्येक वजन को 2 बाइट (BF16) से घटाकर 0.5 बाइट कर देता है, जिससे वजन का आकार मूल का लगभग एक-चौथाई हो जाता है। A14B मॉडल MoE आर्किटेक्चर का उपयोग करते हैं, जिनमें कुल 27B पैरामीटर हैं और प्रति चरण 14B सक्रिय हैं, जिसके लिए एकल कार्ड पर 720P वीडियो के लिए कम से कम 80GB GPU मेमोरी की आवश्यकता होती है। TI2V-5B एक घना मॉडल है जो 4090 पर 720P@24fps चला सकता है। इंटेल ने अभी तक क्वांटाइज्ड मॉडल्स की मेमोरी और गुणवत्ता प्रदर्शन का खुलासा नहीं किया है, जिनके लिए तीसरे पक्ष की परीक्षण आवश्यकता होती है। ये मॉडल मुख्य vLLM निष्पादन पाइपलाइन का उपयोग नहीं करते, बल्कि Intel के आंतरिक vllm-omni शाखा (feats/ar-w4a16-wan22) की ओर संकेत करते हैं, जिसे सेवा चलाने के लिए स्थापित किया जाना आवश्यक है। इस रिलीज़ से परिगणना की कुशलता में हो रहे स्थानांतरण पर प्रकाश डाला गया है, जिसका Proof of Work (PoW) और Proof of Stake (PoS) प्रणालियों पर प्रभाव पड़ सकता है।

ME News के अनुसार, 21 अप्रैल (UTC+8) को, Beating द्वारा निगरानी के अनुसार, Intel के मुख्य AI इंजीनियर Haihao Shen ने घोषणा की कि Intel ने Hugging Face पर Alibaba के Wan 2.2 वीडियो मॉडल के तीन INT4 क्वांटाइज्ड संस्करण अपलोड किए हैं: T2V-A14B (टेक्स्ट टू वीडियो), I2V-A14B (इमेज टू वीडियो) और TI2V-5B (टेक्स्ट-इमेज मिक्स्ड टू वीडियो), जिन्हें सभी AutoRound के साथ W4A16 पर कम किया गया है। Shen स्वयं AutoRound के मुख्य लेखक हैं। INT4 प्रत्येक वजन को BF16 के 2 बाइट से 0.5 बाइट तक कम करता है, जिससे वजन का आकार मूल संस्करण का लगभग एक-चौथाई हो जाता है। A14B के दोनों संस्करण मूल रूप से MoE आर्किटेक्चर का उपयोग करते हैं, कुल पैरामीटर 27B, प्रति स्टेप 14B सक्रिय, और आधिकारिक दस्तावेज़ के अनुसार 720P चलाने के लिए कम से कम 80GB VRAM की आवश्यकता होती है; TI2V-5B एक घना मॉडल है, जिसका मूल संस्करण 4090 पर 720P@24fps चला सकता है। Intel ने क्वांटाइज्ड संस्करणों के लिए VRAM और चित्रण गुणवत्ता की तुलना प्रकाशित नहीं की है, जिसकी प्रतीक्षा तीसरे पक्ष के पुनरुत्पादन के लिए है। तीनों मॉडलों की इनफ़रेंस पाइपलाइन vLLM की मुख्य पथ पर नहीं है, README vllm-omni की Intel की स्वयं की शाखा (feats/ar-w4a16-wan22) की ओर संकेत करता है, जिसे सेवा शुरू करने के लिए स्थापित करना होगा। (स्रोत: BlockBeats)

डिस्क्लेमर: इस पेज पर दी गई जानकारी थर्ड पार्टीज़ से प्राप्त की गई हो सकती है और यह जरूरी नहीं कि KuCoin के विचारों या राय को दर्शाती हो। यह सामग्री केवल सामान्य सूचनात्मक उद्देश्यों के लिए प्रदान की गई है, किसी भी प्रकार के प्रस्तुतीकरण या वारंटी के बिना, न ही इसे वित्तीय या निवेश सलाह के रूप में माना जाएगा। KuCoin किसी भी त्रुटि या चूक के लिए या इस जानकारी के इस्तेमाल से होने वाले किसी भी नतीजे के लिए उत्तरदायी नहीं होगा। डिजिटल संपत्तियों में निवेश जोखिम भरा हो सकता है। कृपया अपनी वित्तीय परिस्थितियों के आधार पर किसी प्रोडक्ट के जोखिमों और अपनी जोखिम सहनशीलता का सावधानीपूर्वक मूल्यांकन करें। अधिक जानकारी के लिए, कृपया हमारे उपयोग के नियम और जोखिम प्रकटीकरण देखें।