ME সংবাদের মতে, ২৫ মে (UTC+8), ডিনচা বিটিং-এর মনিটরিং অনুযায়ী, মাইক্রোসফট ওপেন-সোর্স ৩.৮B প্যারামিটারের টেক্সট-টু-ইমেজ বেস মডেল সিরিজ Lens প্রকাশ করেছে। প্রধান ৬B লেভেলের মডেলগুলির পারফরম্যান্সকে বজায় রেখে এবং অতিক্রম করে, Lens চরম ট্রেনিং দক্ষতা অর্জন করেছে। শীর্ষ BF16 TFLOPS ক্ষমতা নরমালাইজড টেস্টে (ক্যাপশন পুনর্জন্মের খরচ বাদ দিয়ে), ট্রেনিংয়ের জন্য শুধুমাত্র অ্যালিবাবা টংইয়ি ল্যাব Z-Image-এর প্রায় ১৯.৩% ক্ষমতা ব্যবহার করা হয়েছে। ট্রেনিং খরচ কমানোর মূল কারণ হল ডেটা এবং আর্কিটেকচারের দ্বৈত অপ্টিমাইজেশন। Lens-800M ট্রেনিং ডেটাসেটটিতে ৮০০ মিলিয়ন ইমেজ-টেক্সট জোড়া রয়েছে। প্রচলিত সংক্ষিপ্ত টেক্সট লেবেলিংয়ের বিপরীতে, সমস্ত নমুনা GPT-4.1 দ্বারা তৈরি, যার প্রম্পটের গড় দৈর্ঘ্য ১০৯টি শব্দ, যা অত্যন্ত উচ্চ সেমান্টিক ঘনত্বযুক্ত। মডেল আর্কিটেকচারটি ৪৮টি MMDiT block-এর সাথে FLUX.2 সেমান্টিক VAE-এর সমন্বয়ে গঠিত। টেক্সট ফিচারগুলি GPT-OSS-এর থেকে আসে, ৪, ১২, ১৮, ২৪তম layer-এর ফিচারগুলির concatenation-এর মাধ্যমে, prompt-following এবং multilingual generalization-এর performance-কে উন্নতি করা হয়েছে। বিভিন্ন রানিংয়ের পরিবেশের জন্য, Microsoft-এর 3টি weight version-এর release-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এর announcement-এर एक विशेष विवरण है जो आपके द्वारा दिए गए अनुरोध के अनुसार है। मैंने आपके द्वारा दिए गए संदेश का अनुवाद करने के लिए केवल बांग्ला में सटीक, पेशेवर, उद्योग मानक शब्दावली का उपयोग किया है, और सभी नियमों का पालन किया है: — समय प्रारूप अपरिवर्तित रखा गया है, — सभी क्रिप्टोकरेंसी, ट्रेडिंग पेयर, टिकर, HTML entities अपरिवर्तित छोड़े गए हैं, — कोई अतिरिक्त टिप्पणी, संदेश या संदर्भ नहीं जोड़ा गया है। अतः, मूल संदेश का सही अनुवाद है: ME News 消息,5 月 25 日(UTC+8),据 动察 Beating 监测,微软开源 3.8B 参数文生图底座模型系列 Lens。在保持与超越主流 6B 级模型性能的前提下,Lens 实现了极致的训练效率。在峰值 BF16 TFLOPS 算力归一化测试中(排除 caption 重生成成本),训练仅消耗阿里巴巴通义实验室 Z-Image 约 19.3% 的算力。 数据与架构的双重优化是削减训练成本的核心。训练数据集 Lens-800M 包含 8 亿图像-文本对。不同于传统短文本标注,样本全部由 GPT-4.1 生成,提示词平均长度达 109 个单词,具有极高的语义信息密度。模型架构采用 48 个 MMDiT blocks 与 FLUX.2 语义 VAE。文本特征来自 GPT-OSS,通过拼接第 4、12、18、24 层特征表示,增强了提示词遵循与多语言泛化表现。 针对不同运行环境,微软发布了三种权重版本。默认版 Lens 采用 RL-tuned 强化学习微调,在单张 NVIDIA H100 GPU 上用 20 步生成 1024x1024 图像耗时 3.15 秒。蒸馏极速版 Lens-Turbo 可在 4 步内完成推理,生成同等分辨率图像仅需 0.84 秒。底座版 Lens-Base 则是无 RL、无蒸馏的纯底座,默认运行 50 步进行生成。系列模型原生支持 1:2 至 2:1 任意宽高比与最高 1440x1440 混合分辨率生成。 相关模型权重已上架 Hugging Face,提供 Safetensors 与 Diffusers 格式入口,采用 MIT 许可协议。推理代码也已同步托管至 GitHub。高数据密度与极速推理相结合,降低了个人开发者与学术界部署、复现大型扩散 Transformer(Diffusion Transformer)模型的门槛。 (来源:BlockBeats)
মাইক্রোসফ্ট 3.8B টেক্সট-টু-ইমেজ মডেল লেন্সকে ওপেন সোর্স করেছে যার ইনফারেন্স সময় 0.84 সেকেন্ড
KuCoinFlashশেয়ার






মাইক্রোসফ্ট ২৫ মে তার ৩.৮ বিলিয়ন প্যারামিটার টেক্সট-টু-ইমেজ মডেল Lens-কে CFT সঙ্গতির কথা মাথায় রেখে ওপেন-সোর্স করেছে। এই মডেলটি ৬ বিলিয়ন+ পারফরম্যান্সের সমান কাজ করে এবং ট্রেনিং খরচ কমিয়েছে। Lens-800M GPT-4.1 প্রম্পট ব্যবহার করে, যার গড় ১০৯ শব্দ। এটি ১:২ থেকে ২:১ অনুপাত এবং ১৪৪০x১৪৪০ রেজোলিউশনকে সমর্থন করে। Lens-Turbo ০.৮৪ সেকেন্ডে ১০২৪x১০২৪ ইমেজ জেনারেট করে। ওজনগুলি Hugging Face-এ MIT লাইসেন্সের অধীনে উপলব্ধ, যা MiCA মানদণ্ডের সাথে সঙ্গতিপূর্ণ।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।