ME সংবাদ অনুযায়ী, 27 মে (UTC+8), অ্যানালিসিস বিটিং-এর মনিটরিং অনুযায়ী, নিজস্ব বড় মডেল MiMo-V2.5 সিরিজে API-এর স্থায়ী মূল্যহ্রাস চালুর পর, শাওমির বড় মডেল টিমের প্রধান লুও ফুলি X-এ অ্যালগরিদম খরচ কমানোর কৌশল প্রকাশ করেন। লুও ফুলি বলেন, DeepSeek-এর API মূল্যের সাথে সমন্বয়ের পরও, শাওমির হাই-লোড ইনফারেন্স ইঞ্জিনটি লাভ-ক্ষতির সমতা বজায় রাখতে সক্ষম। খরচ কমানোর মূল কারণগুলি হল মিশ্র মনোযোগ আর্কিটেকচার এবং স্তরবদ্ধ KV ক্যাশে অপটিমাইজেশন। ক্যাশে হিট (Cache Hit) খরচ 99% কমানোর ডিজাইন লক্ষ্যের জন্য, শাওমির ইনফারেন্স ফ্রেমওয়ার্কটি SWA (স্লাইডিং উইন্ডো অ্যাটেনশন) -এর জন্য স্তরবদ্ধ KV ক্যাশে অপটিমাইজেশন বাস্তবায়িত করেছে। উৎপাদন পরীক্ষা দেখিয়েছে, স্তরবদ্ধ অপটিমাইজেশনটি 5 গুণ ক্যাশে token-এর ধারণক্ষমতা বৃদ্ধি করেছে, 80% ক্যাশে খরচ কমিয়েছে। গ্লোবাল অ্যাটেনশন মডিউলগুলির মধ্যে ক্যাশে রিড (Cache Read Overlap) প্রযুক্তির সংমিশ্রণে, সিস্টেমটি ক্যাশে-হিটের প্রকৃতখরচকেওআরওকমিয়েছে। মডেলটি 1:7-এরস্তর-প্রতি-স্পারসিটি (layer-wise sparsity ratio) -এরঅভিনবতা,অর্থাৎগ্লোবালঅ্যাটেনশন(GA)এবংস্লাইডিংউইন্ডোঅ্যাটেনশন(SWA)-এরস্তরঅনুপাত1:7-এরজন্য,মৌলিকইনপুটএবংআউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক্সটপ্রিফিল (Prefill)পর্যায়ে,60স্তরSWAকেবলস্থানীয়স্লাইডিংউইন্ডোগণনাকরে,যা70স্তরবিশিষ্টMiMo-V2.5-Proমডেলটিরসমগ্রঅ্যাটেনশনগণনা,একটিমাত্র10স্তরবিশিষ্টপ্রচলিতগ্লোবালGQAমডেলেরসমতুল্যহয়েছে।অতি-নিম্নগণনা-লোডযা,মূলইনফারেন্সখরচকমিয়েছে,যা,মূলতদামকমানোরআগে,শাওমিরজন্য2থেকে3গুণলাভসহগহয়েছিল।অতএব,দামকমানোহলঅপটিমাইজেশন-ভিত্তিকখরচকমানোরপ্রতিফলন,অথবাহানি-ভিত্তিকপ্রতিদ্বন্দ্বিতা। লুওফুলিbলেন,খরচ-কমখরচ-কমইনফারেন্সসেবা,শেষপয়েন্টস্মার্টনিসক্সকেউৎসাহিতকরবে।বড়মডেলপ্রতিষ্ঠানগুলি,অবশ্যইঅজ্জয়াদদামযুদ্ধথেকেদূরেথাকবে,এবংঅলগরিদমএবংইনফারেন্সসিসটেমএরঅধ:পদবদধ:পদভিত্তিআউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক্সটপ্রিফিল (Prefill)পর্যায়ে,60স্তরSWAকেবলস্থানীয়স্লাইডিংউইন্ডোগণনাকরে,যা70স্তরবিশিষ্টMiMo-V2.5-Proমডেলটিরসমগ্রঅ্যাটেনশনগণনা,একটিমাত্র10স্তরবিশিষ্টপ্রচলিতগ্লোবালGQAমডেলেরসমতুল্যহয়েছে।অতি-নিম্নগণনা-লোডযা,মূলইনফারেন্সখরচকমিয়েছে,যা,মূলতদামকমানোরআগে,শাওমিরজন্য2থেকে3গুণলাভসহগহয়েছিল।অতএব,দামকমানোহলঅপটিমাইজেশন-ভিত্তিকখরচকমানোরপ্রতিফলন,অথবাহানি-ভিত্—আউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক्सটপ्रिफिल (Prefill)पर्याये,60स्तरSWAकेवलस्थानीयस्लाइडिंगउइन्डोगणनाकरे,याह70स्तरविशिष्टMiMo-V2.5-Proमॉडलटिरसमग्रअ्याटेनशनगणना,एकटिमात्र10स्तरविशिष्टप्रचलितग्लोबलGQAमॉडलेसमतुल्यहये।अति-निम्नगणना-लोडया,मूलइनफेरेन्सखरचकमिएछे,या,मूलतदामकमानोरआगे,शाओमिजन्य2थेके3गुणलाभसहगहये।अतएव,दामकमानोहलअप्टिमाइजेशन-भित्तिकखरचकमानोरप्रतिफलन,अथवाहानि-भित्—আউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক्सটপ्रिफिल (Prefill)पर्याये,60स्तरSWAकेवलस्थानीयस्लाइडिंगउइन्डोगणनाकरे,याह70स्तरविशिष्टMiMo-V2.5-Proमॉडलटिरसमग्रअ्याटेनशनगणना,एकटिमात्र10स्तरविशिष्टप्रचलितग्लोबलGQAमॉडलेसमतुल्यहये।अति-निम्नगणना-लोडया,मूलइनफेरेन्सखरचकमिएछे,या,मूलतदामकमानोरआगे,शाओमिजन्य2थेके3गुणलाभसहगहये।अतएव,दामकमानोहलअप्टिमाइजेशन-भित्तिकखरचकमानोरप्रतिफलन,अथवाहानि-भित्—আউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক्सটপ्रिफिल (Prefill)पर्याये,60स्तरSWAकेवलस्थानीयस्लाइडिंगउइन्डोगणनाकरे,याह70स्तरविशिष्टMiMo-V2.5-Proमॉडलटिरसमग्रअ्याटेनशनगणना,एकटिमात्र10स्तरविशिष्टप्रचलितग्लोबलGQAमॉडलेसमतुल्यहये।अति-निम्नगणना-लोडया,मूलइनफेरेन्सखरचकमिएछे,या,मूलतदामकमानोरआगे,शाओमिजन्य2थेके3गुणलाभसहगहये।अतएव,दामकमानोहलअप्टिमाइजेशन-भित्तिकखरचकमानोरप्रतिफलन,अथवाहानि-भित्—আউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক्सটপ्रिफिल (Prefill)पर्याये,60स्तरSWAकेवलस्थानीयस्लाइडिंगउइन्डोगणनाकरे,याह70स्तरविशिष्टMiMo-V2.5-Proमॉडलटिरसमग्रअ्याटेनशनगणना,एकटिमात्र10स्तरविशिष्टप्रचलितग्लोबलGQAमॉडलेसमतुल्यहये।अति-निम्नगणना-लोडया,मूलइनफेरेन्सखरचकमिएछे,या,मूलतदामकमानोरआगे,शाओमिजन्य2थेके3गुणलाभसहगहये।अतएव,दामकमानोहलअप्टिमाइजेशन-भित्तिकखरचकमानोरप्रतिफलन,अथवाहानि-भित्—আউটপুটখরচ60%থেকে80%কমিয়েছে।দীর்টেক்ஸটপ্rফiল (Prefill)প্rযাe,60স্tరSWAকeবলস্tহাnीeস্lাiডiंgউiंডoগণanaaaker,e,ya70স্tరvishishṭMiMo-V2.5-Proমoডalটiরসamagrঅyāṭeṉaśaŋaṇana,aekṭimātra10স্tరvishishṭprachalitগlōbalaGQAមoডaleসamatulyaheye।aṭi-nimngaṇana-loḍayā,mūla inphērēnsakharachakamiyēchē,yā,mūlata dāmakamānōraġē,śāōmi janya 2thēkē 3guṇalābhasahagahayē।aṭaēva,dāmakamānōhalapṭimājēśana-bhitikakharachamānōrapratiphalaṇ,aṭhavāhāni-bhit—আউটপুটখরচ60%থেকে80%কমিয়েছে।দীর্ঘটেক্��������������������������������������������������� � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � �� (উৎস: BlockBeats)
Xiaomi-এর MiMo-V2.5 মডেল 10-স্তরের সমতুল্য মনোযোগ গণনার মাধ্যমে খরচ কমায়
KuCoinFlashশেয়ার






Xiaomi-এর MiMo-V2.5 মডেলটি 10-স্তরের সমতুল্য অনুধাবন গণনা ব্যবহার করে খরচ কমিয়েছে। 70-স্তরের Pro সংস্করণটি ক্যাশ হিট খরচ 99% এবং ইনপুট/আউটপুট খরচ 60-80% কমিয়েছে। অন-চেইন সংবাদ অনুযায়ী, মডেলটি গ্লোবাল এবং স্লাইডিং উইন্ডো অনুধাবনের মধ্যে 1:7 স্পারসিটি অনুপাত ব্যবহার করে। গ্লোবাল ক্রিপ্টোকারেন্সি নীতির পরিবর্তনগুলি এই দক্ষতা লাভগুলির উপর কিভাবে AI বাস্তবায়নকে প্রভাবিত করতে পারে তা প্রভাবিত করতে পারে।
উৎস:আসল দেখান
দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না।
ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।