সিয়েরা μ-বেঞ্চকে মাল্টিলিঙ্গুয়াল এএসআর মূল্যায়নের জন্য ওপেন সোর্স করেছে

ME সংবাদ, ২১ এপ্রিল (UTC+8), ডিনামিক বিটিং দ্বারা পর্যবেক্ষণে, কাস্টমার সার্ভিস এআই কোম্পানি সিয়েরা একটি বহুভাষিক স্বয়ংক্রিয় স্বরলিপি (ASR) মূল্যায়ন সেট μ-Bench ওপেন-সোর্স করেছে, যার ডেটা ২৫০টি বাস্তব কাস্টমার সার্ভিস কলের রেকর্ডিং এবং ৪,২৭০টি ম্যানুয়ালি অ্যানোটেটেড অডিও ক্লিপ থেকে আসে, যার স্যাম্পলিং রেট ৮কেএইচজেড, মনো। আগের প্রকাশিত ASR মূল্যায়নগুলি বা শুধুমাত্র ইংরেজির জন্য ছিল, অথবা স্টুডিওতে পড়া কনটেন্ট ব্যবহার করত, যা বহুভাষিক কাস্টমার সার্ভিস স্কেনারিওতে ভয়েস এজেন্টকে ইন্টিগ্রেট করতে চাওয়া দলগুলির জন্য প্রায়শই অপ্রয়োজনীয়। μ-Bench-এর মাধ্যমে বাস্তব কলগুলির মাধ্যমেই এই ফাঁকটি পূরণ করা হয়েছে। এই প্রকাশিতটি Sierra-এর অভ্যন্তরীণ মূল্যায়নের একটি উপসেট। অভ্যন্তরীণভাবে, ৪২টি ভাষা, ৭৯টি অঞ্চলগত ভেরিয়েন্ট, ১৩টিরওবেশি সরবরাহকারীকে কভার করা হয়। এখনওপেন-সোর্সকৃত ৫টি অঞ্চল—ইংরেজি, স্প্যানিশ, তুর্কি, ভিয়েতনামি, এবং মণ্ডারিন—এবং ৫টি ফার্ম—Deepgram Nova-3, Google Chirp-3, Microsoft Azure Speech, ElevenLabs Scribe v2, OpenAI GPT-4o Mini Transcribe-এর পারফরম্যান্স। কোড, ডেটাসেট (Hugging Face-এর উপর)এবংএকটিওপেনলিডারবোর্ডসহসমস্তকিছুপ্রকাশকরাহয়েছে,অন্যান্যফার্মগুলিকেপ্রতিযোগিতায়অংশগ্রহণকরতেআমন্ত্রণজানানোহয়েছে। মূল্যায়নেরপ্রকৃতঅনন্যতাহলঅঙ্কগুলি।Sierraএকটিনতুনমেট্রিকUER(UtteranceErrorRate,বক্তব্য-স্তরেরভুলেরহার)প্রস্তাবকরেছে,যামৌলিকঅর্থপরিবর্তনকারীভুলগুলিকেঅপ্রাসঙ্গিকভুলগুলিরথেকেআলাদাভাবেগণনাকরে।প্রচলিতWER(শব্দভুলহার)একটি“এ”শব্দচ্ছিন্নহওয়াএবংফোননম্বরএকটিঅসঠিকশুনতেভুলকরা—উভয়কেসমানভাবেগণনাকরে—কিন্তুএকটিভয়েসএজেন্টযদিঅনুবাদকেসময়মতঅনুসরণকরত,তবেশুধুমাত্রদ্বিতীয়টিপদক্ষেপগুলিকেবিঘ্নিতকরত।Sierraঅনুসারে,দুটিWERপ্রায়সমানফার্মওUER-এঅনেকদূরপিছিয়েথাকতপারে,কারণতাদেরভুলগুলিরপ্রকৃতিঅলগ। ফলাফলগতভাবে, Google Chirp-3-এর accuracy-এর level-এ highest-এ, but inference is slower; Deepgram Nova-3-এর p50 latency nearly 8x faster, yet its multilingual accuracy is the lowest. Mandarin recognition error rates can reach five times that of English, and Vietnamese performance varies widely across vendors—these gaps are invisible when looking only at English benchmarks. (উৎস: BlockBeats)