أخبار ME، في 16 أبريل (UTC+8)، وفقًا لمراقبة Beating، أطلقت Step星辰 رسميًا StepAudio 2.5 TTS. على عكس أنظمة TTS التقليدية التي تتطلب علامات مشاعر محددة مسبقًا، فإن هذه النسخة تدعم التحكم في كل تفصيلة الصوت باستخدام وصف بلغة طبيعية: فالعلامات يمكنها فقط التعبير عن "الحزن"، بينما يمكن للغة الطبيعية وصف تفاصيل أدق مثل "حزن مكبوت، دون بكاء، مع اهتزاز خفيف"، ويقوم الذكاء الاصطناعي بتوليد الصوت المقابل بناءً على ذلك. يتم التحكم على ثلاثة مستويات: التحكم السياقي العام يحدد النبرة العاطفية الأساسية وجو الموقف للنص بأكمله، مما يضمن اتساق تعبير الشخصيات خلال المحادثات المتعددة؛ التحكم السياقي في النص يضبط النبرة، الإيقاع، التوقفات، التوكيد، وشعور التنفس على مستوى الجملة، ويمكنه حتى تصوير الأفكار الداخلية والمضامين الضمنية للشخصية؛ وتكرار الصوت بدون عينات (Zeroshot TTS) لا يتطلب إعادة تدريب، بل يمكنه تقليد أي صوت مرجعي باستخدام تسجيلات عشوائية، مع إمكانية ضبط العاطفة والأسلوب بشكل مستقل. تم إطلاق جميع الوظائف الثلاث بالكامل على منصة Step星辰 المفتوحة ومنصة Step Plan. وفي نفس اليوم، أطلقت جوجل أيضًا Gemini 3.1 Flash TTS، والتي تستخدم أوامر اللغة الطبيعية بدلًا من علامات SSML لتحقيق تحكم دقيق، واحتلت المرتبة الأولى في التقييمات الخارجية. إن إطلاق كلا الطرفين في نفس اليوم باستخدام نفس النهج يشير إلى أن نموذج التحكم في TTS ينتقل جماعيًا من "اختيار العلامات" إلى "وصف الاحتياجات". بالنسبة للمبدعين المحتوى الصوتي ومديري التسجيل الصوتي، لم يعد عليهم الآن الاعتماد على التسجيل المتكرر لضبط المشاعر، بل يمكنهم تحديد درجات الدقة في الصوت بجملة واحدة فقط. (المصدر: BlockBeats)
إطلاق StepAudio 2.5 TTS مع تحكم عاطفي دقيق
KuCoinFlashمشاركة






تم إطلاق StepAudio 2.5 TTS في 16 أبريل (UTC+8)، ويوفر تحكمًا دقيقًا في المشاعر عبر اللغة الطبيعية. يمكن للمستخدمين الآن تحديد نبرات مثل "حزن مكبوت، دون نبرة بكاء، اهتزاز خفيف." يدعم النظام السياق العالمي، والتحكم داخل النص، وتقليد الصوت بدون تدريب مسبق. تبرز الأخبار على السلسلة هذا التقدم في تقنية الصوت الذكية. في الوقت نفسه، أطلقت جوجل Gemini 3.1 Flash TTS، والتي تستخدم أيضًا اللغة الطبيعية للتعديل الدقيق للكلام. قد تشمل مناقشات السياسات العالمية للعملات المشفرة قريبًا هذه الأدوات كجزء من أطر تنظيمية أوسع.
المصدر:عرض النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة قد حصلت عليها من أطراف ثالثة ولا تعكس بالضرورة وجهات نظر أو آراء KuCoin. يُقدّم هذا المحتوى لأغراض إعلامية عامة فقط ، دون أي تمثيل أو ضمان من أي نوع ، ولا يجوز تفسيره على أنه مشورة مالية أو استثمارية. لن تكون KuCoin مسؤولة عن أي أخطاء أو سهو ، أو عن أي نتائج ناتجة عن استخدام هذه المعلومات.
يمكن أن تكون الاستثمارات في الأصول الرقمية محفوفة بالمخاطر. يرجى تقييم مخاطر المنتج بعناية وتحملك للمخاطر بناء على ظروفك المالية الخاصة. لمزيد من المعلومات، يرجى الرجوع إلى شروط الاستخدام واخلاء المسؤولية.