Tongyi lanza Fun-ASR1.5 con reconocimiento mejorado de dialectos

iconKuCoinFlash
Compartir
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumen

expand icon
Tongyi lanzó Fun-ASR1.5 el 20 de abril, ofreciendo un reconocimiento mejorado de dialectos y ahora disponible mediante API en Alibaba Cloud BaiLian. El modelo admite 30 idiomas, siete sistemas principales de dialectos chinos y más de 20 acentos regionales. Las pruebas internas muestran una reducción del 56,2% en la tasa de error de caracteres para dialectos comunes, con cinco dialectos alcanzando más del 90% de precisión. El reconocimiento de poesía clásica china alcanzó una precisión del 97%. El modelo está optimizado para su uso en educación, servicios gubernamentales e entrevistas. Esta actualización de noticias en la cadena destaca las últimas noticias sobre tasas de interés en el desarrollo de IA.

Noticias de ME, el 20 de abril (UTC+8), según el monitoreo de Beating, el laboratorio Tongyi lanzó el modelo de reconocimiento de voz Fun-ASR1.5 el 20 de abril, y ya ha implementado la API en Alibaba Cloud BaiLian y ofrece una experiencia en línea en la comunidad ModelScope. Según la oficina, esta versión utiliza un solo modelo para cubrir 30 idiomas, siete grandes grupos de dialectos chinos y más de 20 acentos regionales, eliminando la necesidad de separar modelos por dialecto. Las evaluaciones internas de Tongyi muestran que la tasa de errores de caracteres en escenarios típicos de dialectos disminuyó un 56,2 % en comparación con la versión anterior; ya cinco dialectos alcanzan una precisión superior al 90 % y quince superan el 80 %. El reconocimiento de poemas antiguos también fue optimizado específicamente, con una precisión a nivel de caracteres interna declarada del 97 %. Todos estos números provienen de pruebas internas de Tongyi, no de benchmarks de terceros. Las colas largas de dialectos chinos más difíciles de procesar ahora se integran en un solo conjunto de capacidades directamente comerciales. Para escenarios como transmisiones educativas en vivo, líneas de atención al ciudadano locales y transcripciones de entrevistas, los usuarios ya no necesitan desglosar múltiples cadenas de reconocimiento según el acento regional, lo que simplifica la implementación. (Fuente: BlockBeats)

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.