Cartesia lanza Sonic-3.5 e Ink-2 para IA de voz en tiempo real

icon MarsBit
Compartir
AI summary iconResumen

Según el monitoreo de Beating, la startup de modelos de voz AI Cartesia anunció el lanzamiento de Sonic-3.5 e Ink-2, junto con una pila tecnológica unificada de agentes de voz en tiempo real compuesta por ambos modelos. Sonic-3.5 se encarga de la conversión de texto a voz (TTS), mientras que Ink-2 se encarga de la conversión de voz a texto (STT). Sonic-3.5 está optimizado para la generación de voz en tiempo real con baja latencia, reduciendo el tiempo de salida del primer sonido a 90 milisegundos. Soporta de fábrica 42 idiomas y puede pronunciar palabras heterofónicas y caracteres alfanuméricos en inglés sin necesidad de preprocesamiento. La tasa de error de palabras (WER) de Ink-2 se redujo al 3,6%, además de introducir detección de turnos nativa y mecanismos de procesamiento de ruido, que permiten determinar si el usuario ha terminado de hablar basándose en el significado y la comprensión semántica, en lugar de depender únicamente del tiempo de silencio tradicional. Actualmente, Ink-2 solo está disponible en inglés; las versiones multilingües se lanzarán posteriormente. Los desarrolladores pueden invocar ambos modelos mediante una única API. Sonic-3.5 e Ink-2 están diseñados para una colaboración bidireccional en flujo continuo, reduciendo la latencia y la pérdida del sistema causadas por la "combinación de múltiples proveedores".

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.