Cartesia lança Sonic-3.5 e Ink-2 para IA de voz em tempo real

icon MarsBit
Compartilhar
AI summary iconResumo

De acordo com a monitoramento da Beating, a startup de modelos de voz AI Cartesia anunciou o lançamento do Sonic-3.5 e do Ink-2, juntamente com uma pilha unificada de agentes de voz em tempo real composta por ambos os modelos. O Sonic-3.5 é responsável pela conversão de texto em voz (TTS), enquanto o Ink-2 realiza a conversão de voz em texto (STT). O Sonic-3.5 é otimizado para geração de voz em tempo real com baixa latência, reduzindo o tempo de saída do primeiro som para 90 milissegundos. Suporta nativamente 42 idiomas e consegue pronunciar palavras heterofônicas e alfanuméricas em inglês sem pré-processamento. A taxa de erro de palavra (Word Error Rate) do Ink-2 foi reduzida para 3,6%, além de introduzir detecção de turnos nativa (Native Turn-Detection) e mecanismos de processamento de ruído, permitindo determinar se o usuário terminou de falar com base no significado e na compreensão semântica, em vez de depender apenas da duração tradicional de silêncio. Atualmente, o Ink-2 está disponível apenas em inglês, com versões multilíngues a serem lançadas posteriormente. Desenvolvedores podem chamar ambos os modelos por meio de uma única API. O Sonic-3.5 e o Ink-2 foram projetados para operar em fluxo bidirecional coordenado, reduzindo a latência e a sobrecarga do sistema causadas por "integração de múltiplos fornecedores".

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.