Tongyi lança o Fun-ASR1.5 com reconhecimento aprimorado de dialetos

iconKuCoinFlash
Compartilhar
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconResumo

expand icon
O Tongyi lançou o Fun-ASR1.5 em 20 de abril, oferecendo reconhecimento aprimorado de dialetos e agora disponível via API no Alibaba Cloud BaiLian. O modelo suporta 30 idiomas, sete principais sistemas de dialetos chineses e mais de 20 sotaques regionais. Testes internos mostram uma redução de 56,2% na taxa de erro de caracteres para dialetos comuns, com cinco dialetos atingindo mais de 90% de precisão. O reconhecimento de poesia clássica chinesa alcançou 97% de precisão. O modelo é otimizado para uso em educação, serviços governamentais e entrevistas. Esta atualização de notícias on-chain destaca as últimas notícias sobre taxas de juros no desenvolvimento de IA.

Notícia da ME, 20 de abril (UTC+8): De acordo com o monitoramento da Beating, o Laboratório Tongyi lançou em 20 de abril o modelo de reconhecimento de voz Fun-ASR 1.5, que já está disponível como API na Alibaba Cloud Bailian e oferece experiência online aberta na comunidade ModelScope. O oficial afirma que esta versão cobre 30 idiomas, sete grandes grupos de dialetos chineses e mais de 20 sotaques regionais com um único modelo, abandonando a abordagem anterior de separar modelos por dialeto. Avaliações internas da Tongyi mostram que a taxa de erro de caracteres em cenários típicos de dialetos caiu 56,2% em relação à versão anterior; já cinco dialetos alcançaram precisão superior a 90% e quinze superaram 80%. O reconhecimento de poemas clássicos foi otimizado especificamente, com uma precisão de caracteres interna declarada de 97%. Todos esses números são provenientes de testes internos da Tongyi, não de benchmarks de terceiros. As longas caudas de dialetos mais difíceis de processar no reconhecimento de voz chinês estão agora integradas em uma única capacidade diretamente comercializável. Para cenários como transmissões educacionais ao vivo, linhas diretas governamentais locais e transcrição de entrevistas, os usuários não precisam mais dividir múltiplas cadeias de reconhecimento conforme os sotaques regionais, simplificando a implantação. (Fonte: BlockBeats)

Aviso legal: as informações nesta página podem ter sido obtidas de terceiros e não refletem necessariamente os pontos de vista ou opiniões da KuCoin. Este conteúdo é fornecido apenas para fins informativos gerais, sem qualquer representação ou garantia de qualquer tipo, nem deve ser interpretado como aconselhamento financeiro ou de investimento. A KuCoin não é responsável por quaisquer erros ou omissões, ou por quaisquer resultados do uso destas informações. Os investimentos em ativos digitais podem ser arriscados. Avalie cuidadosamente os riscos de um produto e a sua tolerância ao risco com base nas suas próprias circunstâncias financeiras. Para mais informações, consulte nossos termos de uso e divulgação de risco.