Header Ads

Microsoft desenvolve texto em voz baseado em AI que exigiu muito pouco treinamento

A tecnologia text-to-speech não é exatamente nova, embora a desvantagem seja que, na maior parte, a iteração atual da tecnologia não é muito realista. Isso significa que, se você espera que a conversão de texto em fala simule conversas humanas reais, pode ser uma tarefa bem difícil de realizar.

Publicidade

No entanto, tem havido muito esforço nessa área e, mais recentemente, parece que a Microsoft tentou mão em algo semelhante, com a principal diferença é que o modelo da Microsoft pode realmente exigir menos treinamento. Esta IA foi desenvolvida com pesquisadores chineses onde, com base em 200 amostras de voz, eles conseguiram criar sons com realismo.

Isso foi conseguido com Transformers, que para quem não conhece são redes neurais profundas projetadas para emular os neurônios em nosso cérebro. Usando Transformers, ajuda a processar informações de maneira mais eficiente. Até agora, com base nos resultados, parece que o novo modelo marcou 99,84% em termos de inteligibilidade de palavras, embora tenha sido relatado que ainda soa um pouco robótico, o que você pode ouvir por si mesmo através das amostras postadas no GitHub. Nós temos que admitir que eles soam muito realistas, muito parecido com o modo como a tecnologia Duplex AI do Google é igualmente convincente. Embora esses avanços tecnológicos sejam bem-vindos, também precisamos nos preocupar com a IA soando (e parecendo) realista demais, devido a preocupações sobre como ela poderia ser usada para espalhar desinformação.

Via: Ubergizmo

Nenhum comentário