O Google Translatotron traduz e imita a voz do usuário
Podemos estar prestes a alcançar um vale estranho quando se trata de tradução em tempo real da palavra falada. Já é incrível como os sistemas, particularmente os do Google, podem traduzir o que dizemos na hora, mas quase todos falam com vozes obviamente sintetizadas. O que você sentiria se ouvisse falando outra língua que mal conhece? Esse é o futuro mágico e quase inquietante que o Google Tradutor pode oferecer graças ao Translatotron.
O Translatotron não é um novo personagem dos Transformers. É apenas o apelido que os pesquisadores de IA do Google deram ao seu modelo de tradução de fala para fala, end-to-end. O EESSTM (Estima?) Simplesmente não soa tão cativante nem com a língua torcida.
A capacidade do Translatotron de reter a voz do locutor original mesmo no discurso traduzido é, na verdade, apenas um efeito da verdadeira natureza do sistema. A maioria dos sistemas de tradução divide o trabalho em três partes. Um transforma fala em texto, outro pega esse texto e o traduz para outro idioma, enquanto o terceiro transforma o texto de novo em fala, freqüentemente em uma voz diferente do orador original.
Este sistema em cascata provou ser eficiente e prático e é o que impulsiona a maioria dos sistemas de tradução, incluindo o Google. Os pesquisadores da AI do Google, no entanto, acreditam que um sistema de ponta a ponta pode realmente superá-lo, removendo o intermediário. Literalmente, pula a parte onde a fala é traduzida em texto primeiro.
O Translatotron ainda não supera os tradicionais sistemas em cascata nos testes da equipe, mas provou que isso era pelo menos possível. Como qualquer modelo de aprendizado de máquina, ele poderia melhorar com o tempo. Dada a vantagem de preservar a voz original do falante até mesmo no discurso traduzido, pesquisas adicionais nesse campo podem se mostrar úteis para os futuros sistemas de tradução com tecnologia de inteligência artificial do Google.
Via: Slash Gear
Nenhum comentário