A Microsoft anunciou no início deste ano de 2023 a criação de uma inteligência artificial que pode imitar a voz humana em apenas alguns segundos. O VALL-E é capaz de imitar uma voz humana em apenas três segundos. De acordo com a Microsoft, o recurso é uma nova ferramenta de linguagem para alimentar os text-to-speech (TTS), texto para fala, em português, que permite fazer com que textos transformados em áudio sejam mais naturais.
A tentativa é busca naturalizar, ou até mesmo humanizar, vozes de aplicativos e assistentes de áudio como Google Tradutor. Dessa forma, os textos transformados em fala podem receber uma leitura com maior naturalidade, menos robotizadas, como são atualmente. De acordo com a Microsoft, a nova IA é capaz de sintetizar as falas e entonações de vozes humanas em diversos contextos.
Clique no botao abaixo para liberar o conteudo completo gratuitamente.

