Nvidia Enterprise lança solução para síntese de voz “expressiva”

Novidade foi demonstrada no Interspeech 2021 e pode dar voz a personagens, assistentes virtuais e avatares personalizados

Author Photo
6:30 pm - 01 de setembro de 2021
voice tech Reprodução/Shutter Stock

A Nvidia Enterprise, divisão de soluções para desenvolvedores e criadores de conteúdo, anunciou nesta terça-feira (31), durante o Interspeech 2021, uma nova ferramenta para síntese “expressiva” de voz humana, que busca aproximar vozes geradas via inteligência artificial de vozes naturais.

Otimizadas para funcionar com eficiência em GPUs da Nvidia, as ferramentas de IA conversacional de última geração da companhia estão disponíveis no kit de ferramentas Nvidia NeMo, de código aberto, disponível no NGC.

Com a solução, a Nvidia promete transformar falas sintetizadas em tom monótono, características de ligações automáticas ou dos primeiros sistemas de navegação GPS, em vozes com tom profissional de assistentes virtuais em smartphones e speakers inteligentes. Segundo a Nvidia, a ferramenta leva em consideração elementos como ritmo, entonação e timbre para gerar vozes sintéticas.

A interface permite, por exemplo, que um produtor de vídeo grave a si mesmo lendo o roteiro e, em seguida, use o modelo de IA para converter sua fala em uma fala de outro narrador sintético. Usando essa narração básica, o produtor pode, então, dirigir a IA como um ator de voz, ajustando a fala sintetizada para enfatizar palavras específicas e modificando o ritmo da narração para expressar melhor o tom do vídeo.

Os recursos do modelo de inteligência artificial vão além do trabalho de locução: a conversão de texto em voz pode ser usada em games, para ajudar pessoas com deficiências vocais ou até mesmo para ajudar os usuários a traduzir outros idiomas em sua própria voz. É possível até recriar as performances de cantores, combinando não apenas a melodia de uma música, mas também a expressão emocional por trás dos vocais.

Segundo a Nvidia, a equipe de criação interna da divisão Enterprise já está utilizando a tecnologia para produzir narração emotiva para uma série de vídeos sobre o poder da IA. A solução também estará disponível para desenvolvedores brasileiros.

“Essa novidade traz diversos benefícios para a inteligência artificial como um todo. Cada vez mais podemos ver a importância de uma tecnologia personalizada e com as soluções da divisão Nvidia Enterprise isso é possível, com aplicabilidade em diversos setores”, disse Marcio Aguiar, diretor da Nvidia Enterprise para América Latina.

Newsletter de tecnologia para você

Os melhores conteúdos do IT Forum na sua caixa de entrada.