All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Inovação
Notícias

Google desenvolve IA capaz de transformar texto em mensagens de áudio

Funcionários da Deepmind, empresa comprada pela Alphabet/Google com foco em desenvolvimento de inteligência artificial, divulgou uma pesquisa (em inglês) em que anuncia a criação de uma IA capaz de transformar mensagens de texto em arquivos de áudio. O estudo, realizado em parceria com a Imperial College London, explica em detalhes a criação do sistema capaz de fazer esse processo. 

Como nome inglês GAN-TTS, a sigla significa rede adversária geradora (GAN) de texto para mensagem (TTS). Apesar dos nomes complicados, a atuação delas é mais fácil de compreender:  uma GAN nada mais é do que duas inteligências artificiais que “competem” entre si na absorção de aprendizado de uma base de dados, sendo capazes de gerar resultados mais próximos de trabalhos feitos por humanos.  

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

 

Oi, eu sou uma GAN

As GANs são muito utilizadas em trabalhos visuais: existe até um site chamado “Essa pessoa não existe”, no qual essa tecnologia “monta” o rosto de um ser humano utilizando uma base de dados disponível. Aplicada no conceito de texto para voz (TTS), uma GAN seria capaz de, após análise de dados, converter frases em áudio. Porém, diferente do campo de imagem, quase não existem pesquisas que aplicam esse sistema para utilizando escrita. 

Por isso que a pesquisa da Google se destaca: além de ter desenvolvido um sistema com foco em criar áudio com base em texto, o paper lançado pelos pesquisadores afirma que a criação consegue essa conversão com alto grau de naturalidade e (mais importante) que o processo é facilmente replicado, o que significa que pode a IA pode ser treinada em diferentes máquinas, aumentando o tempo de aperfeiçoamento e também permitindo que ela seja utilizada em outras tarefas 

Para desenvolver a GAN-TTS, os pesquisadores utilizaram uma amostragem composta por 567 dados fonéticos, de duração e de tom codificados. Após a primeira rodada de arquivos produzidos, cerca de 1 mil sentenças foram avaliadas por humanos, que avaliavam condições como clareza e naturlidade do audio.  Após outros testes, o melhor modelo testado (que passou por cerca de 1 milhão de testes), apresenta um alto grau de “convencimento”. 

 

* Com informações do Venture Beat

Next Keyrus lança KPM2, metodologia de gestão de projetos »
Previous « Empresas que não inovarem perderão até US$ 20 bilhões em 5 anos
Share
Published by
Redação
Tags: GANGoogle DeepMindinteligência artificial
7 anos ago

    Related Post

  • Movida lança agente de IA no WhatsApp em parceria com a Meta e aposta em nova experiência de locação
  • Medo de investir pouco em IA cresce entre CEOs, aponta Cisco
  • Oracle nomeia Marcelle Paiva como nova VP de vendas, Data&AI Hub na América Latina

Recent Posts

  • Notícias

Medo de investir pouco em IA cresce entre CEOs, aponta Cisco

A inteligência artificial deixou de ser vista apenas como uma aposta tecnológica e passou a…

7 minutos ago
  • Notícias

Movida lança agente de IA no WhatsApp em parceria com a Meta e aposta em nova experiência de locação

A plataforma de locação de automóveis Movida lançou um agente de inteligência artificial integrado ao…

3 dias ago
  • Notícias

Oracle nomeia Marcelle Paiva como nova VP de vendas, Data&AI Hub na América Latina

A Oracle anunciou Marcelle Paiva como nova vice-presidente de vendas, Go-to-Market (GTM) e ecossistema para…

3 dias ago
  • Notícias

Mercado de IPOs de tecnologia ganha força com avanço da IA

O mercado de ofertas públicas iniciais voltou a ganhar tração em 2026, impulsionado principalmente pelo…

3 dias ago
  • Notícias

Oracle adiciona US$ 85 bilhões em contratos de IA e encerra trimestre com carteira recorde de US$ 638 bilhões

A Oracle encerrou o quarto trimestre e o ano fiscal de 2026 com resultados recordes,…

3 dias ago
  • Notícias

Disputa entre Anthropic e OpenAI expõe divergências sobre o futuro da inteligência artificial

A disputa entre Anthropic e OpenAI ganhou novos contornos e se tornou um dos principais…

3 dias ago
All Rights ReservedView Non-AMP Version
  • L