All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Inovação
Notícias

Google desenvolve IA capaz de transformar texto em mensagens de áudio

Funcionários da Deepmind, empresa comprada pela Alphabet/Google com foco em desenvolvimento de inteligência artificial, divulgou uma pesquisa (em inglês) em que anuncia a criação de uma IA capaz de transformar mensagens de texto em arquivos de áudio. O estudo, realizado em parceria com a Imperial College London, explica em detalhes a criação do sistema capaz de fazer esse processo. 

Como nome inglês GAN-TTS, a sigla significa rede adversária geradora (GAN) de texto para mensagem (TTS). Apesar dos nomes complicados, a atuação delas é mais fácil de compreender:  uma GAN nada mais é do que duas inteligências artificiais que “competem” entre si na absorção de aprendizado de uma base de dados, sendo capazes de gerar resultados mais próximos de trabalhos feitos por humanos.  

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

 

Oi, eu sou uma GAN

As GANs são muito utilizadas em trabalhos visuais: existe até um site chamado “Essa pessoa não existe”, no qual essa tecnologia “monta” o rosto de um ser humano utilizando uma base de dados disponível. Aplicada no conceito de texto para voz (TTS), uma GAN seria capaz de, após análise de dados, converter frases em áudio. Porém, diferente do campo de imagem, quase não existem pesquisas que aplicam esse sistema para utilizando escrita. 

Por isso que a pesquisa da Google se destaca: além de ter desenvolvido um sistema com foco em criar áudio com base em texto, o paper lançado pelos pesquisadores afirma que a criação consegue essa conversão com alto grau de naturalidade e (mais importante) que o processo é facilmente replicado, o que significa que pode a IA pode ser treinada em diferentes máquinas, aumentando o tempo de aperfeiçoamento e também permitindo que ela seja utilizada em outras tarefas 

Para desenvolver a GAN-TTS, os pesquisadores utilizaram uma amostragem composta por 567 dados fonéticos, de duração e de tom codificados. Após a primeira rodada de arquivos produzidos, cerca de 1 mil sentenças foram avaliadas por humanos, que avaliavam condições como clareza e naturlidade do audio.  Após outros testes, o melhor modelo testado (que passou por cerca de 1 milhão de testes), apresenta um alto grau de “convencimento”. 

 

* Com informações do Venture Beat

Next Keyrus lança KPM2, metodologia de gestão de projetos »
Previous « Empresas que não inovarem perderão até US$ 20 bilhões em 5 anos
Share
Published by
Redação
Tags: GANGoogle DeepMindinteligência artificial
7 anos ago

    Related Post

  • HPE une rede e segurança e mira fim da gestão fragmentada
  • Consumidores ainda resistem a delegar pagamentos a agentes de IA, indica Forrester
  • Anthropic alerta governo Trump sobre riscos cibernéticos expostos por modelos avançados de IA

Recent Posts

  • Notícias

Empresas não sabem como comprar IA, e esse é o maior obstáculo da adoção, diz executivo da HPE

A maioria das empresas que hoje investe em inteligência artificial não sabe exatamente quem deve…

12 horas ago
  • Notícias

Datamint capta R$ 25 milhões em rodada seed liderada pela Headline

A Datamint, startup brasileira de inteligência artificial (IA) voltada à gestão de ativos em operações…

12 horas ago
  • Notícias

Consumidores ainda resistem a delegar pagamentos a agentes de IA, indica Forrester

Os consumidores ainda não estão preparados para permitir que agentes de inteligência artificial (IA) realizem…

13 horas ago
  • Notícias

Anthropic alerta governo Trump sobre riscos cibernéticos expostos por modelos avançados de IA

A Anthropic intensificou seus alertas ao governo dos Estados Unidos sobre os riscos cibernéticos associados…

14 horas ago
  • Notícias

HPE une rede e segurança e mira fim da gestão fragmentada

Por anos, equipes de TI operaram segurança e rede como disciplinas separadas, com ferramentas distintas,…

14 horas ago
  • Notícias

Gwynne Shotwell afasta pressão por IPO e diz que SpaceX mantém foco no longo prazo

A presidente e COO da SpaceX, Gwynne Shotwell, afirmou que a abertura de capital da…

15 horas ago
All Rights ReservedView Non-AMP Version
  • L