All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Inovação
Notícias

Google Cloud anuncia disponibilidade geral do Text-to-Speech

O Google Cloud anunciou recentemente a disponibilidade geral da ferramenta de conversão de texto para voz Text-to-Speech, que foi disponibilizada ao público inicialmente há alguns meses.

Entre outras coisas, a solução ganhou 17 novas vozes, incluindo português, inglês (EUA) e espanhol, que permitem a criação de aplicativos em idiomas variados, como anunciado no evento Cloud Next’ 18, em julho.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

No total, a API agora oferece 56 vozes em 14 idiomas e variantes, sendo 30 delas padrão e 26 delas WaveNet (produto da DeepMind), capazes de imitar vozes humanas e sons naturais, o que permite uma melhor experiência aos usuários.

Audio Profiles

O Google Cloud também revelou que o recurso Audio Profiles agora também está disponível. Com a novidade, o usuário pode otimizar a reprodução dos áudios Text-to-Speech nos diferentes tipos de equipamentos, como fones de ouvido, alto-falantes e linhas telefônicas.

“Por exemplo, se o áudio que o seu aplicativo produz é ouvido principalmente em fones de ouvido, você pode criar uma voz sintética a partir da API Cloud Text-to-Speech que seja otimizada especificamente para fones de ouvido”, explica o Google em um post no seu blog sobre as novidades.

Novas funções do Speech-to-Text

Além disso, o Google também anunciou novas atualizações beta para o serviço que transforma voz em texto Speech-to-Text, incluindo reconhecimento multicanal, diarização de alto-falante e detecção automática de idiomas, todas anunciadas durante o Google Cloud Next’ 18.

Entre outras coisas, essas funções possibilitam a transcrição de vários canais de áudio com identificação de vozes, de modo a registrar quais palavras foram ditas por quem.

E nos casos em que as amostras de áudio que não são separadas em canais, como em uma palestra, por exemplo, o Google disponibiliza a chamada diarização. Para usá-la, basta inserir o número de pessoas falantes como parâmetro à API e, por meio de aprendizagem de máquina (Machine Learning), a ferramenta elabora uma categoria de cada palavra com um número e, na transcrição, consegue identificar o falante de maneira assertiva.

Next Oracle leva machine learning para as salas de aula »
Previous « Boldon James e Varonis anunciam aliança para promover governança e proteção de dados
Leave a Comment
Share
Published by
Redação
Tags: AIGoogle Cloudtext to speech
8 anos ago

    Related Post

  • HPE une rede e segurança e mira fim da gestão fragmentada
  • Consumidores ainda resistem a delegar pagamentos a agentes de IA, indica Forrester
  • Anthropic alerta governo Trump sobre riscos cibernéticos expostos por modelos avançados de IA

Recent Posts

  • Notícias

Empresas não sabem como comprar IA, e esse é o maior obstáculo da adoção, diz executivo da HPE

A maioria das empresas que hoje investe em inteligência artificial não sabe exatamente quem deve…

5 horas ago
  • Notícias

Datamint capta R$ 25 milhões em rodada seed liderada pela Headline

A Datamint, startup brasileira de inteligência artificial (IA) voltada à gestão de ativos em operações…

5 horas ago
  • Notícias

Consumidores ainda resistem a delegar pagamentos a agentes de IA, indica Forrester

Os consumidores ainda não estão preparados para permitir que agentes de inteligência artificial (IA) realizem…

6 horas ago
  • Notícias

Anthropic alerta governo Trump sobre riscos cibernéticos expostos por modelos avançados de IA

A Anthropic intensificou seus alertas ao governo dos Estados Unidos sobre os riscos cibernéticos associados…

7 horas ago
  • Notícias

HPE une rede e segurança e mira fim da gestão fragmentada

Por anos, equipes de TI operaram segurança e rede como disciplinas separadas, com ferramentas distintas,…

7 horas ago
  • Notícias

Gwynne Shotwell afasta pressão por IPO e diz que SpaceX mantém foco no longo prazo

A presidente e COO da SpaceX, Gwynne Shotwell, afirmou que a abertura de capital da…

8 horas ago
All Rights ReservedView Non-AMP Version
  • L