Notícias

Google mostra novidades de IA que auxilia pessoas com dificuldades de fala

Em um universo com smartphones, TVs inteligentes e alto-falantes conectados, usar a voz para executar diferentes comandos é um hábito que só tende a crescer. Mas como incluir nesse espectro de consumo pessoas que, por alguma condição física, têm dificuldades com a fala?

Pensando nessa questão o Google lançou em maio o Project Euphonia, que pretende explorar os recursos de inteligência artificial para averiguar como esse recurso pode interpretar e entender de forma mais eficiente as frases ditas por pessoas cuja velocidade ou pronúncia fuja do padrão aprendido pelo software. E a iniciativa acabou de apresentar seus primeiros resultados.

A companhia apresentou o vídeo abaixo, que mostra o pesquisador russo Dimitri Kanesky, que ficou surdo quando criança, tentando (e não conseguindo) se comunicar com o alto-falante Google Home. E depois, com a ajuda de um programa chamado Parrotron, sendo capaz de interagir com a caixa inteligente:

A companhia de Mountain View também publicou um post explicando como foi realizado o trabalho atual. De acordo com o texto, um formato de reconhecimento de voz padrão foi usado como base e depois modificado de acordo com as horas de gravação recolhidas pelo time de pessoas com dificuldades de fala. Essa medida, de acordo com o comunicado, já reduziu em até um terço o número de vezes em que o sistema não entendia (ou confundia) o que era dito.

Com base nos resultados, a pesquisa também apresentou os dois erros mais comuns cometidos pelos sistemas de análise de reconhecimento automático de fala (ASR, em inglês). O primeiro é o fato de que a IA troca alguma letra (como entender ‘b’ no lugar de ‘p’) e acaba não interpretando a frase corretamente.

O segundo erro mais comum detectado pelo time acontece quando a tecnologia entende uma palavra quando o usuário na verdade falou outra. Por exemplo: ao invés de “ligue a música”, o sistema interpreta como “ligue a máquina”.

Esses são alguns dos pontos que a pesquisa deseja explorar no futuro, especialmente coletando áudios de pessoas com alguma condição diferente de fala, para treinar a IA e aprimorar o trabalho realizado.  O projeto até disponibilizou um formulário para quem desejar contribuir com os áudios, então é possível que surjam novidades em breve.

Recent Posts

Movida lança agente de IA no WhatsApp em parceria com a Meta e aposta em nova experiência de locação

A plataforma de locação de automóveis Movida lançou um agente de inteligência artificial integrado ao…

11 horas ago

Oracle nomeia Marcelle Paiva como nova VP de vendas, Data&AI Hub na América Latina

A Oracle anunciou Marcelle Paiva como nova vice-presidente de vendas, Go-to-Market (GTM) e ecossistema para…

12 horas ago

Mercado de IPOs de tecnologia ganha força com avanço da IA

O mercado de ofertas públicas iniciais voltou a ganhar tração em 2026, impulsionado principalmente pelo…

12 horas ago

Oracle adiciona US$ 85 bilhões em contratos de IA e encerra trimestre com carteira recorde de US$ 638 bilhões

A Oracle encerrou o quarto trimestre e o ano fiscal de 2026 com resultados recordes,…

13 horas ago

Disputa entre Anthropic e OpenAI expõe divergências sobre o futuro da inteligência artificial

A disputa entre Anthropic e OpenAI ganhou novos contornos e se tornou um dos principais…

13 horas ago

Marketing B2B precisa se reorganizar para atender compradores mais autônomos, diz Forrester

As áreas de marketing B2B precisam rever sua estrutura operacional para acompanhar a transformação do…

14 horas ago